You are on page 1of 48

III

Phần

Hoạt động của người dùng trên quy mô lớn


Hệ thống IPTV
Chương 7
Mô hình khối lượng công việc

7.1 Tổng quan


Một thiết kế thành công của phiên máy chủ ứng dụng P2PTV và các thuật toán điều phối ngang hàng phải
xem xét cẩn thận hoạt động của người đăng ký TV. Đặc biệt, để xác định số lượng phiên tải lên và tải xuống
tối ưu và sự phân phối của chúng trên các phiên bản UE, việc xác định bản chất của việc chuyển kênh TV có
một tầm quan trọng tối quan trọng. Nếu máy chủ ứng dụng có thể dự đoán, ít nhất là trong ngắn hạn, quá
trình chuyển đổi kênh, nó có thể chủ động phân bổ các phiên SIP cần thiết để người dùng kênh mới có thể
đáp ứng với độ trễ tối thiểu.
Thật không may, việc đo lường và mô hình hóa một hệ thống IPTV quy mô lớn ngoài đời thực không
phải là một nhiệm vụ đơn giản. Trở ngại quan trọng nhất đối với sự hiểu biết thấu đáo về các hệ thống này
là thiếu dữ liệu thực tế cho thấy cách người dùng xem TV, do kiến trúc khép kín của các triển khai hiện có.
Vì những lý do này, nhiều nghiên cứu đo lường IPTV tập trung vào các dịch vụ dựa trên Internet như PPLive,
PPStream, SopCast, TVAnts ( Hei và cộng sự. , 2007 ; Silverston & Fourmaux , 2007 ; Ali và cộng sự. ,
2006 ; Xie và cộng sự. , 2007 ; Vu et al. , 2007 ). Các dịch vụ này mang đến trải nghiệm hoàn toàn khác so với
truyền hình cổ điển, ở chỗ người dùng truy cập các kênh truyền hình bằng phần mềm duyệt / xem được cài
đặt trên máy tính của họ. Ngoài ra, những hạn chế về công nghệ như băng thông hạn chế, phát trực tuyến
ngang hàng, độ trễ kết nối kênh lớn, v.v., ngăn cản người dùng chuyển hoặc duyệt các kênh truyền hình với
tốc độ tương tự như với TV thông thường.
Mặc dù những nghiên cứu này tạo ra một cái nhìn sâu sắc về hành vi của người dùng IPTV trên Internet, nhưng chúng
tôi cho rằng họ không phù hợp với công việc của chúng tôi, vốn nhắm đến một môi trường thương mại vườn có tường bao
quanh. Vì lý do này, chúng tôi tập trung vào tập hợp các phép đo hẹp từ IPTV được triển khai từ xa. Cha và cộng sự. ( Cha,
Rodriguez, Crowcroft, et al. , 2008 ) trình bày nghiên cứu hoàn chỉnh đầu tiên về hoạt động của người dùng trong một nhà
cung cấp IPTV lớn, sử dụng dữ liệu ẩn danh được thu thập từ dịch vụ Telefonica IPTV, Movistar Imagenio. Qiu và cộng sự. ( Qiu,
Ge, Lee, Wang, Xu và Zhao , 2009 ; Qiu, Ge, Lee, Wang, Zhao và Xu , 2009 ) đã công bố một kết quả tương tự bằng cách sử
dụng các dấu vết thu thập được từ dịch vụ U-question của AT&T và hơn nữa, họ đề xuất một mô hình tạo khối lượng công
việc cho hệ thống IPTV được gọi là Đồng hồ simul.
Mô hình của họ cung cấp một khởi đầu tốt để tạo ra một khối lượng công việc tổng hợp. Tuy nhiên, để giữ
74 Chương 7. Mô hình khối lượng công việc

Phiên ngoại tuyến

Phiên trực tuyến


Màu sắc chính

Phiên trực tuyến


Phiên ngoại tuyến
Phiên kênh
Phiên kênh

Hình 7.1: Mô hình hóa hoạt động của người dùng.

độ phức tạp của nó thấp, nó mắc một số thiếu sót. Đầu tiên, các tác giả giới hạn số lượng thuộc tính hệ thống mà họ lập
mô hình, chẳng hạn như loại trừ các biến thể hàng tuần của người dùng đang hoạt động. Thứ hai, các thông số được công
bố của họ thường mang lại kết quả kém hoàn hảo hơn giữa mô hình và dữ liệu thực tế. Cuối cùng, mô hình của họ có một
vài điều đáng tiếc.
Trong công việc của mình, chúng tôi dựa vào dữ liệu đã xuất bản của họ để cải tiến mô hình Simulwatch, sao cho khối
lượng công việc tổng hợp khớp với dấu vết dữ liệu tốt hơn. Đặc biệt, bởi vì mục tiêu của chúng tôi là sử dụng mô hình này
để thúc đẩy đánh giá hiệu suất của dịch vụ P2PTV của chúng tôi, chúng tôi không có ý định giới hạn số lượng các thông số
đặc trưng cho hệ thống với chi phí là một kết quả thấp hơn hoàn hảo. Giống như Simulwatch, mô hình của chúng tôi tập
trung vào các khía cạnh khối lượng công việc chính sau: hoạt động người dùng và mức độ phổ biến của kênh.

• Các hoạt động người dùng bao gồm hai đặc điểm: (i) tỷ lệ tại đó người dùng thay đổi trạng thái hoạt
động xem của họ được gọi là phiên họp, tức là bật và tắt thiết bị người dùng của họ, và thay đổi giữa
các kênh; và (2) chiều dài của mỗi phiên bật, tắt hoặc kênh. Ngoài ra, những đặc điểm này sẽ xác định
số lượng UE trực tuyến tại một thời điểm nhất định.

• Các kênh phổ biến cho biết kênh mà người dùng có nhiều khả năng xem nhất. Chỉ số phổ biến có hai
thứ nguyên: không gian tạm thời và không gian người dùng. Thứ nguyên thời gian đề cập đến sự
thay đổi trung bình dài hạn và ngắn hạn về mức độ phổ biến của kênh. Thứ nguyên người dùng mô
hình hóa sở thích của người dùng cho các kênh TV đã chọn.

7.2 Hoạt động của người dùng

Hoạt động của người dùng bao gồm ba loại phiên:

• Phiên trực tuyến khi thiết bị của người dùng được bật và nó có thể tham gia tích cực vào việc chuyển
tiếp kênh TV tới những người dùng khác.

• Trong số các phiên họp khi thiết bị của người dùng bị tắt.

• Phiên kênh khi người dùng đang xem một kênh truyền hình cụ thể. Các phiên kênh trùng lặp với các
phiên trực tuyến của UE.

Fi gure 7.1 minh họa các loại phiên cho thiết bị người dùng. Các tham số từ dữ liệu có sẵn, đặc trưng
cho động lực của hoạt động của người dùng, như sau:

• Các thời lượng phiên của mỗi loại phiên, được biểu thị bằng d trên, d tắt , và d ch, tương ứng.

• Các tỷ lệ phiên của mỗi loại phiên, được biểu thị bằng x trên, x tắt và x ch, tương ứng.

• Các tỷ lệ giữa các UE trực tuyến và trong số các UE, được chuẩn hóa thành tổng số người dùng đang hoạt động từ hệ thống: r trên
và r tắt .

Chúng tôi nhấn mạnh các thông số này trong fi gure 7.2, nơi chúng được tạo ra bởi sự chồng chất của
nhiều người xem TV cùng một lúc.
7.2. Hoạt động người dùng 75

dtrên dtắt

Sự kiện phiên trực tuyến

Sự kiện phiên ngoại tuyến

1 1
xtrên
• x tắt

Hình 7.2: Các thông số đặc trưng cho hoạt động của người dùng.

1 1 1
c 4 bc 4 Dấu vết Dấu vết Dấu vết 1
Mô hình c4 Mô hình Mô hình
c 3 bc 3 Điểm tại c Tôi Điểm tại c Tôi Điểm tại c Tôi
0,8 0,8 bc 4 0,8
Điểm tại bc Tôi Điểm tại bc Tôi Điểm tại bc Tôi
c2 c5 0,5
bc 2 c 3 bc 3
CCDF 1 - F (d trên)

0,6 0,6 0,6


CCDF 1 - F (d tắt )

CCDF 1 - F (d ch)
c 2 bc 2 Âm mưu QQ
1 1
bc 5 0
c4 0 0,5 1
0,4 0,4 0,4
c1 bc 4
0,5 0,5
c1 bc 1 c 3 bc 3
0,2 0,2 0,2
Âm mưu QQ Âm mưu QQ
bc 1 c 2 bc 2
0 0 c 1 bc 1
0 0,5 1 0 0,5 1
0 0 0
10 0 10 5 10 0 10 5 10 0 10 5
d trên [ S] d tắt [ S] d ch [ S]

(a) Thời lượng phiên trực tuyến d trên. (b) Thời lượng của phiên d tắt . (c) Thời lượng phiên kênh d ch.

Hình 7.3: Kết hợp dữ liệu độ dài phiên thành một phân phối siêu cấp số nhân.

7.2.1 Thời lượng phiên

Các phiên từ hoạt động của người dùng đại diện cho một quá trình đổi mới, được đặc trưng bởi phân phối xác suất
cho từng loại phiên. Qiu và cộng sự. đề xuất mô hình hóa việc phân phối dữ liệu thực nghiệm này bằng cách sử
dụng hỗn hợp theo cấp số nhân hoặc là siêu cấp số nhân phân phối xác suất. Thật không may, các tham số của
chúng chỉ phù hợp sơ bộ với dấu vết dữ liệu, điều này được nhấn mạnh trong phần đánh giá mô hình. Vì lý do này,
trong phần này, chúng tôi nâng cao mối liên hệ giữa dữ liệu và mô hình tổng hợp.
Siêu cấp số nhân có thể gần đúng với nhiều loại phân phối xác suất đuôi dài ( Jewell , 1982 ). Trong số một
vài điều kiện để thành công là phân phối xác suất mà nó xấp xỉ phải có một hàm mật độ xác suất đơn điệu
nghiêm ngặt (PDF). Do đó, các phân phối như bình thường không thể được gần đúng với một siêu cấp số
nhân. Vì phân tích dữ liệu có sẵn chỉ ra rằng PDF của nó là đơn điệu, nên phân phối xác suất của nó có thể
được xấp xỉ thành công với một siêu cấp số nhân, với CDF có dạng:

F (d) = 1 - n ∑ p Tôi e - λ Tôi d, (7,1)


tôi = 1

Ở đâu x ∈ [ 0, ∞), λ tôi> 0 và:

n
∑ p tôi = 1. (7.2)
tôi = 1

Để xác định các tham số của mỗi phân phối siêu mũ (đối với d trên, d tắt , và
d ch), chúng tôi sử dụng thuật toán xác định được mô tả bởi Feldmann et al. ( Feldmann & Whitt , 1998 ). Các
76 Chương 7. Mô hình khối lượng công việc

0,1 0,02 0,35


Tỷ lệ phiên trực tuyến x trên O O tỷ lệ trong phiên x tắt Tỷ lệ phiên kênh x ch
0,3
0,08
0,015
0,25
x trên [ min - 1]

0,06

x ch [ min - 1]
0,2

x tắt [ min - 1]
0,01
0,15
0,04

0,1
0,005
0,02
0,05

0 0 0
0 3 6 9 12 15 18 21 24 0 3 6 9 12 15 18 21 24 0 3 6 9 12 15 18 21 24
t [ h] t [ h] t [ h]

(a) Tỷ lệ phiên trực tuyến x trên. (b) Tỷ lệ phiên x tắt . (c) Tỷ lệ phiên kênh x ch.

Hình 7.4: Tỷ giá phiên trong một ngày thông thường.

phương pháp bao gồm việc xác định từng cấp số nhân từ hỗn hợp thành các khoảng cách đều theo cấp số nhân
[ c Tôi, b · c Tôi ], Ở đâu b là một yếu tố đại diện cho kích thước khoảng thời gian, thường là 2.
Chúng tôi áp dụng quy trình này cho dữ liệu từ tất cả các loại phiên. Các fi gures 7.3 (a) –7.3 (c) minh họa
siêu cấp số nhân fi tting cho mỗi độ dài phiên. Chúng tôi đã chọn n = 4 cho d trên, d tắt , n = 5 cho d ch,
và chúng tôi nhấn mạnh các điểm khoảng thời gian được sử dụng cho fi tting ( c Tôi và bc Tôi). Bằng cách so sánh dữ liệu và sự phân
bố mô hình trong một biểu đồ QQ, chúng tôi nhận thấy rằng chúng tôi có được một vị trí hợp lý trong mọi trường hợp.
Đối với độ dài phiên kênh, chúng tôi đã sử dụng một số lượng lớn hơn các thông số để mô tả mô hình, do
phần lớn các phiên có thời lượng dưới 1 giây và thiếu dữ liệu cho các phiên này. Do đó, tất cả các phiên
trong phạm vi 0-10 giây được tính gần đúng bằng hai cấp số nhân trong hỗn hợp.

Bảng 7.1 minh họa các thông số của mô hình. Thống kê Kolmogorov-Smirnov (KS) xác định mức độ tốt
trong mọi trường hợp.

Tham số d trên d tắt d ch Tham số d trên d tắt d ch


p1 0,4264 0,4030 0,03876 λ 1 · 10 5 8.1219 3.0985 5.3894

p2 0,3110 0,1745 0,07252 λ 2 · 10 4 3.6078 3,691 5.6563

p3 0,0647 0,0460 0,1240 λ 3 · 10 2 1.518 1.203 0,7326

p4 0,1980 0,3763 0,3499 λ4 0,2301 0,1414 0,15411

p5 - - 0,4148 λ5 - - 1,3115

Bảng 7.1: Mô hình độ dài phiên: các tham số của phân phối siêu mũ.

7.2.2 Tỷ lệ phiên
Trong hệ thống IPTV, các phiên hoạt động của người dùng không phải là các biến ngẫu nhiên độc lập. Thay vào
đó, tất cả chúng đều được điều chỉnh bởi một quá trình bên ngoài: lịch trình chương trình TV ( Qiu, Ge, Lee, Wang,
Xu và Zhao , 2009 ) và hoạt động hàng ngày của người dùng. Do đó, việc xếp chồng các phiên hoạt động cho tất cả
người dùng trong hệ thống không phải là một quá trình ngẫu nhiên riêng về lâu dài.

7.2.2.1 Lập mô hình hàng ngày

Fi gures 7.4 (a) –7.4 (c) minh họa tốc độ mà tất cả người dùng trong hệ thống bật và tắt thiết bị TV của họ và
thay đổi giữa các kênh trong một ngày thông thường. Dữ liệu được lấy mẫu cách nhau một phút. Tỷ lệ
phiên bật / tắt biểu thị số lượng UE được bật / tắt trong khoảng thời gian mẫu, được chuẩn hóa thành số lần
tắt / bật UE ở đầu khoảng thời gian tương tự. Tỷ lệ phiên kênh là số lần thay đổi kênh trong khoảng thời
gian lấy mẫu, được chuẩn hóa thành số lượng UE trực tuyến trong cùng một khoảng thời gian. Gures cho
thấy rằng trong khi tỷ giá phiên
7.2. Hoạt động người dùng 77

× 10 - 3
5 1.005
r X∗ r X ∗30 r X ∗15 r X ∗10 r X ∗6,66
4 60 phút 30 phút
20 phút 15 phút 12 phút 10 phút 7,5 phút6,66 phút 1
3

r X∗=S X∗/ S 0
X x ( f)

2
0,995
1

0 0,99
0 0,02 0,04 0,06 0,08 0,1 0,12 0,14 0,16 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1
× 10 - 3
f [ min - 1] Ngưỡng lọc X ∗

π 10 4
l X∗ l X ∗30 l X ∗15 l X ∗10 l X ∗6,66
π

Kích thước phổ ( l X ∗)


2 10 3
φ x ( f)

10 2

2

-π 10 1
0 0,02 0,04 0,06 0,08 0,1 0,12 0,14 0,16 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1
× 10 - 3
f [ min - 1] Ngưỡng lọc X ∗

(a) Đặc tính tần số (độ lớn X x và giai đoạn (b) Sức mạnh chuẩn hóa của tỷ lệ phiên mô hình ( S k / S),
φ x) tỷ lệ phiên trực tuyến x trên. và số lượng các thành phần quang phổ so với thresh-
cũ k.

× 10 - 3
5 0,1 0,1
X ∗30 ⊂ X ∗15 ⊂ X ∗10 ⊂ X ∗6,66 Dấu vết Tra e
4 0,08 X ∗30 0,08 X ∗15
c

x trên( t) [ min - 1]

x trên( t) [ min - 1]
3 0,06 0,06
X x ( f)

30 phút 15 phút 10 phút 6,66 phút


2 0,04 0,04

1 0,02 0,02

0 0 0
0 0,02 0,04 0,06 0,08 0,1 0,12 0,14 0,16 0 6 12 18 24 0 6 12 18 24

f [ min - 1] t [ h] t [ h]

π 0,1 0,1
X ∗30 ⊂ X ∗15 ⊂ X ∗10 ⊂ X ∗6,66 Dấu vết Tra e
π 0,08 X ∗10 0,08 X ∗6,66
c
x trên( t) [ min - 1]

x trên( t) [ min - 1]
2
0,06 0,06
φ x ( f)

0
0,04 0,04

2 0,02 0,02

-π 0 0
0 0,02 0,04 0,06 0,08 0,1 0,12 0,14 0,16 0 6 12 18 24 0 6 12 18 24

f [ min - 1] t [ h] t [ h]

(c) Nửa bên trái của phổ tốc độ phiên được mô hình chấp thuận. (d) So sánh tốc độ phiên được tạo lại cho các mô-đun với các giá
trị ngưỡng và số lượng thước đo khác nhau.

Hình 7.5: Mô hình hóa tỷ lệ phiên hàng ngày với phân tích tần suất.

có vẻ phức tạp, nó cũng thể hiện một mô hình trực quan dựa trên hoạt động gia tăng của người dùng vào
buổi sáng và buổi tối.
Để mô hình hóa tốc độ phiên với mức độ phức tạp cao như vậy trong miền thời gian, Qiu et al. ( Qiu, Ge,
Lee, Wang, Xu và Zhao , 2009 ) đề xuất một cách tiếp cận khác dựa trên phân tích tần số. Tuy nhiên, trong khi
ý tưởng tiên phong của họ có giá trị, nó không nắm bắt được mức độ phức tạp của dữ liệu. Vì lý do này,
chúng tôi mở rộng mô hình của họ với cách tiếp cận tương tự nhưng triệt để hơn. Ngoài ra, chúng tôi còn
đưa mô hình của mình tiến thêm một bước nữa bằng cách tích hợp mô hình hoạt động hàng tuần.

Vì phương pháp chúng tôi trình bày là giống nhau đối với tỷ lệ của cả ba loại phiên, được biểu thị bằng x trên,
x tắt , x ch, chúng tôi sẽ chỉ minh họa kỹ thuật cho một trong số chúng. Bằng cách dựa vào phân tích Fourier,
mục tiêu của chúng tôi là tạo ra một tập hợp đủ nhỏ các thành phần quang phổ có thể mô tả chính xác
hàm miền thời gian. Các fi gures 7,5 (a) –7,5 (d) cho thấy tốc độ phiên có một số lượng nhỏ các thành phần
phổ chi phối, tập trung vào các khoảng thời gian nhất định tại 60 phút, 30 phút, 15 phút, v.v., tương ứng với
chương trình TV. Ngoài ra, một số thành phần biên độ cao tần số thấp mô tả mô hình ngày.

Không giống như mô hình Qiu, chúng tôi không cố gắng xấp xỉ phổ tỷ lệ phiên bằng một hàm liên tục.
Đầu tiên, chúng tôi hiểu rằng bất kỳ sự xấp xỉ nào của các thành phần quang phổ quan trọng đều có ảnh
hưởng nghiêm trọng đến miền thời gian và thứ hai, thông tin về pha (mà
78 Chương 7. Mô hình khối lượng công việc

các tác giả của ( Qiu, Ge, Lee, Wang, Xu và Zhao , 2009 ) không có mô hình nào cả) không thể dễ dàng xấp xỉ
bằng bất kỳ hàm biết nào. Thay vào đó, mô hình của chúng tôi dựa vào việc xác định các thành phần tần số
chi phối.
Hướng tới mục tiêu này, chúng tôi áp dụng phương pháp tiếp cận dựa trên ngưỡng cho cường độ phổ,
trong đó giá trị ngưỡng X ∗ được lựa chọn dựa trên (i) các thành phần được chọn chứa một phần hợp lý của
công suất tín hiệu, (ii) mô hình bao gồm số lượng thành phần phổ chiếm ưu thế mong muốn và (iii) số
lượng các thành phần phổ và do đó các tham số của mô hình là nhỏ. Để xác định một ngưỡng tốt, trong fi
gure 7,5 (b), chúng tôi hiển thị tỷ lệ công suất của mô hình
tín hiệu, được biểu thị bằng r X ∗ cho một ngưỡng thay đổi X ∗. Chúng ta có:

SX∗
rX∗=S0 , (7,3)

Ở đâu S X ∗ là sức mạnh của tốc độ phiên trực tuyến được mô hình hóa, chỉ chứa các thành phần tần số có
cường độ X ≥ X ∗, và S 0 là sức mạnh của toàn bộ chức năng.
Đối với ngưỡng thỏa mãn hai điều kiện cuối cùng, chúng tôi chọn ngưỡng cường độ có chứa tập hợp
các thành phần tần số có liên quan. Từ tập hợp các tần số ưu thế được xác định trong fi gure 7.5 (a), chúng
tôi chọn một tập hợp các giá trị ngưỡng bao gồm dần dần các thành phần
lúc 30, 15, 10 và 6,66 phút. Chúng tôi biểu thị các ngưỡng này bằng X ∗
30, X ∗ 15, X ∗ 10, và X ∗ 6,66. Bất cứ gì
ngưỡng nhỏ hơn, mô hình của chúng tôi thu được sự gần đúng ngày càng tốt hơn của dấu vết thực, với chi
phí của một số lượng lớn hơn các tham số mô hình.

Ngưỡng X ∗ Kích thước phổ l X ∗ Tỷ lệ công suất r X ∗ Tham số mô hình (thực + phức tạp)

X 30
∗ 14 + 1 99,28% 9+7

X 15
∗ 24 + 1 99,51% 14 + 12

X 10
∗ 46 + 1 99,75% 25 + 23

X 6,66
∗ 114 + 1 99,89% 59 + 57

Bảng 7.2: Đặc điểm phổ phiên trực tuyến cho các giá trị ngưỡng đã chọn.

Bảng 7.2 chứa kích thước phổ, tỷ lệ công suất và các thông số mô hình mà chúng tôi thu được cho mỗi
ngưỡng. Fi gure 7,5 (c) minh họa số lượng mẫu phổ được Từng bước
được đưa vào mô hình với ngưỡng ngày càng nhỏ hơn, X ∗, tức là các mẫu cho một lượng lớn X ∗ cũng là một
phần trong quang phổ của một nhóm nhỏ X ∗. Trong khi ngưỡng nhỏ hơn sẽ tăng thêm độ chính xác cho mô
hình, nó cũng làm tăng số lượng thông số của mô hình. Chúng ta lưu ý rằng mỗi thành phần phổ, độ lớn và
pha, đại diện cho cùng một số phức, và phổ đối xứng về độ lớn và phản đối xứng về pha, ngoại trừ thành
phần liên tục ở tần số không.
Do đó, đối với một số l X ∗ các tần số trong phổ, bao gồm cả thành phần liên tục, mô hình sẽ có ( l X ∗ - 1) / 2
tham số phức tạp mô tả từng thành phần quang phổ tại f> 0 và
( l X ∗ + 3) / 2 tham số thực mô tả giá trị tần số và độ lớn của thành phần liên tục.

Fi gure 7,5 (d) tóm tắt tỷ lệ phiên trực tuyến, x trên, được tạo từ mô hình tần suất của chúng tôi bằng cách sử
dụng các giá trị ngưỡng và số lượng thông số khác nhau. Chúng ta có thể quan sát thấy rằng một mô hình
sử dụng ngưỡng thấp hơn X ∗ và một bộ tham số lớn hơn gần đúng với dữ liệu gốc hơn. Do đó, việc chọn một
ngưỡng có liên quan phụ thuộc vào việc đạt được độ chính xác mong muốn, đặc biệt là đối với các sự kiện thoáng
qua.
Trong fi gures 7.6 (a) –7.6 (c), chúng tôi minh họa và so sánh mô hình tần suất của chúng tôi cho từng
loại phiên với dữ liệu theo dõi ban đầu. Đối với mô hình, chúng tôi đã chọn hai ngưỡng, một ngưỡng cao và
một ngưỡng thấp. Fi gure thể hiện sự cân bằng giữa số lượng các thông số đặc trưng cho mô hình và độ
chính xác của nó.
7.2. Hoạt động người dùng 79

× 10 - 2
0,1 1,5
0,3

x trên( t) [ min - 1]
Dấu vết Dấu vết Dấu vết

x ch ( t) [ min - 1]
x tắt ( t) [ min - 1]
1
0,2
0,05
0,5 0,1

0 0 0
0 3 6 9 12 15 18 21 24 0 3 6 9 12 15 18 21 24 0 3 6 9 12 15 18 21 24
t [ h] t [ h] t [ h]
× 10 - 2
0,1 1,5
Mô hình X ∗ 6,66 Mô hình X ∗ 5.5 0,3 Mô hình X ∗ 5.5
x trên( t) [ min - 1]

x ch ( t) [ min - 1]
x tắt ( t) [ min - 1]
Mô hình X ∗ 30 1 Mô hình X ∗ 60 Mô hình X ∗ 60
0,2
0,05
0,5 0,1

0 0 0
0 3 6 9 12 15 18 21 24 0 3 6 9 12 15 18 21 24 0 3 6 9 12 15 18 21 24
t [ h] t [ h] t [ h]

(a) Tỷ lệ phiên trực tuyến x trên (b) Tỷ lệ phiên x tắt (c) Tỷ lệ phiên kênh x ch
mô hình. mô hình. mô hình.

Hình 7.6: Giá trị gần đúng của tỷ lệ phiên hàng ngày với mô hình tần suất của chúng tôi.

7.2.2.2 Xác định số lượng UE trực tuyến / xuất hiện

Chúng tôi không lập mô hình trực tiếp số lượng UE trực tuyến / trong tổng số các UE trực tuyến và thay vào đó, chúng
được mô hình hóa gián tiếp thông qua tỷ lệ phiên. Để đơn giản, chúng tôi sẽ chuẩn hóa tất cả các giá trị sao cho tổng của
tất cả các UE trong hệ thống là 1. Do đó, chúng tôi có thể tham khảo số lượng trực tuyến / của fl ine
UE là tỷ lệ UE trực tuyến / trong tổng số, đóng góp bởi r trên và r tắt , tương ứng. Cách tiếp cận này có ưu điểm
là dễ dàng mở rộng đến bất kỳ số lượng UE tùy ý nào. Vì thế:

r trên + r tắt = 1. (7.4)

Theo dữ liệu có sẵn từ Qiu và các cộng sự, tỷ lệ phiên trực tuyến / không trực tuyến đo lường số lượng
UE được bật / tắt trong khoảng thời gian một phút, được chuẩn hóa thành số lượng UE ở trạng thái không
hoạt động / trực tuyến ở đầu của cùng một khoảng.

Hệ quả 1. Hãy để chúng tôi giả định một tùy ý ∆ khoảng thời gian t kết thúc tại thời điểm t. Nếu tỷ số UE trực tuyến / trong tổng số UE tại

đầu khoảng thời gian là r trên và r tắt , tương ứng, và tỷ lệ phiên trực tuyến / trong thời gian này
khoảng thời gian là r trên( t) và r tắt ( t), tương ứng, khi đó phần UE trực tuyến / của fl ine ở cuối khoảng thời
gian là:

r trên( t) = r trên( t - ∆ t) + x trên( t) r tắt ( t - ∆ t) ∆ t - x tắt ( t) r trên( t - ∆ t) ∆ t, r tắt ( t) = r tắt ( t - ∆ t)


(7,5)
+ x tắt ( t) r trên( t - ∆ t) ∆ t - x trên( t) r tắt ( t - ∆ t) ∆ t.

Bằng chứng. Từ định nghĩa tỷ lệ phiên bật / tắt đã nói ở trên, theo sau đó là phần tắt UE được bật là x trên r tắt ∆
t. Tương tự, phần của trên UE bị tắt là
x tắt r trên ∆ t.
Do đó, giải pháp sau đây.

Định lý 1. Cho một trạng thái ban đầu của hệ tại thời điểm t = 0 với ar trên( 0) và r tắt ( 0) tỷ lệ trực tuyến / trong tổng số UE
tương ứng. Cho trước một t> lớn nhất định 0, tỷ lệ UE trực tuyến / trong tổng số UE tại thời điểm t, r trên( t) và r tắt ( t),
không phụ thuộc vào r trên( 0) và r tắt ( 0), và giá trị của chúng chỉ được xác định bởi tỷ lệ phiên trực tuyến / trong tổng số phiên.

Bằng chứng. Chúng tôi sẽ chứng minh định lý cho r trên( t). Bằng chứng cho r tắt ( t) là bổ sung cho nhau.
Từ phương trình 7.5 và 7.4, nó như sau:

r trên( t) = r trên( t - ∆ t) + x trên( t) ( 1 - r trên( t - ∆ t)) ∆ t - x tắt ( t) r trên( t - ∆ t) ∆ t,


( ) (7.6)
= r trên( t - ∆ t) 1 - x trên( t) ∆ t - x tắt ( t) ∆ t + x trên( t) ∆ t.
80 Chương 7. Mô hình khối lượng công việc

Hãy để chúng tôi biểu thị cho đơn giản các giá trị sau:

A (t) = 1 - x trên( t) ∆ t - x tắt ( t) ∆ t, B (t) = x trên(


(7.7)
t) ∆ t.

Do đó, phần nhỏ của các UE trực tuyến tại thời điểm t được xác định bởi phương trình đệ quy:

r trên( t) = A (t) · r trên( t - ∆ t) + B (t). (7.8)

Để giải phương trình này, tồn tại một ∆ t mà chúng ta có thể viết:

r trên( t) = A (t) · r trên( t - ∆ t) + B (t),


r trên( t - ∆ t) = A (t - ∆ t) · r trên( t - 2 ∆ t) + B (t - ∆ t), r trên( t - 2 ∆ t) = A
(t - 2 ∆ t) · r trên( t - 3 ∆ t) + B (t - 2 ∆ t), (7.9)
.
.
.

r trên( ∆ t) = A ( ∆ t) · r trên( 0) + B ( ∆ t).

Bằng cách thay thế, chúng tôi nhận được:

t t t
r trên( t) = r trên( 0) · ∏ A (u) + ∑ B (u) ∏ A (v). (7.10)
u=∆t u=∆t v=u+∆t
u←u+∆t u←u+∆t v←v+∆t

Từ việc xác định tỷ lệ phiên trực tuyến / không hoạt động và trừ khi hệ thống không hoạt động 1, cho một t
và ∆ t, chúng ta có:

0 < x trên( t) ∆ t + x tắt ( t) ∆ t < 2, (7.11)

bởi vì không thể tồn tại một số UE thay đổi trạng thái từ trực tuyến sang trực tuyến và từ ngoại tuyến, trong
một ∆ t, lớn hơn tổng số UE trong hệ thống 2.
Với điều kiện này, kết quả là - 1 < A (t) < 1, và khi nào t 0 sản phẩm đầu tiên trong
phương trình 7.10 có xu hướng bằng không. Do đó, khi t 0, chúng tôi có được rằng:

t t
r trên( t) u ∑ B (u) ∏ A (v), (7.12)
u=∆t v=u+∆t
u←u+∆t v←v+∆t

mà không phụ thuộc vào trạng thái ban đầu của hệ thống.

Các gures 7.7 (a) và 7.7 (b) cung cấp một cái nhìn sâu sắc đặc biệt về các liên kết từ định lý trước. Chúng
tôi đã mô phỏng sự phát triển của hệ thống IPTV bằng cách sử dụng mô hình tần số của tỷ lệ phiên, được
minh họa trong fi gure 7.7 (a), và phương trình đệ quy của tỷ lệ UE trực tuyến / trên mạng. Tại
thời điểm ban đầu, các UE được chia thành một nửa trực tuyến và một nửa trong r trên( 0) = r tắt ( 0) = 0,5. Kết
quả cho thấy rằng, ngoại trừ giai đoạn chuyển đổi ban đầu trong đó sản phẩm đầu tiên từ
phương trình 7.10 có xu hướng bằng không, tỷ số UE r trên và r tắt chỉ phụ thuộc vào x trên và x tắt . Vì lý do
tương tự, cả hai biến đều có mô hình ngày mạnh tương ứng với tỷ giá phiên.
1 Đó là x trên( t) = x tắt ( t) = 0 cho bất kỳ t.
2 Một UE được coi là đã thay đổi trạng thái nếu ở cuối ∆ t khoảng thời gian có một trạng thái khác với lúc đầu. Nó có
không thành vấn đề nếu cùng một UE thay đổi trạng thái nhiều lần trong ∆ t. Điều kiện chỉ đơn giản nói rằng ở cuối ∆ t chúng tôi không thể có
nhiều UE hơn ở cả trạng thái bật và tắt, so với số lượng chúng tôi có lúc đầu. Ở cực điểm, nếu tất cả các UE
thay đổi trạng thái, sau đó x trên( t) ∆ t = x tắt ( t) ∆ t = 1. Tuy nhiên, cực đoan này không thể xảy ra đối với bất kỳ ∆ t, vì luôn tồn tại một cái nhỏ hơn ∆
t mà ít nhất một UE không thay đổi trạng thái.
7.2. Hoạt động người dùng 81

0,1 2
x trên ( mô hình) 1 Một phần của UE trực tuyến: r trên
x tắt ( mô hình) Một phần trong số các UE: r tắt
0,09 1,8

0,08 1,6
Hội tụ từ
0,5 trạng thái ban đầu
0,07 1,4

0,06 1,2
0
x [ min - 1]

0,05 1 0 1 2 3

r
0,04 0,8

0,03 0,6
Trạng thái ổn định

0,02 0,4

0,01 0,2

0 0
0 3 6 9 12 15 18 21 24 1 2 3 4 5 6 7 số 8

t [ h] t [ ngày]

(a) Tỷ lệ phiên trực tuyến / trong tổng số phiên x trên( t), x tắt ( t) phù hợp (b) Sự phát triển của tỷ lệ UE trực tuyến / trên mạng so với tỷ lệ
với mô hình tần số của chúng tôi. phiên được mô hình hóa.

Hình 7.7: Tỷ số UE trực tuyến / trong tổng số: r trên( t), r tắt ( t).

1,4
Dấu vết r trên ( đo lường)
Dấu vết r trên ( tính toán)
1,3
Mô hình r trên

1,2

1.1

1
r trên

0,9

0,8

0,7

0,6

0,5
0 1 2 3 4 5 6 7

t [ ngày]

Hình 7.8: So sánh tỷ lệ UE trực tuyến giữa dấu vết thực và mô hình.

7.2.2.3 Mô hình hóa mô hình hàng tuần

Trong fi gure 7.8, chúng tôi so sánh mô hình với dữ liệu theo dõi trong khoảng thời gian một tuần, được chuẩn hóa
lại thành giá trị trung bình thu được từ mô hình. Trong khi mô hình của chúng tôi tạo ra tỷ lệ UE trực tuyến / trên
mạng tương tự như dấu vết thực, hai điểm khác biệt chính trở nên rõ ràng. Đầu tiên, mức sử dụng TV cao điểm vào
buổi tối vượt quá giá trị dự đoán của chúng tôi một chút. Thứ hai, tồn tại một mô hình rõ ràng hàng tuần về số
lượng UE trực tuyến, tương ứng với việc tăng mức sử dụng TV vào cuối tuần. Các
dấu vết r trên đã thu được theo hai cách: được đo trực tiếp và được tính toán từ tỷ lệ phiên, tương tự như mô
hình của chúng tôi. Ngày đầu tiên trong tuần, ngày 0, là Chủ nhật.
Fi gure minh họa rằng mô hình của chúng tôi xấp xỉ rất tốt tỷ lệ người dùng được tính toán, tuy nhiên,
có sự khác biệt lớn hơn so với mô hình được đo trực tiếp. Lý do cho những khác biệt này nằm ở sự hiểu biết
tinh tế về những hạn chế của dữ liệu đo được. Đầu tiên, dữ liệu được công bố gần đúng với mức sử dụng TV
trong đời thực và có độ phân giải giới hạn về thời gian. Ví dụ: độ phân giải thời gian của tốc độ phiên là một
phút, và do đó thông tin có giá trị về động lực của hệ thống, ở các thang thời gian nhỏ hơn sẽ bị mất. Thứ
hai, các tham số của mô hình tỷ lệ phiên được xác định bằng cách kiểm tra dữ liệu theo dõi từ một ngày
điển hình. Tuy nhiên, có thể điển hình như ngày đó, dữ liệu đo được không nắm bắt được sự thay đổi nhỏ
trong các thang thời gian lớn, chẳng hạn như tuần.

Vì vấn đề đầu tiên chỉ có thể được giải quyết bằng các phép đo của hệ thống IPTV đã triển khai chính xác
hơn, nên trong phần này, chúng tôi sửa đổi mô hình của mình để giải quyết mô hình hàng tuần của
82 Chương 7. Mô hình khối lượng công việc

0,1 1,5
Mô hình r trên quang phổ Dấu vết r trên
0,08 Thiếu thành phần tần suất hàng tuần Dấu vết r trên thành phần liên tục và cơ bản (hàng tuần)
1,4
trong mô hình
0,06
1,3
Xr

0,04
1,2
0,02 Y 0 + Y 1 cos (2 πf 0 t + φ Y, 1)

1.1
0
0 5 10 15 20 25 30

r trên
1
f [ tuần - 1]
0,1
0,9
Dấu vết r trên quang phổ
0,08 Dấu vết r trên thành phần cơ bản (hàng tuần)
0,8
0,06
Yr

Y1 0,7
0,04
2
0,6
0,02

0 0,5
0 5 10 15 20 25 30 0 1 2 3 4 5 6 7

f [ tuần - 1] t [ ngày]

(a) So sánh đặc tính tần số giữa các mô hình X và theo dõi Y. (b) Sự phát triển của tỷ lệ UE trực tuyến / trên mạng, thu được
với tỷ lệ phiên được mô hình hóa.

Hình 7.9: Phân tích tần suất của dữ liệu tỷ lệ UE trực tuyến.

số lượng UE trực tuyến / trong tổng số các UE. Vì tỷ lệ UE trực tuyến / trên mạng được lập mô hình gián tiếp thông
qua tỷ lệ phiên trực tuyến / trực tuyến, chúng tôi phải sửa đổi mô hình tỷ lệ phiên để phù hợp với các biến thể
hàng tuần. Phương pháp chúng tôi đề xuất như sau.

• Chúng tôi thực hiện phân tích tần suất trước trên dấu vết dữ liệu để xác định sự khác biệt hàng tuần về số
lượng UE trực tuyến.

• Chúng tôi đề xuất một chức năng điều biến M (t) cho tỷ lệ UE trực tuyến r trên( t) gần đúng với dữ liệu đo
được.

• Chúng tôi tính toán tỷ lệ phiên trực tuyến / trong tổng số phiên mới, được biểu thị bằng r ∗ t) và r ∗
trên( tắt ( t).

Bằng cách áp dụng phép biến đổi Fourier rời rạc trên dữ liệu vết, chúng tôi xác định tần số chính
các thành phần trong số lượng các UE trực tuyến. Chúng tôi biểu thị đặc tính tần số của mô hình r trên
bởi X, và dấu vết r trên bởi Y. Trong fi gure 7.9 (a), so sánh hai phổ, chúng tôi ngay lập tức quan sát thấy rằng
dữ liệu vết có thêm thành phần tần số với chu kỳ hàng tuần. Để cho
chúng tôi biểu thị tần suất hàng tuần này bằng f 0, và cường độ và giai đoạn thành phần hàng tuần bằng Y 1
và φ Y, 1, tương ứng. Ngoài ra, chúng tôi biểu thị bằng Y 0 thành phần liên tục của dấu vết r trên,
và bởi Y Tôi độ lớn của thành phần ở tần số Tôi · f 0. Fi gure 7.9 (b) hiển thị các thành phần giống nhau trong
miền thời gian.
Dựa trên phân tích tần số, chúng tôi có thể viết mô hình và theo dõi r trên xét về các thành phần tần số
chi phối của chúng, như sau.

r trên( t) | mô hình = X 0

+ X 7 cos (2 π 7 f 0 t + φ X, 7)
+ X 14 cos (2 π 14 f 0 t + φ X, 14)
+ X 21 cos (2 π 21 f 0 t + φ X, 21) + · · ·,
r trên( t) | dấu vết u Y 0 (7.13)
+ Y 1 cos (2 π f 0 t + φ Y, 1)
+ Y 7 cos (2 π 7 f 0 t + φ Y, 7)
+ Y 14 cos (2 π 14 f 0 t + φ Y, 14)
+ Y 21 cos (2 π 21 f 0 t + φ Y, 21) + · · ·.
7.2. Hoạt động người dùng 83

Để có được tỷ lệ UE trực tuyến theo dõi từ tỷ lệ được mô hình hóa, chúng tôi đề xuất một hàm điều chế M
(t), như vậy mà:

r trên( t) | dấu vết = M (t) · r trên( t) | mô hình , (7.14)

trong đó hàm điều chế có dạng:

M (t) = M 0 + M 1 cos (2 π f 0 t + φ M). (7,15)

Cơ sở lý luận để chọn một chức năng điều chỉnh, thay vì chỉ đơn giản là thêm thành phần cơ bản vào mô
hình, là một sản phẩm tạo điều kiện thuận lợi cho việc chuyển đổi tỷ lệ phiên trực tuyến / của phiên. Kết quả
chúng tôi thu được là một kết quả gần đúng, do (i) khó khăn trong việc khớp biên độ và pha của tất cả các
thành phần phổ chi phối, và (ii) sự xuất hiện của các thành phần phổ xung quanh các tần số chi phối. Tuy
nhiên, vì điều cần thiết là phải lập mô hình số lượng UE thông qua tốc độ phiên, nên hàm điều chế chỉ có ba
tham số và vì lỗi nhỏ, chúng tôi cảm thấy rằng cách tiếp cận này là một sự thỏa hiệp tốt. 3.

Bằng cách điều chỉnh mô hình r trên( t) với M (t), chúng tôi đạt được:

r trên( t) | dấu vết = M (t) · r trên( t) | mô hình

= X0 M0
+ X 0 M 1 cos (2 π f 0 t + φ X, 1)
+ X 7 M 0 cos (2 π 7 f 0 t + φ X, 7)
1 1
+ X 7 M 1 cos (2 π 6 f 0 t + φ X, 7 - φ M) + 2 X 7 M 1 cos (2 π số 8 f 0 t + φ X, 7 + φ M)
2
+ X 14 M 0 cos (2 π 14 f 0 t + φ X, 14)
1 1
+ X 14 M 1 cos (2 π 13 f 0 t + φ X, 14 - φ M) + 2 X 14 M 1 cos (2 π 15 f 0 t + φ X, 14 + φ M) + · · ·.
2
(7.16)

Bằng cách xác định độ lớn và pha của các tần số quan trọng nhất, chúng tôi tìm ra các tham số của hàm
điều chế:

Y 0,
M0=X0

Y 1, (7,17)
M1=X0

φ M = φ Y, 1.

Tuy nhiên, do tính gần đúng trong mô hình, chúng ta phải cẩn thận rằng tốc độ phiên được điều chỉnh
không vượt quá khoảng [0, 1]. Nếu các ranh giới này bị vượt quá, chúng tôi phải sửa đổi chức năng điều chế
cho phù hợp.

Định lý 2. Hãy để r trên( t) và r tắt ( t) là tỷ lệ UE trực tuyến / trong tổng số UE, thu được từ phiên trực tuyến / trong tổng số
tỷ lệ, x trên và x tắt . Cho hàm điều biến liên tục M (t), trong trạng thái dừng của hệ
chúng tôi có được một tỷ lệ UE trực tuyến mới r ∗ trên( t) = M (t) r trên( t) và tỷ lệ UE fl trong r ∗ tắt ( t) = 1 - r ∗ trên( t) khi nào
tỷ lệ phiên trực tuyến / trong tổng số phiên mới là:

3 Có thể đề xuất một hàm điều chế phức tạp hơn với các thành phần phổ ở nhiều tần số.
84 Chương 7. Mô hình khối lượng công việc

x trên(
∗ t) = M (t) x trên( t),
(7,18)
x tắt
∗ ( t) = ( 1 - M (t)) x trên( t) + x tắt ( t).

Bằng chứng. Từ định lý 1, tỷ lệ UE trực tuyến là:

t t t
r trên( t) = r trên( 0) ∏ A (u) + ∑ B (u) ∏ A (v), (7.19)
u=∆t u=∆t v=u+∆t
u←u+∆t u←u+∆t v←v+∆t

Ở đâu:

A (t) = 1 - x trên( t) ∆ t - x tắt ( t) ∆ t, B (t) = x trên(


(7.20)
t) ∆ t.

Tương tự, với tỷ lệ phiên mới x ∗ trên( t), xtắt


∗ ( t), UE trực tuyến được điều chế là:

t t t
r trên(
∗ t) = r ∗trên( 0) ∏ A ∗ ( u) + ∑ B ∗ ( u) ∏ A ∗ ( v), (7.21)
u=∆t u=∆t v=u+∆t
u←u+∆t u←u+∆t v←v+∆t

Ở đâu:

A ∗ ( t) = 1 - x ∗ trên( t) ∆ t - x t∗ắt ( t) ∆ t,
(7.22)
B ∗ ( t) = x ∗ trên( t) ∆ t.

Chúng ta có:

t t t
r trên(
∗ t) = M (t) r trên( t) = r trên( 0) M (t) ∏ A (u) + M (t) ∑ B (u) ∏ A (v), (7.23)
u=∆t u=∆t v=u+∆t
u←u+∆t u←u+∆t v←v+∆t

nơi chúng tôi xác định:

t t
∏ A ∗ ( u) = M (t) ∏ A (u),
u=∆t u=∆t
u←u+∆t u←u+∆t
(7.24)
t t t t
∑B∗( u) ∏ A ∗ ( v) = M (t) ∑ B (u) ∏ A (v)
u=∆t v=u+∆t u=∆t v=u+∆t
u←u+∆t v←v+∆t u←u+∆t v←v+∆t

Từ đẳng thức thứ nhất, chúng ta có được rằng:

A ∗ ( ∆ t) = M ( ∆ t) A ( ∆ t),
M ( 2 ∆ t) A ( 2 ∆ t),
A ∗ ( ∆ t) A ∗ ( 2 ∆ t) = M ( 2 ∆ t) A ( ∆ t) A ( 2 ∆ t) ⇒ A ∗ ( 2 ∆ t) = M ( ∆ t)
M ( 3 ∆ )t
A ∗ ( ∆ t) A ∗ ( 2 ∆ t) A ∗ ( 3 ∆ t) = M ( 3 ∆ t) A ( ∆ t) A ( 2 ∆ t) A ( 3 ∆ t) ⇒ A ∗ ( 3 ∆ t) = A ( 3 ∆ t),
M ( 2 ∆ t)
.
.
.

(7.25)
và nói chung:
7.2. Hoạt động người dùng 85

M (t)
A ∗ ( t) = M (t - ∆ t) A (t). (7.26)

Bằng cách thay thế đẳng thức cuối cùng trong phần thứ hai của phương trình 7.24, chúng ta thu được:

t t t t
M (v)
∑ B ∗ ( u) ∏ A ∗ ( v) = ∑ B ∗ ( u) ∏ A (v)
u=∆t v=u+∆t u=∆t v=u+∆tM (v - ∆ t)
u←u+∆t v←v+∆t u←u+∆t v←v+∆t
t
M (t) ∏ A (v)
t
= ∑ B ∗ ( u) M (u) v = u + ∆ t (7.27)
u=∆t
u←u+∆t v←v+∆t
t t
= M (t) ∑ B ∗ ( u)
u=∆tM (u) ∏ Av =(v).
u+∆t
u←u+∆t v←v+∆t

Do đó, chúng tôi có được:

B ∗ ( t) = M (t) B (t). (7.28)

Bây giờ, chúng ta hãy xem xét một ∆ t. Sau đó, chúng ta có thể ước lượng:

A ∗ ( t) ≈ A (t). (7.29)

Do đó, xem xét các khái niệm của A ∗ và B ∗, chúng tôi cuối cùng thu được:

x trên(
∗ t) ∆ t = M (t) x trên( t) ∆ t ⇒ x trên(
∗ t) = M (t) x trên( t),

1 - x ∗ trên( t) ∆ t - x t∗ắt ( t) ∆ t ≈ 1 - x trên( t) ∆ t - x tắt ( t) ∆ t ⇒ x ∗ tắt ( t) = ( 1 - M (t)) x trên( t) + x tắt ( t).


(7.30)

Bằng cách sử dụng biểu thức cuối cùng của các tham số hàm điều chế từ phương trình 7.17, chúng tôi
tìm ra giá trị của các tham số này, bằng cách áp đặt các điều kiện biên bổ sung:

0 ≤ x ∗trên( t) ≤ 1, 0 ≤ x ∗tắt ( t) ≤ 1,
(7,31)
0 ≤ r ∗ trên( t) ≤ 1, 0 ≤ r ∗tắt ( t) ≤ 1,

tức là tỷ lệ phiên được điều chỉnh và tỷ lệ UE không được vượt quá khoảng [0, 1] 4.
Để thỏa mãn các giới hạn này, chúng tôi chọn điều chỉnh một chút, nếu cần, biên độ của
thành phần hàng tuần M 1 bởi vì nó chỉ ảnh hưởng đến sự thay đổi hàng tuần về số lượng UE trực tuyến / trong
tổng số các UE thay vì trung bình. Để giải hệ bất phương trình, chúng ta hãy xem xét M (t) de fi ned
theo phương trình 7.15, và chúng ta hãy biểu thị t + và t - bất kì t mà chúng tôi có:

cos (2 π f 0 t + + φ M) ≥ 0, ∀ t +,
(7,32)
cos (2 π f 0 t - + φ M) < 0, ∀ t -,

Bằng cách loại bỏ từng bất đẳng thức sang một bên, chúng ta thu được các giới hạn sau:

4 Theo định nghĩa của tốc độ phiên, chúng ta không thể có thêm UE thay đổi trạng thái trực tuyến hoặc trạng thái trong bất kỳ ∆ t hơn
chúng tôi đã có trước đây. Tương tự như vậy, theo định nghĩa của các tỷ lệ UE, chúng ta không thể có số lượng các UE ở trạng thái trực tuyến
hoặc ở trạng thái không hoạt động, lớn hơn tổng số các UE trong hệ thống.
86 Chương 7. Mô hình khối lượng công việc

x trên(
∗ t) = M (t) x trên( t)
x tắt
∗ ( t) = ( 1 - M (t)) x trên( t) + x tắt ( t)
0,1

x ∗ ( t)
0,05

0
0 1 2 3 4 5 6 7

t [ ngày]

r trên( t)
r trên(

Tỷ lệ UE trực tuyến
∗ t) = M (t) r trên( t)
1

0,8

0,6
0 1 2 3 4 5 6 7

t [ ngày]

Hình 7.10: Tỷ lệ UE trực tuyến được điều chế r ∗ trên thu được từ x ∗ trên và x ∗ tắt .

- M 0 ≤ M 1 ≤ M 0, {
{ } }
1 / x trong( t -) - M 0 1 / x trong( t +) - M 0
tối đa ≤ M 1 ≤ tối thiểu { ,
cos (2 π f 0 t - + φ M)} cos (2 π f 0 t + + φ M)
{ }
1 - M 0 + x tắt ( t -) / x trên( t -) ≤ M 1 ≤ tối thiểu { 1 - M 0 + x tắt ( t +) / x trên( t +)
tối đa ,
cos (2 π f 0 t - + φ M) cos (2 π f 0 t + + φ M)
{ } }
1 - M 0 - ( 1 - x tắt ( t +)) / x trên( t +) 1 - M 0 - ( 1 - x tắt ( t -)) / x trên( t -)
tối đa ≤ M 1 ≤ tối thiểu { ,
cos (2 π f 0 t + + φ M) cos (2 π f 0 t - + φ M)
{ } }
1 / r trên( t -) 1 / r trên( t +)
tối đa ≤ M 1 ≤ min .
cos (2 π f 0 t - + φ M) cos (2 π f 0 t + + φ M)
(7,33)

Bằng cách giải phương trình cho M 1, tuân theo các ràng buộc trước đó, chúng tôi nhận được giá trị 0,0741, nhỏ hơn
một chút so với giá trị lý tưởng 0,0943 được đưa ra bởi phương trình 7.17 5. Do đó, các biến thể hàng tuần
với số lượng UE trực tuyến / trong số các UE trực tuyến sẽ không lớn như dấu vết, nhưng chúng tôi tin rằng việc
chọn chức năng điều chế theo cách này thể hiện một sự thỏa hiệp tốt cho mô hình của chúng tôi. Trong bàn
7.3, chúng tôi tóm tắt các tham số của hàm điều chế M (t).

Tham số Giá trị

M0 0,96068

M1 0,07408

φM 0,22189

Bảng 7.3: Các tham số của hàm điều chế M (t).

Cuối cùng, chúng tôi sửa đổi tỷ lệ phiên trực tuyến / trong tổng số phiên, sao cho tỷ lệ UE trực tuyến / trong tổng số
kết quả của UE được điều chỉnh bởi M (t). Trong fi gure 7.10, chúng tôi minh họa kết quả của định lý trước, nơi chúng tôi
thu được tỷ lệ UE trực tuyến được điều chế r ∗
trên, bằng cách thay thế tỷ giá phiên bằng x∗ trên và
x tắt
∗ . Cuối cùng, chúng tôi xác minh rằng những thay đổi này đối với tỷ lệ phiên không làm thay đổi đáng kể mô hình dựa trên tần
suất ban đầu của chúng tôi. Cuối cùng, sự tương tự về cosine là:

5 Trên thực tế, giá trị được chọn cho M 1 có thể thấp hơn một chút để tính sai số về độ chính xác của máy.
7.2. Hoạt động người dùng 87

800 0,1
PDF e trên ( dấu vết)
1 0,08
PDF N µ, σ
Âm mưu QQ

x trên( t) [ min - 1]
700
0,8 0,06

600 0,6 0,04

0,4 0,02
500
0,2 0
0 4 số 8 12 16 20 24
400 0
PDF

0 0,5 1 t [ h]
0,1
300
0,08

X trên( t) [ min - 1]
200 0,06

0,04
100
0,02

0 0
- 0,01 - 0,008 - 0,006 - 0,004 - 0,002 0 0,002 0,004 0,006 0,008 0,01 0 4 số 8 12 16 20 24

e trên [ min - 1] t [ h]

(a) So sánh PDF và định lượng của lỗi e trên (b) Mô hình hóa tỷ lệ phiên trực tuyến như x trên có nghĩa là với
với phân phối chuẩn N µ, σ. một lỗi Gaussian cộng.

Hình 7.11: Mô hình hóa các đặc tính ngẫu nhiên của tỷ lệ phiên trực tuyến.

x trên · x ∗trên
S cos, trên = ‖ x trên ‖‖ x ∗
trên ‖ u 0,9986,
x tắt · x ∗tắt (7,34)
S cos, tắt = ‖ x tắt ‖‖ x ∗
tắt ‖ u 0,9479,

điều này cho thấy rằng sự khác biệt giữa tỷ lệ phiên ban đầu và phiên bản sửa đổi là không đáng kể.

7.2.3 Thuộc tính ngẫu nhiên

Tỷ lệ phiên trực tuyến, trong tổng số và kênh, được tạo với mô hình trước đó, có bản chất xác định. Ý tưởng
đằng sau phân tích và mô hình hóa của chúng tôi, dựa trên các đặc tính tần số, là khai thác các thành phần
tần số chi phối tạo ra các mẫu lặp lại từ các thang thời gian, từ một tuần đến vài phút. Tuy nhiên, có một
nhược điểm là cách tiếp cận của chúng tôi không nắm bắt được bất kỳ sự ngẫu nhiên vốn có nào từ quá
trình thực tế. Trong thực tế, mặc dù tỷ lệ phiên không phải là biến ngẫu nhiên độc lập, được kết hợp bởi cả
hoạt động của con người trên quy mô lớn (hàng ngày, hàng tuần, v.v.) và lịch chương trình truyền hình trên
quy mô nhỏ (giờ, phút), nhưng chúng vẫn là ngẫu nhiên. Do đó, trong phần này, chúng tôi phân tích sâu
hơn dữ liệu có sẵn, theo hướng thêm thuộc tính ngẫu nhiên vào tỷ giá phiên. Đây,

thuộc tính ngẫu nhiên của tỷ lệ phiên trực tuyến x trên, vì phân tích tương tự đối với những phân tích khác.
Chúng tôi bắt đầu từ tiền đề rằng, bất kể sự thiếu ngẫu nhiên của nó, mô hình tần suất đại diện cho một
mức trung bình. Do đó, hợp lý khi kết luận rằng tỷ lệ phiên trực tuyến thực
đại diện cho một độ lệch ngẫu nhiên từ mức trung bình này. Hãy để chúng tôi biểu thị bằng e trên( t) lỗi giữa tỷ lệ
phiên trực tuyến theo dõi và mô hình, tức là:

e trên( t) = x trên( t) | dấu vết - x trên( t) | mô hình . (7,35)

Mục tiêu của chúng tôi là xác định phân phối xác suất đặc trưng cho lỗi này. Về mặt trực quan, có hai
nguyên nhân gây ra lỗi này: (i) tính gần đúng trong mô hình tần số của chúng tôi không nắm bắt được tất cả
các thành phần tần số có liên quan và (ii) bản chất ngẫu nhiên của người dùng xem TV. Vì nguyên nhân đầu
tiên là một thuộc tính xác định, vì nó lặp lại đều đặn nên chúng tôi muốn loại trừ nó ra khỏi phân tích của
chúng tôi càng nhiều càng tốt.
Quan sát đầu tiên về lỗi trong miền thời gian chỉ ra rằng mẫu lỗi không tương tự
88 Chương 7. Mô hình khối lượng công việc

trong các khoảng thời gian khác nhau của cùng một ngày, được đặc trưng bởi các biến thể lớn hơn trong các giờ
buổi tối do các giá trị gần đúng trong mô hình tần suất gây ra. Để xác định thời gian điển hình trong ngày mà các
mẫu lỗi là đại diện, chúng tôi tính toán trung bình của lỗi và phương sai tại các thời điểm khác nhau bằng cách sử
dụng cửa sổ trượt W Để xác định một giá trị trung bình điển hình µ và phương sai
σ 2 đối với tập hợp mẫu lỗi, chúng tôi loại trừ việc sử dụng TV cao điểm vào buổi tối, vì việc cho phép một phương
sai lớn như vậy sẽ dẫn đến độ lệch cao trong tỷ lệ phiên tại các thời điểm, chẳng hạn như vào ban đêm hoặc buổi
sáng, trong khi thông thường chúng sẽ không xảy ra.
Trên tập dữ liệu còn lại, chúng tôi áp dụng ước lượng mật độ hạt nhân cho fi hàm mật độ xác suất của
nó. Như gure 7.11 (a) minh họa, PDF tương tự như một phân phối chuẩn có cùng µ và σ như các mẫu lỗi. Do
đó, có thể kết luận rằng tỷ giá phiên
lỗi có thể được mô hình hóa bằng quy trình Gaussian N µ, σ nghĩa là ở đâu µ gần bằng không. Một âm mưu
QQ, trong cùng một thiết kế, xác định sự phù hợp giữa dấu vết và phân phối chuẩn.
Về mặt này, nếu chúng ta biểu thị biến ngẫu nhiên tỷ lệ phiên trực tuyến bằng X trên( t), chúng ta có:

X trên( t) = x trên( t) + N µ, σ,
(7,36)
X ∗trên( t) = x ∗trên( t) + N µ, σ,

Ở đâu X ∗trên và x ∗ trên là các phiên bản được điều chế hàng tuần tương ứng. Hình 7.11 (b) minh họa
sự khác biệt giữa phiên bản ngẫu nhiên và xác định của tỷ lệ phiên trực tuyến. Bằng cách làm theo cùng
một phương pháp, chúng tôi tìm ra giá trị trung bình µ và phương sai σ 2 ( hoặc độ lệch chuẩn σ) cho các
phiên của fl ine và các kênh, tóm tắt các giá trị kết quả trong bảng 7.4.

lỗi µ σ
e trên 0 ( ∼ 10 - 6) 8.8219 · 10 - 4

e tắt 0 ( ∼ 10 - 6) 2.1437 · 10 - 4

e ch 0 ( ∼ 10 - 5) 0,0061

Bảng 7.4: Các tham số của lỗi phân phối chuẩn e trên, e tắt và e ch.

7.3 Mức độ phổ biến của kênh

Qiu và cộng sự. đã thực hiện một nghiên cứu toàn diện về mức độ phổ biến của kênh trong một hệ thống IPTV lớn ( Qiu,
Ge, Lee, Wang, Zhao và Xu , 2009 ). Phân tích của họ tập trung vào cách người dùng thay đổi giữa các kênh truyền hình và
kết luận rằng mức độ phổ biến của một kênh truyền hình được xác định bởi các hành động của người dùng sau đây, điều
này điển hình cho các nghiên cứu tương tự về IPTV ( Cha, Rodriguez, Crowcroft, et al. , 2008 ):

• Chuyển đổi kênh mục tiêu, khi người dùng chuyển trực tiếp sang kênh truyền hình quan tâm.

• Chuyển kênh tuần tự, tương ứng với việc người dùng duyệt qua các kênh có sẵn để tìm kiếm một
chương trình truyền hình thú vị.

Trên thực tế, bản chất của chuyển đổi tuần tự phụ thuộc vào việc người dùng trước đó đang xem một
kênh TV hay thiết bị của người dùng (tức là thiết bị của người dùng) đã bị tắt. Khi người dùng tiếp tục xem
TV mà không dò kênh cụ thể, sau một thời gian không hoạt động, thiết kế của UE là tiếp tục từ kênh đã biết
gần đây nhất. Do đó, chúng ta có thể phân chia thêm chuyển đổi tuần tự trong:

• Bật lên UE / TV set, nơi tiếp tục lại kênh đã biết gần đây nhất.
Duyệt về phía trước qqq:
scf 37%

Duyệt ngược q S q c q b: 15%

7.3. Mức độ phổ biến của kênh 89

Mục tiêu tq: 44%


Tuần tự S q: 56%
Kênh Bật q S q o: 4 %
sự lựa chọn Đang duyệt q S q c: 52% Duyệt về phía
trước q S q c q f: 37% duyệt ngược q S q
c q b: 15%

Hình 7.12: Tổng hợp các kiểu chọn kênh.

• Đang duyệt, khi người dùng thay đổi từ kênh hiện tại ở đằng trước tiếp theo hoặc phía sau đến cái
trước. Kết quả từ nghiên cứu cho chúng tôi thấy rằng trong hơn 72% các sự kiện duyệt web, người
dùng chuyển tiếp đến kênh tiếp theo.

Tên Ký hiệu Giá trị

Chuyển đổi mục tiêu qt 0,44

Chuyển đổi tuần tự qs=1 - qt 0,56

Bật chuyển đổi tuần tự qo 0,08

Chuyển đổi tuần tự duyệt web qc=1 - qo 0,92

Chuyển tiếp trình tự duyệt duyệt Chuyển tiếp trình qf 0,72

tự duyệt ngược Chuyển đổi tuần tự duyệt web qb=1 - q f 0,28

Bảng 7.5: Tập hợp các xác suất cho các sự kiện chuyển kênh.

Chúng tôi chỉ định một xác suất q cho mọi loại sự kiện chuyển kênh. Bảng 7.5 và fi gure 7.12 tóm tắt các
kiểu chuyển mạch kênh và xác suất tương ứng của chúng. Ngược lại với chuyển mạch tuần tự, trong đó các
kênh tương lai phụ thuộc vào các kênh trước đó, chuyển đổi mục tiêu là một quá trình ngẫu nhiên không có
bộ nhớ. Cuối cùng, chúng tôi giới thiệu mức độ phổ biến chuyển đổi mục tiêu của một kênh Tôi là xác suất
chuyển sang kênh cụ thể đó,
đóng góp bởi P Tôi. Thông qua nghiên cứu toàn diện của họ, Qiu et al. kết luận rằng mức độ phổ biến của một kênh
truyền hình có hai yếu tố:

• A dài hạn thành phần, P µ, điều đó theo sau một zipf-lũy thừa sự phân phối.

• A tức thời thành phần, P t, điều đó theo sau một nghĩa là đảo ngược mô hình.

Vì chúng tôi cho rằng mô hình của họ là một mô hình tốt, chúng tôi sẽ sử dụng lại nền tảng công việc
của họ để thực hiện khối lượng công việc của chúng tôi. Do đó, trong hai phần sau, chúng tôi mô tả nền
tảng toán học như được trình bày trong ( Qiu, Ge, Lee, Wang, Zhao và Xu , 2009 ), trong khi chúng tôi mở
rộng một số phương trình, chẳng hạn như nghiệm của xác suất tức thời, sang dạng tổng quát hơn.

7.3.1 Mức độ phổ biến lâu dài cho chuyển đổi mục tiêu

Hãy để chúng tôi xem xét một hệ thống IPTV với N các kênh, theo thứ tự giảm dần về mức độ phổ biến của chúng.
Mức độ phổ biến lâu dài của kênh Tôi Là:

•• Q1
•• tôi <N ′ = N / 10,
Q 0 Tôi α ′
P µ, tôi = • (7,37)
e-βi+Q2
••• nếu không thì,
Q0
90 Chương 7. Mô hình khối lượng công việc

trong đó mức độ phổ biến của chỉ mười phần trăm hàng đầu của các kênh, được biểu thị bằng N ′, Là zipf, trong khi
phần còn lại là một số mũ ( Qiu, Ge, Lee, Wang, Xu và Zhao , 2009 ). Đối với Q 2, vì lợi ích của sự chính xác,
chúng tôi áp đặt:

(
Q 2 = ln Q 1 N ′ - α ′) + N ′ β, (7,38)

và Q 0 là một yếu tố bình thường hóa sao cho:

N
∑ P µ, tôi = 1. (7,39)
tôi = 1

Tham số Giá trị Tham số Giá trị Tham số Giá trị

N 700 α 0,45 β′ 0,006

N′ 70 α′ 0,513 Q1 12,642

Bảng 7.6: Các tham số của mô hình phổ biến kênh trung bình cho chuyển mạch mục tiêu.

7.3.2 Mức độ phổ biến tức thời cho chuyển đổi mục tiêu

Mức độ phổ biến tức thời của một kênh truyền hình có mức độ phổ biến lâu dài P µ được mô hình hóa bởi một quá
trình ngẫu nhiên Ornstein-Uhlenbeck được mô tả bởi phương trình vi phân ngẫu nhiên:

( )
d P t = θ P µ - P t d t + σ d W t, (7.40)

nơi chúng tôi có:

• θ là có nghĩa là tỷ lệ đảo ngược,

• µ là trung bình dài hạn,

• σ là không ổn định của quy trình Weiner,

• W t là một Quy trình Weiner đặc trưng bởi W t - W S ∼ N 0, t - S.

Trong khi Qiu et al. đưa ra một giải pháp tại các thời điểm rời rạc, mục tiêu của chúng tôi là giải phương
trình vi phân ngẫu nhiên cho bất kỳ thời điểm thời gian thực nào t, khi người đăng ký chuyển sang kênh mới.

Định lý 3. Hãy để giây phút thay đổi kênh cuối cùng, và ∆ t là khoảng thời gian cho một thay đổi tiếp theo đối với cùng một kênh,
bởi cùng một người dùng hoặc một người dùng khác. Sau đó, mức độ phổ biến tức thời của kênh tại thời điểm t + ∆ t là:


( ) 1 - e - 2 θ ∆ t N 0,1,
Pt+∆t=Pt e-θ∆t+Pµ1 - e-θ∆t+σ (7.41)

Ở đâu N 0,1 là một số ngẫu nhiên có phân phối chuẩn chuẩn. Bằng

chứng. Chúng tôi giải phương trình vi phân ngẫu nhiên:

dPt
(7.42)
d t + θ P t = θ P µ + σ d W t.

Bằng cách nhân cả hai vế với e θ t, chúng tôi đạt được:

d P t e θ t + θ P t e θ t = θ P µ e θ t + σ e θ t d W t.
(7.43)
dt
7.3. Mức độ phổ biến của kênh 91

Sau đó, bằng cách tích phân trong khoảng [ t, t + ∆ t]:

∣∣∣ t + ∆ t ∣∣∣ t + ∆ t ∫t+∆t


Pt eθt = Pµeθt + σ e θ t d W t,
t t t
( ) ∫t+∆t (7,44)
P t + ∆ t e θ ( t + ∆ t) - P t e θ t = P µ e θ ( t + ∆ t) - e θ t + σ e θ t d W t.
t

Trong phương trình trước, số hạng cuối cùng của vế phải là tích phân của Itō¯. Bằng cách chia đôi bên cho e θ ( t
+ ∆ t), và xem xét lời giải cho tích phân của Itō¯ ( Dixit và cộng sự. , 1994 ), chúng tôi đã hoàn thành bằng chứng của

chúng tôi.

Xem xét mức độ phổ biến ban đầu của kênh P 0, tại thời điểm t sự phổ biến của kênh P t có một phân phối bình thường với giá
trị trung bình và phương sai ( Kloeden và cộng sự. , 1994 ):

( )
E [ P t] = P 0 e - θ t + P µ 1 - e - θ t, (7.45)

σ 2 ( 1 - e - 2 θ t)
Var [ P t] = . (7.46)

Các tham số của mô hình được đưa ra trong bảng 7.7, trong khi σ chúng ta có:


σ = P u · c v 2 θ. (7.47)

Tham số Giá trị

θ 0,12

cv 0,5

Bảng 7.7: Các tham số của mô hình phổ kênh tức thời cho chuyển mạch mục tiêu.

7.3.3 Đặt hàng kênh

Mô hình về mức độ phổ biến chuyển đổi mục tiêu giả định các kênh truyền hình được sắp xếp theo mức độ phổ
biến giảm dần. Tuy nhiên, thứ tự các kênh được thiết lập, khi được phát cho người dùng, thường khác với các kênh
truyền hình được sắp xếp xung quanh việc đưa chúng vào một gói truyền hình nhất định như cơ bản, trẻ em & âm
nhạc, phiêu lưu, thể thao, trả tiền cho mỗi lần xem, vân vân. Người đăng ký cũng có thể tùy chỉnh thứ tự của các
kênh theo sở thích của họ.
Vì thứ tự các kênh TV đóng một vai trò quan trọng đối với việc chuyển đổi tuần tự, nên cần thiết lập một
thứ tự kênh xem xét cả việc phát sóng và tùy chỉnh của người dùng. Về mục tiêu này, Qiu et al. đề xuất một
chức năng hoán vị đơn giản, với việc chấp nhận một lỗi cao hơn một chút nếu các kênh mà người dùng
nhận được là nhóm cao.
Hãy để chúng tôi biểu thị bằng σ chức năng hoán vị đồng nhất cho một người dùng nhất định, sao cho
một kênh TV trên vị trí Tôi trong tập hợp mức độ phổ biến giảm dần, sẽ được điều chỉnh trên vị trí σ ( Tôi) tại
thiết bị / TV của người dùng. Hàm hoán vị là hàm lưỡng tính, và do đó tồn tại một hàm ngược
σ - 1 ( Tôi), sao cho một kênh ở vị trí Tôi trong tập hợp nhận được sẽ có vị trí σ - 1 ( Tôi) trong tập hợp có thứ tự.
92 Chương 7. Mô hình khối lượng công việc

7.4 Kết luận


Việc thiết kế phiên P2PTV-AS và các thuật toán điều phối ngang hàng đòi hỏi sự hiểu biết thấu đáo về hoạt
động của người dùng trong một hệ thống IPTV thương mại lớn. Thật không may, do tính chất khép kín của
các triển khai hiện có, cho đến nay chỉ có một số nghiên cứu toàn diện về cách khán giả dân cư xem TV. Tác
phẩm của Qiu et al. là một trong số ít cung cấp tập dữ liệu toàn diện, được phân tích từ một số khía cạnh ( Qiu,
Ge, Lee, Wang, Xu và Zhao ,
2009 ; Qiu, Ge, Lee, Wang, Zhao và Xu , 2009 ). Chúng bao gồm quy trình của thiết bị người dùng trực tuyến, của các
phiên kênh và kênh; mức độ phổ biến của kênh và động lực của nó; phân loại người dùng và tùy chọn kênh. Bằng
cách dựa trên dữ liệu của họ, các tác giả đề xuất một trình tạo khối lượng công việc IPTV đơn giản được gọi là Đồng
hồ simul.
Mặc dù tác phẩm của Qiu el al. đại diện cho một nền tảng vô giá, phân tích của chúng tôi về mô hình và bộ tạo
của họ cho thấy nó không phù hợp với mục đích của chúng tôi. Về cơ bản, các thuật toán Simulwatch không hoàn
thiện về các khía cạnh nhất định của đặc điểm khối lượng công việc, như số lượng người dùng trực tuyến và động
lực hoạt động trên quy mô thời gian lớn hơn, điều này cần thiết cho một thiết kế tốt của hệ thống P2PTV. Ngoài ra,
nó còn gặp phải một số lỗi mà theo ý kiến của chúng tôi, không mô hình hóa chính xác dữ liệu đời thực.

Để giải quyết những vấn đề này, chúng tôi đã mở rộng công việc của họ bằng cách đề xuất một mô hình tỷ lệ
phiên mới, dựa trên các thành phần phổ chi phối, thay vì đặc tính tần số liên tục. Chúng tôi chứng minh rằng tốc
độ phiên được liên kết với số lượng thiết bị người dùng trực tuyến tại bất kỳ thời điểm nào và trạng thái ổn định
của hệ thống không phụ thuộc vào các điều kiện ban đầu. Khối lượng công việc của chúng tôi bao gồm mô hình
hoạt động hàng tuần của người dùng, bằng cách sử dụng chức năng điều chỉnh làm thay đổi tốc độ phiên và gián
tiếp số lượng UE trực tuyến. Không giống như Simulwatch, chúng tôi không để tốc độ phiên hoàn toàn mang tính
xác định, bằng cách đo lường và thêm thành phần ngẫu nhiên phân phối chuẩn.
Chương số 8

Tổng hợp khối lượng công việc

8.1 Tổng quan


Trong khi việc phân tích và mô hình hóa khối lượng công việc IPTV tương đối đơn giản, việc tổng hợp nó trở
nên khó khăn hơn. Vì mô hình khối lượng công việc là mô hình gần đúng với thực tế và do sự khác biệt nhỏ
và dữ liệu không đầy đủ bao gồm tất cả các chi tiết về cách người dùng xem TV, các thông số mô hình khác
nhau không khớp hoàn toàn. Về phần cuối, chương này mô tả chi tiết về việc tạo khối lượng công việc IPTV
bắt đầu từ mô hình của chúng tôi.
Fi gure 8.1 minh họa rằng thuật toán tổng hợp của chúng tôi chia việc triển khai mô hình khối lượng
công việc thành các bước hợp lý sau:

• Hoạt động của người dùng tỷ lệ phiên, bằng cách tạo ra những khoảnh khắc bắt đầu cho các phiên trực tuyến, trên kênh và
trên kênh.

• Hoạt động của người dùng trực tuyến và có thời lượng phiên thấp hơn, bằng cách tạo chuỗi trực tuyến / trong số

Khởi đầu

Tỷ lệ phiên hoạt động của người dùng Bước 1: Tạo sự kiện phiên trực tuyến / ngoại tuyến / kênh

Thời lượng phiên hoạt động của người dùng Bước 2: Tạo tiến trình phiên trực tuyến / ngoại tuyến

Bước 3: Tạo tiến trình phiên kênh

Bước 4: Sửa lỗi tiến trình phiên

Mức độ phổ biến của kênh Bước 5: Phân bổ kênh

Dừng lại

Hình 8.1: Tổng quan về thuật toán tổng hợp khối lượng công việc.
94 Chương 8. Tổng hợp khối lượng công việc

Khoảng thời gian trực tuyến Sự kiện ngoại tuyến Sự kiện trực tuyến

Dòng thời gian của người dùng

Màu sắc chính


Sự kiện trực tuyến / khoảng thời gian

Sự kiện ngoại tuyến / khoảng thời gian


Sự kiện kênh Khoảng thời gian kênh Khoảng thời gian ngoại tuyến
Sự kiện / khoảng thời gian của kênh

Hình 8.2: Định nghĩa các phần tử được sử dụng trong thuật toán khối lượng công việc.

phiên cho người dùng trong hệ thống.

• Hoạt động của người dùng thời lượng phiên kênh, bằng cách tạo chuỗi phiên kênh cho người dùng
trong hệ thống.

• Các kênh phổ biến, bằng cách phân bổ kênh cho các phiên kênh hiện có.

8.2 Hoạt động của người dùng

Để giữ cho việc triển khai đơn giản, việc tổng hợp hoạt động của người dùng tách riêng việc triển khai tỷ lệ
phiên và thời lượng phiên. Cách tiếp cận này có lợi thế về tính hiệu quả, vì chi phí tính toán được giảm đáng
kể, đặc biệt là đối với một số lượng lớn người dùng.

8.2.1 Phân tích mô hình

Trạng thái phiên trực tuyến, trên kênh và phiên kênh của hoạt động người dùng phải phù hợp với hai phân
phối mô hình: (i) tỷ lệ phiên và (ii) thời lượng phiên. Chúng tôi nhắc nhở người đọc rằng
tỷ lệ phiên là các biến ngẫu nhiên X ∗ trên, X ∗tắt và X ch, được tạo bằng cách sử dụng tần suất hàng ngày
mô hình, chức năng điều biến hàng tuần và thành phần ngẫu nhiên phân phối chuẩn. Các
thời lượng phiên d trên, d tắt và d ch được tạo ra từ các phân phối siêu cấp số nhân đã định.
Để đơn giản hóa sự hiểu biết của thuật toán khối lượng công việc, chúng tôi xác định các yếu tố sau,
được hình dung trong fi gure 8.2:

• Một phiên biến cố là thời điểm bắt đầu một phiên nhất định. Tùy thuộc vào loại phiên, chúng tôi có các
sự kiện phiên trực tuyến, phiên trực tuyến và kênh.

• Một phiên khoảng thời gian là khoảng thời gian kéo dài bởi một phiên nhất định. Tương tự như sự kiện phiên, chúng
tôi có các khoảng thời gian phiên trực tuyến, trong số và kênh.

• Một phiên mốc thời gian là chuỗi các phiên mà một người dùng nhất định tạo ra thông qua hoạt động xem TV của
họ.

Mục tiêu của chúng tôi là tạo ra, cho mọi người dùng, một tập hợp các sự kiện đại diện cho các khoảnh khắc thời gian
khi UE của người dùng thay đổi trạng thái trực tuyến, của fl ine và / hoặc kênh, với các ràng buộc sau:

(i) Đối với một người dùng cá nhân, có các khoảng thời gian phiên trực tuyến và phiên xen kẽ.

(ii) Đối với một người dùng cá nhân, các khoảng thời gian của phiên kênh chỉ được trùng lặp với thời gian trực tuyến
các khoảng thời gian của phiên.

(iii) Thời lượng của mọi khoảng thời gian trực tuyến, trong tổng số và kênh là d trên, d tắt và d ch, tương ứng.
8.2. Hoạt động người dùng 95

(iv) Khi tất cả người dùng được tập hợp lại với nhau, sự chồng chất của kênh trực tuyến, kênh và kênh của họ
các sự kiện xác định một quá trình có tỷ lệ X ∗ trên, X ∗tắt và X ch, tương ứng.

(v) Sự kiện trực tuyến và sự kiện trực tuyến là một tập hợp con của các sự kiện kênh, vì việc bật UE sẽ tắt
đều liên quan đến sự thay đổi trạng thái kênh.

Về bản chất, mục tiêu của chúng tôi là phù hợp với các sự kiện phiên có X ∗ trên, X ∗tắt và X ch đánh giá với
khoảng thời gian phiên của d trên, d tắt và d ch thời lượng, trong khi duy trì một số lượng không đổi trong tổng số người dùng
trong hệ thống. Chúng tôi bắt đầu với việc phân tích mô hình hoạt động của người dùng để xác định xem liệu các ràng buộc trên
có thể được đáp ứng hay không, và nếu không, những điều chỉnh nào là cần thiết. Đặc biệt, chúng tôi xác minh xem số lượng sự
kiện phiên trực tuyến / trong số các phiên có phù hợp với các khoảng thời gian của phiên hay không.

8.2.1.1 Phiên trực tuyến / trong số các phiên hoạt động

Với khoảng thời gian trực tuyến / trong khoảng thời gian của phiên d trên và d tắt theo cấp số nhân
phân phối, mỗi với n thông số p Tôi và λ Tôi, như thể hiện trong bảng 7.1, giá trị trung bình hoặc giá trị mong đợi cho mỗi
khoảng thời gian là:

n p Tôi ∣
∣∣∣∣,
d̄ ¯ trên = ∑
tôi = 1 λ tôi vào
n p Tôi ∣∣∣
(8.1)
d̄¯tắt = ∑ .
tôi = 1 λ mình dừng đây

Chúng ta hãy xem xét một khoảng thời gian quan sát t tối đa, như vậy mà t tối đa → ∞. Đối với một thiết bị người dùng nhất định, số lượng

trung bình của khoảng thời gian trực tuyến và trong khoảng thời gian có thể được cung cấp trong t tối đa Là:

2 t tối đa
n̄ ¯ d, o = u 1,02 · 10 - 4 t tối đa (8,2)
d̄ ¯ trên +d̄¯ tắt

Mặt khác, các sự kiện trực tuyến / trong phiên có tỷ lệ trung bình x ∗ trên( t) và x ∗ tắt ( t)
được chuẩn hóa với số lượng người dùng trực tuyến và người dùng trực tuyến tại mỗi thời điểm t, tương ứng. Đưa cho
phần nhỏ của UE trực tuyến / trong tổng số các UE r ∗ trên( t) và r ∗ tắt ( t), chúng ta có thể viết tỷ lệ phiên bật / tắt tuyệt đối
cho một UE cá nhân với tư cách là 1:

z trên(
∗ t) = x ∗trên( t) rtắt
∗ ( t),
(8,3)
z tắt
∗ ( t) = x ∗ tắt ( t) r ∗trên( t).

Fi gure 8.2.1.1 minh họa sự khác biệt giữa hai hình thức của tỷ giá phiên. Người ta có thể quan sát thấy
rằng trong khi tỷ lệ trực tuyến / của fl ine chuẩn hóa khác nhau theo thứ tự độ lớn, các dạng tuyệt đối gần
như giống hệt nhau. Kết quả này được mong đợi vì tổng số người dùng / UE trong hệ thống không đổi theo
thời gian. Do đó, về trung bình, số UE bật phải bằng số UE tắt.

Tỷ lệ phiên trung bình cho một UE trong t tối đa Là:

1 ∫ t tối đa z ∗
z̄ trên
¯ ∗ = t tối đa 0 trên( t) d t,
(8,4)
1 ∫ t tối đa z ∗
z̄ tắt
¯ ∗= t tối đa 0 tắt ( t) d t.

1 Chúng tôi sử dụng ký hiệu z ∗ đối với phiên bản được điều chỉnh hàng tuần của tỷ lệ phiên tuyệt đối, để phân biệt với phiên bản không
được điều chỉnh, được ký hiệu bằng z.
96 Chương 8. Tổng hợp khối lượng công việc

× 10 - 3 × 10 - 4
2 3
x trên

1,8 x tắt

[ S - 1]
1,6

z trên

1
1,4

1,2
0
0 1 2 3 4 5 6 7
x ∗ [ S - 1]

1 t [ ngày]
× 10 - 4
0,8 3

0,6
2

∗ [ S - 1]
0,4

z tắt
1
0,2

0 0
0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 7

t [ ngày] t [ ngày]

(a) Tỷ lệ phiên trực tuyến / trong tổng số phiên được chuẩn hóa x ∗ trên, x ∗ (b) Tỷ lệ phiên trực tuyến / trong tổng số phiên trực tuyến tuyệt đối z ∗ trên, z ∗tắt cho
tắt . một
UE.

Hình 8.3: So sánh tỷ lệ phiên trực tuyến / trong tổng số phiên được chuẩn hóa với phiên bản tuyệt đối.

Xem xét các biểu thức mô hình cho tỷ lệ phiên, chúng ta có thể tính số lượng trung bình của các sự kiện phiên trực tuyến /
trong số các sự kiện phiên trực tuyến mà một UE trải qua trong t tối đa:

∫ t max ( )
n̄ ¯ z, o = n̄ ¯ z, trên + n̄ ¯ z, tắt = z trên(
∗ t) + z ∗tắt ( t) d t u 1.55 · 10 - 4 t tối đa (8,5)
0

Từ kết quả cuối cùng, chúng tôi thu được:

n̄ ¯ d, o u 0,65.
(8,6)
n̄ ¯ z, o

Phần này cho thấy rằng, trung bình, số lượng các khoảng thời gian trực tuyến / trong số các khoảng thời
gian phiên trực tuyến mà một UE có thể đáp ứng trong một khoảng thời gian lớn tùy ý chỉ xấp xỉ 65% số
lượng các sự kiện trực tuyến / trong số các khoảng thời gian mà UE phải tạo ra trong cùng lúc. Về cơ bản,
thời lượng trung bình của các phiên lớn hơn khoảng cách trung bình giữa các sự kiện trực tuyến / trong
phiên. Sự không nhất quán này bắt nguồn từ dữ liệu hạn chế có sẵn cho tỷ lệ và thời lượng phiên, tức là một
ngày, so với mô hình của chúng tôi mà chúng tôi đã mở rộng sang quy mô thời gian hàng tuần.
Để phù hợp với sự khác biệt này, chúng tôi triển khai thuật toán khối lượng công việc để ưu tiên
tỷ lệ phiên ( x ∗ trên, x ∗tắt ) trong khoảng thời gian của phiên ( d trên, d tắt ). Chúng tôi biện minh cho cách tiếp cận của mình
bằng cách xem xét các khía cạnh sau đây. Tốc độ phiên bao gồm thời gian chuyển tiếp cao, tức là đám đông
fl ash, tại các thời điểm cụ thể như ranh giới giờ, tương ứng với lịch chương trình truyền hình. Bản chất của
những thay đổi này trong tỷ lệ phiên làm cho nó khó gần đúng với độ chính xác tốt. Đối với việc thiết kế
thuật toán P2PTV, tỷ lệ phiên trực tuyến / trong tổng số phiên tương tự với tỷ lệ churn. Chúng tôi kỳ vọng
rằng hiệu suất của một hệ thống ngang hàng như vậy sẽ nhạy cảm hơn đối với những người ngang hàng
đến hoặc rời khỏi hệ thống trong một khoảng thời gian ngắn, hơn là với những thay đổi nhỏ trong thời gian
những người ngang hàng ở lại trực tuyến hoặc của họ. Cuối cùng, chúng tôi chỉ ra rằng khoảng thời gian
khoảng phiên gần đúng có thể gần với mô hình.

8.2.1.2 Phiên kênh

Chúng tôi áp dụng nguyên tắc tương tự cho các phiên kênh. Với chế độ phân phối siêu hàm mũ, thời lượng
trung bình của một khoảng kênh là:

n p Tôi
∣∣∣∣,
d̄ ¯ ch = ∑ (8,7)
tôi = 1 λ tôi ch
8.2. Hoạt động người dùng 97

Ở đâu p Tôi và λ Tôi là các thông số mô hình từ bảng 7.1. Trong khoảng thời gian quan sát t tối đa, số khoảng
kênh dự kiến là:

t tối đa u 0,0012.
n̄ ¯ d, c = (8,8)
d̄ ¯ ch

Tương tự như các phiên trực tuyến, tỷ lệ sự kiện của kênh tại thời điểm này t Là x ch ( t),
được chuẩn hóa cho số lượng người dùng trực tuyến và chúng tôi có thể viết tỷ lệ sự kiện tuyệt đối là:

z ch ( t) = x ch ( t) r ∗trên( t). (8,9)

Số sự kiện kênh trung bình, trong cùng một khoảng thời gian tùy ý t tối đa, Là:
∫ t tối đa z ch ( t) d t u 8.25 · 10 - 4,
n z, c = (8.10)
0

và chúng tôi có được:

n d, c u 1,39.
(8,11)
n z, c

Kết quả cuối cùng cho thấy rằng số lượng khoảng thời gian được khoảng thời gian quan sát dựa trên độ
dài của chúng cao hơn một chút so với số lượng sự kiện phiên. Vì những lý do tương tự như trước đây, trong
quá trình triển khai, chúng tôi ưu tiên tỷ lệ sự kiện kênh, dẫn đến thời lượng trung bình cao hơn so với mô
hình. Trong chương tiếp theo, chúng tôi phân tích chi tiết sự khác biệt này và chúng tôi chỉ ra rằng đó là một
sự thỏa hiệp hợp lý.

8.2.2 Sự kiện phiên


Phân tích trước đây của chúng tôi cho thấy rằng tỷ lệ sự kiện kênh tuyệt đối vượt quá tỷ lệ trực tuyến / trên mạng
theo một thứ tự độ lớn. Do đó, ý tưởng đằng sau thuật toán của chúng tôi là tạo ra chuỗi các sự kiện kênh đầu
tiên, và sau đó nội suy các sự kiện trực tuyến / trong số các sự kiện trong đó. Những sự kiện này sau đó sẽ
là liên kết đến các sự kiện kênh gần nhất, chẳng hạn như sự kiện trực tuyến t trên trước kênh liên kết của nó
biến cố t ch, và một sự kiện không hợp lý t tắt là sau sự kiện kênh được liên kết của nó t ch.
Fi gure 8.4 minh họa việc tạo ra các sự kiện phiên. Thuật toán khởi tạo thời điểm
về sự kiện trực tuyến đầu tiên, về sự kiện trên kênh và số lượng người dùng trực tuyến và của những người dùng /
UE trực tuyến. Xét một số fi xed của U người đăng ký dịch vụ IPTV, người đăng ký sau có thể có dạng:

u trên = δ U U,
(8.12)
u tắt = ( 1 - δ U) U.

Thông số δ U đại diện cho phần ban đầu của các UE trực tuyến. Vì thuật toán đảm bảo sự hội tụ của khối lượng
công việc sau một thời gian trôi qua hợp lý, δ U có thể được đặt thành bất kỳ giá trị ban đầu nào trong
khoảng [0, 1]. Tuy nhiên, chúng ta có thể giảm thiểu khoảng hội tụ nếu chúng ta chọn δ U = 0,8117. Vòng lặp
chính của thuật toán tạo ra một sự kiện kênh mới cho mỗi lần lặp, cho đến khi
thời gian đạt được. Ở mỗi lần lặp lại, chúng tôi kiểm tra xem sự kiện trực tuyến cuối cùng hay sự kiện không hoạt động có nên được liên kết

với sự kiện kênh cuối cùng hay không. Khi bất kỳ sự kiện nào trong số này được liên kết, chúng tôi thêm chúng vào dòng thời gian, sau đó tạo

một sự kiện mới.

Các sự kiện trực tuyến / trong số các sự kiện tương ứng với việc người dùng bật và tắt UE của họ, được
liên kết tự động với các sự kiện kênh gần nhất. Cách tiếp cận này duy trì phân phối tốc độ phiên phù hợp
cho tất cả các sự kiện, đồng thời tạo kết nối hợp lý rằng việc bật UE được theo sau cùng một lúc với kênh TV
đã biết gần đây nhất. Tương tự như vậy, việc tắt UE nên được đặt trước bằng cách điều chỉnh kênh TV hiện
tại. Các Loại liên kết phân biệt giữa các sự kiện kênh này. Bởi vì hai sự kiện được liên kết không xảy ra cùng
một lúc, tồn tại một
98 Chương 8. Tổng hợp khối lượng công việc

Khởi đầu

Khởi tạo người dùng / UE trực tuyến và ngoại tuyến trênu và tắt u

Tạo sự kiện trực tuyến, ngoại tuyến và kênh đầu tiên trên t, tắt t và ch t

Là t trên • t?
ch
Đúng Không

Là tắtt• t?ch
t•
Liên kết các sự kiện trên tch Đúng

t •t
Không
utrên
• utrên 1 •u
• , tắt utắt• 1 Tìm sự kiện không được liên kết * ch tắt

•X •
•1
* *
Tạo tiếp theo trên tt • trên • tắtu Liên kết các sự kiện tắt t• tch

utrên
• utrên 1 •u
• , tắt utắt• 1

•X u •
•1
*
Tạo tiếp theo tắt t • ttắt
• tắt mở

•X chu on •
•1
Tạo tiếp theo ch t • tch

Là t ch • t tối đa?
Đúng

Không

Dừng lại

Hình 8.4: Thuật toán tạo các sự kiện phiên.

Khoảng thời gian chưa đến, thường là vài mili giây, khi UE có thể trực tuyến nhưng không xem bất kỳ kênh
truyền hình nào. Tuy bản chất của lỗi này hoàn toàn là xác suất nhưng trên thực tế chúng tôi coi đó là lỗi
không đáng kể.

8.2.3 Khoảng thời gian trực tuyến / trong phiên

Tiếp theo việc tạo các sự kiện phiên trong các tập hợp E trên, E tắt , và E ch, chúng tôi bao gồm phiên
khoảng thời gian d trên và d tắt , tổ chức trong các bộ Tôi trên và Tôi tắt . Không giống như các sự kiện phiên, độc
lập giữa chúng với tỷ lệ của chúng, việc tính toán các khoảng thời gian phiên là chủ đề
đối với một số ràng buộc. Đầu tiên, khoảng thời gian phiên trực tuyến / của phiên bắt nguồn từ một sự kiện trực tuyến /
trong tổng số và kết thúc tại một sự kiện trực tuyến / không trực tuyến. Thứ hai, số lượng các khoảng thời gian trực tuyến
và không trùng lặp tại bất kỳ thời điểm nào phải bằng số lượng người dùng / UE. Cuối cùng, theo

Mở sự kiện trực tuyến Sự kiện ngoại tuyến chưa được chỉ định

Sự kiện trực tuyến gần nhất Sự kiện ngoại tuyến chưa được chỉ định đầu tiên
Dòng thời gian của người dùng

Người dùng được chọn

Khoảng thời gian trực tuyến ước tính

Màu sắc chính


Sự kiện trực tuyến / khoảng thời gian

Sự kiện ngoại tuyến / khoảng thời gian lỗi Khoảng thời gian trực tuyến mới

Hình 8.5: Tạo khoảng thời gian trực tuyến / trong tổng số.
8.2. Hoạt động người dùng 99

Khởi đầu

Sự kiện nào có trước?


Sự kiện trực tuyến trêne Là đầu tiên e Là đầu tiên
Sự kiện ngoại tuyến tắt

Tạo khoảng thời gian ngoại tuyến cho sự kiện trực tuyến
Tạo độ dài khoảng thời gian tắt d

Có còn lại các UE ngoại tuyến ban đầu không?

Đúng Không

Khoảng thời gian dài d tắt kết thúc lúc trên e Tìm sự kiện ngoại tuyến mở g tắt gần nhất với trên d e• tắt

Khoảng thời gian dài trên g e• tắt bắt đầu từ g tắt và kết thúc lúc trên e

Tẩy tắt g từ tập hợp ngoại tuyến mở

Thêm vàoe trên


đến tập hợp trực tuyến mở

Tạo khoảng thời gian trực tuyến cho sự kiện ngoại tuyến
Tạo độ dài khoảng thời gian trênd

Có còn lại các UE trực tuyến ban đầu không?


Không Đúng

g gần nhất với tắt d


Tìm sự kiện ngoại tuyến mở trên e• trên Khoảng thời gian dài trên d kết thúc lúc tắt e

Khoảng thời gian dài tắteg • trên bắt đầu từ g tắt và kết thúc lúc trên e

Tẩy trên g từ tập hợp ngoại tuyến mở

Thêm vàoetắtđến tập hợp trực tuyến mở

Có nhiều sự kiện hơn không?

Đúng

Không

Dừng lại

Hình 8.6: Thuật toán tạo khoảng thời gian phiên trực tuyến / trong tổng số phiên.

mục tiêu mà chúng tôi đã đặt ra để triển khai, chúng tôi phải bao gồm tất cả các sự kiện ở mức cân bằng với thời
lượng phiên gần đúng.

Để đạt được những hạn chế này, chúng tôi sử dụng phương pháp lập trình động trong đó chúng tôi fi x ràng buộc số
người dùng / UE và chúng tôi phân bổ các sự kiện phiên chưa được chỉ định cho người dùng dòng thời gian. Dòng thời
gian của người dùng thể hiện trình tự lặp đi lặp lại của các sự kiện và khoảng thời gian trực tuyến liên quan đến mỗi UE.
Mọi khoảng thời gian mới trong dòng thời gian đều được chỉ định sao cho chúng tôi giữ lỗi độ dài phiên ở mức tối thiểu.

Chúng tôi duy trì hai bộ O trên và O tắt , lưu trữ các sự kiện bắt đầu cho các khoảng thời gian phiên mở
hiện tại. Đây là những phiên có sự kiện bắt đầu, nhưng chúng tôi chưa xác định kết thúc
sự kiện và độ dài của chúng vẫn chưa được biết. Lý tưởng nhất là các bộ O trên và O tắt có thể được sắp xếp sao cho việc tìm
kiếm được thực hiện theo thời gian logarit, trong khi việc chèn các phần tử mới vào cuối được thực hiện
phân bổ theo thời gian cố định.

Bằng cách phân tích cú pháp các tập hợp sự kiện E trên, E tắt , từ nhỏ nhất đến lớn nhất, cho mọi sự kiện trực tuyến mới / trong tổng số sự kiện chưa

được chỉ định e trên hoặc là e tắt chúng tôi tạo ra một cái mới đóng cửa của fl trong / khoảng thời gian trực tuyến của độ dài d tắt hoặc là d trên,

có phân phối siêu mũ đã biết. Sau đó, chúng tôi tìm kiếm sự kiện trong O tắt hoặc là
100 Chương 8. Tổng hợp khối lượng công việc

Sự kiện trực tuyến Sự kiện kênh

Dòng thời gian của người dùng

Màu sắc chính

Sự kiện trực tuyến / khoảng thời gian

Sự kiện ngoại tuyến / khoảng thời gian


Sự kiện kênh Sự kiện ngoại tuyến
Sự kiện kênh

Hình 8.7: Tình huống ngoại lệ yêu cầu điều chỉnh các mốc thời gian của phiên.

O trên đặt gần nhất vớiThứ


đầutựcủa
bất thường
khoảng thời gian mới: e trên - d tắt hoặc là eĐơntắthàng
- dbìnhtrên. Sau một khoảng thời gian, chúng tôi
thường

tạo một khoảng thời gian mới, chúng tôi xóa sự kiện bắt đầu khỏi tập hợp đang mở và chèn phần kết thúc
sự kiện cho tập mở. Chúng tôi lặp lại các bước tương tự cho đến khi chúng tôi đã chỉ định tất cả các sự kiện phiên. Vì ban đầu các
tập hợp đang mở trống, chúng tôi sử dụng số lượng người dùng trực tuyến và không chính thức ban đầu để tạo
mở khoảng thời gian không có sự kiện bắt đầu trong khối lượng công việc; đây là những khoảng thời gian phiên
bắt đầu trước thời điểm ban đầu.
Fi gure 8.5 minh họa nguyên tắc của thuật toán, thông qua việc gán một hàm mới
biến cố. Các sự kiện từ tập hợp mở trực tuyến, O trên, được mô tả Đơn
Đơn hàng bình thường
bằng màu cam, trong khi các sự kiện chưa
hàng bình thường

được gán có màu xanh lam. Bằng cách chọn sự kiện nhỏ nhất và chưa được gán, chúng tôi tạo ra một
Màu sắc chính

khoảng thời gianSựtrực


kiện trựctuyến của
tuyến / khoảng thờichiều
gian dài d trên và sau đó chúng tôi tìm kiếm sự kiện trực tuyến mở gần với đầu
khoảng thời gian nhất. Sau khi tìm thấy một trận đấu, sự kiện trực tuyến mở sẽ bị xóa khỏi O trên và
Sự kiện ngoại tuyến / khoảng thời gian

Sự kiện kênh trước khi hoán đổi


sự kiện mới củaSự
fl kiện
ine kênh
đượcsau
thêm O tắt . Fi gure 8.6 tóm tắt ý tưởng cơ bản của thuật toán.
vàođổi
khi hoán

Đối với khoảng thời gian phiên có độ dài nhất định, không chắc rằng chúng ta có một khởi đầu hoàn toàn phù hợp
biến cố. Do đó, khối lượng công việc kết quả sẽ có độ dài phiên trực tuyến / trong tổng số phiên gần giống
nhưng không giống với mô hình của chúng tôi. Vì tỷ lệ phiên trực tuyến / trong phiên thay thế thời lượng
phiên trực tuyến / trong phiên, như được chỉ ra trong phân tích trước đó của chúng tôi, chúng tôi hy vọng
rằng thời lượng phiên trung bình sẽ nhỏ hơn giá trị thu được từ mô hình, để phù hợp với tất cả các sự kiện
của phiên.

8.2.4 Hiệu chỉnh cho các mốc thời gian của phiên

Không giống như hoạt động của người dùng trong đời thực, tổng hợp khối lượng công việc sử dụng phân
phối xác suất mô hình để tạo ra các sự kiện người dùng bật / tắt thiết bị và thay đổi kênh truyền hình của
họ. Bởi vì những sự kiện này được điều chỉnh bởi quy luật của các số ngẫu nhiên, trong những trường hợp
rất bất ngờ, có thể xảy ra hai sự kiện phiên trực tuyến / trong số các sự kiện phiên trực tuyến gần hơn các sự
kiện kênh tương ứng của chúng. Fi gure 8.7 minh họa chính xác tình huống này, trong đó các kênh sự kiện
tương ứng với việc bật / tắt UE nằm ngoài các sự kiện trực tuyến / trong tổng thể tương ứng.
Trong những tình huống hiếm hoi khi ngoại lệ này xảy ra, chúng ta có thể thực hiện hai cách tiếp cận khác nhau. Đầu
tiên, chúng tôi tìm kiếm sự kiện kênh liền kề mà hầu hết có thể được gán cho dòng thời gian của người dùng khác. Nếu
một sự kiện được tìm thấy và có thể hoán đổi, bằng cách không thay đổi thứ tự sự kiện cho người dùng kia, chúng tôi sẽ
trao đổi hai sự kiện kênh. Fi gure 8.8 cho thấy nguyên tắc liên quan. Nói chung, khi hoán đổi sự kiện xảy ra, nó được thực
hiện với sự thỏa hiệp của một khoảng thời gian chưa đến hạn lớn hơn giữa sự kiện trực tuyến / trực tuyến và các sự kiện
kênh. Trong quá trình tổng hợp khối lượng công việc, chúng tôi có thể chọn ngưỡng trên cho khoảng thời gian chưa đến
mà chúng tôi chấp nhận được và chỉ hoán đổi các sự kiện khi ngưỡng này không bị vượt quá.

Khi không thể hoán đổi, chúng tôi không liên kết bất kỳ sự kiện nào của kênh với sự kiện trực tuyến và
sự kiện trực tuyến. Trong thực tế, điều này có thể tương ứng với tình huống người dùng bật nhanh UE
trước khi tắt lại và trong khoảng thời gian này, UE không dò kênh TV nào. Trên thực tế, tỷ lệ các phiên trực
tuyến yêu cầu điều chỉnh là rất nhỏ. Theo kinh nghiệm của chúng tôi, nó
Sự kiện trực tuyến / khoảng thời gian

Sự kiện ngoại tuyến / khoảng thời gian


Sự kiện kênh Sự kiện ngoại tuyến
Sự kiện kênh

8.2. Hoạt động người dùng 101

Thứ tự bất thường Đơn hàng bình thường

Đơn hàng bình thường Đơn hàng bình thường

Màu sắc chính

Sự kiện trực tuyến / khoảng thời gian

Sự kiện ngoại tuyến / khoảng thời gian

Sự kiện kênh trước khi hoán đổi


Sự kiện kênh sau khi hoán đổi

Hình 8.8: Điều chỉnh tiến trình phiên bằng cách hoán đổi các sự kiện kênh với người dùng khác.

Trên Thay đổi Tắt

Màu sắc chính

Sự kiện trên kênh


Sự kiện ngoài kênh
Thay đổi sự kiện kênh

Hình 8.9: Các loại sự kiện phiên kênh và ánh xạ của chúng tới các khoảng thời gian của kênh.

là khoảng 0,5%, tùy thuộc vào các thông số được sử dụng để tạo khối lượng công việc, chẳng hạn như số
lượng người dùng và thời lượng.

8.2.5 Khoảng thời gian phiên kênh


Mỗi sự kiện kênh được đặc trưng bởi một kiểu, chỉ định xem nó có tương ứng với việc chuyển đổi UE hay không trên hoặc
là tắt, hoặc một kênh thay đổi. Trên sự kiện chỉ có thể bắt đầu các khoảng thời gian của kênh, tắt sự kiện chỉ có thể kết thúc
các khoảng thời gian của kênh, trong khi thay đổi các sự kiện có thể bắt đầu và kết thúc chúng. Fi gure 8.9 minh họa ánh
xạ này cho khoảng thời gian trực tuyến của một UE đã chọn. Kênh trên và tắt các sự kiện được liên kết với các mốc thời
gian của UE thông qua ánh xạ của chúng tới các sự kiện phiên trực tuyến / trong phiên. Do đó, mục tiêu hiện tại là thêm
vào mỗi dòng thời gian của UE các sự kiện thay đổi, sao cho các khoảng kết quả có thời lượng được phân phối siêu cấp số
nhân.
Việc tạo ra các khoảng thời gian của phiên kênh, được biểu thị bằng Tôi ch, theo một quy trình tương tự như
phiên trực tuyến / trực tuyến, dựa trên cách tiếp cận lập trình động. Chúng tôi duy trì một tập hợp, O ch, sự
kiện kênh mở có thể được chỉ định vào đầu các khoảng thời gian mới. Đây là những sự kiện
đã được chỉ định cuối cùng cho dòng thời gian của mỗi người dùng và chỉ trên và thay đổi sự kiện có thể
được thêm vào tập hợp này. Kênh tắt các sự kiện xảy ra ngay trước khi tắt UE, và do đó không thể bắt đầu
một khoảng kênh mới.
Bằng cách lặp lại tất cả các sự kiện kênh, theo thứ tự thời gian, tùy thuộc vào loại sự kiện, chúng tôi có
các khả năng sau.

• Kênh trên các sự kiện được thêm vào tập hợp mở, mà không tạo ra bất kỳ khoảng thời gian mới nào vì UE
tương ứng đã ở trong khoảng thời gian cho đến khi sự kiện xảy ra.

• Đối với kênh thay đổi các sự kiện, chúng tôi tạo khoảng thời gian kênh mới với siêu cấp số nhân
102 Chương 8. Tổng hợp khối lượng công việc

Ngoại tuyến
e trên, 1,1 Tôi trên, 1,1 e tắt, 1,1 Tôi tắt, 1,1 e trên, 1,2
phiên họp

e ch, 1,1 e ch, 1,2 e ch, 1,3 e ch, 1,4 e ch, 1,5 e ch, 1,6

Kênh
phiên họp

Tôi ch, 1,1 Tôi ch, 1,2 Tôi ch, 1,3 Tôi ch, 1,4 Tôi ch, 1,5

Màu sắc chính

Sự kiện phiên
Khoảng thời gian phiên

Hình 8.10: Dòng thời gian phiên cho một người dùng cá nhân.

thời lượng phân phối và chúng tôi đối sánh nó với các UE ban đầu còn lại, là các UE không có sự kiện
trước đó trên dòng thời gian của chúng hoặc với sự kiện mở là sự kiện phù hợp nhất với khoảng thời
gian.

• Những sự kiện tắt tạo khoảng thời gian kênh, có thể là kết thúc mở, nếu UE tương ứng là khoảng thời
gian ban đầu hoặc được khớp với sự kiện cuối cùng, ngược lại. Trong tình huống cuối cùng này,
khoảng thời gian không tuân theo mô hình. Tuy nhiên, chúng tôi coi sự xấp xỉ này là sự thỏa hiệp tốt
giữa độ chính xác của khối lượng công việc và hiệu suất của thuật toán. Đánh giá sâu về khối lượng
công việc tổng hợp, trong chương tiếp theo, cho thấy rằng độ lệch so với mô hình là đủ nhỏ để có thể
chấp nhận được trong các trường hợp thực tế.

Fi gure 8.10 nhấn mạnh mối quan hệ giữa các sự kiện và khoảng thời gian, cho phép dễ dàng truy cập
vào tất cả các thành phần phiên có cùng dòng thời gian của người dùng. Gure cho thấy bản chất chồng
chéo của phiên trực tuyến / trực tuyến và kênh, và vai trò của ánh xạ giữa các sự kiện của chúng.

8.3 Chỉ định kênh


Ở bước cuối cùng của quá trình tổng hợp khối lượng công việc, chúng tôi chỉ định các kênh truyền hình riêng lẻ cho
các phiên kênh của người dùng. Việc gán kênh sử dụng tính phổ biến của kênh toàn cầu, được trình bày trong
phần 7.3, bao gồm chuyển mạch tuần tự và chuyển mạch đích. Chuyển đổi tuần tự sử dụng bộ nhớ của kênh trước
đây, trong khi chuyển đổi mục tiêu xem xét mức độ phổ biến tức thời của tất cả các kênh TV. Mô hình giả định rằng
tất cả người đăng ký đều có quyền truy cập vào toàn bộ tập hợp các kênh truyền hình và thứ tự của các kênh được
thay đổi ngẫu nhiên đối với người xem.
Thuật toán gán, được minh họa trong fi gure 8.11, cực kỳ đơn giản. Cho mọi
khoảng thời gian kênh, chúng tôi xác định hành động của người dùng dựa trên xác suất thay đổi kênh p S, p o,
p f cho lần lượt chuyển đổi tuần tự, bật UE và chuyển tiếp. Chúng tôi không thực hiện p o
xác suất trực tiếp, thay vào đó nó được lấy từ loại sự kiện thay đổi kênh. Nhiều nhất
hoạt động tốn kém, xét về công suất xử lý cần thiết, là tính toán kênh chuyển đổi mục tiêu, vì nó yêu cầu
cập nhật mức độ phổ biến tức thời của tất cả các kênh truyền hình trong mỗi lần thay đổi kênh.

8.4 Kết luận


Tổng hợp khối lượng công việc IPTV là một hoạt động đầy thách thức. Lý do chính là sự đơn giản hóa đằng
sau mô hình khối lượng công việc và tính gần như độc lập giữa các khía cạnh khác nhau của mô hình.
Những điều này cũng cần thiết vì chúng tôi muốn giữ số lượng mô hình
8,4. Kết luận 103

Khởi đầu

Tạo đồng phục p • [0,1]

pq• S pq• S

Tuần tự Mục tiêu


Sự kiện kênh là thay đổi Sự kiện kênh là trên
Tính toán P (t) cho tất cả các kênh truyền hình
t

Tạo đồng phục p • [0,1] cMới • ccũ


Tạo đồng phục p • [0,1]
p•q f p•q f • c •

cMới • tối đa c• • Ptôi,t)k (• p •

cMới ••• • • 1c
• •cũ • 1• cMới ••• • • 1c
• •cũ • •
1 •• k •1 ••

Có nhiều khoảng thời gian kênh hơn không?


Đúng

Không

Dừng lại

Hình 8.11: Thuật toán gán kênh.

tham số nhỏ, bởi vì chúng tôi không có dữ liệu thích hợp để ước tính các tham số nhất định với mức độ phức
tạp cao, hoặc để giữ cho thuật toán tổng hợp phù hợp hơn. Vì vậy, chúng tôi đề xuất thực hiện phương
pháp tiếp cận theo từng bước, trong đó chúng tôi tạo theo thứ tự từng thành phần sau của hoạt động
người dùng: (i) các sự kiện phiên; (ii) các mốc thời gian của phiên trực tuyến; (iii) các mốc thời gian của phiên
kênh; (iv) sự phù hợp giữa các mốc thời gian trực tuyến / trong tổng số và kênh, và cuối cùng; (v) các kênh
truyền hình phiên.
Bởi vì mô hình khối lượng công việc là một mô hình gần đúng với thực tế, thật khó để tạo ra một kết quả
phù hợp hoàn hảo với các khía cạnh khác nhau của hành vi người dùng. Vì những lý do này, chúng tôi cho
rằng cần phải thỏa hiệp ceratin, miễn là lỗi không có tác động đáng kể. Theo phân tích phân tích của chúng
tôi, điểm đầu tiên trong số này xuất hiện giữa tỷ giá phiên và thời lượng phiên, chúng tôi điều chỉnh bằng
cách ưu tiên tỷ giá trong thời gian.
Việc thiết lập dòng thời gian của người dùng, nghĩa là sự liên kết giữa một tập hợp con các sự kiện phiên với
một người dùng nhất định, xem xét logic hoạt động của người dùng: người dùng bật UE TV / set-top box của họ,
thay đổi kênh và sau đó tắt thiết bị của họ. Để tính toán các mốc thời gian của người dùng theo các ràng buộc của
mô hình khối lượng công việc, đồng thời cung cấp khả năng mở rộng ở mức độ cao về cả thời gian và không gian
người dùng, chúng tôi sử dụng phương pháp lập trình động. Nguyên tắc của phương pháp này bao gồm ghi nhớ
sự kiện cuối cùng từ mỗi dòng thời gian và thêm các sự kiện mới vào dòng thời gian của người dùng để cung cấp
kết quả phù hợp nhất cho thời lượng phiên.
104 Chương 8. Tổng hợp khối lượng công việc
Chương 9
Đánh giá khối lượng công việc

9.1 Tổng quan


Tính sẵn có hạn chế của dữ liệu đời thực về hoạt động xem TV là lý do thúc đẩy chính đằng sau công việc của
chúng tôi về mô hình hóa và tổng hợp khối lượng công việc. Ngoài ra, một đầu vào tổng hợp có lợi ích là cho phép
chúng tôi điều chỉnh các thông số nhất định, chẳng hạn như số lượng người đăng ký truyền hình hoặc số kênh
truyền hình. Bằng cách thay đổi các tham số kịch bản, chúng tôi có thể kiểm tra các thuật toán P2PTV của mình
trong nhiều điều kiện khác nhau và do đó chúng tôi không bị giới hạn bởi các đặc tính của tập dữ liệu gốc.

Nhiều tác giả đã nhận ra tầm quan trọng của mô hình hệ thống, bao gồm Qiu và cộng sự, dựa trên dữ
liệu mà chúng tôi dựa trên phương pháp tổng hợp của họ và mô hình và trình tạo Simulwatch mà chúng tôi
đã mở rộng trong công việc hiện tại của mình ( Qiu, Ge, Lee, Wang, Xu và Zhao , 2009 ; Qiu, Ge, Lee, Wang,
Zhao và Xu , 2009 ). Đặc biệt, khi dữ liệu hoàn chỉnh không thể được công bố, do các thỏa thuận không tiết lộ
hoặc các vấn đề về quyền riêng tư, thì việc xác định chính xác thực tế cung cấp một công cụ vô giá để thiết
kế và tối ưu hóa hệ thống. Tài liệu khoa học có chứa các ấn phẩm tương tự về mô hình hóa Internet TV, sử
dụng dữ liệu từ dịch vụ PPLive, hiện được đặt tên là PPTV, 1 ( Vu et al. , 2007 ), hoặc trên các dịch vụ video theo
yêu cầu ( Tang và cộng sự. , 2003 ).
Theo quan điểm của chúng tôi, khối lượng công việc IPTV tổng hợp có tầm quan trọng tối cao đối với việc thiết
kế máy chủ ứng dụng P2PTV. Ý tưởng cốt lõi của các thuật toán điều phối phiên và ngang hàng, SCA và PCA, là dự
đoán nhu cầu của người dùng và thực hiện hành động khắc phục trước. Do đó, để cho phép một thiết kế và thử
nghiệm phù hợp, yêu cầu của người dùng phải đáp ứng các điều kiện làm việc thực tế. Cuối cùng, trong chương
này, chúng tôi phân tích khối lượng công việc tổng hợp dựa trên dữ liệu có sẵn, để xác định xem các phần mở rộng
của chúng tôi đối với mô hình Simulwatch và các giá trị gần đúng được thực hiện trong quá trình triển khai có được
chấp nhận hay không.
Chúng tôi tiếp cận việc đánh giá khối lượng công việc IPTV từ cả góc độ hẹp và góc độ rộng. Trong trường hợp
đầu tiên, chúng tôi xác minh các đặc điểm của hoạt động của người dùng tổng hợp dựa trên dữ liệu đo lường tạo
thành cơ sở của mô hình khối lượng công việc. Sự so sánh này nhấn mạnh những điểm tương đồng như

1 Trang chủ PPTV, http://www.pptv.com/


106 Chương 9. Đánh giá khối lượng công việc

1,5
Dấu vết
Sợi tổng hợp

1,4

1,3

1,2

u trên
1.1

0,9

0,8

0,7
Thu T6 Đã ngồi mặt trời Thứ hai Thứ ba

ngày

Hình 9.1: So sánh tỷ lệ người dùng trực tuyến trong khối lượng công việc tổng hợp với dữ liệu theo dõi.

cũng như các sai số gần đúng. Trong tình huống thứ hai, chúng tôi so sánh khối lượng công việc tổng hợp của mình với
dữ liệu từ các nghiên cứu khác về hệ thống IPTV, với mục đích chỉ ra rằng khối lượng công việc có thể đặc trưng cho một
mô hình rộng hơn về cách người dùng xem TV.

9.2 Đánh giá dựa trên dữ liệu theo dõi


Chúng tôi bắt đầu bằng cách so sánh khối lượng công việc tổng hợp với dữ liệu IPTV có sẵn từ Qiu và cộng sự, đây là cơ sở
đằng sau mô hình mở rộng và các thuật toán tổng hợp của chúng tôi. Để đạt được mục đích này, chúng tôi so sánh ba chỉ
số cơ bản: tỷ lệ thiết bị người dùng trực tuyến, đặc điểm phiên, bao gồm tốc độ phiên và thời lượng phiên, và cuối cùng là
mức độ phổ biến của kênh. Trước đây, chúng tôi đã chỉ ra rằng chúng tôi không lập mô hình và tổng hợp các lớp người
dùng cũng như sở thích của người dùng đối với các kênh truyền hình cụ thể, do dữ liệu không chính xác bao gồm các khía
cạnh này.

9.2.1 Hoạt động của người dùng

9.2.1.1 Phần người dùng trực tuyến

Fi gure 9.1 so sánh phần nhỏ của các UE trực tuyến, u trên, giữa dữ liệu theo dõi ban đầu và
khối lượng công việc tổng hợp. Chúng tôi nhắc nhở người đọc rằng các thuật toán của chúng tôi, không tạo ra u trên trực
tiếp. Thay vào đó, phần người dùng trực tuyến / trong tổng số người dùng được xác định tự động theo tỷ lệ
trực tuyến / trong số các sự kiện phiên.

Khi đánh giá mức độ tốt của các kết quả của chúng tôi, chúng tôi lưu ý rằng xu hướng của cả đại lượng
vết và đại lượng tổng hợp là tương tự nhau trong suốt khoảng thời gian đo. Đầu tiên, tỷ lệ UE trực tuyến
trong ngày tuân theo mô hình hoạt động thấp vào ban đêm và hoạt động cao vào giờ chiều và buổi tối. Thứ
hai, việc bổ sung chức năng điều biến gần đúng với mô hình dao động hàng tuần, với nhiều người dùng
xem TV hơn vào cuối tuần.
Mặc dù kết quả tích cực này, có một số lỗi có thể quan sát được, trong đó khối lượng công việc tổng hợp
đánh giá thấp nhu cầu của người dùng trong giờ cao điểm và chỉ một số ngày mới cung cấp kết quả phù
hợp. Nguyên nhân sâu xa của những lỗi này nằm ở bản chất của mô hình tỷ lệ phiên, do đó, nó quyết định
phần nhỏ người dùng trực tuyến. Do dữ liệu có sẵn hạn chế, mô hình tỷ lệ phiên chỉ sử dụng dữ liệu trong
ngày. Có thể là đại diện cho ngày, không thể nắm bắt được những thay đổi giữa các ngày. Do đó, khối
lượng công việc thể hiện phần nhỏ người dùng trực tuyến trong Thứ Sáu và Thứ Bảy chính xác hơn Thứ
Năm hoặc Chủ Nhật.
Ngoài ra, việc đánh giá thấp các đỉnh buổi tối được xác định bằng cách loại bỏ các thành phần cao nhất
thời khỏi tỷ giá phiên. Để giữ cho các thông số của mô hình ở mức thấp, mô hình của chúng tôi loại trừ các
thành phần tần số rất cao, sự mất mát của chúng gây ra tỷ lệ đến thấp hơn ở
9.2. Đánh giá dựa trên dữ liệu theo dõi 107

× 10 - 3 × 10 - 4 × 10 - 3
1,5 4 10
Dấu vết Dấu vết Dấu vết

x trên [ S - 1]
1

x ch [ S - 1]
x tắt [ S - 1]
2 5
0,5

0 0 0
0 4 số 8 12 16 20 24 0 4 số 8 12 16 20 24 0 4 số 8 12 16 20 24
t [ h] t [ h] t [ h]
× 10 - 3 × 10 - 4 × 10 - 3
1,5 4 6
Tổng hợp (Thứ năm) Tổng hợp (Thứ 4) Tổng hợp (Thứ 4)
x trên [ S - 1]

1 4

x ch [ S - 1]
Tổng hợp (Chủ nhật) Tổng hợp (Chủ nhật) Tổng hợp (Chủ nhật)

x tắt [ S - 1]
2
0,5 2

0 0 0
0 4 số 8 12 16 20 24 0 4 số 8 12 16 20 24 0 4 số 8 12 16 20 24
t [ h] t [ h] t [ h]

(a) Tỷ lệ phiên trực tuyến chuẩn hóa (b) Bình thường hóa tỷ lệ phiên (c) Tỷ lệ phiên kênh chuẩn hóa z ch.
x trên. z tắt
∗ .

1 1 0,7
Dấu vết Dấu vết Dấu vết
Sợi tổng hợp Sợi tổng hợp Sợi tổng hợp
0,6
0,8 0,8
0,5
CCDF 1 - F (d trên)

0,6 0,6
CCDF 1 - F (d tắt )

CCDF 1 - F (d ch)
0,4

0,3
0,4 0,4

0,2
0,2 0,2
0,1

0 0 0
10 0 10 5 10 0 10 5 10 0 10 5
d trên d tắt d ch

(d) Thời lượng phiên trực tuyến d trên. (e) Trong thời lượng phiên d tắt . (f) Thời lượng phiên kênh d ch.

Hình 9.2: So sánh khối lượng công việc tổng hợp của chúng tôi với dữ liệu theo dõi.

Ranh giới chương trình truyền hình vào buổi tối. Hiệu ứng tương tự, mặc dù ít rõ rệt hơn, được quan sát
thấy sau nửa đêm khi người dùng tắt thiết bị của họ và tỷ lệ khởi hành tổng hợp cũng nhỏ hơn.
Thật không may, do sự phức tạp của dữ liệu trong cuộc sống thực, việc sửa những lỗi này là không dễ dàng và vì mục
đích của chúng tôi, bất chấp những điểm không hoàn hảo hiện có, chúng tôi coi mô hình hiện có là có thể chấp nhận
được. Đối với các ứng dụng khác, khi mong muốn mức độ chính xác cao hơn, tốc độ phiên có thể được mô tả đơn giản
bằng số lượng thông số cao hơn, bằng cách sử dụng các nguyên tắc tương tự mà chúng tôi đã mô tả trong chương 7.

9.2.1.2 Tỷ lệ phiên

Các fi gures 9.2 (a), 9.2 (b) và 9.2 (c) so sánh dấu vết và tổng hợp trực tuyến, của fl ine và tốc độ phiên kênh
với mô hình dựa trên các thành phần tần số lần lượt là 58, 47 và 64. Giống như trong dữ liệu ban đầu, tỷ lệ
phiên trực tuyến được chuẩn hóa cho số lượng người dùng không chính thức, trong khi tỷ lệ phiên kênh và
tỷ lệ phiên kênh được chuẩn hóa cho số lượng người dùng trực tuyến. Bởi vì trong các thuật toán tổng hợp,
tốc độ phiên được ưu tiên hơn các đặc điểm khối lượng công việc khác, chúng tôi thu được giá trị gần đúng
rất tốt của dữ liệu thực.
Tỷ lệ phiên trực tuyến và tỷ lệ phiên trực tuyến được điều chỉnh để tạo ra mô hình hàng tuần cho một
phần nhỏ người dùng trực tuyến. Vì vậy, thông tin của chúng tôi hiển thị tỷ giá tổng hợp cho hai ngày đại
diện trong tuần, Thứ Năm và Chủ Nhật, khi nhu cầu của người dùng tương ứng là thấp và cao. Sự thay đổi
tỷ lệ tương tự đối với cả sự kiện trực tuyến và sự kiện, với tỷ lệ trực tuyến cao hơn một chút và tỷ lệ thấp hơn
trong những ngày cao điểm. Ở chế độ của chúng tôi, tỷ lệ phiên kênh không bị ảnh hưởng bởi các ngày
trong tuần.

9.2.1.3 Thời lượng phiên

Trong chương 8, phân tích phân tích của chúng tôi cho thấy rằng, do dữ liệu không đầy đủ và mô hình gần
đúng, tồn tại sự không khớp giữa số lượng sự kiện phiên và khoảng thời gian của phiên, được tạo ra ở tỷ lệ
mô hình và phân phối thời lượng. Sự không khớp này xảy ra đối với bất kỳ loại phiên nào. Để đáp ứng sự
khác biệt này, có hai khả năng: sửa đổi khối lượng công việc
108 Chương 9. Đánh giá khối lượng công việc

Mở sự kiện trực tuyến

Sự kiện trực tuyến bị đình trệ

Dòng thời gian của người dùng

Dòng thời gian bị đình trệ

Màu sắc chính


Sự kiện trực tuyến / khoảng thời gian

Sự kiện trực tuyến bị đình trệ

Khoảng thời gian ngoại tuyến

Hình 9.3: Dòng thời gian của người dùng bị đình trệ trong quá trình tổng hợp khối lượng công việc.

mô hình hoặc ưu tiên một tham số hơn tham số khác trong quá trình tổng hợp. Bởi vì cả hai phương pháp đều tạo
ra độ lệch so với dữ liệu có sẵn, chúng tôi đã kiểm tra và triển khai cách tiếp cận thứ hai, bằng cách định tỷ lệ được
tạo ra cho một tỷ lệ cụ thể của mô hình và cho phép một sai số nhất định đối với độ dài khoảng thời gian. Phương
pháp này có ưu điểm là giữ cho mô hình khối lượng công việc đơn giản hơn, đồng thời cung cấp giải pháp thiết
thực cho sự khác biệt.
Phiên trực tuyến và phiên trực tuyến thuộc cùng một dòng thời gian của người dùng và về lý thuyết, lỗi
được chia sẻ giữa chúng. Trước đây, chúng tôi đã tính toán tỷ lệ giữa số phiên, tính vào một khoảng thời
gian tùy ý, dựa trên độ dài khoảng thời gian, d, và tỷ lệ sự kiện tuyệt đối, z, tại:

n d, o u 0,65.
(9,1)
n z, o

Kết quả này chỉ ra rằng độ dài khoảng cộng trực tuyến lớn hơn và không nằm trong các sự kiện phiên. Các
giá trị 9,2 (d) và 9,2 (e) tạo ra sự khác biệt giống nhau trong các hàm phân phối tích lũy bổ sung (CCDF) của
các khoảng thời gian trực tuyến và của các khoảng thời gian tương ứng. Chúng tôi lưu ý rằng lỗi được chia
sẻ không đồng đều giữa các phiên trực tuyến và trong phiên, do cách triển khai các thuật toán tổng hợp của
chúng tôi xử lý các phép gán sự kiện từ các tập hợp đang mở. Trên thực tế, thời lượng trung bình của các
khoảng thời gian trực tuyến cao hơn một chút so với mức trung bình, điều này được bù đắp bằng mức giảm
trung bình của các phiên ine lớn hơn.
Vì lợi ích của việc mô tả các thuật toán tổng hợp càng đơn giản càng tốt, trong chương 8, chúng tôi đã
bỏ qua một số chi tiết nhỏ. Một trong số đó là việc ngăn chặn dòng thời gian của người dùng bị đình trệ,
là các dòng thời gian của người dùng không tiến triển bởi vì sự kiện của họ không bao giờ được chọn từ tập
hợp đang mở. Fi gure 9.3 minh họa tình huống của dòng thời gian bị đình trệ, khi sự kiện trực tuyến tương
ứng bị chậm lại so với tiến trình bình thường. Khi khoảng cách đến sự kiện hiện tại tiếp tục tăng lên, xác
suất chọn sự kiện bị đình trệ là không.
Trong mã C ++ của mình, chúng tôi đã thử nghiệm một số chiến lược để ngăn chặn sự xuất hiện của các mốc
thời gian bị đình trệ, mỗi chiến lược có một mức hiệu suất khác nhau về thời gian thực thi, tính gần đúng của mô
hình và cân bằng giữa các phiên trực tuyến và trong phiên. Chúng tôi tin rằng cách tiếp cận đã chọn của chúng tôi
mang lại sự thỏa hiệp hợp lý giữa những điều này, với tác dụng phụ là khoảng thời gian trực tuyến dài hơn bình
thường, đặc biệt là do thiết kế của các thuật toán điều phối phiên và điều phối ngang hàng không nhạy cảm lắm
với độ dài phiên. Chúng tôi thừa nhận rằng có thể có nhiều thuật toán tổng hợp hiện đại hơn và thông minh hơn,
điều này có thể làm giảm sai số giữa khối lượng công việc được tạo và mô hình.

Trong fi gure 9.2 (f), chúng tôi kiểm tra khoảng thời gian cho các phiên kênh. Lỗi có tính chất tương tự,
do sự không khớp của mô hình và các ràng buộc của thuật toán. Phân tích trước đây cho thấy rằng số
khoảng thời gian được điều chỉnh bởi một khoảng thời gian tùy ý, dựa trên thời lượng,
9.2. Đánh giá dựa trên dữ liệu theo dõi 109

Màu sắc chính


Sự kiện trực tuyến / khoảng thời gian

Sự kiện / khoảng thời gian của kênh

Sự kiện ngoại tuyến / khoảng thời gian

Khoảng cách sự kiện trực tuyến

Khoảng cách sự kiện ngoại tuyến


1
Sự kiện trực tuyến Kênh trên biến cố
0,8

0,6

CDF
0,4

0,2

0
10 - 6 10 - 4 10 - 2 10 0 10 2
•trên
ǫ trên

1
Kênh tắt biến cố Sự kiện ngoại tuyến
0,8

0,6

CDF
0,4

0,2

0
10 - 6 10 - 4 10 - 2 10 0 10 2
•tắt ǫ tắt

(a) Nguyên nhân của lỗi sự kiện trong dòng thời gian phiên. (b) CDF của lỗi sự kiện.

Hình 9.4: Sai số ước lượng giữa các phiên trực tuyến / trong tổng số và các phiên kênh.

vượt quá tỷ lệ dựa trên tỷ lệ sự kiện kênh:

n d, c u 1,39.
(9.2)
n z, c

Do đó, khoảng thời gian tổng hợp trung bình cao hơn một chút so với mô hình, cũng được đưa ra trong kết quả của
chúng tôi.

9.2.1.4 Khoảng cách sự kiện phiên

Trong dữ liệu mô hình có sẵn từ Qiu và cộng sự, các sự kiện kênh thể hiện bất kỳ thay đổi trạng thái nào đối
với kênh TV hiện tại của người dùng, bao gồm cả việc bật và tắt thiết bị của người dùng ( Qiu, Ge, Lee, Wang,
Xu và Zhao , 2009 ). Khi người dùng bật UE của nó, nó sẽ tự động dò kênh, thường là kênh TV cuối cùng; và,
rõ ràng hơn, khi người dùng tắt UE của nó, nó cũng dò ra khỏi kênh hiện tại. Bằng cách xem xét logic này,
trong dòng thời gian của mỗi người dùng, chúng tôi đã chia các sự kiện kênh thành bật, tắt và thay đổi fl
avors. Từ khái niệm của chúng, hai loại đầu tiên luôn được ánh xạ tới các sự kiện trực tuyến và các sự kiện
kênh, nơi lý tưởng là chúng phải trùng khớp với nhau.
Trên thực tế, xem xét bản chất ngẫu nhiên của tỷ lệ sự kiện, không thể có được sự trùng lặp hoàn hảo
giữa trực tuyến và trên sự kiện kênh, và trong và tắt sự kiện kênh. Thuật toán tổng hợp của chúng tôi có
tính đến giá trị gần đúng này và quy tắc chung là trên
sự kiện kênh sẽ ngay lập tức thành công sự kiện trực tuyến, trong khi tắt sự kiện kênh phải ngay trước sự
kiện of fl ine. Các sự kiện khớp theo cách này phải gần bằng
có thể, với một sai số khoảng cách không đáng kể được biểu thị bằng ε trên và ε tắt như chúng tôi trình bày trong fi gure 9.4 (a).

Để đánh giá sự phù hợp sự kiện của khối lượng công việc tổng hợp của chúng tôi, trong điều kiện 9.4, chúng
tôi hiển thị CDF của khoảng cách sự kiện phiên trực tuyến và của phiên, đó là khoảng cách giữa một cặp sự kiện
phù hợp. Kết quả cho thấy khớp rất tốt, với trung bình lỗi khoảng cách phiên là 61,7 mili giây và
66,5ms, tương ứng. Lỗi lớn hơn một giây trong ít hơn 1,5% phiên. Lỗi khoảng cách phiên là rất nhỏ, nguồn
gốc của nó hoàn toàn là do nghệ thuật và các tác động có ít ảnh hưởng đến hiệu suất tổng thể của hệ
thống. Do đó, chúng tôi tin rằng việc loại bỏ lỗi hoàn toàn, bằng cách sửa đổi mô hình khối lượng công việc
hoặc thuật toán tổng hợp, sẽ mang lại ít lợi ích xứng đáng cho nỗ lực.
110 Chương 9. Đánh giá khối lượng công việc

qqp
soi

q •
qqp
scfi 1 (mod N)
q •
qqp
scbi 1 (mod N)

Tôi • 2 Tôi • 1 Tôi Tôi • 1 Tôi • 2


Huyền thoại N
Chuyển đổi mục tiêu qt pj P
• • •, 1 ()
Tôi
Bật lên j •1
j • Tôi
Đang duyệt

Hình 9.5: Mô hình hóa việc chuyển kênh bằng chuỗi Markov.

9.2.2 Mức độ phổ biến của kênh

Mức độ phổ biến của kênh bao gồm một số thành phần mô hình hóa các khía cạnh khác nhau về cách người
dùng thay đổi giữa các kênh TV. Hành vi xem TV được phân chia giữa việc điều chỉnh TV đến một kênh quan
tâm cụ thể, được gọi là chuyển đổi mục tiêu, và duyệt giữa các kênh khả dụng với mục đích tạo ra một
chương trình thú vị, được gọi là chuyển mạch tuần tự.
Như chúng tôi đã mô tả trong phần 7.3, Qiu et al. kết luận rằng một tập hợp các xác suất thống nhất có thể
mô hình hóa các loại chuyển mạch kênh khác nhau. Đối với chuyển đổi mục tiêu, tần số truy cập kênh tuân
theo sự kết hợp của zipf và hàm mũ cho hầu hết các kênh phổ biến và các kênh còn lại, tương ứng.

9.2.2.1 Mức độ phổ biến toàn cầu so với mục tiêu

Để xác minh độc lập mức độ phổ biến của kênh khối lượng công việc, chúng tôi tính toán xác suất truy cập-
bility của một kênh, được biểu thị bằng p Tôi, kết quả từ cả chuyển đổi mục tiêu và tuần tự. Với mục đích này,
chúng tôi lập mô hình quá trình chuyển kênh bằng chuỗi Markov độc lập về thời gian, trong đó
mỗi tiểu bang đại diện cho một kênh TV ( Bikfalvi và cộng sự. , 2011 ).
Các chuyển đổi trạng thái trong chuỗi Markov phụ thuộc vào thứ tự kênh khi người dùng truy cập. Với
mục đích này, chúng tôi sử dụng hàm hoán vị ngẫu nhiên σ ( Tôi), đã giới thiệu trong phần
7.3.3, đó là duy nhất cho mọi người dùng và ánh xạ tập hợp các kênh truyền hình được sắp xếp theo thứ tự giảm dần của chúng
mục tiêu chuyển đổi phổ biến P µ, Tôi thứ tự các kênh được lưu trên TV của người dùng. Để đơn giản hóa các
ký hiệu, chúng tôi sẽ xác định chuỗi Markov chuyển tiếp theo thứ tự kênh
nhận được bởi người dùng. Do đó, một kênh truyền hình trên vị trí Tôi trong chuỗi Markov sẽ có
mục tiêu chuyển đổi phổ biến P µ, σ - 1 ( Tôi). Fi gure 9.5 minh họa các chuyển đổi trạng thái Markov khi điều
chỉnh một kênh nhất định Tôi:

• xác suất chuyển đổi của việc chuyển đổi mục tiêu từ một kênh j Là q t P µ, σ - 1 ( Tôi), Ở đâu j 6 = Tôi;

• xác suất chuyển tiếp khi bật là q o;

• xác suất chuyển tiếp của chuyển đổi tuần tự chuyển tiếp từ kênh trước là
q S q c q f, và;

• xác suất chuyển tiếp của chuyển đổi tuần tự ngược từ kênh kế tiếp là
q S q c q b.

Do đó, chúng ta có thể viết xác suất chuyển sang kênh Tôi ( tức là xác suất chuyển đổi sang
trạng thái Markov Tôi) như:

N
p tôi = q t ∑ p j P µ, σ - 1 ( i) + q S q o p tôi + q S q c q f p Tôi - 1 (mod N) + q S q c q b p tôi + 1 (mod N). j = 1 (9,3)

j 6 = Tôi
9.2. Đánh giá dựa trên dữ liệu theo dõi 111

Bằng cách xem xét xác suất chuyển đổi cho tất cả các kênh TV và ràng buộc rằng tổng của tất cả các trạng thái
bằng một, chúng tôi thu được hệ thống tuyến tính không thuần nhất của N + 1 phương trình với N
không biết:


••
•• β p1+γ1 p2+α1 p3+α1 p4+· · · + α1 pN-1+δ1 pN =0
••
••
•• δ2 p1+β p2+γ2 p3+α2 p4+· · · + α2 pN-1+α2 pN =0
••
••
•• α3 p1+δ3 p2+β p3+γ3 p4+· · · + α3 pN-1+α3 pN =0
••

α4 p1+α4 p2+δ4 p3+β p4+· · · + α4 pN-1+α4 pN =0 (9,4)
••
•• ..
•• .
••
••
••
•• γN p1+αN p2+αN p3+αN p4+· · · + δN pN-1+β pN=0
••
••
• p1+p2+p3+p4+· · · + pN-1+pN = 1,

trong đó, để thuận tiện, chúng tôi đã tạo các ký hiệu tạm thời:

α k = - q t P µ, σ - 1 ( k),

β = 1 - q S q o,
(9,5)
γ k = - q t P µ, σ - 1 ( k) - q S q o q f,

δ k = - q t P µ, σ - 1 ( k) - q S q o q b.

Được viết dưới dạng ma trận, chúng ta có:

A · P = B, (9,6)

Ở đâu A là ( N + 1) × N ma trận:

• •
• β γ1 α1 α1 ··· α1 δ1 •
• •
• γ2 β δ2 α2 ··· α2 α 2 ••

• •
• •
• α3 δ3 β γ3· · · α3 α3•
• •
• •
A=• • α4 α4 δ4 β ··· α4 α 4 •• , (9,7)
• •
• . . . . ... . . •
• .
. .
.
.
.
.
.
.
.
.
. •
• •
• •
• γNαNαNαN· · · δN β ••

• •
1 1 1 1 ··· 1 1

P là N × 1 ma trận:

[ ]>
P= p1p2p3p4· · · pN , (9,8)

và B là ( N + 1) × 1 ma trận:

[ ]>
B= 0000···01 . (9,9)
112 Chương 9. Đánh giá khối lượng công việc

10 - 1
Chuyển đổi mục tiêu P µ, tôi
Chuyển đổi mục tiêu và tuần tự p Tôi

10 - 2

Mức độ phổ biến của kênh (tần suất truy cập)


10 - 3

10 - 4

10 - 5
10 0 10 1 10 2 10 3

Kênh ( Tôi)

Hình 9.6: So sánh mức độ phổ biến của kênh trung bình chuyển mạch đích, P µ, Tôi, với mức độ phổ biến của kênh
trung bình đối với chuyển đổi mục tiêu và tuần tự, p Tôi.

Kể từ lần đầu tiên N phương trình phụ thuộc tuyến tính 2, hệ thống tương đương với một hệ thống tuyến
tính không thuần nhất của N phương trình với N không biết. Với các thông số của chúng tôi, phần còn lại N các
phương trình độc lập tuyến tính, vì định thức của chúng khác 0 và hệ có nghiệm duy nhất:

P = A - 1 B. (9.11)

Do sự chuyển đổi tuần tự và hoán vị ngẫu nhiên của thứ tự kênh, phân
tổng xác suất truy cập kênh p Tôi khác với mức độ phổ biến của kênh chuyển mạch mục tiêu. Fi gure 9.6 so
sánh mức độ phổ biến của kênh, được đo dưới dạng tần số truy cập, có và không có
chuyển mạch tuần tự. Kết quả cho thấy rằng chuyển đổi kênh tuần tự phân phối lại một phần mức độ phổ
biến từ các kênh phổ biến nhất đến các kênh ít phổ biến nhất.

9.2.2.2 Mức độ phổ biến của chuyển mạch mục tiêu

Tác phẩm của Qiu et al. cung cấp tập dữ liệu phong phú về mức độ phổ biến của kênh. Các tác giả tiếp cận
vấn đề đo lường từ hai khía cạnh: khái niệm về mức độ phổ biến của kênh và khía cạnh thời gian của phép
đo. Điều đầu tiên thừa nhận rằng mức độ phổ biến có thể được thể hiện dưới dạng cả hai tần suất truy cập, và
tổng lượng thời gian mà người dùng bỏ ra, được gọi là thời gian chờ, trên kênh nhất định. Cả nghiên cứu đo
lường và nghiên cứu trước đây của chúng tôi về vấn đề này ( Bikfalvi và cộng sự. , 2011 ) cho thấy rằng, trên
thực tế, tần suất truy cập và thời gian dừng mang lại các giá trị phổ biến tương tự khi thời lượng phiên
trung bình hoặc thời gian giữ kênh bằng nhau.
Kích thước thời gian của phép đo mức độ phổ biến liên quan đến thời gian trong ngày và độ dài của cửa
sổ quan sát trong đó phép đo được thực hiện. Để đạt được mục đích này, các tác giả của Simulwatch cung
cấp ba bộ dữ liệu cho mỗi trường hợp: thời lượng khác nhau là 15 phút, 1 giờ và 12 giờ; và thay đổi thời gian
trong ngày lần lượt là 12 giờ sáng, 8 giờ sáng và 8 giờ tối. Thật không may, dữ liệu của họ chỉ tập trung vào
thành phần chuyển đổi mục tiêu của mức độ phổ biến trung bình, trong khi chuyển đổi hoặc duyệt tuần tự
được đặc trưng riêng biệt.
Các thiết bị fi 9.7 (a) và 9.7 (b) so sánh mức độ phổ biến của kênh tổng hợp với dấu vết, trong đó mức độ
phổ biến của kênh trung bình được đo tương ứng là tần số truy cập và thời gian dừng. Đối với dữ liệu theo
dõi, chúng tôi bao gồm các kích thước thời gian, với mức độ phổ biến là chức năng của
2 Đầu tiên N phương trình phụ thuộc tuyến tính do ràng buộc:

N
∑ P µ, σ - 1( i) = 1. (9,10)
tôi = 1

Do đó, bất kỳ phương trình nào cũng có thể được viết dưới dạng kết hợp tuyến tính của phương trình kia N - 1 phương trình.
9.2. Đánh giá dựa trên dữ liệu theo dõi 113

10 0 10 0

P µ, tôi ( tần suất truy cập)

P µ, tôi ( thời gian chờ)


10 - 5 10 - 5
Theo dõi 15 phút Theo dõi 15 phút
Theo dõi 1 giờ Theo dõi 1 giờ
Theo dõi 12 giờ Theo dõi 12 giờ
Sợi tổng hợp Sợi tổng hợp

10 - 10 10 - 10
10 0 10 1 10 2 10 3 10 0 10 1 10 2 10 3

Kênh ( Tôi) Kênh ( Tôi)

10 0 10 0
P µ, tôi ( tần suất truy cập)

P µ, tôi ( thời gian chờ)


10 - 5 10 - 5
Theo dõi 12 giờ sáng Theo dõi 12 giờ sáng
Theo dõi 8 giờ sáng Theo dõi 8 giờ sáng
Theo dõi 8 giờ tối Theo dõi 8 giờ tối
Sợi tổng hợp Sợi tổng hợp

10 - 10 10 - 10
10 0 10 1 10 2 10 3 10 0 10 1 10 2 10 3

Kênh ( Tôi) Kênh ( Tôi)

(a) Mức độ phổ biến được đo bằng tần suất truy cập. (b) Mức độ phổ biến được đo bằng thời gian dừng.

Hình 9.7: Mức độ phổ biến kênh trung bình cho chuyển mạch mục tiêu P µ: theo dõi so với khối lượng công việc tổng hợp.

10 0 10 - 1
Mô hình Mô hình
Tổng hợp (tần suất truy cập) Tổng hợp (tần suất truy cập)
p Tôi 10 - 2
P µ, tôi

10 - 3

10 - 5 10 - 4
0 100 200 300 400 500 600 700 0 100 200 300 400 500 600 700

Kênh ( Tôi) Kênh ( Tôi)

10 0 10 - 1
Mô hình Mô hình
Tổng hợp (thời gian dừng) Tổng hợp (thời gian dừng)

10 - 2
p Tôi
P µ, tôi

10 - 3

10 - 5 10 - 4
0 100 200 300 400 500 600 700 0 100 200 300 400 500 600 700

Kênh ( Tôi) Kênh ( Tôi)

(a) Mức độ phổ biến trung bình cho việc chuyển đổi mục tiêu, P µ. (b) Mức độ phổ biến trung bình cho chuyển đổi mục tiêu và tuần tự,
p.

Hình 9.8: Mức độ phổ biến trung bình của kênh: mô hình so với khối lượng công việc tổng hợp.

thời gian đo lường được minh họa trong phần trên cùng và mức độ phổ biến dưới dạng hàm của thời gian trong ngày
được hiển thị ở phía dưới.
Qiu el al. kết luận rằng thứ nguyên thời gian có ít ảnh hưởng đến mức độ phổ biến tổng thể, trong đó
các kênh luôn được sắp xếp theo thứ tự mức độ phổ biến giảm dần của chúng. Các tác giả của nghiên cứu
vẫn để ngỏ câu hỏi về việc liệu mức độ phổ biến của kênh không được sắp xếp có thay đổi theo kích thước
của cửa sổ đo lường hay theo thời gian trong ngày. Ví dụ: một tập hợp con kênh truyền hình phổ biến hơn
vào buổi sáng hơn là buổi tối. Thay vào đó, mô hình của họ giả định một bộ đồng phục
nghĩa là mức độ phổ biến của kênh, chúng tôi biểu thị bằng P µ, và điều chỉnh động lực phổ biến với
bổ sung một thành phần tức thời P t.
Thật không may, do thiếu bất kỳ dữ liệu chắc chắn nào, chúng tôi giả định rằng mức độ phổ biến trung bình là
giống nhau trong suốt cả ngày và cho bất kỳ khoảng thời gian đo lường nào. Bằng cách bỏ qua những điểm không
hoàn hảo này của mô hình, chúng tôi nhận thấy rằng mức độ phổ biến tổng hợp xấp xỉ tốt với dữ liệu thu thập
được cho một tập hợp con lớn của các kênh hiện có cho cả tần số truy cập và thời gian dừng. Lỗi lớn nhất xảy ra
đối với các kênh không phổ biến nhất, trong đó phân phối mức độ phổ biến giảm nhanh hơn so với mô hình hàm
mũ.
Trong fi gures 9,8 (a) và 9,8 (b), chúng tôi so sánh mục tiêu và mức độ phổ biến toàn cầu với các giá trị lý
thuyết tương ứng. Kết quả này cho thấy thuật toán tổng hợp gần đúng với mô hình, ngoại trừ một lỗi nhỏ
đối với thời gian dừng của các kênh không phổ biến nhất.
114 Chương 9. Đánh giá khối lượng công việc

10 0 10 0 10 0

10 - 5
10 - 5 10 - 5
CCDF 1 - F (d trên)

CCDF 1 - F (d tắt )

CCDF 1 - F (d ch)
10 - 10

10 - 10 10 - 10
10 - 15
Dấu vết Dấu vết Dấu vết
Mô hình của chúng tôi Mô hình của chúng tôi Mô hình của chúng tôi
Simulwatch Simulwatch Simulwatch
10 - 15 10 - 15 10 - 20
10 0 10 5 10 0 10 5 10 0 10 5
t [ S] t [ S] t [ S]

(a) d trên (b) d tắt (c) d ch

Hình 9.9: So sánh phân phối độ dài phiên: dữ liệu theo dõi, mô hình của chúng tôi và mô hình Simulwatch.

Tham số p1 p2 p3 λ1 λ2 λ3
d trên 0,3 0,66 0,04 1,3 · 10 - 2 3,3 · 10 - 3 2.3 · 10 - 4

d tắt 0,19 0,75 0,06 3.2 · 10 - 2 2,5 · 10 - 3 2,4 · 10 - 4

d ch 0,23 0,64 0,13 2.1 2,6 · 10 - 2 3.2 · 10 - 3

Bảng 9.1: Các tham số Simulwatch cho phân phối siêu mũ mô hình hóa độ dài phiên.

Nguyên nhân của lỗi này là do khoảng thời gian quan sát hoạt động của người dùng bị hạn chế (7 ngày) và số
lượng người dùng ít (10 000 người dùng). Nói chung, chúng tôi kỳ vọng rằng mức độ phổ biến thời gian dừng hội
tụ với tần suất truy cập sau một khoảng thời gian lớn nhất định đảm bảo cùng một khoảng thời gian phiên kênh
trung bình.
Mặc dù mô hình mức độ phổ biến của kênh không hoàn hảo nhưng theo ý kiến của chúng tôi, giá trị gần
đúng có thể chấp nhận được đối với việc thiết kế và thử nghiệm đầy đủ các thuật toán điều khiển máy chủ ứng
dụng. Kết quả của chúng tôi cho thấy lỗi chính do mô hình tạo ra chứ không phải do các thuật toán tổng hợp. Do
đó, trong các tình huống ưu tiên kết hợp chính xác hơn, công việc trong tương lai có thể mở rộng mô hình hàm mũ
zipf hiện có để giải quyết sự phân bố của các kênh không phổ biến.

9.3 So sánh với Trình tạo khối lượng công việc Simulwatch

Công việc của chúng tôi về mô hình hóa và tổng hợp khối lượng công việc IPTV quy mô lớn mở rộng những nỗ lực trước
đó của Qiu và các cộng sự, và bộ tạo khối lượng công việc IPTV của họ, được gọi là Đồng hồ simul. Các cải tiến của chúng
tôi tập trung vào việc tăng độ chính xác và sửa một số lỗi trong mô hình của họ, đồng thời cung cấp cách tiếp cận chặt chẽ
hơn để triển khai. Trong phần này, chúng tôi nhằm mục đích biện minh cho công việc của mình, bằng cách xem xét sự
khác biệt giữa đóng góp của chúng tôi và của họ.

9.3.1 Thời lượng phiên

Simulwatch sử dụng hỗn hợp phân phối theo cấp số nhân để lập mô hình thời lượng phiên d trên, d tắt , và
d ch. Tuy nhiên, phân tích các tham số chỉ ra rằng phân phối xác suất chỉ là một sự xấp xỉ thô của dữ liệu vết.
Fi gure 9.9 so sánh phân phối thực nghiệm thu được
từ dữ liệu thực tế, với các phân phối được đề xuất bởi mô hình của chúng tôi và mô hình Simulwatch, tương
ứng. Người ta có thể quan sát thấy rằng trong khi siêu cấp số nhân có thể được sử dụng để tính gần đúng
dữ liệu, các thông số do Simulwatch đề xuất, được đưa ra trong bảng 9.1, không đảm bảo tính tốt tuyệt đối.
9.3. So sánh với Trình tạo khối lượng công việc Simulwatch 115

9.3.2 Tỷ lệ phiên
Nắm bắt được mô hình hàng ngày của tỷ lệ sự kiện phiên là một nhiệm vụ đầy thách thức. Đặc biệt, sự gia
tăng tạm thời trong hoạt động của người dùng ở ranh giới chương trình TV, hay còn gọi là đám đông,
không có ý nghĩa quan trọng đối với việc đánh giá đúng hiệu suất của hệ thống. Nhận thức được điều này,
các tác giả của Simulwatch đề xuất sử dụng kỹ thuật phân tích tín hiệu nhằm mô hình hóa các đặc tính phức
tạp của tín hiệu tỷ lệ phiên trong miền tần số. Trong mô hình của họ, phần lớn phổ tốc độ phiên (tức là biến
đổi Fourier) được ước lượng gần đúng bằng hàm mật độ xác suất của phân bố Weibull, trong khi một số đột
biến phổ tại 1 giờ, 30 phút, v.v. được lập mô hình riêng lẻ.

Trong khi phương pháp của họ cho thấy hứa hẹn và bất chấp kết quả được hiển thị trong bài báo 3, mô hình
Simulwatch không hoạt động vì những lý do sau.

• Bằng cách tính gần đúng phổ, chúng ta không thu được tín hiệu gần đúng. Ngay cả một sự thay đổi
nhỏ trong miền tần số cũng dẫn đến những thay đổi đáng kể trong miền thời gian.

• Phép biến đổi Fourier là một hàm trên số phức. Môđun của quang phổ cho biết độ lớn của từng thành
phần quang phổ, trong khi đối số biểu thị pha. Cả hai thành phần đều cần thiết để biểu diễn chính
xác tín hiệu. Tuy nhiên, Simulwatch thì không.

• PDF của phân phối Weibull có xu hướng bằng 0 cho một tham số k < 1. Do đó, mô hình không nắm bắt
được f = 0 thành phần.

Ures gures 9.10 (a) và 9.10 (b) minh họa lý do tại sao mô hình Simulwatch không thành công, trong một ví dụ về
tỷ lệ phiên trực tuyến, x trên. Chúng tôi sử dụng mô hình Simulwatch của đặc tính tần số như được mô tả
trong ( Qiu, Ge, Lee, Wang, Xu và Zhao , 2009 ), trong đó phổ công suất được Weibull mô tả
hàm mật độ xác suất:

()
k f k-1
X 2x ( f) = e - ( f / µ) k, (9,12)
µµ
với k = 0,0036, µ = 278. Các tác giả lập mô hình riêng lẻ các thành phần quang phổ tương ứng
đến cực đại cục bộ quang phổ ở 60 và 30 phút: X x ( 1/60) = 1,76 và X x ( 1/30) = 1,41. Như
bình thường, phổ công suất và biên độ là đối xứng, tập trung xung quanh f S/ 2, ở đâu f S là tần số lấy mẫu.
Mô hình không đề xuất một chức năng cho giai đoạn và chúng tôi giả định rằng nó
là số không.

Do các lý do nói trên, tín hiệu được tái tạo từ mô hình Simulwatch, được hiển thị trong fi gure 9.10 (b),
trình bày các đặc tính sau. Bởi vì thiếu pha, tín hiệu trong miền thời gian là tổng các hàm cosin với pha bằng
không và do đó, đối xứng xung quanh bằng không. Tiếp theo, các thành phần tần số cao có thể bị suy giảm
đáng kể so với tín hiệu gốc. Trên thực tế, chỉ có các thành phần chính được đặt thủ công ở 60 và 30 phút là
có thể dễ dàng phân biệt được. Chúng tôi nhấn mạnh những tín hiệu này trong fi gure nhỏ hơn với tổng
tương ứng của chúng.

Do những kết luận này, chúng tôi kết luận rằng mô hình Simulwatch không đủ khả năng để nắm bắt mô
hình phức tạp của tỷ lệ phiên. Thay vào đó, phương án thay thế của chúng tôi dựa trên các thành phần tần
số chi phối phù hợp hơn nhiều và mang lại kết quả rất gần với bản gốc. Nhược điểm của nó bao gồm một số
lượng lớn hơn các tham số đặc trưng cho mô hình, thường là vài chục giá trị phức tạp, trái ngược với 6 hoặc
8 tham số trên mỗi tín hiệu do Simulwatch đề xuất. Tuy nhiên, chúng tôi tin rằng các mối quan tâm liên
quan đến một số lượng lớn hơn các tham số mô hình là hoàn toàn mang tính học thuật, vì chúng có ít tác
động đến hiệu suất trong quá trình tạo khối lượng công việc.
3 Trong ( Qiu, Ge, Lee, Wang, Xu và Zhao , 2009 ), fi gure 10 cho thấy sự phù hợp gần như hoàn hảo giữa dấu vết thực và
mô hình fi tting. Cho rằng phổ gần đúng Weibull trên thực tế là một dải thông thấp, nên không thể thu được các thành phần tần số cao như
điều đó cho thấy.
116 Chương 9. Đánh giá khối lượng công việc

10 2 0,12
Dấu vết: X x = | F ( x) | Dấu vết: x ′ trên( t) = F - 1 ( F ( x trên( t)))
60 phút 30 phút Simulwatch Simulwatch: x ′ trên( t) = F - 1 ( X x)
0,1
10 0
Xx

x 60 phút
0,08
x 30 phút
10 - 2
0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,1 x 60 phút + x 30 phút

x trên
0,06
f [ min - 1]


0 3 6
Dấu vết: φ x = tranh luận F ( x)
Simulwatch 0,04
π
π
2
φx

0 0,02

2

0
0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,1 0 3 6 9 12 15 18 21 24

f [ min - 1] thứ tự]

(a) Phân tích tần suất của tỷ lệ phiên (độ phóng đại X x và giai (b) Tốc độ phiên được xây dựng lại trong miền thời gian dựa
đoạn φ x) và mô hình Simulwatch. trên mô hình quang phổ.

Hình 9.10: Mô hình Simulwatch cho tỷ lệ phiên.


Số lượng người dùng (chuẩn hóa)

4
Cha tập dữ liệu (tháng 5)

3 Cha tập dữ liệu (tháng 7)

0
0 1 2 3 4 5 6 7

t [ ngày]
Số lượng người dùng (chuẩn hóa)

1,4
Sợi tổng hợp

1,2

0,8

0 1 2 3 4 5 6 7

t [ ngày]

Hình 9.11: So sánh số lượng người dùng trực tuyến, chuẩn hóa theo mức trung bình.

9.4 So sánh với dữ liệu của bên thứ ba


Cuối cùng, chúng ta phải trả lời câu hỏi: hoạt động của người dùng IPTV mà chúng ta đã mô tả trong tác
phẩm hiện tại đại diện như thế nào? Dữ liệu được công bố bởi Qiu et al. đại diện, không nghi ngờ gì, một tập
hợp đầy đủ. Nó thể hiện cả mức độ phổ biến kênh của nhà cung cấp IPTV với gói kênh phong phú, cũng như
hoạt động của cơ sở người đăng ký lớn trải rộng trên nhiều múi giờ. Để trả lời câu hỏi này, chúng tôi so sánh
khối lượng công việc tổng hợp của mình với các phép đo từ hệ thống IPTV của bên thứ ba.
Cha và cộng sự. đã xuất bản một nghiên cứu sâu rộng về cách người dùng xem TV, dựa trên các dấu vết thu thập
được từ một công ty viễn thông ở Tây Ban Nha ( Cha, Rodriguez, Crowcroft, et al. , 2008 ). Bởi vì công việc của họ không xuất
bản tất cả các biến từ khối lượng công việc của chúng tôi, chúng tôi chỉ kiểm tra những biến có sẵn. Chúng tôi không
mong đợi có được một kết hợp hoàn hảo, mà là để ước tính sự giống nhau giữa hai hệ thống khác nhau. Để đạt được điều
này, chúng tôi so sánh các đặc điểm sau của khối lượng công việc tổng hợp:

• số lượng người dùng trực tuyến;

• tỷ lệ người dùng đến và đi hàng ngày trên một kênh TV đã chọn, và;

• sự phân bố thời gian đi và đến của người dùng trên một kênh truyền hình đã chọn.

Fi gure 9.11 so sánh số lượng người dùng trực tuyến, được chuẩn hóa theo mức trung bình, giữa
Cha tập dữ liệu và khối lượng công việc tổng hợp của chúng tôi. Các đặc điểm chính của dữ liệu giống nhau, với
9.4. So sánh với dữ liệu của bên thứ ba 117

10 10 10
Kênh 1 Kênh 10
số 8 số 8 số 8

Tỷ lệ đến (chuẩn hóa)

Tỷ lệ đến (chuẩn hóa)


Tỷ lệ đến (chuẩn hóa) 6 6 6

4 4 4

2 2 2

0 0 0
0 4 số 8 12 16 20 24 0 4 số 8 12 16 20 24 0 4 số 8 12 16 20 24

t [ h] t [ h] t [ h]

15 15 15
Kênh 1 Kênh 10

Tỷ lệ khởi hành (chuẩn hóa)

Tỷ lệ khởi hành (chuẩn hóa)


Tỷ lệ khởi hành (chuẩn hóa)

10 10 10

5 5 5

0 0 0
0 4 số 8 12 16 20 24 0 4 số 8 12 16 20 24 0 4 số 8 12 16 20 24

t [ h] t [ h] t [ h]

(a) Cha tập dữ liệu: tỷ lệ đến của người dùng (trên cùng), tỷ lệ rời của người (b) Khối lượng công việc tổng hợp: kênh 1 (trái), kênh 10 (phải)
dùng (dưới)

Hình 9.12: Tỷ lệ đến và đi của người dùng trên / từ một kênh truyền hình phổ biến.

mô hình hàng ngày bao gồm số lượng người xem thấp vào ban đêm, tăng nhẹ vào buổi sáng, một lần giảm
tiếp theo vào ban ngày, khi hầu hết người đăng ký đang đi làm và hoạt động nhiều vào buổi tối.

Tuy nhiên, chúng tôi cũng quan sát thấy một số khác biệt chính, rất có thể được tạo ra bởi sự khác biệt
văn hóa giữa Hoa Kỳ và Tây Ban Nha. Một trong số đó là nhu cầu vào buổi tối thấp hơn vào buổi tối cuối
tuần, chẳng hạn như thứ bảy và chủ nhật, do đó làm thay đổi sự thay đổi hàng tuần. Sau đó, lượng người
xem tuyệt đối vào ban đêm gần bằng 0, không giống như khối lượng công việc tổng hợp của chúng tôi, nơi
phần lớn người dùng trực tuyến là đáng kể (khoảng 60–70%). Mặc dù không thể đánh giá nguyên nhân thực
sự của sự khác biệt này, nhưng nó có thể do một số yếu tố gây ra, bao gồm: (i) số lượng người đăng ký ở
Tây Ban Nha thấp hơn nhiều và hầu hết họ đều tắt TV vào ban đêm; (ii) thiết bị do nhà cung cấp IPTV lắp đặt
và thiết bị có tiếp tục nhận kênh ngay cả khi TV đã tắt hay không.

Tiếp theo, chúng tôi so sánh kênh về tỷ lệ đến và đi của người dùng, là tỷ lệ sự kiện trực tuyến / trong
phiên. Cha và cộng sự. không cung cấp kết quả về tỷ lệ toàn cầu, mà thay vào đó họ tập trung vào kênh
truyền hình phổ biến nhất từ miễn phí Gói truyền hình, dành cho tất cả các thuê bao. Vì cung cấp kênh giữa
hai tập dữ liệu là khác nhau, 700 kênh ở Hoa Kỳ so với 120 kênh truyền hình, ở Tây Ban Nha, chúng tôi đã
chọn hai kênh đại diện, 1 và 10, từ khối lượng công việc tổng hợp của mình. Cả hai kênh này đều phổ biến,
đồng thời đáp ứng các thành phần người dùng khác nhau.

Các thiết bị fi 9.12 (a) và 9.12 (b) so sánh hai tình huống và chúng tôi đưa ra các nhận xét sau. Tập dữ liệu
tiếng Tây Ban Nha khá nhất quán với số lượng người dùng trực tuyến, đã được trình bày trước đây. Vì vậy,
hoạt động hàng ngày của người dùng trải qua hai mức cao điểm vào khung giờ 2:00 chiều–6:00PM và lại
vào khung giờ 10:00 PM–1:00AM. Kết quả này không giống như hoạt động hàng ngày ở Hoa Kỳ, nơi mà sự
khác biệt vào giữa các giờ trong ngày không rõ ràng như vậy. Mặc dù dữ liệu đại diện cho hoạt động của
người dùng trên một kênh truyền hình duy nhất, do mức độ phổ biến cao của các kênh và người dùng truy
cập đồng đều theo thời gian, tỷ lệ đến và đi tổng hợp có cùng hình dạng với tỷ lệ sự kiện toàn cầu. Do đó,
chúng tôi có thể kết luận một cách hợp lý rằng mặc dù Cha dữ liệu minh họa cho một kênh truyền hình duy
nhất, mô hình này cũng giống nhau đối với hoạt động của người dùng toàn cầu.
Trong 9.1 gures 9.13 (a) và 9.13 (b), chúng tôi kiểm tra sự phân bố thời gian giữa các chuyến đến và giữa
các chuyến đi của người dùng. Như trường hợp của tỷ lệ sự kiện, Cha tập dữ liệu được giới hạn cho một
kênh truyền hình duy nhất và, để quan tâm đến tính kỹ lưỡng, chúng tôi so sánh với bốn kênh đại diện từ
khối lượng công việc tổng hợp được trải rộng trên phạm vi phổ biến: 1, 10, 100 và 500.
Theo ý kiến của chúng tôi, những kết quả cuối cùng này nhấn mạnh những điểm tương đồng giữa hành vi của người dùng từ
118 Chương 9. Đánh giá khối lượng công việc

1 1
Kênh 1
0,8 0,8 Kênh 10
Kênh 100
Kênh 500
0,6 0,6
CDF

CDF
0,4 0,4

0,2 0,2

0 0
10 - 3 10 - 2 10 - 1 10 0 10 1 10 2 10 - 4 10 - 2 10 0 10 2 10 4

[Các] thời gian đến giữa các kênh [Các] thời gian đến giữa các kênh

1 1
Kênh 1
0,8 0,8 Kênh 10
Kênh 100
Kênh 500
0,6 0,6
CDF

CDF
0,4 0,4

0,2 0,2

0 0
10 - 3 10 - 2 10 - 1 10 0 10 1 10 2 10 3 10 - 4 10 - 2 10 0 10 2 10 4

[Các] thời gian khởi hành giữa các kênh [Các] thời gian khởi hành giữa các kênh

(a) Cha tập dữ liệu (b) Khối lượng công việc tổng hợp

Hình 9.13: CDF của thời gian đến và đi giữa các người dùng trên / từ một kênh truyền hình phổ biến.

hai dịch vụ IPTV khác nhau theo khu vực. Dữ liệu trùng khớp không hoàn hảo do các cài đặt khác nhau của hệ thống,
chẳng hạn như các kênh truyền hình có sẵn hoặc hành vi của người dùng, bao gồm cả các khía cạnh văn hóa. Dữ liệu có
sẵn từ việc triển khai IPTV ở quy mô nhỏ hơn cho thấy các mẫu tương đương có thể so sánh được về sự tham gia của
người dùng và truy cập kênh ( Yu và cộng sự. , 2009 ). Mặc dù phân tích sâu hơn về hành vi của người dùng nằm ngoài
phạm vi của công việc hiện tại, nhưng các ví dụ tích cực mà chúng tôi đã xem xét trong phần này phục vụ cho việc xác
nhận kết quả trong mô hình tổng hợp của chúng tôi.

9.5 Kết luận


Một thiết kế tốt của các thuật toán điều phối phiên và ngang hàng tại P2PTV-AS yêu cầu thể hiện chính xác
hoạt động của người đăng ký IPTV. Bởi vì khối lượng công việc tổng hợp của chúng tôi được thiết kế ngược
lại từ dữ liệu đo lường hiện có và hạn chế, nó thực hiện một số phép tính gần đúng trong việc tạo ra quy
trình hoạt động của người dùng. Chúng được tạo ra bởi cả mô hình khối lượng công việc, là một cái nhìn
đơn giản về thực tế và các thuật toán tổng hợp được thiết kế để phù hợp và tập trung vào một tập hợp nhỏ
các tham số.
Để xác minh xem những lỗi này không thực sự làm thay đổi dữ liệu đã biết hay không, trong chương này,
chúng tôi đã tiến hành đánh giá toàn diện về khối lượng công việc tổng hợp. Chiến lược của chúng tôi bao gồm so
sánh với dữ liệu theo dõi ban đầu, được xuất bản bởi Qiu và cộng sự, nhấn mạnh vào các đặc điểm khối lượng
công việc sau: tỷ lệ người dùng trực tuyến, tỷ lệ phiên, thời lượng phiên và mức độ phổ biến của kênh. Kết quả cho
thấy rằng khối lượng công việc của chúng tôi cung cấp một số liệu gần đúng tốt, trong bối cảnh các yêu cầu thiết
kế của chúng tôi. Đối với các ứng dụng yêu cầu độ chính xác từng hạt, chúng tôi đã đưa ra một số đề xuất để cải
tiến trong tương lai, chẳng hạn như các phần mở rộng cho mô hình và các thay đổi đối với thuật toán tổng hợp.

Ngoài các đặc điểm nói trên, chúng tôi đã kiểm tra khối lượng công việc tổng hợp dựa trên trình tạo
Simulwatch và dữ liệu IPTV của bên thứ ba. Những kết quả này chứng minh cho công việc hiện tại và cho thấy
rằng mặc dù mô hình hiện tại dựa trên một triển khai IPTV duy nhất, các thuộc tính của nó có thể được khái quát
hóa cho nhiều đối tượng người đăng ký hơn.

You might also like