Việc đánh giá chất lượng cảm nhận của một luồng đa phương tiện không phải là đơn giản. Trên thực tế, việc đánh giá chất lượng cảm nhận đòi hỏi người đánh giá phải thực chủ quan và cần phải có một phương pháp khách quan [20] có khả năng đánh giá chất lượng dịch vụ tự động trong thời gian thực. Tuy nhiên, phương pháp khách quan không thể thay thế các phương pháp chủ quan vì kết quả đánh giá của phương pháp tự động không tương quan với cảm nhận của con người, do đó việc sử dụng phương pháp đo lường tự động này rất hạn chế. Trong nghiên cứu này, luận văn chọn một phương pháp đo lường kết hợp hai phương pháp trên dựa trên hồi quy logistic [21]. Sử dụng thống kê quy nạp, một mô hình hồi quy logistic sẽ đưa dữ liệu đầu vào tới một hàm logistic để cho kết quả đầu ra là một xác suất. Giả sử các tham số QoS của mạng là dữ liệu đầu vào cho hàm logistic và kết quả đầu ra là điểm cảm nhận của người dùng. Một số phương pháp [22] đã có cũng được áp dụng phương pháp này để đánh giá QoE. Trong [22], các tác giả sử dụng một mạng noron ngẫu nhiên (Random Neural Networks) như một hàm logistic để xác định giá trị QoE đầu ra phù hợp. Tương tự, luận văn đã thực hiện một thử nghiệm để cung cấp đầu vào (là một bộ dữ liệu) cho mô hình noron ở trên. Dựa trên một nghiên cứu đã được thực hiện trong [23], luận văn đã sử dụng các nguyên tắc
cơ bản tương tự để định nghĩa PSQA (đánh giá chất lượng giả chủ quan) như là một phương pháp đo lường QoE. Mô hình notron sử dụng ba lớp: lớp đầu vào, lớp ẩn và lớp đầu ra. Lớp đầu vào có ba ô nhập liệu, mỗi ô tương ứng với một tham số QoS: Độ trễ, tỷ lệ tổn thất, và tỷ lệ tổn thất có điều kiện (tức là xác suất để một gói tin sẽ bị hủy khi gói tin trước đó đã bị hủy). Mỗi một notron duy nhất của lớp đầu ra sẽ là kết quả số điểm QoE, gọi là điểm UPS.
Tiếp theo, luận văn sẽ mô tả các thử nghiệm đã được sử dụng để xây dựng một bộ dữ liệu thật để thiết lập các thông số liên quan đến dịch vụ đối tượng trong nghiên cứu này, mô hình nghiên cứu dựa trên một mạng notron. Để thực hiện điều này, 150 người đã được mời cho điểm một cách chủ quan chất lượng cảm nhận cho mỗi cấu hình mạng (tức là bộ bốn thông số mạng: thời gian trễ, jitter, tỷ lệ tổn thất và tỷ lệ tổn thất có điều kiện) sử dụng điểm MOS. Người xem được lựa chọn là những người có kinh nghiệm về video. Độ tuổi dao động từ 20 đến 30.
Điểm MOS (điểm trung bình do người dùng đánh giá chủ quan) là biểu hiện cụ thể bằng con số, chỉ ra cảm nhận của người dùng về chất lượng dịch vụ. Điểm MOS có giá trị từ 1 đến 5, với 5 là chất lượng dịch vụ rất tốt, làm hài lòng hoàn toàn khách hàng, còn 1 chỉ ra chất lượng dịch vụ rất xấu, không thể chấp nhận được. Từ đó, các mức ngưỡng về chất lượng dịch vụ được quy ước và chuẩn hóa theo MOS, ví dụ đối với dịch vụ VoIP thì điểm MOS phải trên ngưỡng 3.5.
Điểm MOS thu được được đưa vào hai cơ sở dữ liệu riêng biệt được gọi là cơ sở dữ liệu đào tạo và cơ sở dữ liệu xác nhận. Sau khi hoàn thành bộ dữ liệu, cơ sở dữ liệu đào tạo được sử dụng như đầu vào các mạng notron để các nghiên cứu sâu hơn có thể xác định được các thông số của mô hình.
Thực tế, luận văn đã sử dụng các nguyên tắc cơ bản giống như các nguyên tắc đã được sử dụng trong một bài báo trước đây [24] để định nghĩa phương pháp PSQA, một phương pháp đo QoE được các nghiên cứu mạng chấp nhận rộng rãi trong cộng đồng. Qua đây, luận văn muốn nhấn mạnh ở đây là các loại kịch bản và điều kiện mô phỏng ở đây cũng đã được sử dụng trong nhiều nghiên cứu khác cùng
lĩnh vực. Do đó, phần chủ quan của phương pháp đo lường QoE này chính là quá trình chấm điểm của con người (ví dụ, khán giả tham gia thử nghiệm). Vấn đề quan trọng của phương pháp giống như PSQA chính là việc nghiên cứu sâu hơn về mạng notron ngẫu (RNN) [28] để tìm ra mối liên hệ giữa các thông số gây nhiễu và chất lượng cảm nhận. Ta chia phương pháp đo lường thành năm bước như sau:
1) Tạo cấu hình 2) Đánh giá chủ quan 3) Xây dựng bộ dữ liệu 4) Cấu hình mạng notron 5) Xác nhận
Bước 5 là một quá trình xác nhận thông qua (tức là so sánh các giá trị thu được bằng phương pháp đo lường với kết quả của cơ sở dữ liệu xác nhận). Nếu chúng gần giống nhau đối với tất cả các tham số thì các thông số của mạng notron được thông qua, nếu không, chúng ta phải lựa chọn lại cấu hình và lặp lại các bước 1, 2, 3 và 4 cho đến khi mạng lưới notron được xác nhận. Với phương pháp đo lường này dựa trên nghiên cứu về notron, chúng ta có được một hàm tham số, với các thông số được mã hoá trong mạng notron ngẫu nhiên đã được cấu hình, cho ra một thông số tổng hợp phi tuyến tính sử dụng các tham số mạng được gọi là UPS (điểm cảm nhận của người sử dụng):
( , , )
UPS =F d l cl (1)
trong đó d là độ trễ, l là tỷ lệ tổn thất và c là tỷ lệ tổn thất có điều kiện. F là hàm logistic đã được đề cập đến trong phần đầu của luận văn. Các số liệu UPS có thể được sử dụng để đại diện cho mức độ hài lòng của người dùng.
Như đã đề cập, nội dung chính của luận văn này chính là phương pháp lựa chọn máy chủ mới dựa trên việc hiện thực hóa MAB, điều này phụ thuộc chặt chẽ vào các giả định (chẳng hạn như sự tuyến tính, nhiễu...) trên hàm trả về. Vì vậy, sử dụng phương pháp đo lường dựa trên logistic hồi quy là một phương pháp có sẵn và đã được chấp nhận, để thu được giá trị QoE như là một hàm trả về trong phương
pháp mà luận văn đã sử dụng. Nói một cách khác, ta có thể tiến hành các thuật toán lựa chọn máy chủ (sẽ được trình bày trong chương III) mà không cần quan tâm đến phương pháp đo lường QoE vì những lý do sau:
• Phương pháp đo dựa trên MAB làm cho không có giả định về tính tuyến tính của các hàm trả về. Nó không sử dụng một hàm tuyến tính đơn giản để ánh xạ tham số QoS thành QoE như các phương pháp khác. Bằng cách sử dụng phương pháp đo lường trên cơ sở mạng notron và nghiên cứu sâu hơn làm cho UPS trở thành một phương pháp lai giữa các kỹ thuật chủ quan và khách quan
• Phương pháp dựa trên MAB làm cho không có giả định về đặc điểm tĩnh (cố định, không thay đổi) của hàm trả về. Các số liệu UPS không phải lúc nào cũng phụ thuộc vào một vài tham số cụ thể do có nhiều yếu tố ảnh hưởng đến cảm nhận của người sử dụng thay đổi theo thời gian
Phương pháp UPS sử dụng thang điểm giá trị định tính được đề xuất bởi Mean Opinion Score Normalization (MOS), khuyến nghị ITU-T Rec P.801 [29]: 1 – Tồi, 2 – Nghèo nàn, 3 – Bình thường, 4 - Tốt và 5 - Tuyệt vời.