1. Trang chủ
  2. » Luận Văn - Báo Cáo

Luận văn thạc sĩ Khoa học máy tính: Ứng dụng học máy trong dự đoán chất lượng dịch vụ cho hệ thống điện toán đám mây

61 1 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Ứng dụng học máy trong dự đoán chất lượng dịch vụ cho hệ thống điện toán đám mây
Tác giả Nguyễn Như Ngọc
Người hướng dẫn PGS.TS Thoại Nam
Trường học Đại học Quốc gia TP. HCM
Chuyên ngành Khoa học máy tính
Thể loại Luận văn thạc sĩ
Năm xuất bản 2024
Thành phố TP. Hồ Chí Minh
Định dạng
Số trang 61
Dung lượng 1,25 MB

Nội dung

NHIỆM VỤ VÀ NỘI DUNG : Luận văn nghiên cứu phương pháp lọc cộng tác với phân tích thành phần và ứng dụng phương pháp trong dự đoán thời gian chất lượng dịch vụ trong điện toán đám mây..

Trang 1

ĐẠI HỌC QUỐC GIA TP HCM

TRƯỜNG ĐẠI HỌC BÁCH KHOA

-

NGUYỄN NHƯ NGỌC

ỨNG DỤNG HỌC MÁY TRONG DỰ ĐOÁN CHẤT LƯỢNG DỊCH VỤ CHO HỆ THỐNG

ĐIỆN TOÁN ĐÁM MÂY

Chuyên ngành: Khoa học máy tính

Mã số:8480101

LUẬN VĂN THẠC SĨ

TP HỒ CHÍ MINH, tháng 6 năm 2024

Trang 2

CÔNG TRÌNH ĐƯỢC HOÀN THÀNH TẠI TRƯỜNG ĐẠI HỌC BÁCH KHOA –ĐHQG -HCM Cán bộ hướng dẫn khoa học: PGS.TS Thoại Nam Cán bộ chấm nhận xét 1: PGS.TS Huỳnh Tường Nguyên Cán bộ chấm nhận xét 2: TS Nguyễn Quang Hùng Luận văn thạc sĩ được bảo vệ tại Trường Đại học Bách Khoa, ĐHQG TP HCM ngày 18 tháng 6 năm 2024

Thành phần Hội đồng đánh giá luận văn thạc sĩ gồm: 1 Chủ tịch: TS Lê Thành Sách

2 Thư ký: TS Lê Thanh Vân 3 Phản biện 1: PGS.TS Huỳnh Tường Nguyên 4 Phản biện 2: TS Nguyễn Quang Hùng 5 Uỷ viên: TS Hà Việt Uyên Synh Xác nhận của Chủ tịch Hội đồng đánh giá LV và Trưởng Khoa quản lý chuyên ngành sau khi luận văn đã được sửa chữa (nếu có)

CHỦ TỊCH HỘI ĐỒNG TRƯỞNG KHOA KHOA HỌC VÀ KỸ THUẬT MÁY TÍNH

Trang 3

ĐẠI HỌC QUỐC GIA TP.HCM

TRƯỜNG ĐẠI HỌC BÁCH KHOA CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập - Tự do - Hạnh phúc

NHIỆM VỤ LUẬN VĂN THẠC SĨ

Họ tên học viên: Nguyễn Như Ngọc MSHV: 2070421 Ngày, tháng, năm sinh: 20/11/1996 Nơi sinh: Quảng Trị Chuyên ngành: Khoa Học Máy Tính Mã số : 8480101

I TÊN ĐỀ TÀI :

Ứng dụng học máy trong dự đoán chất lượng dịch vụ cho hệ thống điện toán đám mây (Apply machine learning in predicting quality of service for cloud computing system)

II NHIỆM VỤ VÀ NỘI DUNG :

Luận văn nghiên cứu phương pháp lọc cộng tác với phân tích thành phần và ứng dụng phương pháp trong dự đoán thời gian chất lượng dịch vụ trong điện toán đám mây Từ giải thuật cơ bản, luận văn áp dụng những kỹ thuật mở rộng cho bài toán dự đoán trực tuyến như stochastic gradient descent và điều chỉnh trọng số hệ số học nhằm thích nghi với điều kiện thay đổi môi trường Từ đó nâng cao độ chính xác và hiệu quả dự đoán

III NGÀY GIAO NHIỆM VỤ : (Ghi theo trong QĐ giao đề tài) 04/09/2023 IV NGÀY HOÀN THÀNH NHIỆM VỤ : (Ghi theo trong QĐ giao đề tài) 12/05/2024 V CÁN BỘ HƯỚNG DẪN (Ghi rõ học hàm, học vị, họ, tên): PGS.TS Thoại Nam

Trang 4

Đầu tiên, em xin gửi lời cảm ơn gia đình và những người thân yêu đã luôn tạo điều kiện và động lực để giúp em an tâm học tập, vượt qua khó khăn và chinh phục những thách thức

Em đặc biệt cảm ơn thầy Thoại Nam đã tận tình giúp đỡ và hướng dẫn em trong học tập cũng như trong suốt quá trình thực hiện luận văn, những ý kiến quý báu của thầy giúp em học tập, nghiên cứu và khắc phục được nhiều thiếu sót để hoàn thành luận văn

Em xin chân thành cảm ơn quý thầy (cô) trường Đại học Bách Khoa Thành phố Hồ Chí Minh nói chung và khoa Khoa học và Kỹ thuật máy tính nói riêng đã tận tình dạy bảo, truyền đạt kiến thức cho em trong suốt khóa học tại trường

Cuối cùng, cảm ơn bạn bè đã đồng hành cùng tôi, cùng chia sẻ, trao đổi kiến thức, kinh nghiệm trong quá tình thực hiện luận văn Các bạn đã cho tôi những lời khuyên bổ ích trong học tập cũng như trong cuộc sống

Xin chân thành cảm ơn

Trang 5

Ứng dụng đám mây được xây dựng trên kiến trúc hướng dịch vụ đang ngày càng phổ biến Các loại dịch vụ được phát triển đa dạng bởi các nhà cung cấp và phục vụ cho các ứng dụng và người dùng Điều này cho phép hệ thống đám mây dễ dàng mở rộng và tận dụng tối đa nguồn tài nguyên sẵn có Tuy nhiên sự thay đổi của môi trường và số lượng yêu cầu dịch vụ có thể dễ dàng ảnh hưởng đến chẩt lượng dịch vụ của hệ thống đám mây Người dùng và ứng dụng cần lựa chọn các dịch vụ thành phần phù hợp để thích ứng với điều kiện hệ thống dựa trên chất lượng của các dịch vụ thành phần Do đó, việc đưa ra giải pháp dự đoán chất lượng dịch vụ thành phần kịp thời với độ chính xác cao là rất cần thiết Xuất phát từ yêu cầu này luận văn nghiên cứu bài toán dự đoán trực tuyến chất lượng dịch vụ với các phần chính sau

Đầu tiên, luận văn trình bày tổng quan, các công trình nghiên cứu liên quan về các phương pháp hiện có trong dự đoán chất lượng dịch vụ trong hệ thống đám mây Các yếu tố ảnh hưởng đến chất lượng dịch vụ, các hạn chế và thách thức cần giải quyết đối với bài toán dự đoán trực tuyến chất lượng dịch vụ

Tiếp theo, luận văn nghiên cứu phương pháp lọc cộng tác với phân tích ma trận thành phần và ứng dụng phương pháp trong dự đoán thời gian chất lượng dịch vụ Từ cơ sở lý thuyết của giải thuật MF truyền thống hiện có, luận văn áp dụng những kỹ thuật mở rộng cho dự đoán trực tuyến như stochastic gradient descent và trọng số hệ số học thích nghi để tăng độ chính xác và đạt hiệu quả trong bài toán dự đoán chất lượng dịch vụ trực tuyến

Cuối cùng, ứng dụng mô hình đưa ra trong dự đoán chất lượng dịch vụ hệ thống đám mây, cụ thể là thời gian đáp ứng và thông lượng với tập dữ liệu thực tế gồm ~40 triệu mẫu Các kết quả thu thập từ mô hình sẽ được phân tích và đánh giá hiệu quả dự đoán so với các giải thuật hiện có

Ngoài ra, từ mô hình tổng quát có luận văn đưa ra một số hướng phát triển đề tài sau này

Trang 6

Cloud applications built on a service-oriented architecture are becoming increasingly popular The services are developed by providers and cater to various applications and users This enables cloud systems to easily scale and fully utilize available resources However, environmental changes and workload of service can easily impact the quality of service of the cloud system Users and applications need to select appropriate candidate services to adapt to system conditions based on the performance of these candidate services at the current time Therefore, providing timely and highly accurate predictions of component service quality is essential This thesis addresses the need for such predictions with the following main points

Firstly, the thesis provides an overview and discusses related research on existing methods for predicting service quality in cloud systems It examines the factors affecting service quality, as well as the limitations and challenges that need to be addressed in the online service quality prediction problem

Next, the thesis explores the Collaborative Filtering (CF) method with Matrix Factorization (MF) and its application in predicting service quality over time Based on the theoretical foundation of existing traditional MF algorithms, the thesis applies extended techniques for online prediction, such as stochastic gradient descent and adaptive learning rate weights, to achieve high accuracy and efficiency in online service quality prediction

Finally, the thesis applies the proposed model to predict the quality of service in cloud systems, specifically response time and throughput, using a real dataset consisting of approximately 40 million samples The results obtained from the model are analyzed and the prediction effectiveness is evaluated in comparison to existing algorithms

Additionally, the thesis suggests several directions for future research based on the generalized model

Trang 7

Tôi xin cam đoan luận văn này là công trình nghiên cứu của riêng tôi và những nội dung được trình bày trong luận văn này là hoàn toàn trung thực

Những số liệu, bảng biểu phục vụ cho việc phân tích và dẫn dắt đề tài này được thu thập từ các nguồn tài liệu khác nhau được ghi chú trong mục tài liệu tham khảo hoặc chú thích ngay bên dưới các bảng biểu

Ngoài ra, đối với các tài liệu diễn giải để làm rõ thêm các luận điểm đã phân tích và trích dẫn trong phần phụ lục cũng được chú thích nguồn gốc dữ liệu

Trang 12

trăm QoS: Quality of Service Chất lượng dịch vụ

SGD: Stochastic gradient descent Giảm độ dốc ngẫu nhiên SVD: Singular Value Decomposition Phân rã giá trị

SLA Service-Level Agreements Các thỏa thuận cấp độ dịch vụ SOA: Service-Oriented Architecture Kiến trúc hướng dịch vụ

Trang 13

Trong hệ thống dịch vụ đám mây, thông số chất lượng dịch vụ luôn là yếu tố quan trọng trong việc trong việc đảm bảo hiệu suất và độ tin cậy của các ứng dụng Môi trường đám mây thường xuyên thay đổi do nhiều yếu tố như khối lượng tải, sự thay đổi của tài nguyên và sự cố mạng ảnh hưởng tới chất lượng dịch vụ Ví dụ, tăng thời gian đáp ứng hoặc giảm thông lượng Do đó trong hệ thống đám mây có kiến trúc hướng dịch vụ cần có phần mềm trung gian đảm nhiệm các tính năng giám sát và phân tích thời gian thực, cung cấp cho quản trị viên những thông tin chi tiết về hiệu suất dịch vụ và giúp xác định, giải quyết các sự cố tiềm ẩn trước khi chúng ảnh hưởng đến người dùng Việc dự đoán chất lượng dịch vụ chính xác có ý nghĩa quan trọng trong sử dụng tối ưu hệ thống và đưa ra những điều chỉnh kịp thời

Vấn đề mà luận văn tập trung là dự đoán QoS thời gian thực của các thành phần dịch vụ hiện có dựa vào dữ liệu trong quá khứ Việc dự đoán QoS chính xác giúp hệ thống đám mây điều chỉnh các dịch vụ đang chạy theo thời gian thực để duy trì hiệu suất cao, đảm bảo rằng dịch vụ luôn hoạt động ở mức tối ưu Quản lý tài nguyên hiệu quả hơn cũng là một lợi ích quan trọng, giúp giảm thiểu lãng phí và tối ưu hóa chi phí Ngoài ra, dự đoán QoS giúp đảm bảo các thỏa thuận về mức dịch vụ (SLA) với khách hàng, đảm bảo độ tin cậy và chất lượng dịch vụ

Giải thuật được nghiên cứu là Matrix Factorization (MF) trong Collaborative Filtering (CF) MF là một kỹ thuật phổ biến trong lọc cộng tác để đề xuất sản phẩm hoặc dịch vụ cho người dùng dựa trên sở thích của họ Đây là một phương pháp chủ chốt trong hệ thống đề xuất sản phẩm, đặc biệt là trong các ứng dụng như Netflix, Amazon, Spotify, v.v Phương pháp này giúp khám phá các mối quan hệ ẩn giữa người dùng và sản phẩm, từ đó dự đoán sở thích của người dùng một cách chính xác hơn Bên cạnh đó, Matrix Factorization còn giảm chiều dữ liệu, giúp cải thiện hiệu suất tính toán và tối ưu hóa quá trình xử lý dữ liệu

Phương pháp Matrix Factorization kết hợp lân cận đã được áp dụng để dự

Trang 14

Dự đoán QoS của các dịch vụ thành phần hiện thời gian thực đóng vai trò quan trọng cho việc thích ứng dịch vụ trong thời gian thực, với những yêu cầu đặc biệt về độ chính xác, hiệu quả, và độ bền vững Mô hình được đánh giá trên tập dữ liệu QoS quy mô lớn thực tế của các dịch vụ Web

Trang 15

Chương 1 Giới thiệu

1.1 Tổng quan đề tài 1.1.1 Kiến trúc hướng dịch vụ trong điện toán đám mây

Điện toán đám mây hiện nay cung cấp dịch vụ, tài nguyên theo yêu cầu người dùng và đã trở thành nơi phổ biến để lưu trữ và cung cấp các ứng dụng trực tuyến khác nhau, bao gồm công cụ tìm kiếm, thương mại điện tử, phát trực tuyến đa phương tiện, v.v Khác với việc lưu trữ ứng dụng nội bộ, các ứng dụng được triển khai trong đám mây có thể mở rộng ra nhiều trung tâm dữ liệu phân tán để phục vụ người dùng trên toàn cầu Tuy nhiên, các ứng dụng đám mây phân tán gặp nhiều khó khăn trong việc đảm bảo chất lượng dịch vụ (QoS) do môi trường đám mây thay đổi liên tục Do đó, một nhiệm vụ quan trọng là thiết kế và phát triển các ứng dụng với khả năng tự thích ứng

Kiến trúc hướng dịch vụ (SOA) là một mô hình kiến trúc hiện đại kết hợp các dịch vụ thành phần để thực hiện logic ứng dụng phức tạp [2] Mỗi dịch vụ cung cấp một đơn vị chức năng, chạy trong quy trình riêng và giao tiếp qua API Đề tài luận văn đề cập đến các dịch vụ tổng quát như dịch vụ thành phần trong môi trường đám mây và các dịch vụ Web truy cập qua Internet Do tính năng kết nối linh động của SOA, nhiều ứng dụng đám mây hiện nay sử dụng SOA để đạt được khả năng tự thích ứng Các nền tảng thương mại điện tử được xây dựng trên SOA bằng cách kết hợp các dịch vụ thành phần được lưu trữ trên toàn cầu để cung cấp các chức năng như đề xuất sản phẩm, thực hiện đơn hàng, và phát hiện gian lận Để tạo nội dung web động, mỗi yêu cầu thường yêu cầu một thành phần ban đầu để gọi các dịch vụ tổng hợp khác, sau đó truy vấn nhiều dịch vụ khác để tạo ra phản hồi tổng hợp Để đảm bảo việc phân phối thích ứng dịch vụ thời gian thực là cần thiết để đạt được khả năng chịu lỗi đối với các biến động QoS tiềm ẩn của các dịch vụ thành phần do môi trường đám mây thay đổi

Trang 16

1.1.2 Chất lượng dịch vụ

Chất lượng dịch vụ thường được sử dụng để mô tả các thuộc tính phi chức năng của một dịch vụ, với các ví dụ điển hình bao gồm thời gian phản hồi, thông lượng, tính sẵn sàng, độ tin cậy, v.v QoS của các dịch vụ được xác định trực tiếp trong các thỏa thuận mức dịch vụ (SLAs) bởi các nhà cung cấp dịch vụ cho người

Trang 17

- Thay đổi theo thời gian: Môi trường thay đổi liên tục, chẳng hạn như sự biến đổi độ trễ mạng trên Internet và tải công việc của dịch vụ, làm cho nhiều thuộc tính QoS (ví dụ, thời gian phản hồi và thông lượng) được cung cấp cho người dùng dao động mạnh mẽ theo thời gian - Đặc thù người dùng: Sự phân bố địa lý ngày càng tăng của các dịch vụ

có ảnh hưởng đáng kể đến QoS mà người dùng cảm nhận Người dùng từ các vị trí khác nhau thường quan sát các giá trị QoS khác nhau trên cùng một dịch vụ

Những đặc điểm này làm cho việc dự đoán thông tin QoS chính xác để thích ứng dịch vụ trong thời gian thực trở thành bài toán quan trọng trong hệ thống cung cấp dịch vụ đám mây

Hình 1.2: Các yếu tố ảnh hưởng đến QoS

Trang 18

1.2 Các nghiên cứu liên quan

Để thích ứng dịch vụ thời gian thực hiệu quả, chúng ta cần có thông tin về các thay đổi QoS theo thời gian thực của mỗi dịch vụ đang hoạt động và các dịch vụ tương lai của nó nhằm đưa ra các quyết định kịp thời và chính xác Khác với các hệ thống dựa trên thành phần truyền thống, nhiều thuộc tính QoS của các dịch vụ thành phần, như thời gian phản hồi và thông lượng, cần được đo từ phía người dùng (tức là các ứng dụng gọi dịch vụ) thay vì từ phía dịch vụ (tức là các nhà cung cấp dịch vụ)

Để dự đoán QoS chính xác, nhiều phương pháp khác nhau đã được thực hiện Nghiên cứu về dự đoán QoS có thể được phân loại thành các phương pháp Nearest Neighborhood - NN, Phân Tích Ma Trận (Matrix Factorization - MF) và Học Sâu (Deep Learning - DL) Các phương pháp NN [4] [5] dựa trên giả định rằng nếu người dùng có trải nghiệm QoS tương tự trong quá khứ, họ sẽ có trải nghiệm QoS tương tự trong tương lai Tuy nhiên, các phương pháp NN chỉ sử dụng thông tin từ trong vùng lân cận để đưa ra dự đoán và bỏ qua thông tin hữu ích ẩn trong toàn bộ ma trận QoS của người dùng và dịch vụ Các phương pháp học sâu dựa trên mô hình phân tích nhân tố (Factorization Machine - FM) [6] [7] và mạng nơ-ron nhiều lớp (multi-layer perceptron - MLP) [8] [9] nâng cao dự đoán QoS dịch vụ

Các phương pháp MF [10] [11] dự đoán QoS bằng cách sử dụng các ma trận đặc trưng ẩn của người dùng và dịch vụ, được học từ toàn bộ dữ liệu có sẵn trong ma trận QoS Các dịch vụ đang hoạt động thường xuyên được gọi, do đó các giá trị QoS tương ứng có thể dễ dàng được thu thập và ghi lại Các nghiên cứu hiện có ([12], [13]) về thích ứng dịch vụ đã đề xuất một số phương pháp hiệu quả để dự đoán (ví dụ, bằng cách sử dụng các mô hình chuỗi thời gian) các giá trị QoS thời gian thực của các dịch vụ đang hoạt động, điều này có thể giúp xác định khi nào cần thích ứng và dịch vụ đang hoạt động nào cần thay thế

Trang 19

1.3 Mục tiêu đề tài

Trong luận văn, việc dự đoán QoS được thực hiện bằnhg cách sử dụng dữ liệu QoS trong quá khứ từ người dùng và dịch vụ khác nhau để ước tính chính xác các giá trị QoS của các dịch vụ đang hoạt động Kỹ thuật Collaborative Filtering (CF) với phương pháp phân tích ma trận (Matrix Factorization - MF) được áp dụng trong các hệ thống đề xuất Để thích ứng với các biến động QoS theo thời gian, MF được mở rộng với các kỹ thuật mới về biến đổi dữ liệu, học trực tuyến và trọng số thích nghi Phương pháp này không chỉ cải thiện độ chính xác mà còn đảm bảo hiệu quả và độ bền vững cao, rất quan trọng cho việc thích ứng dịch vụ trong thời gian thực tối ưu

Mục tiêu cụ thể: 1 Dự đoán QoS của các dịch vụ đang hoạt động trong thời gian thực đáp ứng các yêu cầu về độ chính xác, hiệu quả và độ bền vững

2 Đánh giá chất lượng dự đoán QoS trực tuyến với phân tích ma trận MF

Trang 20

1.4 Ý nghĩa đề tài 1.4.1 Ý nghĩa thực tiễn

Cung cấp giải pháp dự đoán thời gian thực chất lượng dịch vụ của các dịch vụ thành phần trong hệ thống đám mây từ đó giúp ứng dụng, người dùng lựa chọn dịch vụ tối ưu và thích nghi với điều kiện của môi trường và hệ thống

Luận văn đưa ra mô hình dự doán UMF thời gian thực với độ chính xác cao được khảo sát với dữ liệu thực tế

1.4.2 Ý nghĩa khoa học

Đề ra phương pháp cải tiến cho mô hình Matrix Factorization để áp dụng vào dự đoán trực tuyến chất lượng dịch vụ và nâng cao chất lượng dự đoán khi sử dụng dữ liệu ngẫu nhiên trong quá khứ để huấn luyện mô hình

Đề ra phương pháp tinh chỉnh hệ số học đối với các mẫu dữ liệu để cải thiện tốc độ hội tụ trong học trực tuyến

Trang 21

Chương 2 Kiến thức chung

2.1 Thích ứng dịch vụ thời gian thực dựa trên QoS

QoS được sử dụng để mô tả các thuộc tính phi chức năng của một dịch vụ, bao gồm thời gian phản hồi (response time), thông lượng (through put) thể hiện tính sẵn sàng, và độ tin cậy Việc đo lường và duy trì các thuộc tính này là cần thiết để đảm bảo trải nghiệm người dùng ổn định và đáp ứng các thỏa thuận mức dịch vụ (SLA)

Hiện nay với các ứng dụng được xây dựng trên kiến trúc hướng dịch vụ (SOA), một logic ứng dụng phức tạp được phân tích và xử lí bởi nhiều tác vụ thành phần cơ bản QoS là giá trị tổng hợp của các dịch vụ thành phần [15] Trong một môi trường động, các dịch vụ ban đầu có thể trở nên không khả dụng, các dịch vụ mới có thể xuất hiện và các giá trị QoS của dịch vụ có thể thay đổi theo thời gian, dẫn đến các vi phạm thoả thuận dịch vụ (SLA) ban đầu Do đó, thích ứng dịch vụ thời gian thực dựa trên QoS là cần thiết

Một ví dụ về thích ứng thời gian thực, ứng dụng phức tạp yêu cầu R tới dịch vụ đám mây và được thực thi bởi tổ hợp các loại dịch vụ thành phần A, B, C Trong đó loại dịch thành phần A được cung cấp bởi các dịch vụ đám mây A1, A2 Tương tự với B và C Yêu cầu có thể được thực thi bởi dịch vụ A1, B1 và C1 Do tác động của các yếu tố môi trường dịch vụ A1 không khả dụng và C1 quá tải làm suy giảm QoS Trong trường hợp này thích ứng dịch vụ thời gian thực là cần thiết để thay thế dịch vụ A1 à A2, C1 à C2

Trang 22

Các thành phần điển hình cho bộ thích ứng dịch vụ thời gian thực dựa trên QoS bao gồm:

- Công cụ BPEL: Quản lý và thực thi quy trình công việc - Bộ điều chỉnh thích ứng: Kiểm soát các hành động thích ứng theo các

chính sách định sẵn - Bộ quản lý dịch vụ: Thực hiện khám phá dịch vụ và trung gian giao

diện - Bộ quản lý QoS: Thu thập và dự đoán QoS Trong đó độ chính xác của quá trình thích nghi phụ thuộc việc thu thập và dự đoán QoS là trọng tâm của đề tài luận văn

2.2 Collaborative Filtering (CF)

Collaborative filtering là thuật toán lọc tương tác được ứng dụng rộng rãi trong hệ thống đề xuất (recommendation system) để tìm ra sản phẩm mà khách

Trang 23

Thuật toán sẽ không cần sử dụng thông tin sản phẩm là đầu vào cho dự báo điểm đánh giá (rating) Đầu vào của thuật toán là một ma trận tiện ích (ultility matrix) chứa giá trị đánh giá của các cặp (user, item) Mỗi cột là các điểm xếp hạng mà một người dùng đã đánh giá và mỗi dòng là các số điểm xếp hạng của một sản phẩm Tuy nhiên, với mỗi người dùng, thường chỉ có một tập hợp nhỏ các sản phẩm được xếp hạng Với ma trận xếp hạng người dùng và sản phẩm thưa thớt, mục tiêu của CF là tận dụng dữ liệu đánh giá quan sát được một phần để dự đoán các đánh giá còn lại, từ đó gợi ý các sản phẩm phù hợp cho người dùng theo các giá trị dự đoán

Hình 2.2: Utility matrix

Có 2 phương pháp chính được sử dụng trong collaborative filtering bao gồm: Neighborhood-based collaborative Filtering và Matrix Factorization

Neighborhood-based collaborative filtering là một kỹ thuật phổ biến trong hệ thống gợi ý, dùng để dự đoán sở thích người dùng dựa trên hành vi của họ và những người dùng có sở thích tương tự Phương pháp này có hai dạng chính: dựa trên người dùng (User-based filtering) và dựa trên sản phẩm (Item-based filtering) User-based filtering dùng tìm kiếm những người dùng có đánh giá tương tự để đề xuất các mục mà họ thích, trong khi lọc dựa trên mục tìm các

Trang 24

Kỹ thuật Matrix Factorization hoạt động bằng cách phân rã ma trận đánh giá ban đầu, với hàng là người dùng và cột là các sản phẩm, thành hai ma trận nhỏ hơn: một ma trận đặc trưng người dùng và một ma trận đặc trưng mục Mỗi ma trận này chứa các đặc trưng ẩn (latent factors) đại diện cho các yếu tố cơ bản ảnh hưởng đến sở thích của người dùng và thuộc tính của các mục Ưu điểm của phân rã ma trận là khả năng xử lý tốt dữ liệu thưa, cải thiện độ chính xác của dự đoán so với các phương pháp lọc cộng tác dựa trên lân cận, và khả năng mở rộng cho các hệ thống lớn Tuy nhiên, phân rã ma trận cũng có một số hạn chế, bao gồm việc khó khăn trong việc xử lý vấn đề khi có người dùng hoặc mục mới và cần điều chỉnh cẩn thận các tham số mô hình để đạt được hiệu suất tốt nhất

Tương tự với dự đoán xếp hạng trong các hệ thống gợi ý, các lần gọi dịch vụ trong quá khứ có thể tạo ra một ma trận QoS người dùng-dịch vụ tương ứng với từng thuộc tính QoS Giả sử có n người dùng và m dịch vụ, ma trận QoS thu thập được là ma trận nxm Mỗi hàng đại diện cho một người dùng dịch vụ (tức là u_i), mỗi cột đại diện cho một dịch vụ (tức là s_j ) trên đám mây, và mỗi giá trị R_ij, biểu thị giá trị QoS quan sát được bởi người dùng khi gọi dịch vụ

Như minh họa trong Hình 2.3, các giá trị trong các mục màu xám là dữ liệu QoS quan sát được từ đồ thị gọi dịch vụ người dùng, và các mục trống là các giá trị QoS chưa biết cần được dự đoán (được ký hiệu là ?) Trên thực tế, ma trận QoS rất thưa thớt (giá trị R_ij chưa biết ở nhiều mục), vì mỗi người dùng thường chỉ gọi một tập hợp nhỏ các dịch vụ Vấn đề dự đoán QoS do đó có thể được mô hình hóa như một vấn đề Collaborative Filtering với mục tiêu ước lượng xấp xỉ các giá trị chưa biết trong ma trận từ tập hợp các mục đã được quan sát

Trang 25

2.3 Matrix Factorization (MF)

Phân tích ma trận thành nhân tử (Matrix Factorization) là một trong những mô hình được sử dụng phổ biến nhất để giải quyết vấn đề Collaborative Filtering như đã nói ở trên, bằng cách ràng buộc hạng của một ma trận QoS, tức là rank(R) = d Giả thiết về hạng thấp dựa trên thực tế rằng các mục trong R thường có mối tương quan lớn Ví dụ, một số người dùng gần nhau có thể có điều kiện mạng tương tự, và do đó trải nghiệm QoS tương tự trên cùng một dịch vụ Do đó, R có hạng thấp Hình 2.4 minh họa một ví dụ áp dụng phân tích ma trận vào dự đoán QoS

Hình 2.4: Matrix Factoration trong dự đoán QoS [16]

Ý tưởng chính đằng sau Matrix Factorization cho Recommendation Systems là tồn tại các tính chất ẩn (latent features) mô tả sự liên quan giữa các người dùng và sản phẩm Ví dụ với hệ thống gợi ý các bộ phim, tính chất ẩn có thể là hình sự, chính trị, hành động, hài, …; cũng có thể là một sự kết hợp nào đó của các thể loại này; hoặc cũng có thể là bất cứ điều gì mà chúng ta không thực

Trang 26

Hình 2.5: Ma trận R được phân tích thành tích của hai ma trận U và S

Cụ thể, ma trận R được phân tích thành không gian ẩn của người dùng 𝑈 𝜖 ℝ!×# và không gian ẩn của dịch vụ 𝑆 𝜖 ℝ!×$, sao cho R có thể được khớp tốt bằng tích trong của U và S, tức là 𝑅%& ≈ 𝑈%'𝑆& Để đạt được điều này, cần tối ưu hóa hàm mất mát:

ℒ = 12, 𝐼%& .𝑅%& − 𝑈%'𝑆&0

)

23, ∥ 𝑈% % ∥)

)+ , ∥ 𝑆& ∥

)

Trong đó, các thành phần đầu tiên biểu thị tổng các lỗi bình phương giữa mỗi giá trị QoS quan sát được 𝑅%& giá trị QoS dự đoán tương ứng 𝑈%'𝑆& Đặc biệt, 𝐼%& = 1 nếu 𝑅%& được quan sát, ngược lại 𝐼%& = 0 Các thành phần còn lại , được

Trang 27

Hình 2.6: Dự đoán dữ liệu không xác định với MF [16]

Phương pháp tối ưu hóa giảm độ dốc (Gradient Descent) là thuật toán được áp dụng phổ biến để tìm ra các giải pháp cho U và S, thông qua quá trình cập nhật bắt đầu từ các khởi tạo ngẫu nhiên và lặp lại cho đến khi hội tụ Sau khi thu được U và S một giá trị QoS cụ thể chưa biết có thể được dự đoán bằng cách sử dụng tích trong tương ứng

- Khởi tạo: Bắt đầu với các giá trị ngẫu nhiên cho U và S - Tối ưu hoá: Sử dụng phương pháp giảm độ dốc GD để tối thiểu hóa hàm

mất mát, cập nhật U và S qua các lần lặp - Dự đoán: Sau khi tối ưu hóa, sử dụng tích trong của U và S để dự đoán

các giá trị QoS chưa biết Lợi ích khi áp dụng phương pháp này là tối ưu hoá giúp giảm thiểu lỗi giữa các giá trị QoS quan sát và dự đoán và tránh quá khớp bằng các thành phần

Trang 28

Phương pháp phân tích ma trận MF cung cấp công cụ hiệu quả để dự đoán các giá trị QoS trong môi trường dịch vụ thay đổi, hỗ trợ cho việc thích ứng dịch vụ thời gian thực

Trang 29

Chương 3 Phương pháp dự đoán chất lượng dịch vụ

3.1 Bài toán dự đoán chất lượng dịch vụ

Để phục vụ các yêu cầu của người dùng, các lần gọi dịch vụ được thực hiện để hoàn thành logic nhất định của ứng dụng Với giả thiết rằng mỗi loại dịch vụ có nhiều dịch vụ khả dụng và phân tán như đã trình bày trong Mục 2.1

Bài toán dự đoán QoS sử dụng dữ liệu QoS từ các người dùng khác nhau trong các lần gọi dịch vụ trong quá khứ Mỗi mẫu dữ liệu đại diện QoS được quan sát bởi người dùng được ghi cùng với thời gian của nó Trong thực tế mỗi người chỉ gọi một tập nhỏ các dịch vụ tại các thời điểm, trong khi nhiều dịch vụ khác không được gọi, dẫn đến các giá trị QoS không xác định Có thể coi dữ liệu QoS là một ma trận 3 chiều gồm người dùng, dịch vụ và thời gian Trong đó gồm các phần tử có giá trị từ quan sát và các phần tử trống là không xác định Để đưa ra các quyết định thích ứng dịch vụ tối ưu, chúng ta cần thông tin QoS thời gian thực không chỉ của các dịch vụ đang hoạt động mà của tất cả các dịch vụ Do đó bài toán dự đoán QoS trực tuyến của các dịch vụ ứng cử viên là vấn đề dự đoán các giá trị QoS không xác định tại khoảng thời gian hiện tại dựa vào dữ liệu trong quá khứ

Phương pháp dự đoán trực tuyến QoS cần giải quyết những vấn đề dưới đây:

Về độ chính xác: Phương pháp cần đảm bảo độ chính xác dự đoán QoS Các giá trị này ảnh hưởng đến quyết định điều chỉnh để thích ứng dịch vụ Dự đoán không chính xác có thể dẫn đến lựa chọn dịch vụ không phù hợp và ảnh hưởng đến chất lượng dịch vụ ở người dùng

Về hiệu quả: Giá trị QoS sẽ được cập nhật liên tục với các giá trị mới quan sát hoặc hết hạn sau một khoảng thời gian không được cập nhật Do đó dự đoán QoS cần thực hiện hiệu quả và trong thời gian thực

Trang 30

Về độ tin cậy: Các dịch vụ có thể được thêm mới hay ngừng bởi nhà cung cấp Tương tự người dùng có thể thường xuyên tham gia hoặc rời khỏi môi trường Phương pháp dự đoán cần phải tin cậy và thích ứng tốt với sự thay đổi cao của người dùng và dịch vụ

Ngoài ra do đặc tính của dự đoán trực tuyến khác với dự đoán ngoại tuyến thì những phương pháp dự đoán thông thường có nhiều hạn chế: Dữ liệu QoS có độ lệch với độ biến thiên lớn, giá trị QoS thay đổi theo thời gian, kích thước không cố định của người dùng và dịch vụ

3.2 Phương pháp

Như đã phân tích ở trên giải thuật MF có thể được sử dụng trong bài toán dự đoán QoS thời gian thực Tuy nhiên, để thích nghi với những đặc tính của bài toán đưa ra thì giải thuật cần được cải tiến để đạt được kết quả về độ chính xác, hiệu quả và độ tin cậy Đối với mô hình MF thông thường chỉ ứng dụng với ma trận hai chiều cụ thể, trong bài toán thời gian thực thì giải thuật sẽ thu thập và dự đoán QoS dưới dạng luồng dữ liệu

Mô hình dự đoán gồm các giai đoạn: - Thu thập dữ liệu dưới dạng luồng: Thu thập QoS được quan sát liên

tục dưới dạng luồng dữ liệu Luồng dữ liệu này phản ánh các yêu cầu dịch vụ thời gian thực và các giá trị QoS tương ứng thu được ở người dùng

- Biến đổi và chuẩn hóa dữ liệu: QoS được thu thập sẽ trải qua quá trình biến đổi dữ liệu để chuẩn hóa các giá trị QoS Bước này rất quan trọng để xử lý các phân phối lệch và các biến đổi trong dữ liệu QoS

- Cập nhật mô hình trực tuyến: Dữ liệu mới QoS đã chuẩn hóa được liên tục đưa vào mô hình để cập nhật trực tuyến Quá trình đào tạo

Ngày đăng: 25/09/2024, 14:32

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1] J. Zhu, P. He, Z. Zheng and M. R. Lyu, "Collaborative web service QoS prediction via neighborhood integrated matrix factorization," IEEE Transactions on Services Computing, vol. 6, pp. 289-299, 2013 Sách, tạp chí
Tiêu đề: Collaborative web service QoS prediction via neighborhood integrated matrix factorization
[2] M. P. Papazoglou, P. Traverso, S. Dustdar, and F. Leymann, "Service- oriented computing: State of the art and research challenges," IEEE Computer, vol. 40, pp. 38-45, 2007 Sách, tạp chí
Tiêu đề: Service-oriented computing: State of the art and research challenges
[4] Z. Zheng, H. Ma, M.R. Lyu, I. King, "Qos-aware web service recommendation by collaborative filtering," IEEE Transactions on Services Computing, vol. 4, pp. 140-152, 2011 Sách, tạp chí
Tiêu đề: Qos-aware web service recommendation by collaborative filtering
[5] Y. Zhang, C. Yin, Q. Wu, Q. He , H. Zhu, "Location-Aware Deep Collaborative Filtering for Service Recommendation," IEEE Transactions on Systems, Man, and Cybernetics: Systems, vol. 51, pp. 1-12, 2019 Sách, tạp chí
Tiêu đề: Location-Aware Deep Collaborative Filtering for Service Recommendation
[6] J. Zhu, P. He, Z. Zheng and M. R. Lyu, "An embedding based factorization machine approach for web service qos prediction," International Conference on Service-Oriented Computing, Spain, 2017, p. 272–286 Sách, tạp chí
Tiêu đề: An embedding based factorization machine approach for web service qos prediction
[7] Y. Yang, Z. Zheng, X. Niu, M. Tang, Y. Lu, X. Liao, "location-based factorization machine model for web service qos prediction," IEEE Transactions on Services Computing, vol. 14, p. 1264–1277, 2021 Sách, tạp chí
Tiêu đề: location-based factorization machine model for web service qos prediction
[8] Y. Xia, D. Ding, Z. Chang, F. Li, "Joint deep networks based multisource feature learning for qos prediction," IEEE Transactions on Services Computing, vol. 15, p. 2314–2327, 2021 Sách, tạp chí
Tiêu đề: Joint deep networks based multisource feature learning for qos prediction
[9] H. Zhang, D. Wang, W. Zhang,. et al "QoS prediction in intelligent edge computing based on feature learning," Journal of Cloud Computing, vol.12, 2023 Sách, tạp chí
Tiêu đề: QoS prediction in intelligent edge computing based on feature learning
[10] J. Zhu, P. He, Z. Zheng, M.R Lyu, "Towards online, accurate, and scalable qos prediction for runtime service adaptation," IEEE 34th International Conference on Distributed Computing Systems, Madrid, Spain, 2014, p.318–327 Sách, tạp chí
Tiêu đề: Towards online, accurate, and scalable qos prediction for runtime service adaptation
[11] H. Wu, K. Yue, B. Li, B. Zhang, CH. Hsu, "Collaborative QoS prediction with context-sensitive matrix factorization," Future Generation Computer Systems, vol. 82, p. 669–678, 2018 Sách, tạp chí
Tiêu đề: Collaborative QoS prediction with context-sensitive matrix factorization
[12] A. Amin, L. Grunske, and A. Colman, "An automated approach to forecasting QoS attributes based on linear and non-linear time series modeling," Proceedings of the 27th IEEE/ACM International Conference on Automated Software Engineering, Essen, Germany, 2012, pp. 130-139 Sách, tạp chí
Tiêu đề: An automated approach to forecasting QoS attributes based on linear and non-linear time series modeling
[13] Pazat, C. Wang and J.-L.,"A two-phase online prediction approach for accurate and timely adaptation decision," Proceedings of the 27th IEEE/ACM International Conference on Automated Software Engineering, Honolulu, HI, USA, 2012, pp. 218-225 Sách, tạp chí
Tiêu đề: A two-phase online prediction approach for accurate and timely adaptation decision
[14] A. Metzger, O. Sammodi, K. Pohl, and M. Rzepka, "Towards proactive adaptation with confidence: Augmenting service monitoring with online testing," Proceedings of the 2010 ICSE Workshop on Software Engineering for Adaptive and Self-Managing Systems., (SEAMS’10). ACM, pp. 20-28, 2010 Sách, tạp chí
Tiêu đề: Towards proactive adaptation with confidence: Augmenting service monitoring with online testing
[15] Pazat, C. Wang and J.-L., "A two-phase online prediction approach for accurate and timely adaptation decision," IEEE Ninth International Conference on Services Computing, Honolulu, HI, USA, 2012, pp. 218-225 Sách, tạp chí
Tiêu đề: A two-phase online prediction approach for accurate and timely adaptation decision
[16] J. Zhu, P. He, Z. Zheng and M. R. Lyu, "Online QoS Prediction for Runtime Service Adaptation via Adaptive Matrix Factorization," IEEE Transactions on Parallel and Distributed Systems, vol. 28, pp. 2911-2924, 2017 Sách, tạp chí
Tiêu đề: Online QoS Prediction for Runtime Service Adaptation via Adaptive Matrix Factorization
[17] V. H. Tiep, "Matrix Factorization Collaborative Filtering," 2017. [Online].Available:https://machinelearningcoban.com/2017/05/31/matrixfactorization/.[Accessed 1 May 2024] Sách, tạp chí
Tiêu đề: Matrix Factorization Collaborative Filtering
[18] Z. Zheng, H. Ma, M. R. Lyu, and I. King, "WSRec: A collaborative filtering based web service recommender system," IEEE International Conference on Web Services, Los Angeles, CA, USA, 2009, pp. 437-444 Sách, tạp chí
Tiêu đề: WSRec: A collaborative filtering based web service recommender system
[19] scipy.stats.boxcox, "Reference guide," [Online]. Available: http://docs.scipy.org/doc/scipy-0.17.0/reference/generated/scipy.stats.boxcox.html. [Accessed 1 May 2024] Sách, tạp chí
Tiêu đề: Reference guide
[20] P. Leitner, A. Michlmayr, F. Rosenberg, and S. Dustdar, "Monitoring, prediction and prevention of SLA violations in composite services," IEEE International Conference on Web Services, Miami, FL, USA, 2010, pp. 369- 376 Sách, tạp chí
Tiêu đề: Monitoring, prediction and prevention of SLA violations in composite services

HÌNH ẢNH LIÊN QUAN

Hình 1.1: Các thành phần Service-Oriented Architecture - Luận văn thạc sĩ Khoa học máy tính: Ứng dụng học máy trong dự đoán chất lượng dịch vụ cho hệ thống điện toán đám mây
Hình 1.1 Các thành phần Service-Oriented Architecture (Trang 16)
Hình 1.2: Các yếu tố ảnh hưởng đến QoS - Luận văn thạc sĩ Khoa học máy tính: Ứng dụng học máy trong dự đoán chất lượng dịch vụ cho hệ thống điện toán đám mây
Hình 1.2 Các yếu tố ảnh hưởng đến QoS (Trang 17)
Hình 2.1: Sự thay đổi trong thích ứng dich vụ thời gian thực - Luận văn thạc sĩ Khoa học máy tính: Ứng dụng học máy trong dự đoán chất lượng dịch vụ cho hệ thống điện toán đám mây
Hình 2.1 Sự thay đổi trong thích ứng dich vụ thời gian thực (Trang 22)
Hình 2.3: Dự đoán QoS [16] - Luận văn thạc sĩ Khoa học máy tính: Ứng dụng học máy trong dự đoán chất lượng dịch vụ cho hệ thống điện toán đám mây
Hình 2.3 Dự đoán QoS [16] (Trang 25)
Hình 2.6: Dự đoán dữ liệu không xác định với MF [16] - Luận văn thạc sĩ Khoa học máy tính: Ứng dụng học máy trong dự đoán chất lượng dịch vụ cho hệ thống điện toán đám mây
Hình 2.6 Dự đoán dữ liệu không xác định với MF [16] (Trang 27)
Hình 4.1: Sơ đồ khối tổng quát giải thuật với mỗi mẫu dữ liệu - Luận văn thạc sĩ Khoa học máy tính: Ứng dụng học máy trong dự đoán chất lượng dịch vụ cho hệ thống điện toán đám mây
Hình 4.1 Sơ đồ khối tổng quát giải thuật với mỗi mẫu dữ liệu (Trang 41)
Hình 4.3: Phân bố dữ liệu QoS thời gian đáp ứng - Luận văn thạc sĩ Khoa học máy tính: Ứng dụng học máy trong dự đoán chất lượng dịch vụ cho hệ thống điện toán đám mây
Hình 4.3 Phân bố dữ liệu QoS thời gian đáp ứng (Trang 44)
Hình 4.4: Phân bố dữ liệu QoS thông lượng - Luận văn thạc sĩ Khoa học máy tính: Ứng dụng học máy trong dự đoán chất lượng dịch vụ cho hệ thống điện toán đám mây
Hình 4.4 Phân bố dữ liệu QoS thông lượng (Trang 44)
Hình 4.5: Phân bố dữ liệu QoS thời gian đáp ứng sau khi biến đổi - Luận văn thạc sĩ Khoa học máy tính: Ứng dụng học máy trong dự đoán chất lượng dịch vụ cho hệ thống điện toán đám mây
Hình 4.5 Phân bố dữ liệu QoS thời gian đáp ứng sau khi biến đổi (Trang 45)
Hình 4.6: Phân bố dữ liệu QoS thông lượng sau khi biến đổi - Luận văn thạc sĩ Khoa học máy tính: Ứng dụng học máy trong dự đoán chất lượng dịch vụ cho hệ thống điện toán đám mây
Hình 4.6 Phân bố dữ liệu QoS thông lượng sau khi biến đổi (Trang 45)
Hình 4.7: MRE của thời gian đáp ứng theo lát thời gian - Luận văn thạc sĩ Khoa học máy tính: Ứng dụng học máy trong dự đoán chất lượng dịch vụ cho hệ thống điện toán đám mây
Hình 4.7 MRE của thời gian đáp ứng theo lát thời gian (Trang 49)
Hình 4.8: NPRE của thời gian đáp ứng theo lát thời gian - Luận văn thạc sĩ Khoa học máy tính: Ứng dụng học máy trong dự đoán chất lượng dịch vụ cho hệ thống điện toán đám mây
Hình 4.8 NPRE của thời gian đáp ứng theo lát thời gian (Trang 49)
Hình 4.10: Hàm mất mát theo dữ liệu mới/cũ với UMF (p = 1.0) - Luận văn thạc sĩ Khoa học máy tính: Ứng dụng học máy trong dự đoán chất lượng dịch vụ cho hệ thống điện toán đám mây
Hình 4.10 Hàm mất mát theo dữ liệu mới/cũ với UMF (p = 1.0) (Trang 51)
Hình 4.11: Hàm mất mát theo từng iteration với UMF (p=0.6) - Luận văn thạc sĩ Khoa học máy tính: Ứng dụng học máy trong dự đoán chất lượng dịch vụ cho hệ thống điện toán đám mây
Hình 4.11 Hàm mất mát theo từng iteration với UMF (p=0.6) (Trang 51)
Hình 4.12: Hàm mất mát theo từng iteration với AMF - Luận văn thạc sĩ Khoa học máy tính: Ứng dụng học máy trong dự đoán chất lượng dịch vụ cho hệ thống điện toán đám mây
Hình 4.12 Hàm mất mát theo từng iteration với AMF (Trang 52)

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN