Kỹ thuật phân rã ma trận SVD

Một phần của tài liệu (LUẬN văn THẠC sĩ) khai thác sự đa dạng trong tư vấn thông tin liên lĩnh vực (Trang 29 - 31)

Chương 2 HỆ THỐNG TƯ VẤN

2.5. Các kỹ thuật trong hệ thống tư vấn

2.5.2. Kỹ thuật phân rã ma trận SVD

Bài toán phân rã giá trị riêng được phát biểu như sau: với bất kỳ ma trận A kích thước M × N nào đó có số M ≥ N, có thể được viết dưới dạng tích của một ma trận U

trực giao theo cột có kích thước M × N, một ma trận chéo W có kích thước N × N với các số trên đường chéo là không âm, và ma trận chuyển vị của một ma trận trực giao V

có kích thước N× N (xem công thức 2.4).

𝐴 𝑈 𝑊 𝑉 𝑈

𝑤 ⋯

𝑤 𝑉

(2.4)

Đường chéo khởi tạo r của S(s1,s2, ..., sr) có các đặc trưng si>0s1≥s2≥ …≥ sr. Trong đó, r cột đầu tiên của U là vector riêng của AAT và đại diện cho các vector riêng trái của A trong không gian mở rộng cột, r cột đầu tiên của V là vector riêng của ATA và đại diện cho các vector riêng phải của A trong không gian mở rộng hàng. Nếu chúng ta chỉ tập trung vào các r giá trị riêng khác không, kích thước hiệu quả SVD [16] của ma trận U, SV sẽ trở thành M × r, r × rr × N tương ứng.

Một thuộc tính quan trọng của SVD, đặc biệt hữu ích trong các hệ thống tư vấn là nó có thể cung cấp giá trị xấp xỉ thấp nhất. Bằng cách giữ lại k << r giá trị riêng của S

và loại bỏ các phần còn lại (tức là giữ k giá trị riêng lớn nhất), dựa trên thực tế là các mục trong S đều được sắp xếp, chúng ta sẽ giảm số chiều của dữ liệu và hy vọng sẽ nắm

bắt được mối quan hệ "tiềm ẩn" quan trọng nhưng hiện tại không rõ ràng trong các đại diện ban đầu của ma trận A. Kết quả đường chéo ma trận được gọi là Sk . Ma trận U

V cũng nên được giảm cho phù hợp. Uk được tạo ra bằng cách loại bỏ r-k cột từ ma trận

U. Vk được tạo ra bằng cách loại bỏ r - k hàng từ ma trận V. Ma trận Ak được định nghĩa trong công thức (2.5) như sau:

Thuật toán 2.1: Thuật toán SVD Input: Ma trận đánh giá R

Output: Ma trận Rgiảm

Processing:

Bước 1: Tạo ma trận đánh giá R ban đầu, có kích thước M × N. Trong đó bao gồm các xếp hạng của M NSD trên N sản phẩm trong đó rij là đánh giá của NSD ui trên sản phẩm pj.

Bước 2: Loại bỏ tất cả các giá trị dữ liệu chưa đánh giá trong R như sau:

2.1: Tính giá trị trung bình của tất cả các hàng ri, trong đó i = 1..M,

và tính giá trị trung bình của tất cả các cột rj , trong đó j = 1..N.

2.2: Thay thế tất cả các mục ma trận không có giá trị, biểu hiện bằng

⊥, với cột trung bình tương ứng rj ta thu được ma trận mới R’.

2.3: Trừ các giá trị trung bình hàng tương ứng ri của tất cả các giá trị trong ma trận vừa thu được R’, ta thu được ma trận chuẩn hóa

R”.

Bước 3: Tính toán SVD của R” và có được ma trận U, SV, có kích thước lần lượt là M × M, M × N, N × N tương ứng. Mối quan hệ được thể hiện bởi công thức (2.6):

𝑅" 𝑈 𝑆 𝑉 (2.6)

Bước 4: Giảm chiều bằng cách giữ chỉ k đường chéo từ ma trận S để có được một ma trận k × k ký hiệu Sk . Tương tự như vậy ta có ma trận Uk

Vk với kích thước M × kk × N được tạo ra. Ta thu được ma trận Rgiảm

dựa trên công thức (2.7):

𝑅 ả 𝑈 𝑆 𝑉 (2.7)

Một phần của tài liệu (LUẬN văn THẠC sĩ) khai thác sự đa dạng trong tư vấn thông tin liên lĩnh vực (Trang 29 - 31)

Tải bản đầy đủ (PDF)

(83 trang)