Kết quả thực nghiệm và giải thích kết quả

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu học máy trong xây dựng gợi hệ ý âm nhạc (Trang 47 - 53)

Hình 3.5: Kết quả đánh giá hệ thống

Phương pháp lọc cộng tác dựa trên các thẻ đánh dấu nhận điểm trung bình 3,6 điểm số cao nhất trong bốn kết quả gợi ý. Tiếp theo là phương pháp kết hợp dựa trên lọc cộng tác và lọc nội dung có điểm trung bình là 3,3. Phương pháp gợi ý dựa trên nội dung đặc trưng âm thanh ở vị trí thứ 3 với điểm trung bình là 2,8. Cuối cùng như dự đoán, các gợi ý tồi nhận điểm trung bình là 1,5.

0 1 2 3 4 5

Điểm trung bình cho các kết quả gợi ý (thang điểm từ 1-5)

Gợi ý dựa vào thẻ đánh dấu Gợi ý dựa vào mfcc

40

Bảng 3.2 chứa nội dung chi tiết về 5 ví dụ được rút ra từ thực nghiệm để làm nổi bật khả năng của hệ gợi ý âm nhạc dựa trên phương pháp kết hợp. Cả 5 ví dụ đều được đưa ra bởi phương pháp kết hợp.

Bảng 3.2. 5 ví dụ rút ra từ thực nghiệm Bản nhạc được chọn Bản nhạc gợi ý Điểm đánh giá Những đặc điểm giống nhau Những thẻ đánh dấu giống nhau Tênbản nhạc Nghệ sỹ Tên bản nhạc Nghệ sỹ Until the End of Time Justin Timberlake Twenty Foreplay Janet Jackson 5

Thể loại giống nhau (slow R&B), cùng khóa nhạc (Si thứ),chùmhợp âm giống nhau, âm sắc giống nhau (nhạc cụ/giọng hát) pop, r&b, sexy, soul Just Got Lucky Dokken Mama Weer All Crazee Now Quiet Riot 5

Thể loại giống nhau (hard rock), Cùng nhịp độ (138), cùng khóa (Đô thăng trưởngvà Rê trưởng), cùng âm sắc (tiếng guitar điện)

hard rock, heavy metal, hair metal, 80s Baby One More Time Britney Spears Crash Gwen Stefani 4 Thể loại giống nhau (pop), nhịp trống giốn nhau, âm sắc giống nhau (tiếng bass, giọng hát) pop, dance, female vocalists, sexy Autumn Leaves Cannonball Adderley Feat. Miles Davis Song for My Father Horace Silver 4

Thể loại giống nhau (cool jazz), âm sắc giống nhau (nhạc cụ) jazz Rumour Has It Adele Rolling in the Deep Adele 5

Thể loại giống nhau (soul / pop), same artist/band (Adele), nhịp trống giống nhau, âm sắc giống nhau(nhạc cụ/giọng hát) soul, pop, Adele, female vocalists, British, singer- songwriter

Trong ví dụ đầu tiên, bản nhạc “Until the End of Time” của Justin Timberlake là bản nhạc được chọn nghe, và bản nhạc “Twenty Foreplay” của Janet Jackson được gợi ý. Khi phân tích hai bản nhạc, chúng ta nhận ra rằng hai bản nhạc có cùng thể loại, cùng khóa nhạc, có chuỗi hợp âm rất giống nhau, và âm sắc cũng

41

rất giống nhau. Bản nhạc của Janet Jackson được gợi ý bởi hệ gợi ý kết hợp vì hai lý do: cả hai bản nhạc đều có cùng các thẻ đánh dấu: pop, r&b, sexy và soul, và đều có các đặc trưng âm thanh.

Xét một cách tổng thể, khi dùng phương pháp kết hợp, người dùng có nhiều khả năng khám phá ra một bản nhạc mới (mà chưa ai biết đến) vì phương pháp này không chỉ dựa hoàn toàn vào lọc cộng tác.

3.4 Kết luận chương

Trong Chương 3, chúng ta đã trình bày các bước xây dựng và hoàn thiện ứng dựng hệ gợi ý âm nhạc dựa trên phương pháp kết hợp giữa các phương pháp đã được trình bày ở chương 2. Chương 3 cũng đưa ra phương pháp thử nghiệm hệ thống, cách tiếp cận và thu thập ý kiến của người dùng nhằm mục đích đánh giá khả năng hoạt động của hệ thống.

42

KẾT LUẬN Kết quả đạt được và hạn chế

Dựa vào kết quả phân tính dữ liệu từ thực nghiệm. Phương pháp gợi ý chỉ dùng lọc cộng tác bằng các thẻ đánh dấu cho kết quả đánh giá tốt nhất. Điều này có thể được giải thích bởi một vài lý do. Trước hết, trang Last.fm có hàng triệu người dùng đăng ký sử dụng. Điều này sẽ giúp tăng hiệu quả gợi ý, vì kết quả sẽ tỷ lệ thuận với số người sử dụng. Tuy nhiên, các thẻ gợi ý chủ yếu liên quan đến tên bản nhạc, tên nghệ sỹ và tên album nhạc. Điều này sẽ ảnh hưởng đên việc chấm điểm của những người tham gia thực nghiệm, vì thông thường bản nhạc có cùng nghệ sỹ biểu diễn thường được đánh giá là giống nhau.

Mục tiêu của phương pháp gợi ý âm nhạc kết hợp sử dung lọc cộng tác và lọc nội dung đã nhìn chung là đã thành công và đi đúng hướng theo yêu cầu được đặt ra. Tuy nhiên những gợi ý không phải luôn chính xác vì tập dữ liệu chỉ có khoảng 500 bản nhạc và thiếu sự đa dạng. Trong ví dụ này, bản nhạc được chọn nghe là bản nhạc jazz, medium-swing có chủ đề giáng sinh được biểu diễn bởi Ellas Fitzgerald. Đây là bản nhạc duy nhất của Ella Fitzgerald trong tập dữ liệu. Ngoài ra, không có nhiều bản nhạc jazz, medium-swing, trong tập dữ liệu. Trên thực thế, chỉ có khoảng 3,8% bản nhạc trong tập dữ liệu có thẻ đánh dấu là jazz. Điều này dẫn đến việc các kết quả được gợi ý không được chính xác.

Ví dụ, gợi ý của phương pháp kết hợp là “What Christmas Means to Me” được biểu diễn bởi Hanson thiên về thể loại pop-rock. Bản nhạc này được gợi ý chủ yếu là do cùng là bản nhạc về giáng sinh. Những gợi ý của hai phương pháp còn lại cũng gặp vấn đề tương tự. Bản nhạc gợi ý dựa trên thẻ đánh dấu, “Christmas Time” được biểu diển bởi Backstreet Boys là thể loại pop-rock. Bản nhạc này cũng được gợi ý vì lý do là ca khúc giáng sinh. Bản nhạc được gợi ý bằng trích chọn đặc trưng âm nhạc, là “Know You Now” của Amy Winehouse thuộc thể loại R&B. Bản nhạc này được gợi ý có thể bởi vị của Amy Winehouse có quãng và chất giọng gần giống với Ella Fitzgerald. Nhưng những bản nhạc này không giống với bản nhạc được nghe. Cụ thể hơn, chúng hoàn toàn khác về thể loại và nhịp điệu.

43

Hướng phát triển

Định hướng phát triển tiếp theo, trước hết tôi sẽ mở rộng tập dữ liệu, tăng sự đa dạng về các thể loại cũng như số lượng các bản nhạc. Việc này sẽ giúp tăng các chỉ số đo mức độ giống nhau và góp phần làm tăng sự chính xác của các bản nhạc gợi ý.

Tổng quát, phương pháp lọc nội dung bằng tự động trích chọn các thuộc tính MFCC thể hiện khá tốt. Nhưng nó lại ít chính xác nhất trong số ba phương pháp được thử nghiệm. Lý do có thể là phương pháp này chỉ xét đến tần số của các âm thanh. Hệ thống trong tương lai có thể sẽ mở rộng thêm một số đặc trưng âm nhạc khác như nhạc cụ và nhịp điệu. Để có thể phục vụ cộng đồng người dùng, hệ thống phải có thêm các tính năng động, tự động cập nhật cơ sở dữ liệu những thẻ gợi ý mới, những bản nhạc mới và điều chỉnh các chỉ số dựa trên tập dữ liệu mới được cập nhật. Ngoài ra, hệ thống có thể có khả năng tự động điều chỉnh gợi ý dựa trên hành vi của từng người dùng. Điều này sẽ làm giúp hệ gợi ý trở nên cá nhân hóa cho từng người sử dụng

44

TÀI LIỆU THAM KHẢO

[1] C. H. Chuan (2013), “Audio Classification and Retrieval Using Wavelets and Gaussian Mixture Models”, Multimedia Engineering and Management,

International Journal of, vol. 4, issue 1.

[2] H. C. Chen, A.L. Chen (2001), “A Music Recommendation System Based on Music Data Grouping and User Interests”, Information and Knowledge

Management, 10th ACM International Conference on, pp. 231-238.

[3] W. W. Cohen, W. Fan (2000), “Web-collaborative Filtering: Recommending Music by Crawling the Web”, Computer Networks, vol. 33, no. 1, pp. 685- 698.

[4] M.M. Deza, E Deza (2009), Encyclopedia of Distances, Springer, New York, pp. 94.

[5] D. Eck, P. Lamere, T. Bertin-Mahieux, S. Green (2008) “Automatic Generation of Social Tags for Music Recommendation”, Advances in Neural

Information Processing Systems, pp. 385-392.

[6] S.A. Golder, B. A. Huberman (2006), “Usage Patterns of Collaborative Tagging Systems”, Journal ofInformation Science, vol. 32, pp. 198–208. [7] J. Jenson, D. Ellis, M. Christensen, S. Jensen (2007), “Evaluation of Distance

Measures between Gaussian Mixture Models of MFCCs”, 8th International

Conference on Music Information Retrieval, pp. 107-108.

[8] P. Knees, T. Pohle, M. Schedl, G. Widmer (2007), “A Music Search Engine Built upon Audio-based and Web-based Similarity Measures”, International ACM SIGIR Conference on Research and Development in Information

Retrieval, pp. 447-454.

[9] M. Levy, M. Sandler (2006), “Lightweight Measures for Timbral Similarity of Musical Audio”, 1st ACM Workshop on Audio and Music Computing

Multimedia.

[10] M. Levy, M. Sandler (2009), “Music Information Retrieval Using Social Tags and Audio”, IEEE Transactions on Multimedia, vol. 11, no. 3, pp. 383- 395.

[11] M. Mandel, D. Ellis (2005), “Song-Level Features and Support Vector Machines for Music Classification”, 6th International Conference on Music

45

[12] X. Su, T. Khoshgoftaar (2009), “A Survey of Collaborative Filtering Techniques”, Advances in Artificial Intelligence.

[13] X. Wu, L. Zhang, Y. Yu (2006), “Exploring Social Annotations for the Semantic Web”, 15th International Conference on World Wide Web, pp. 417-426.

[14] http://www.Last.fm/, truy cập ngày 26/9/2016.

[15] http://www.vamp-plugins.org/sonic-annotator/, truy cập ngày 26/9/2016. [16] http://www.sonicvisualiser.org/, truy cập ngày 26/9/2016.

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu học máy trong xây dựng gợi hệ ý âm nhạc (Trang 47 - 53)