Những việc chưa làm được

Một phần của tài liệu hệ thống tìm kiếm âm thanh QBH trong cơ sở dữ liệu đa phương tiện và ứng dụng (Trang 53 - 58)

4. Th ực nghiệm

4.3Những việc chưa làm được

Chưa xác định được thời gian truy cập của từng truy vấn tại các khoảng thời gian khác nhau, tình được thời gian đáp ứng trung bình của hệ thống với từng truy vấn vì cơ sở dữ liệu các bản nhạc chưa đủ lớn để xảy ra một thời gian cho truy vấn. Ta nhận thấy độ phức tạp của thuật toán tuyến tính phụ thuộc vào độ dài đoạn truy vấn.

Chưa thử được trên nhiều bộ dữ liệu khác nhau để đưa ra sự khác nhau giữa các bộ dữ liệu.

KT LUN

Trong luận văn này đã trình bày những hiểu biết của mình về xây dựng hệ thống tìm kiếm thông tin âm nhạc dựa trên cơ sở dữ liệu do giọng người hát. Trong hệ thống bao gồm các phần:

• Phần xử lý âm thanh truy vấn: sử dụng kỹ thuật pitch tracking để rút trích đặc trưng cao độ của âm thanh truy vấn bằng việc sử dụng phương pháp autocorrelation.

• Biểu diễn đặc trưng đường cao độ thành một đặc trưng phù hợp trong việc tìm kiếm trong cơ sở dữ liệu. Đặc trưng này được sử dụng trong quá trình tìm kiếm • Tìm kiếm và so sánh đặc trưng trong hệ thống được thực hiện bằng phương

pháp DTW.

• Phần thực nghiệm: Kết quả thu được khi test thử một demo open source trên hệ điều hành ubuntu.

Phát triển tiếp theo

Cùng với sự bùng nổ khả năng lưu trữ của máy tính, truy vấn thông tin trở thành một đề tài rất quan trọng trong thời gian gần đây. Việc xây dựng một hệ thống truy vấn phù hợp với bản chất của dữ liệu mà nó thao tác trên đó là rất cần thiết. Việc này sẽ tăng hiệu quả cho việc tìm kiếm thông tin và làm cho giao tác giữa người và máy trở nên gần gũi. Dù đã đạt được những bước tiến cụ thể, lĩnh vực truy vấn bằng giọng hát vẫn cần những nghiên cứu xa hơn để có thể dựa vào ứng dụng thực tế:

• Truy vấn trên bộ dữ liệu lớn: Những đề tài về truy vấn âm nhạc bằng giọng phát hiện nay chỉ tập trung vào đặc trưng và phương pháp tìm kiếm. Để có thể đưa ứng dụng vào việc thương mại hoá, những phương pháp cụ thểđể truy vấn trên một bộ dữ liệu lớn (hàng chục ngàn bài hát) với thời gian đáp ứng của hệ thống phải được xem xét kỹ lưỡng.

• Tựđộng rút trích thông tin giai điệu trên dữ liệu nhạc số thông thường: Trong đề tài này, cơ sở dữ liệu được xét đến chỉ dừng lại ở MIDI đơn âm. Để có thể có được một bộ dữ liệu lớn mà không tốn quá nhiều công sức, việc rút trích giai điệu chủ đề trên một tập tin MIDI đa âm nên được cân nhắc đến. Đây là một bài toán khó và thường thì lời giải sẽ không được rạch ròi đúng sai với một

dữ liệu cụ thể do việc nhận được giai điệu chính từ một bản nhạc phức tạp đa âm (như giao hưởng, concerto, …) cũng không phải đơn giản với những người không có hiểu biết nhiều về âm nhạc. Bài toán còn trở nên phức tạp hơn nếu định dạng dữ liệu là những bản nhạc số thông thường như WAV, MP3, WMA. • Phát triển hệ thống tìm kiếm trên điện thoại di động. Hiện tại mới phát triển một

hệ thống tìm kiếm trên điện http://www.shazam.com.vn. Nhưng nó lại tìm kiếm trên bản thu âm chứ không phải là dựa trên giai điệu mà người dùng ngân nga vào. Như chúng ta biết điện thoại di động ngày nay rất phổ biến vì vậy ta nên hướng đến nó. Để thực thi một hệ thống tìm kiếm trên điện thoại di động thì ta phải có một tổng đài cố định làm nhiệm vụ như một máy tìm kiếm âm nhạc nhưđã xây dựng ở trên. Việc tìm kiếm sẽ diễn ra như sau: Người dùng sẽ gọi đến tổng dài cố định nào đó (1900xxx) sau đó sẽ hát hoặc ngân nga giai điệu truy vấn đến tổng đài. Tổng đài sẽ làm nhiệm vụ xử lý truy vấn, tìm kiếm để trả về kết quả qua tin nhắn thoại cho người dùng.

TÀI LIỆU THAM KHẢO

Tài liệu tiếng Việt

[1] Học viện bưu chính viễn thông 2007. Xử lý âm thanh và hình ảnh

[2] Lê Tiến Thường, Trần Ngọc Phiên, Trần Đức Tiến.Phương pháp mới trích chu kỳ cao độ trung bình ứng dụng trong nhận dạng thanh điệu tiếng Việt.

[3] Khóa luận tốt nghiệp của sinh viên Nguyễn Quốc Đính. Nhận dạng giọng nói. [4] Tạp chí BCVT & CNTT kỳ 3 10/2007. Xây dựng và khảo sát độ dài từ khóa trong nhận dạng người nói phụ thuộc vào từ khóa tiếng Việt theo mô hình Markov ẩn.

Tài liệu tham khảo tiếng anh

[5] Valeriy Lobaryev Gene Sokolov Alexandr Gordeyev. Sloud Query-by Humming Search Music Engine. National Aerospace University Chkalov str.17 Kharkiv, 61070, Uckrane & USA

[6] Tim Anderson April 2008. Development of a query by humming system.

Sypervisor: Andrew naftel.

[7] Matti Ryynanen and Anssi Klapurri. Query by humming of midi and Audio using Locality sensitive Hashing. Tampere University of Technology Institute of Signal Processing, P.O.Box 553, FI – 33101 Tampere, Finland.

[8] Javier Thaine B.Eng., MeGill university,Dec 5 2007. A Query by humming approach to music retrieval. Simon Fraser University Library Bungary, BC, Canada.

[9] Presented at the 116th Convention 2004 May 8-11. A Query by humming system using MPEG-7 Descriptors, Audio Engineering Society Convention Paper 6137.

Berlin, Germany.

[10]Annie Ding, Calvin On, Edmond Lau. 6.830: Database Systems Final Project Report Massachusetts Institute of Technology. MusicDB: A Query by humming System

[11] Asif Ghias, Jonathan Logan, David Chamberlin, Brian C. Smith-1995. Query by Humming Musical Information Retrieval in An Audio Database. Proceedings of ACM Multimedia 95, (pp. 231-236).

[12] Man Hon Wong and Wai Man Szeto The Chinese University of Hong Kong. Stream Segreation Algorithm for Pattern Matching in Polyphonic Music Database. [13] Fraunhofer Institut Digitale Medientechnologie. Query by Humming Melody Recognition System. Dr-Ing. Karheinz Brandenburg Ehrenbergstr. 3198693 llmenau, Germany.

[14] Lloyd A.Smith, Rodger J.McNab and lan H.Writen. Music Information Retrieval Using Audio Input. Department of Computer Science University of Waikato Private Bag 3105 Hamilton, New Zealand. (adsbygoogle = window.adsbygoogle || []).push({});

[15] Rui Pedro pinto de Carvalho e Paive, 2006. Melody Detection in Polyphonic Audio. University of Coimbra in partial fulfillment of the requirement for the degree of Doctor of Philosophy in Informations Engineering.

[16] Jeffrey Daniel Frey May 2008. Finding song melody similarities using a DNA string matching algorithm.

[17] Jonathan T.Foote. Content-based Retrieval in MIDI and Audio. Institute of Systems Science National University of Singapore Heng Mui Keng Terrace, Kent Ridge Singapore 119597.

[18] M. nand Raju, Bharat Sundaram and Preeti Rao, Presented at National Conference on Comunications, NCC 2003, Jan 31- Feb 2, IIT Madras 2003, A Query- by-humming based music retrieval system.Dept. of EE, I.I.T. Kanpur.

[19] Malcolm Slaney and Michael Casey. 2008 Locality-Sensitve Hashing for Finding Neearst Neighbors. IEEE Signal Processing Magazine.

[20] Blackburn, S. G. (2000) Content Based Retrieval and Navigation of Music UsingMelodic Pitch Contours (PhD Thesis). University of Southampton.

[21] Pardo, B., Shifrin, J., & Birmingham, W. (2004). Name that Tune: A Pilot Study in Finding a Melody from a Sung Query. Journal of the American Society for Information Science and Technology.

[22]Dowling, W. J. (1978) Scale and Contour Two components of a Theory of Memory for Melodies. Psychological Review, 341-354

[23] Lie Lu, Hong You, Hong – Jiang Zhang. A new approach to query by humming in music retrieval, Microsoft Research, China 5F, Beijing Sigma Center 49 Zhichun Road, Beijing 100080, China.

[24]http://neural.cs.nthu.edu.tw/jang/books/audioSignalProcessing/dpDtw.asp?title=1 4-4%20Dynamic%20Time%20Warping [25]http://neural.cs.nthu.edu.tw/jang/books/audioSignalProcessing/matlab4waveReco rd.asp?title=4-4%20Recording%20from%20Microphone [26]http://neural.cs.nthu.edu.tw/jang/books/audioSignalProcessing/matlab4waveRead .asp?title=4-2%20Reading%20Wave%20Files [27] http://gsm.vn/forum/main/showthread.php?t=13545 [28] http://en.wikipedia.org/wiki/Music_information_retrieval [29]http://maikien.com/content/view/63/1/

Một phần của tài liệu hệ thống tìm kiếm âm thanh QBH trong cơ sở dữ liệu đa phương tiện và ứng dụng (Trang 53 - 58)