1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Tìm kiếm nhạc số dựa trên chuỗi đặc trưng âm thanh

67 11 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Phạm Cẩm Ngọc TÌM KIẾM NHẠC SỐ DỰA TRÊN CHUỖI ĐẶC TRƯNG ÂM THANH LUẬN VĂN THẠC SĨ HÀ NỘI – 2010 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CƠNG NGHỆ Phạm Cẩm Ngọc TÌM KIẾM NHẠC SỐ DỰA TRÊN CHUỖI ĐẶC TRƯNG ÂM THANH Ngành : Công nghệ thông tin Chuyên ngành : Hệ thống thông tin Mã số LUẬN VĂN THẠC SĨ NGƯỜI HƯỚNG DẪN KHOA HỌC: TS NGUYỄN HẢI CHÂU Hà Nội - 2010 III MC LC LI CAM ðOAN I LI CM ƠN II DANH MC CÁC KÍ HIU, CÁC CH VIT TT V DANH MC CÁC BNG VI DANH MC CÁC HÌNH V, ð TH VII M ðU CHƯƠNG 1.1 Gii thiu 1.2 Mt s ng dng ca chui ñc trưng 1.2.1 Giám sát phát 1.2.2 Các ng dng liên thông âm 1.2.3 Các b lc ng dng dùng chung file 1.2.4 T ñng t chc thư vin âm nhc 1.2.5 Mt s ng dng khác 1.3 Các phương pháp xác ñnh chui ñc trưng 1.3.1 Phương pháp ca s gi 1.3.2 Phương pháp ca s gi kt hp hc máy 11 1.3.3 Phương pháp DDA (Distortion Discriminant Analysis) 11 1.3.4 Phương pháp da wavelet 12 1.4 ng dng ca k thut th giác máy cho toá 1.4.1 n nhn dng nhc s 13 Biu din hát dưi dng mt spectrogram 14 1.4.2 Tính tốn đc trưng bi thut tốn Boosting theo cp (pairware boosting) 17 1.4.3 Hc “Ocllusion Model” vi thut toán EM (Exp ectation Maximization) 20 1.4.4 Quá trình nhn dng nhc s 22 1.5 Tng kt chương 23 IV CHƯƠNG H QUN TR CƠ S D LIU POSTGRESQL 2.1 Vn tt v lch s PostgreSQL 2.2 Kin trúc ca PostgreSQL 2.3 Các hàm m rng ngôn ng C 2.3.1 Np ñng (dynamic loading) 2.3.2 Các kiu d liu s C 2.3.3 Chun gi hàm theo phiên bn cho hàm C 2.3.4 Chun gi hàm phiên bn cho hàm C 2.3.5 Các quy tc vit chương trình 2.3.6 Biên dch liên kt ti hàm ñng (Dyna Function) 2.3.7 Cơ s cài ñt (Build Infrastructure) m 2.4 Tng kt chương CHƯƠNG 3.1 Xây dng s d liu fingerprint 3.1.1 Thit k s d liu hát Postgre 3.1.2 X 3.2 Xây dng d liu hun luyn 3.3 Kt qu thc nghim KT LUN TÀI LIU THAM KHO V DANH MC CÁC KÍ HIU, CÁC CH VIT TT Ký hiu/vit tt VI DANH MC CÁC BNG B ng Các kiu d liu C kiu ñưc ñnh nghĩ a tương ng SQL 35 VII DANH MC CÁC HÌNH V, ð TH Hình 1 Mơ hình trích chn fingerprint ca Haitsma Hình (a) fingerprint block ca hát gc, (b) fingerpr sau ñã b nén, (c) s khác gia (a) (b) int block ca hát th hin s bít li màu đen (BER=0,078) 10 Hình Biu din ca nh ph liên tip ca hát kh hát, dịng đu: nh ph ban đu, dịng hai: ñ ln wa ác Vi mi velet, dịng 3: 200 wavelet đu tiên 13 Hình Biu din âm theo biên ñ, tn s mã nh Hình Các đc trưng hình ch nht đưc biu din m phân 15 i quan h vi ca s tìm kim bao xung quanh 16 Hình So sánh phương pháp tính tốn đc trưng ca Yanke ( thut toán Pairwise Boosting) vi thut toán ca Haitsma Ha itsma ci tin 20 Hình Mơ hình ph thuc đơn gin đưc gi lp bi h thn g 22 Hình Kin trúc PostgreSQL 28 Hình T chc s d liu theo LUT 51 Hình Mơ hình s d liu 52 Hình 3 So sánh kt qu thc nghim vi b d liu hun Hình So sánh thi gian tìm kim mi bn nhc thu v luyn khác 55 i h thng nhn dng mi (Nhc s) h thng ca Y.Ke (Y Ke) 56 M ðU S phát trin ca máy tính mng Internet hi tìm kim Internet rt ln Nu trưc ñâ kim thơng tin, văn bn hin nhu cu tìm ki (multimedia) cho mc đích gii trí khơng ngng tăng nhc theo phương pháp truyn thng ch ñưc thc hi vào máy tìm kim thơng tin v tiêu ñ hát, nhn ñưc hát tương ng Tuy nhiên, phương pháp ng đưc nhu cu tìm kim bn nhc thc t kh lng nghe mt hát mun bit tên ca hát nhn dng âm nhc vy ñã thu hút ñưc s quan t t chc ln ðã có nhiu báo cơng trì cơng b, ch có phương pháp da tính trưng (cịn gi fingerprint hay local descriptor) hiu qu c Mc đích ca vic tính tốn đưa mt lưng s tương t gia hai ñi tưng multimedia: th thân hai ñi tưng (thưng rt ln), ñơn gin n gia chúng Trong hu ht h thng s dng công ca ñi tưng multimedia vi metadata tiêu ñ ca album) ñưc lưu tr mt s đóng vai trị ch mc cho metadata Metada multimedia chưa bit có th nhn đưc bng cách tín tưng s dng chúng mt truy fingerprint/metadata Có ưu đim ca vic tưng multimedia gc:  Gim thiu ñưc nhu cu v b nh/lưu tr kí ch thưc fingerprint tương ñi nh;  Vic so sánh ñơn gin thơng tin dư tha đưc loi b fingerprint;  Tìm kim hiu qu mà d liu tìm kim l nh Mt h thng fingerprint thông thưng bao gm hai t hành phn chính: phương pháp đ tính tốn fingerprint phương pháp tìm kim fingerprint có hiu qu mt s d liu fingerprint Mc tiêu ca mt h thng nhn dng nhc s da trê (audio fingerprint) t mt bn thu âm ngn tìm kim xác hát gc ca bn thu âm T sau, ngưi s dng lng nghe mt ca k hay ti mt ba tic ðây hát ni ting ñưc nghe nên ñã quên mt li hát tên tác gi gi mt ñon ngn ca bn nhc ñã ñưc thu âm qua ñ server tìm kim nhc s đ nhn li mt tin nhn ch tên hát, li hát hay tác gi ca hát C ơng vic đt nhng thách thc nhng lý sau đây:  Bn thu âm b sai khác so vi bn nhc gc nh h ca thit b thu âm thông dng (thưng ñin nh hưng ca ting n âm xung quanh tro  Bn thu âm ch mt đon nhc thuc há phương pháp tính tốn đc trưng truyn thng b thưng cho kt qu mt chui ñc trưng khác vi tính tốn tồn b hát gc ưng nhiu tín hiu thoi di đng) hay ng q trình thu âm t gc nên n nhc thu âm chui đc trưng đưc u cu tìm kim  H thng nhn dng nhc s cn phi ñáp ng ñưc nh n mt s d liu thc t cho kt qu nhanh xác trê gm hàng trăm nghìn hát Trên s nghiên cu gn ñây ca Haitsma Ka ller [10, 11] Y Ke [5, 6] tin hành xây dng mt h thng nh n dng nhc s da chui đt trưng âm có tính ng dng th c t s dng phương pháp trính rút đc trưng ca s gi kt hp hc máy Bên cnh đó, lun văn tin ti xây dng mt b d liu hun luyn cho kt qu tìm kim s d liu metadada/fingerprint da h qu vi đ xác cao mt n tr s d liu PostgreSQL, ñng thi lun văn kt hp xây dng hàm m rng PostgreSQL đ có th tìm kim hát bng truy bng ngơn ng C SQL ñơn gin Lun văn gm ba chương, ni dung đưc mơ t Chương Chui đc trưng âm ng dng tìm kim thiu v chui ñc trưng âm thành ng dng c dưi đây: nhc s gii a nó, h thng nhn dng âm ca Haitsma [10, 11] Y Ke [5, 6] Chương H qun tr s d liu PostgreSQL trình bày v h qun tr s d liu PostgreSQL cách vit hàm m rng bng ng ôn ng C PostgreSQL Chương Xây dng th nghim h thng tìm kim nhc s dng, th nghim h thng kt qu đt đưc Phn kt lun tng kt tóm tt ni dung ca lun văn mơ t vic xây 46 cc bundle flat_namespace undefined suppress o f oo.so foo.o Tru64 UNIX PIC mc ñnh, vy lnh biên dch sau: cc c foo.c ld shared expect_unresolved ’*’ o foo.so foo.o Các shared library sau có th đưc ti vào P ostgreSQL Khi xác đnh tên file cho câu lnh CREATE FUNCTION, phi ñưa vào tên ca shared library thay tên ca object file 2.3.7 Cơ s cài ñt (Build Infrastructure) m rng Phân phi module m rng PostgreSQL gp n vic xây dng mt h thng cài ñt kh chuyn kh cài PostgreSQL cung cp mt build infrastructure ch giúp đơn gin hóa biên dch hàm m rng Tuy nh mt khung làm vic xây dng hàm m rn lut ñ t ñng biên dch module m rng ca se phc hơn, phi t xây dng h thng bu ð s dng PGXS cho hàm m rng, phi vit makefile này, phi thit lp giá tr cho m vào makefile PGXS Sau ñây mt ví d xây dng m isbn_issn cha mt shared library, mt SQL script mt fil MODULES = isbn_issn DATA_built = isbn_issn.sql DOCS = README.isbn_issn PGXS := $(shell pg_config pgxs) 47 include $(PGXS) Hai dòng cui ging tt c makefi le Trưc ñy, gán giá tr cho bin thêm lut make thơn g dng Các bin sau có th đưc thit lp: MODULES Danh sách shared objects s ñưc biên dch t f (stem) ging (không bao gm hu t danh ile ngun vi trc h sách này) DATA Các file ñưc cài ñt prefix/share/contrib DATA_built Các file ñưc biên dch trưc ñưc cài ñt tron g prefix/share/contrib DOCS Các file ñưc cài ñt dưi prefix/doc/contrib SCRIPTS Các file kch bn (không phi nh phân) ñưc cài ñ t prefix/bin SCRIPTS_built Các file kch bn (khơng phi nh phân) đưc biên d ch trưc cài ñt prefix/bin REGRESS Danh sách trưng hp kim tra hi quy (regressi on test cases) hu t 48 PROGRAM Chương trình nh phân s ñưc biên dch (danh sách object files OBJS) MODULE_big Mt shared object s ñưc biên dch (danh sách obje ct files OBJS) Các bin sau có th ñưc thit lp: EXTRA_CLEAN Các file m rng s ñưc xóa make clean PG_CPPFLAGS S đưc thêm vào CPPFLAGS PG_LIBS S ñưc thêm vào PROGRAM SHLIB_LINK S ñưc thêm vào MODULE_big Sau đó, ta cn đt tên makefile, chng hn Makefile đt thư mc vi file m rng Chúng ta có th s dng make ñ biên dch make install ñ cài ñt module 2.4 Tng kt chương Chương ñã gii thiu chung v h qun tr s cách xây dng hàm m rng C PostgreSQL Chươn hàm m rng C ñã ñưc xây dng ñ cho phép tìm SQL đơn gin d liu PostgreSQL g s trình bày c th kim hát bng truy 49 CHƯƠNG XÂY DNG VÀ TH NGHIM H THNG TÌM KIM NHC S Trong chương này, lun văn s trình bày trình x ây dng kim th h thng nhn dng nhc s t xây dng s d liu b ài hát ñn xây dng d liu hun luyn, xây dng d liu kim th xây d ng hàm m rng PostgreSQL cho phép thc hin tìm kim bn nhc bn g câu lnh truy SQL Khi cài ñt h thng, vic biên dch mã ngun serve s d liu, thu âm hát, chia hát thành r xây dng ñon ngn ñ to d liu hun luyn… ñưc thc hin h ñiu hành Unix/Linux hát ñ to d liu hun luyn d liu ð giúp cho vic thu âm kim th đưc din t đng, chúng tơi xây dng chương trình bash shell, kt hp s dng mt s thư vin ngun m fftw3 [21], ffmpeg [22] mpg123 [23] Các chương trình đưc mơ t dưi đây:  Chương trình batchrec: s dng thư vin ffmpeg mpg123 thc hin t ñng m thu âm li hát t ñu ñn k t thúc, ghi chúng vào thư mc hát thu âm  Chương trình batchsplit: s dng thư vin ffmpeg ñ chia nh mt hát thành ñon nhc k tip theo mt khong th i gian (thưng 30 giây) H thng gm hai thành phn chính: chương trình gia o din ngưi s dùng (UI) vit Java 1.4 chương trình server nhn dng hát (MIS) vit C++, c hai giao tip vi qua TCP/IP socke t có th biên dch mt máy hay máy khác Nu khơng đưc ch ñnh, cng mc ñnh ñây 2000 Trong qúa trình nhn dng hát, chư ơng trình ng dng thc hin thu âm mt hát theo khong thi gian đưc ch đ nh trưc, tính tốn đc trưng 50 cho bn nhc thu âm gi truy mt chui server thc hin tìm kim hát cho chui ñc trư liu fingerprint tr v kt qu tên ca b dng 3.1 Xây dng s d liu fingerprint T hp hát có s d liu, h t cho mi hát lưu tr s d liu dng nhn ñưc mt bn nhc truy Trưc tiê WAV (Waveform Audio File Format) ñưc bin ñi thành dng ñơn âm (mono) nén mu xung 5512.5 KHz Tip theo đó, bin vi kích thưc ca s 2048 mu (0,372 giây) đ d mili giây) vi di lưng khong t 300 H 33 khong ñu Min tn s tương ng vi m truyn ñi s dng ñin thoi di ñng Cui ñã ñưc hc ngưng tưng ng đ to đc trưng giây ca tín hiu Mt hát đ dài trung bình 20 din ñc trưng ca Trong thc t, vic lưu tr file nhc theo ñnh nguyên b nh, h thng ñã kt hp s dng b thư v chuyn ñi mt hát t đnh dng MP3 thành đnh có th tính tốn đc trưng t hát theo 3.1.1 Thit k s d liu hát PostgreSQL Cơng vic tìm kim mt s d liu metadat v không d dàng Vi mt s d liu va phi, b dài trung bình phút, có s d liu ð nhn dng mt chui ñc trưng t mt hát chư 51 kim thc hin so sánh toàn b 250 triu ñ khăn tn thi gian c vi nhng máy tín xây dng chin lưc tìm kim cho h thng ca mình, chui đc trưng truy thuc v hát mà nht mt ñc trưng chui ñc trưng tr fingerprint (hình 3.1), đó, s bao gm mt bng vi tt c giá tr có th ca mt đc trưng 32 (entry) Mi entry s tr ñn mt danh sách trưng ng vi entry Trong mt h thng tìm kim th nh gii hn, mt bng tra cu vi tính thc t Bên cnh đó, có nhng entry s kh gii hn v s lưng hát s d liu, d thưa tht Vì vy, mt bng băm thưng đưc s dng Hình T chc s d liu theo LUT 52 ô Cơ s d liu ca h thng nhn dng âm nhc ñưc m danh hát (song_id), tên Quan h hát (song) bao gm thuc tính: ñnh hát (song_name), ñưng dn thư mc hát t hình 3.2 (lin k), chui đc trưng giá tr (fingerprint – ñưc t chc dưi dng mt mng nguyên dương 32 bit) ñ dài ca chui ñc trưng Quan h ñc trưng (s ub_fingerprint) bao gm thuc tính đnh danh ca đc trưng (subfingerprint_ id), ñnh danh ca hát mà ñc trưng thuc v (song_id), v trí ca đc tr ưng chui ñc trưng (frame) giá tr ca ñc trưng (sub_fingerprint) ð tăng tc đ tìm kim ca h thng, chúng tơi th c hin đánh ch mc cho thuc tính song_id, frame sub_fingerprint T hc nghim cho thy rng, cách ñánh ch mc (ñc bit ch mc trưng sub_fingerprint) giúp ci thin ñáng k tc ñ tìm kim ca h thng Hình Mơ hình s d liu 3.1.2 Xây dng hàm m rng PostgreSQL đ tìm ki m bn nhc Da phương pháp nhn dng âm nhc ñưc ñưa bi Y Ke [5, 6] mc 1.4.4 chương Haitasma [10, 11], chúng tô i tin hành xây dng hai hàm m rng cn thit cho trình nhn dng: 53  Find_near_neighbour: Nhn ñu vào mt chui ñc trưng truy vn, hàm s xét qua ln lưt đc trưng ca nó, tìm k nhng hát mà chui đc trưng tương ng có cha qu tr v ca hàm mt hp hát mà ch có cha nht mt đc trưng thuc chui đc trưng đó, hàm cho bit v trí ca đc trưng chun hát tr v Thc nghim ñã ch rng s lưng ln vic phi tính tốn đ tương t tt ñáp ng ñưc thi gian tìm kim ca h thng Vì v chn theo thut tốn RANSAC [14] đưc s dng cho p s lưng hát tim Theo ñó, nu gi truy (chui bao gm nu chui đc trưng tương ng có cha nht trưng truy  Search: T hp hát v trí ca đc trưng ch tr v bi hàm cách Hamming gia chui ñc trưng ca nhng hát trưng truy ñ ñưa t l bit li (t s gia ca chui ñc trưng truy chui ñc trưn ñ dài ca chui ñc trưng truy vn) Hàm cho kt q hát có t l bit li nh nht Hàm tìm kim tốn RANSAC giúp ci thin đáng k tc đ tìm kim Như vy, vi hai hàm m rng ñưc cài đt trc tip ta có th thc hin tìm kim hát gc cho mt ch 3.2 Xây dng d liu hun luyn ð xây dng d liu hun luyn cho vic tìm kim, t hát gc đưc tin hành thu âm mơi rưc ht cn phi có mt trưng có nhiu nhiu Tp 54 hát ñã thu âm hát gc ca sau đưc chia thành snippet ngn (30 giây cho mi snippet) Các snippet tương ng sau thc hin trích rút đc trưng s ñưc so sánh vi ñ to thành d liu hc H thng s s dng chương trình emtraining ñ t ñng ñc mt danh sách snippet gc snippet thu âm, tính tốn khóa cho snippet này, sau tin hành xây dng d liu hc Trong trình xây dng d liu hun luyn, vic l đưc phân loi theo tiêu chí v th loi nhc ñ t khác Các snippet dùng làm d liu hc nh ñưc tin hành thu âm qua micro cht lưng không t ting n gây nhiu 3.3 Kt qu thc nghim Chúng tơi xây dng mt h thng nhn dng âm nh trưng vi s d liu gm 597 hát tin hàn hai d liu vào T1 T2 gm snippet ñ s d liu 597 hát nói Tp d liu T1 bao âm mơi trưng nhiu nhiu (ting n ban ngày micro cht lưng kém, ting gió to t qu snippet T1 ñã ñưc tin x lý bng cách t không kh nhiu Chúng tin hành kim tra kt qu thc nghim tr luyn: b d liu hun luyn ca Yanke (gi tt luyn to (gi tt HL1, HL2) B cha snippet d liu T1 T2, tron nm T1 55 Khi chy ch ương trình, vi truy snippet ñ tin x lý (T1), đ xác ca vic t ã thu â m mà chưa qua ìm kim tương ng vi b d liu hun luyn YanKe, HL1, HL2 l 86.7%, 89.5% 90% ðng thi tr nghim, nhn thy nu thc hin vic tin x ình thc lý bn nhc truy bng cách tăng th êm biên đ tín hiu, đ xác ca kt qu t tăng lên ñáng k Kim tra vi d liu T2, chúng tơi thu đ ìm kim ñt ñưc ưc cá c kt qu ñúng tương ng nh sau 94.3 % vi b d liu hc ca Yan Ke, 98% vi HL1 v HL2 00%98 Biu ñ so s ánh kt qu thc nghim vi b d liu hun luyn khác 30%94 100% Đ xác 92% 88% YanKe 86.70% 96% HL1 HL2 84% 80% T1 T2 Tpd li u tìm ki m Hình 3 So sánh kt qu thc nghim vi b d liu hun Như vy, c b d liu hun luyn HL1 v nghim tt h T2 luyn khác HL2 ñu cho kt qu thc n so v i d liu hc ca Yan Ke ñi vi d l iu v T1, 56 ia h thng nhn dng Bên cnh đó, đ tin hành so sánh tc đ tìm kim g mi vi h thng nhn dng ca Y Ke, kim s dng mt b d liu tra gm 100 bn nhc thu âm vi ñ dài 30 giây kim vi tính tốn thi gian tìm mi d liu kim tra hai h thng Kt qu cho thy bên cnh mt s trưng hp đc bit (khơng tìm thy bn nhc gc bn thu âm ñã b méo sai khác nhiu so vi bn nhc gc nh hưng kim ca âm) vi thi gian tìm v tương lâu h thng mi cho kt qu tr ca Y Ke nhanh hn h thng bình Theo thng kê, thi gian tìm kim trung so vi ca h thng mi nhanh h thng ca Y Ke 3,6 ln 50 45 40 35 30 25 20 15 10 Hình So sánh thi gian tìm kim mi bn nhc thu v dng mi (Nhc s) h thng ca Y.Ke (Y Ke) i h thng nhn 57 KT LUN Lun văn ñã tin hành nghiên cu xây dng mt h s da chui đt trưng âm có tính ng d phương pháp trính rút đc trưng ca s gi kt hp thng nhn dng nhc ng thc t s dng th giác máy Lun văn ñã ñt ñưc nhng kt qu:  Gii thiu phân tích phương pháp xác ui ñc trưng thi s ñnh ch nht  Trình bày v h qun tr s d liu quan h greSQL cách vit Post hàm m rng PostgreSQL  Xây dng mt b d liu hun luyn cho kt qu tìm kim vi đ s xác cao h thng nhn dng ca Y Ke mt d liu hát hép da h qun tr s d liu PostgreSQL cho p hiu ñánh ch mc qu thuc tính tìm kim Lun văn tin hành xây dng hàm bng ngôn ng C m rng PostgreSQL giúp tăng tc đ tìm kim nh lên 3,6 ln so vi  trung bì h thng nhn dng ca Y Ke 58 TÀI LIU THAM KHO [1].Shazam website [2].Relatable website [3].Musipedia website [4].Napster website [5] Y Ke, D Hoiem, R Sukthankar, Computer Vision for Music Identification, Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR), 2005 [6] Y.Ke et al., Computer vision for music identification: server code, [7] S Baluja, M Covell, Content fingerprinting using wavelets, Proceedings of the 3rd European Conference on Visual Media Production (CVMP), 2006 [8] S Baluja, M Covell, Audio Fingerprinting: Combining Computer Vision & Data Stream Processing, Proceeding of the IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2007 [9] C Burges, J Platt, S Jana, Distortion Discriminant Analysis for Audio Fingerprinting, IEEE Transactions on Pattern Analysis and Machine Intelligencve, 11 (3), 2003 [10] J Haitsma, T Kalker, J Oostveen, Robust Audio Hashing for Content Identification, Content Based Multimedia Indexing 2001, Brescia, Italy, 2001 [11] J Haitsma, T Kalker, A Highly Robust Audio Fingerprinting System, Proceedings of the International Conference for Music Information Retrieval, 2002 [12] M Covell, S Baluja, KnownAudio Detection U sing Waveprint: Spectrogram Fingerprinting By Wavelet Hashing, Proceedings of the IEEE International Conference on Acoustics, Speech and Signal Processing(ICASSP), 2007 59 [13] P Viola andM Jones Rapid object detection using a boosted cascade of simple features In Proceedings of Computer Vision and Pattern Recognition, 2001 [14] M Fischler and R Bolles Random sample consensus: a paradigm for model fitting with applications to image analysis and automated cartography [15] Allamanche E., Herre J., Hellmuth O., Bernhard Fröbach B and Cremer M., “AudioID: Towards ContentBased Identifi cation of Audio Material”, th 100 AES Convention, Amsterdam, The Netherlands, May 2001 [16] Fragoulis D., Rousopoulos G., Panagopoulos T., Alexiou C and Papaodysseus C., “On the Automated Recognition of Seriously Distorted Musical Recordings”, IEEE Transactions on Signal Processing, vol.49, no.4, p.898908, April 2001 [17] Logan B., “Mel Frequency Cepstral Coefficients for Music Modeling”, Proceeding of the International Symposium on Music Information Retrieval (ISMIR) 2000, Plymouth, USA, October 2000 [18] Jacobs, Finkelstein, Salesin Fast Multiresolution Image Querying Proc SIGGRAPH, 1995 [19] P Indyk and R Motwani Approximate nearest neighbor towards removing the curse of dimensionality In Proceedings of Symposium on Theory of Computing, 1998 [20] D Lowe Object recognition from local scale invariant features In Proceedings of International Conference on Computer Vision, 1999 [25] [21] Fftw website [22] Ffmpeg website [23] Mpg123 website http://www.mpg123.de/ [24] PostgreSQL 8.0 Beginning Databases with PostgreSQL: From Novice to Professional, Second Edition, by Nei Matthew and Richard Stones 60 [26] The comprehensive guide to building, programming, and administering PostgreSQL databases, Second Edition by Korry Douglas, Susan Douglas ... TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Phạm Cẩm Ngọc TÌM KIẾM NHẠC SỐ DỰA TRÊN CHUỖI ĐẶC TRƯNG ÂM THANH Ngành : Công nghệ thông tin Chuyên ngành : Hệ thống thông tin Mã số LUẬN VĂN THẠC SĨ NGƯỜI HƯỚNG DẪN KHOA... ðC TRƯNG ÂM THANH VÀ NG DNG TRONG TÌM KIM NHC S 1.1 Gii thiu Chui đc trưng âm (audio fingerprint, acoust ic fingerprint) mt bn tóm tt ca mt chui tín hiu âm Chui ñc kim mu âm hoc phát hin mu âm. .. rng PostgreSQL đ có th tìm kim hát bng truy bng ngôn ng C SQL ñơn gin Lun văn gm ba chương, ni dung đưc mơ t Chương Chui đc trưng âm ng dng tìm kim thiu v chui ñc trưng âm thành ng dng c dưi đây:

Ngày đăng: 11/11/2020, 22:23

Xem thêm:

w