1. Trang chủ
  2. » Luận Văn - Báo Cáo

luận văn thạc sĩ tìm kiếm âm nhạc trên cơ sở nội dung và ứng dụng

68 261 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 68
Dung lượng 1,06 MB

Nội dung

ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG NGUYỄN THÙY DƯƠNG TÌM KIẾM ÂM NHẠC TRÊN CƠ SỞ NỘI DUNG VÀ ỨNG DỤNG LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Thái Nguyên - 2012 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn i MỤC LỤC Trang MỤC LỤC i LỜI CẢM ƠN ii DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT iii MỞ ĐẦU 1 CHƢƠNG I 4 TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU ÂM THANH 4 1.1. Cơ sở dữ liệu đa phƣơng tiện 4 1.1.1. Một số khái niệm cơ bản 4 1.1.2. Hệ thống quản trị cơ sở dữ liệu đa phƣơng tiện (MMDBMS) 5 1.1.3. Truy tìm thông tin 7 1.2. Quá trình chung thiết kế cơ sở dữ liệu âm thanh. 7 1.2.1. Giới thiệu chung về cơ sở dữ liệu âm thanh. 7 1.2.2. Mô hình tổng quát của dữ liệu âm thanh 8 1.2.3. Quá trình chung để phát triển một cơ sở dữ liệu âm thanh 14 CHƢƠNG 2 15 KỸ THUẬT TÌM KIẾM TRONG CƠ SỞ DỮ LIỆU ÂM NHẠC 15 2.1. Kỹ thuật phân loại âm thanh thành âm nhạc, tiếng nói, tiếng động. 16 2.1.1. Âm thanh 16 2.1.2. Đặc trƣng chính của âm thanh 22 2.1.3. Phân lớp âm thanh. 39 2.2. Một số thuật toán trích chọn đặc trƣng âm nhạc. 45 2.2.1. Đặc trƣng của âm nhạc 45 2.2.2. Một số lớp âm nhạc 45 2.2.3. Chỉ số hóa và truy tìm âm nhạc. 49 CHƢƠNG 3. 53 ỨNG DỤNG KỸ THUẬT TÌM KIẾM ÂM NHẠC TRONG GIẢNG DẠY 53 3.1. Cài đặt thử nghiệm hệ thống tìm kiếm âm nhạc 53 3.2. Mô hình hệ thống 54 3.3. Các tham số thực nghiệm 54 3.4. Một số chức năng của chƣơng trình 55 3.5. Kết quả thực nghiệm 56 KẾT LUẬN 57 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn ii LỜI CẢM ƠN Để hoàn thành chƣơng trình cao học và viết luận văn này, tôi đã nhận đƣợc sự hƣớng dẫn, giúp đỡ và góp ý nhiệt tình của quý thầy cô trƣờng Đại học Công nghệ thông tin - Truyền thông, Đại học Thái Nguyên. Trƣớc hết, tôi xin chân thành cảm ơn đến quí thầy cô trƣờng Đại học Công nghệ thông tin - Truyền thông, đặc biệt là những thầy cô đã tận tình dạy bảo cho tôi suốt thời gian học tập tại trƣờng. Tôi xin gửi lời biết ơn sâu sắc đến thầy giáo PGS.TS. Đặng Văn Đức ngƣời đã dành rất nhiều thời gian, tâm huyết và sự tận tình giúp đỡ, hƣớng dẫn cho tôi trong suốt quá trình nghiên cứu và giúp tôi hoàn thành luận văn này. Nhân đây, tôi xin chân thành cảm ơn Ban Giám hiệu trƣờng Cao đẳng Văn hóa nghệ thuật Việt Bắc cùng đồng nghiệp trong Phòng Đào tạo & nghiên cứu khoa học đã tạo rất nhiều điều kiện để tôi học tập và hoàn thành tốt khóa học. Đồng thời, tôi cũng xin cảm ơn quí anh, chị và ban lãnh đạo khoa Âm nhạc, phòng thu thanh của trƣờng cao đẳng Văn hóa nghệ thuật Việt Bắc… đã tạo điều kiện cho tôi điều tra khảo sát để có dữ liệu viết luận văn. Mặc dù tôi đã có nhiều cố gắng hoàn thiện luận văn bằng tất cả sự nhiệt tình và năng lực của mình, tuy nhiên không thể tránh khỏi những thiếu sót, rất mong nhận đƣợc những đóng góp quí báu của quí thầy cô và các bạn. Thái Nguyên, ngày tháng năm 2012 Học viên Nguyễn Thùy Dƣơng Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn iii DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT Stt Ký hiệu Tên đầy đủ Ý nghĩa 1 ADC Analog - to – Digital Conversion Chuyển đổi tƣơng tự số hóa 2 ASR Automatic Speech Recognition Tự động nhận dạng tiếng nói 3 API Application Programming Interface Giao diện lập trình ứng dụng 4 DAC Digital – to – Analog Conversion Chuyển đổi số hóa tƣơng tự 5 DBMS DataBase Management System Hệ quản trị cơ sở dữ liệu 6 DCT Discrete Cosine Transform Biến đổi cosin rời rạc 7 DFT Discrete Fourier Transform Biến đổi Fourier rời rạc 8 HMM Hidden Markov Model Mô hình Markov ẩn 9 HZCRR High Zero- Crossing Rate Ratio Tỷ lệ tốc độ vƣợt qua 0 cao 10 IDFT Inverse Discrete Fourier Transform Biến đổi Fourier liên tục 11 IR Information Retrieval Truy tìm thông tin 12 MARS Multimedia Analysis and Retrieval System Hệ thống chỉ mục và phân tích đa phƣơng tiện 13 MIDI Musical Instrument Digital Interface Giao diện số cho nhạc cụ 14 MIRS Multimedia Indexing and Retrieval System Hệ thống chỉ mục và truy tìm thông tin đa phƣơng tiện Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn iv 15 MMDBMS MultiMedia DataBase Management System Hệ quản trị cơ sở dữ liệu đa phƣơng tiện 16 ORDBMS Open relation DataBase Management System Hệ quản trị cơ sở dữ quan hệ - mở rộng 17 SR Silence Ratio Tỷ lệ câm 18 SNR Signal-to-noise ratio Tỷ lệ nhiễu tín hiệu 19 STFT Short Time Fourier Transform Biến đổi Fourier thời gian ngắn 20 ZCR Zero Crossing Rate Tốc độ vƣợt qua 0 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 1 MỞ ĐẦU Nghị quyết Trung ƣơng II khoá VIII đã đặt ra phƣơng châm chiến lƣợc cho ngành giáo dục là phải: "Đổi mới phƣơng pháp giáo dục đào tạo, khắc phục lối truyền thụ một chiều, rèn luyện nếp tƣ duy sáng tạo của ngƣời học, từng bƣớc áp dụng phƣơng pháp tiên tiến và phƣơng tiện hiện đại vào quá trình dạy học". Ứng dụng công nghệ thông tin vào dạy học đang dần dần đƣợc thực hiện ngày càng nhiều trên bục giảng. Việc thiết kế giáo án và giảng dạy trên máy tính bằng những đoạn phim minh hoạ với hình ảnh, âm thanh sống động, bài giảng sẽ thực sự gây sự chú ý và tạo hứng thú học tập cho học sinh-sinh viên. Trong điều kiện hiện nay tài liệu dạy âm nhạc bằng sự hỗ trợ của CNTT ở nƣớc ta còn nhiều hạn chế, việc tìm ra các giải pháp ứng dụng phần mềm CNTT vào dạy học âm nhạc là yêu cầu cần thiết nhằm góp phần đổi mới phƣơng pháp dạy học cho bộ môn này. Ứng dụng CNTT trong dạy học Âm nhạc ở các trƣờng Đại học – cao đẳng và các trƣờng phổ thông là việc làm tất yếu, giúp cho giảng viên, giáo viên âm nhạc chủ động có những bài soạn mang tính hiện đại và tạo ra đƣợc những tài liệu học tập, tham khảo phong phú cho sinh viên mang tính trực quan sinh động, tạo đƣợc hứng thú học tập cho học sinh. Trên thị trƣờng hiện nay có rất nhiều phần mềm dùng để soạn nhạc, hoà âm, phối khí thu âm, xử lý, biên tập âm thanh, v.v… Các phần mềm đều có lĩnh vực ứng dụng nhất định có tính chuyên biệt khá rõ nét nhƣng nhìn chung khi sử dụng đều có đặc điểm tƣơng đối giống nhau nên việc sử dụng cũng khá dễ dàng. Việc lựa chọn sử dụng cần phải đáp ứng yêu cầu sau: - Lựa chọn những phần mềm đáp ứng nội dung bài dạy, tiết dạy. - Có kỹ năng sử dụng và khai thác phần mềm. - Dễ phổ cập, phù hợp với điều kiện kỹ thuật của địa phƣơng. Ngày nay, việc chia sẻ các bài hát bản nhạc trên internet đã trở nên phổ biến. Thực tế đó cũng mở ra một nhu cầu truy cập vào những thƣ viện âm thanh khổng lồ. Nhu cầu đó đòi hỏi một công nghệ tìm kiếm hiệu quả để tổ chức, sắp xếp, truy tìm Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 2 các nội dung âm thanh, cũng nhƣ có thể xử lý hàng trăm tỷ trang web hỗn độn trên mạng và các thiết bị lƣu trữ trên các máy tính cá nhân. Hiện nay, một số hãng tìm kiếm khổng lồ trên mạng nhƣ Yahoo, Google hay You Tube đang triển khai các hoạt động nghiên cứu theo cách tìm kiếm theo nội dung thay vì từ khóa. Ngƣời dùng chỉ cần gõ những từ hoặc cụm từ liên quan đến bài hát và Yahoo sẽ liệt kê một danh sách các file âm thanh, cho phép khách hàng nghe trực tuyến. Công cụ tìm kiếm âm nhạc này hoạt động dựa trên khả năng đọc nội dung đƣợc nhúng trong tệp âm thanh, còn đƣợc gọi là metadata, để phân loại kết quả tìm kiếm. Trong những năm qua ở Việt Nam, các công cụ tìm kiếm dữ liệu đa phƣơng tiện, trong đó các công cụ tìm kiếm và nhận dạng dữ liệu âm thanh đã dần đƣợc chú ý. Ví dụ, phòng nhận dạng và công nghệ tri thức- Viện công nghệ thông tin đã giới thiệu một số sản phẩm phần mềm có ý nghĩa thực tế rất cao nhƣ: tổng hợp và xử lý ngôn ngữ tiếng Việt, nghiên cứu và tiếp cận các kỹ thuật mới của công nghệ tổng hợp và nhận dạng tiếng nói trên thế giới để áp dụng trong hoàn cảnh Việt nam và âm thanh tiếng Việt, nghiên cứu các phƣơng pháp xử lý tín hiệu số và tín hiệu tiếng nói, các phƣơng pháp tìm đặc trƣng âm thanh. Các sản phẩm nêu trên đã đáp ứng đƣợc phần nào nhu cầu tìm kiếm và nhận dạng dữ liệu âm thanh. Tuy nhiên, các công trình nghiên cứu về tìm kiếm âm thanh theo nội dung vẫn còn hiếm hoặc chƣa tƣơng xứng với tầm quan trọng của nó trong hiện tại và tƣơng lai. Đặc biệt sử dụng các phần mềm này cho công việc giảng dạy âm nhạc tại các trƣờng còn chƣa đáp ứng đƣợc nhu cầu thực tế, thay vì phấn trắng bảng đen truyền thống, giáo viên chỉ click chuột, vài giây sau trên màn hình hiện ra ngay nội dung, âm thanh của bản nhạc. Ứng dụng công nghệ thông tin trong dạy học âm nhạc đang dần dần đƣợc thực hiện ngày càng nhiều trên bục giảng các trƣờng đào tạo nghệ thuật. Nhạc sĩ Hoàng Lân nhận xét rằng từ trƣớc đến nay, bộ môn âm nhạc ”dạy chay” nhiều, ít lôi cuốn đƣợc học sinh. Nếu việc ứng dụng CNTT vào trong dạy học đƣợc thực hiện có hiệu quả trong các trƣờng, sẽ dẫn đến sự thay đổi lớn lao về PPDH nhằm cung cấp Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 3 những tƣ liệu âm nhạc một cách khoa học, phong phú, toàn diện mà còn tác động tích cực đến thẫm mỹ, đến tƣ duy nhận thức của học sinh… Mặt khác, việc hiểu biết sâu sắc về âm thanh cũng nhƣ các khái niệm, thuật toán liên quan sẽ giúp ta ứng dụng và xây dựng các hệ thống tìm kiếm âm thanh phù hợp, hiệu quả hơn. Xuất phát từ những vấn đề nêu trên, luận văn đã tập trung nghiên cứu về vấn đề "Tìm kiếm âm nhạc trên cơ sở nội dung và ứng dụng". Cấu trúc của luận văn nhƣ sau: Chƣơng 1: Tổng quan về cơ sở dữ liệu âm thanh Chƣơng 2: Kỹ thuật tìm kiếm cơ sở dữ liệu âm thanh Chƣơng 3: Ứng dụng kỹ thuật tìm kiếm âm nhạc trong giảng dạy Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 4 CHƢƠNG I TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU ÂM THANH Ngày nay, với sự phát triển vƣợt bậc của khoa học kỹ thuật, sự bùng nổ của dữ liệu đặc biệt là dữ liệu media, nhu cầu thƣởng thức âm nhạc của con ngƣời ngày càng phong phú, đa dạng dẫn đến một nhu cầu rất thực tế đó là nhu cầu tìm kiếm thông tin về âm nhạc. Hầu hết các hệ thống tìm kiếm âm nhạc hiện tại đều dựa trên chỉ mục. Cơ sở dữ liệu dựa trên chỉ mục bộc lộ nhiều nhƣợc điểm nhƣ: tìm kiếm thông tin không chính xác, không tìm đƣợc dữ liệu khi ngƣời dùng không nhớ chính xác thông tin đầu vào, hay chỉ nhớ đƣợc giai điệu, nội dung bài hát. Tìm kiếm âm nhạc theo nội dung là một lĩnh vực nghiên cứu mới và đƣợc nhiều nhà nghiên cứu quan tâm. Hiện có một số phƣơng thức đã đƣợc áp dụng tìm kiếm âm nhạc theo nội dung. Ghias, Logan, Chamberlin và Smith đã đƣa ra phƣơng thức tƣơng tự và sử dụng đầu vào nhƣ một truy vấn. Trong thí nghiệm vào năm 2001, M.Goto đã thu đƣợc kết quả tốt khi các nhà nghiên cứu tiến hành một cuộc thử nghiệm tính toán ƣớc lƣợng MAP sử dụng thuật toán EM. Tuy nhiên, theo kết quả nghiên cứu của Beth Logan thì các phƣơng pháp tìm kiếm âm nhạc theo nội dung hiện nay vẫn chƣa đảm bảo đƣợc cả độ chính xác và thời gian tính toán, đặc biệt khi tìm kiếm giai điệu của các bản nhạc 1.1. Cơ sở dữ liệu đa phƣơng tiện. 1.1.1. Một số khái niệm cơ bản  Loại media và Multimedia Media Media (tiếng Latin: medius – means, intermediary) là đề cập đến các loại thông tin hay loại trình diễn thông tin nhƣ dữ liệu văn bản, ảnh, âm thanh và video. Phân loại media: Có nhiều cách phân loại, nhƣng cách chung nhất là phân loại trên cơ sở khuôn mẫu (format) vật lý hay các quan hệ media với thời gian. Tài Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 5 liệu này phân lớp media dựa trên cơ sở là chúng có chiều thời gian hay không. Qui định này dẫn tới hai lớp media: static và dynamic.  Static media: Không có chiều thời gian, nôi dung và ý nghĩa của chúng không phụ thuộc vào thời gian trình diễn. Media tĩnh bao gồm dữ liệu văn bản, đồ họa.  Dynamic media: Có chiều thời gian, ý nghĩa và độ chính xác của chúng phụ thuộc vào tốc độ trình diễn. Dynamic media bao gồm annimation, video, audio. Media động phụ thuộc chặt chẽ vào tốc độ trình diễn. Thí dụ để cảm nhận chuyển động trơn tru, video phải đƣợc trình chiếu với tốc độ 25 frame/sec (hay 30 frame/sec phụ thuộc vào loại hệ thống video). Tƣơng tự, khi ta play tiếng nói, âm nhạc, chúng chỉ đƣợc cảm nhận tự nhiên khi đạt đƣợc tốc độ nhất định, nếu không chúng làm giảm chất lƣợng và ý nghĩa âm thanh. Vì các media này phải đƣợc trình diễn liên tục và ở tốc độ cố định cho nên chúng còn đƣợc gọi là media liên tục. Hay còn gọi chúng là media đẳng thời (isochronous media) vì quan hệ giữa các đơn vị media và thời gian là cố định. Multimedia Khái niệm multimedia (tiếng Latin: multus- numerous) đề cập đến tập hợp các kiểu media sử dụng chung, trong đó ít nhất có một kiểu media không phải là văn bản (nói cách khác là ít nhất có một media trong đó là ảnh, audio hay video). Trong tài liệu này sử dụng multimedia nhƣ tính từ: thông tin đa phƣơng tiện, dữ liệu đa phƣơng tiện, hệ thống đa phƣơng tiện, truyền thông đa phƣơng tiện, ứng dụng đa phƣơng tiện, Dữ liệu đa phƣơng tiện đề cập đến đại diện các kiểu media khác nhau mà máy tính có thể đọc đƣợc. Thông tin đa phƣơng tiện đề cập đến thông tin kiểu media truyền đạt. Đôi khi khái niệm dữ liệu đa phƣơng tiện và thông tin đa phƣơng tiện sử dụng thay thế cho nhau. Multimedia hay media item (hay còn gọi object) là thực thể tự trị trong hệ thống chỉ mục và truy tìm thông tin đa phƣơng tiện (MIRS – Multimedia Indexing and Retrieval System) mà nó có thể đƣợc truy vấn, tìm kiếm và trình diễn. 1.1.2. Hệ thống quản trị cơ sở dữ liệu đa phƣơng tiện (MMDBMS) Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn [...]... thanh dựa trên cơ sở tiêu đề và tên tệp Do tên tệp và mô tả văn bản là không đầy đủ và chủ quan cho nên việc tìm ra đoạn âm thanh thỏa mãn ngƣời sử dụng là rất khó khăn Thêm nữa, kỹ thuật truy tìm này không hỗ trợ câu truy vấn nhƣ tìm đoạn âm thanh tƣơng tự đoạn đang nghe” Để giải quyết vấn đề này, các kỹ thuật truy tìm âm thanh trên cơ sở nội dung là cần thiết Truy tìm âm thanh trên cơ sở nội dung đơn... trúc chỉ mục Thiết kế các giải thuật tìm kiếm hiệu quả Trên đây là toàn bộ nội dung phần tổng quan về cơ sở dữ liệu âm thanh Để tìm hiểu kỹ hơn về dữ liệu âm thanh, chúng ta đi tìm hiểu các kỹ thuật tìm kiếm trong cơ sở dữ liệu âm thanh Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 15 CHƢƠNG 2 KỸ THUẬT TÌM KIẾM TRONG CƠ SỞ DỮ LIỆU ÂM NHẠC Audio số đƣợc biểu diễn nhƣ trình... giản nhất sử dụng so sánh mẫu với mẫu giữa câu truy vấn và đoạn âm thanh lƣu trữ Cách tiệm cận tổng quát của truy tìm và chỉ số hóa âm thanh trên cơ sở nội dung:  Âm thanh đƣợc phân lớp thành vài loại chung nhƣ âm thanh tiếng nói, âm nhạc và nhiễu  Các loại âm thanh khác nhau đƣợc xử lý và chỉ mục theo các cách khác nhau Thí dụ, nếu âm thanh là tiếng nói, nhận dạng tiếng nói đƣợc áp dụng và tiếng nói... cũng đƣợc sử dụng lại ở đây Phần lớn CSDL âm thanh đang tồn tại sử dụng lƣợc đồ chỉ số hoá trên cơ sở metadata Nội dung âm thanh trên cơ sở tín hiệu Sử dụng metadata là tin cậy và đƣợc khuyến cáo khi có cách tạo ra metadata Thí dụ, nếu ta tạo ra CSDL âm thanh của đài phát thanh hay ghi âm nhạc, thì hầu nhƣ không có vấn đề khi tạo ra metadata Tuy nhiên, trong ứng dụng khác, nhƣ cảnh sát nghe trộm điện... tiếng nói đƣợc chỉ mục trên cơ sở từ nhận dạng đƣợc  Truy vấn các đoạn âm thanh là phân lớp tƣơng tự, xử lý và chỉ số hóa  Các đoạn âm thanh đƣợc truy tìm trên cơ sở tính tƣơng đồng giữa chỉ mục truy vấn và chỉ mục âm thanh trong CSDL Bƣớc phân lớp âm thanh là quan trọng Trƣớc hết, loại âm thanh khác nhau đòi hỏi xử lý khác nhau và các kỹ thuật chỉ mục khác nhau Thứ hai, loại âm thanh khác nhau có... 1.1.3 Truy tìm thông tin Truy tìm thông tin- Information Retrieval (IR) là kỹ thuật tìm kiếm thông tin đƣợc lƣu trữ trên máy tính Đối với dữ liệu đa phƣơng tiện, việc truy tìm thông tin hiệu quả là dựa trên tìm kiếm tƣơng tự Hệ thống lƣu trữ một tập các đối tƣợng đa phƣơng tiện trong cơ sở dữ liệu Ngƣời dùng đƣa ra các truy vấn, và hệ thống tìm ra các đối tƣợng tƣơng tự truy vấn trong cơ sở dữ liệu... nói và âm nhạc Có thể thấy rằng trọng tâm HZCRR của giọng nói phân bổ trong khoảng 0,15; trong khi HZCRR của âm nhạc là dƣới 0,1 Hình 2.7 minh họa mức biến đổi HZCRR của tín hiệu giọng nói (a) và tín hiệu âm nhạc (b)  Tỷ lệ câm (Silence Ratio- SR) Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 26 Tỷ lệ câm (SR) cho biết kích thƣớc của đoạn âm thanh câm Khi phát âm thì... trình truy tìm Phân lớp âm thanh dựa trên một số đặc trƣng khách quan và chủ quan 2.1 Kỹ thuật phân loại âm thanh thành âm nhạc, tiếng nói, tiếng động 2.1.1 Âm thanh  Tính chất cơ bản của tín hiệu âm thanh Khi tần số dao động của không khí đạt mức từ 20 đến 20000 Hz thì tai ngƣời có thể nghe thấy âm thanh Tham số khác đƣợc sử dụng để đo âm thanh là biên độ Biên độ biến đổi làm âm thanh êm nhẹ hay ầm... giữa các âm tiết) trong khi âm nhạc không có cấu trúc này Do đó, sự biến thiên ZCR của tín hiệu giọng nói thƣờng lớn hơn so với tín hiệu âm nhạc, x em hình minh họa dƣới đây Hình 2.6 minh họa ZCR của nhạc và ZCR của giọng nói ZCR đƣợc sử dụng phổ biến trong các giải thuật để phân lớp giọng nói và âm nhạc Một nghiên cứu của LieLu, Hong-Jang Zhang và Hao Jiang [4] mới đây đã Số hóa bởi Trung tâm Học liệu... màu, kết cấu ) 1.2 Quá trình chung thiết kế cơ sở dữ liệu âm thanh 1.2.1 Giới thiệu chung về cơ sở dữ liệu âm thanh Các tín hiệu âm thanh là loại hàm phân tích liên tục Chúng ta sẽ khảo sát việc nén dữ liệu âm thanh thành biểu diễn rời rạc và chỉ số hoá nội dung của chúng Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 8 Các dữ liệu âm thanh thông thƣờng là dạng sóng liên . " ;Tìm kiếm âm nhạc trên cơ sở nội dung và ứng dụng& quot;. Cấu trúc của luận văn nhƣ sau: Chƣơng 1: Tổng quan về cơ sở dữ liệu âm thanh Chƣơng 2: Kỹ thuật tìm kiếm cơ sở dữ liệu âm thanh. điệu, nội dung bài hát. Tìm kiếm âm nhạc theo nội dung là một lĩnh vực nghiên cứu mới và đƣợc nhiều nhà nghiên cứu quan tâm. Hiện có một số phƣơng thức đã đƣợc áp dụng tìm kiếm âm nhạc theo nội. thanh trên cơ sở nội dung đơn giản nhất sử dụng so sánh mẫu với mẫu giữa câu truy vấn và đoạn âm thanh lƣu trữ. Cách tiệm cận tổng quát của truy tìm và chỉ số hóa âm thanh trên cơ sở nội dung:

Ngày đăng: 03/10/2014, 23:10

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1] PGS. TS Đặng Văn Đức, “Giáo trình Cơ sở dữ liệu đa phương tiện” Sách, tạp chí
Tiêu đề: Giáo trình Cơ sở dữ liệu đa phương tiện
[2] DALIBOR MITROVI´ C et al, “Features for Content-Based Audio Retrieval”,ViennaUniversity of Technology, dalibor.mitrovic@computer.org Sách, tạp chí
Tiêu đề: Features for Content-Based Audio Retrieval
[4] Jonathan Foote, “A similary measure for automatic audio Classification” Sách, tạp chí
Tiêu đề: A similary measure for automatic audio Classification
[5] John Watkinson, “An introduction to digital audio” Sách, tạp chí
Tiêu đề: An introduction to digital audio
[6] Jonathan T.Foote, “Content – Base Retrieval of Music and Audio” Sách, tạp chí
Tiêu đề: Content – Base Retrieval of Music and Audio
[7] Jyh-Shing Roger Jang, "Speech and Audio Processing Toolbox", available from the link at the author's homepage at "http://mirlab.org/jang&#34 Sách, tạp chí
Tiêu đề: Speech and Audio Processing Toolbox", available from the link at the author's homepage at
[10] Z.Liu and Q.Huang, “Content-based indexing and retrieval by example in audio,” in ICME 2000, 2000 Sách, tạp chí
Tiêu đề: Content-based indexing and retrieval by example in audio
[9]VOICEBOX- toolbox for speech processing. Home page: http://www.ee.ic.ac.uk/hp/staff/dmb/voicebox/voicebox.html Link
[3] Guojun Lu, Multimedia Database Management Systems, Artech House, Boston – London, 1999 Khác
[8] Subrahmanian V.S., Principles of Multimedia Database Systems, Morgan Kaufmann Publishers, Inc., California, 1998 Khác

HÌNH ẢNH LIÊN QUAN

Hình 2.4(a) chỉ ra đồng hồ lấy mẫu 8 kHz. Một thành phần tín hiệu đƣợc lấy  mẫu là 6 kHz (Hình 2.4b) - luận văn thạc sĩ tìm kiếm âm nhạc trên cơ sở nội dung và ứng dụng
Hình 2.4 (a) chỉ ra đồng hồ lấy mẫu 8 kHz. Một thành phần tín hiệu đƣợc lấy mẫu là 6 kHz (Hình 2.4b) (Trang 25)
Hình 2.6. minh họa ZCR của nhạc và ZCR của giọng nói - luận văn thạc sĩ tìm kiếm âm nhạc trên cơ sở nội dung và ứng dụng
Hình 2.6. minh họa ZCR của nhạc và ZCR của giọng nói (Trang 29)
Hình  dưới  đây  minh  họa  xác  suất  phân  bổ  các  đường  cong  HZCRR  của  giọng nói và âm nhạc - luận văn thạc sĩ tìm kiếm âm nhạc trên cơ sở nội dung và ứng dụng
nh dưới đây minh họa xác suất phân bổ các đường cong HZCRR của giọng nói và âm nhạc (Trang 30)
Hình 2.8 Minh họa đặc trưng tỷ lệ câm - luận văn thạc sĩ tìm kiếm âm nhạc trên cơ sở nội dung và ứng dụng
Hình 2.8 Minh họa đặc trưng tỷ lệ câm (Trang 31)
Hình 2.10. Minh họa đặc trưng điều hòa - luận văn thạc sĩ tìm kiếm âm nhạc trên cơ sở nội dung và ứng dụng
Hình 2.10. Minh họa đặc trưng điều hòa (Trang 34)
Hình 2.11. Hình minh họa đặc trưng ảnh phổ - luận văn thạc sĩ tìm kiếm âm nhạc trên cơ sở nội dung và ứng dụng
Hình 2.11. Hình minh họa đặc trưng ảnh phổ (Trang 35)
Hình 2.12: Ảnh phổ của âm tiếng nói “phonetician” - luận văn thạc sĩ tìm kiếm âm nhạc trên cơ sở nội dung và ứng dụng
Hình 2.12 Ảnh phổ của âm tiếng nói “phonetician” (Trang 36)
Hình 2.13: Quy trình biến đổi MFCC - luận văn thạc sĩ tìm kiếm âm nhạc trên cơ sở nội dung và ứng dụng
Hình 2.13 Quy trình biến đổi MFCC (Trang 37)
Hình 2.14: Phân khung tín hiệu - luận văn thạc sĩ tìm kiếm âm nhạc trên cơ sở nội dung và ứng dụng
Hình 2.14 Phân khung tín hiệu (Trang 38)
Hình 2.15: Mô tả tín hiệu trên miền thời gian và tần số tương ứng của nó - luận văn thạc sĩ tìm kiếm âm nhạc trên cơ sở nội dung và ứng dụng
Hình 2.15 Mô tả tín hiệu trên miền thời gian và tần số tương ứng của nó (Trang 39)
Hình 2.16: Băng lọc khoảng cách theo tần số mel - luận văn thạc sĩ tìm kiếm âm nhạc trên cơ sở nội dung và ứng dụng
Hình 2.16 Băng lọc khoảng cách theo tần số mel (Trang 41)
Hình 2. 17: Phổ sau khi lọc theo thang Mel - luận văn thạc sĩ tìm kiếm âm nhạc trên cơ sở nội dung và ứng dụng
Hình 2. 17: Phổ sau khi lọc theo thang Mel (Trang 42)
Hình  2.18: vector Mel-spectral với các thành phần tương quan cao tương quan lại  thành hệ số tần số Mel 13 - luận văn thạc sĩ tìm kiếm âm nhạc trên cơ sở nội dung và ứng dụng
nh 2.18: vector Mel-spectral với các thành phần tương quan cao tương quan lại thành hệ số tần số Mel 13 (Trang 43)
Hình 2.19: Mel Cepstrum - luận văn thạc sĩ tìm kiếm âm nhạc trên cơ sở nội dung và ứng dụng
Hình 2.19 Mel Cepstrum (Trang 43)
Hình 2.21 Phân lớp âm thanh theo từng bước - luận văn thạc sĩ tìm kiếm âm nhạc trên cơ sở nội dung và ứng dụng
Hình 2.21 Phân lớp âm thanh theo từng bước (Trang 46)
Hình 2.23  mô tả các bước đã nêu trên. Mỗi  bước dưới đây tương ứng với trình tự  của biểu đồ - luận văn thạc sĩ tìm kiếm âm nhạc trên cơ sở nội dung và ứng dụng
Hình 2.23 mô tả các bước đã nêu trên. Mỗi bước dưới đây tương ứng với trình tự của biểu đồ (Trang 49)
Hình 2. 24 Phương pháp phân cụm  K-mean - luận văn thạc sĩ tìm kiếm âm nhạc trên cơ sở nội dung và ứng dụng
Hình 2. 24 Phương pháp phân cụm K-mean (Trang 50)
Hình 2.25 Minh họa phân lớp âm nhạc thông thường - luận văn thạc sĩ tìm kiếm âm nhạc trên cơ sở nội dung và ứng dụng
Hình 2.25 Minh họa phân lớp âm nhạc thông thường (Trang 51)
Hình dưới minh họa giao diện đồ họa dạng hộp thoại của chương trình. - luận văn thạc sĩ tìm kiếm âm nhạc trên cơ sở nội dung và ứng dụng
Hình d ưới minh họa giao diện đồ họa dạng hộp thoại của chương trình (Trang 58)
Hình 3.2 : Mô hình hệ thống nhận dạng đặc trưng âm thanh - luận văn thạc sĩ tìm kiếm âm nhạc trên cơ sở nội dung và ứng dụng
Hình 3.2 Mô hình hệ thống nhận dạng đặc trưng âm thanh (Trang 59)

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN