- 50 - MỘT SỐKHÍACẠNHCỦACƠSỞ DỮ LIỆU ÂMTHANHVÀỨNGDỤNG Sinh viên: Hồ Tất Thành Mã sinh viên: SV0220288 Email: hotatthanh@yahoo.com Cán bộ Hướng dẫn: PGS. TS. Đỗ Trung Tuấn Trường Đại học Khoa học tự nhiên - ĐHQGHN 1.Mở đầu Đa phương tiện đã trở nên phổ biến và đang dần chiếm vai trò chủ đạo trong phương pháp cung cấp và tiếp cận thông tin trên máy tính của con người. Trong đó, âmthanh đóng vai trò rất quan trọng. 2.Về dữ liệu đa phương tiện 2.1. Khái quát Nghiên cứu về đa phương tiện bao trùm các nghiên cứu về tạo, lưu trữ, biến đổi, khai phá, thể hiện nội dung đa phương tiện. 2.2. Khó khăn của việc nghiên cứu đa phương tiện Trước tiên, phải thấy rằng dữ liệu đa phương tiện là dữ liệu lớn. Hơn nữa, dữ liệu đa phương tiện thường có cấu trúc phức tạp và không thống nhất. Việc tương tác với con người và biểu đạt dữ liệu đa phương tiện cũng là một vấn đề lớn. 2.3. Âmthanh trong đa phương tiện Âmthanh là một thành phần quan trọng trong hệ thống đa phương tiện. Âmthanh là loại dữ liệu có khả năng chế tác bằng máy tính. Cơsở dữ liệu âmthanh lưu trữ các đoạn âmthanhvà siêu dữ liệu củaâm thanh). 3.Các lĩnh vực nghiên cứu về âmthanhCó hai lĩnh vực nghiên cứu chính về âmthanh là xử lý tín tín hiệu âm thanhvà thu thập thông tin âmthanh 4.Tổng quan về tín hiệu âmthanhsố 4.1. Các kiến thức cơ bản về âmthanhvàâm tâm lý Sóng âm là một loại sóng cơ. Các đơn vị vật lý củaâmthanh dựa trên tính khách quan và cả tính chủ quan củaâmthanh (tác động củaâmthanh lên tai người). Tiêu biểu có: áp suất âm, cường độ âm, decibel – mức cường độ âm, mức áp suất âm, bát độ, bán cung. Nghiên cứu về âm tâm lý là nghiên cứu về cách thức và khả năng nhận thức âmthanhcủa con người. 4.2. Lưu trữ âmthanh Phương pháp lưu trữ dựa trên lấy mẫu ghi lại thay đổi áp suất của sóng âm theo từng khoảng thời gian nhất định. Phương pháp lưu trữ dạng miêu tả dùng các miêu tả mang nghĩa trừu tượng. 5.Tổng quan về xử lý tín hiệu âm thanhCó nhiều miền biểu diễn tín hiệu âm thanh. Chuỗi tín hiệu lấy mẫu là sự biểu diễn sóng âm trong miền thời gian. Trong miền tần số, sóng âm được xem như là tổng hợp của các sóng đơn tần ở các tần số khác nhau. Người ta dùng biến đổi Fourier để phân tích một tín hiệu tổng hợp thành các tín hiệu đơn tần, chuyển biểu diễn tín hiệu từ miền thời gian sang miền tần s ố. Biến đổi Fourier thời gian ngắn rời rạc X(m,ω) cho biết biên độ và pha của các sóng đơn tần tại từng thời điểm cụ thể. Phổ tần số là đồ thị miêu tả cường độ của các tần số khác nhau. Ảnh phổ là kết quả của việc tính toán phổ tần số theo cửasổ trượt trên tín hiệu tổng hợp, cho biế t biến thiên theo thời gian về năng lượng của các tần số sóng. Việc biến đổi tín hiệu trên các miền khác nhau thực chất là việc thay đổi giá trị các tín hiệu, các hàm của tín hiệu trên các miền đó. 6.Nghiên cứu một số hiệu ứngâmthanh 6.1. Thay đổi độ to Thay đổi độ to là tăng giảm âm lượng, thực hiện bằng cách nhân tỷ lệ áp suất của sóng lên một số lần nào đó.Thay đổi độ to không làm thay đổi phân bố năng lượng, cao độ, nhưng làm thay đổi cường độ tổng thể và cường độ từng sóng đơn tần. 6.2. Làm mờ âm Làm mờ âm là thay đổi độ to một cách từ từ. 6.3. Tăng độ trầm củaâm Tăng độ trầm củaâm thực hiện bằng cách tăng biên độ các sóng thành phần ở tần số rất - 51 - thấp, thực hiện trên miền tần số. Tăng độ trầm ảnh hưởng ít đến phổ, cao độ, cường độ âm 6.4. Tăng độ cao củaâm Tương tự như tăng độ trầm nhưng ở tần số cao. 6.5. Bộ cân chỉnh âm Đặc trưng quan trọng của bộ cân chỉnh âm là việc tăng giảm âm ở các dải tần số khác nhau là độc lập 6.6. Tái lấy mẫu Tái lấy mẫu làm thay đổi tần số lấy mẫu nhưng cố gắng giữ nguyên tính chất của âm, được thực hiện bằng phương pháp nội suy mẫu. 6.7. Thay đổi tốc độ phát Thay đổi tốc độ phát là việc biến đổi tốc độ hoặc thời gian phát một đoạn âm thanh. Thay đổi tốc độ phát cố gắng giữ nguyên cao độ. Có hai phương pháp cơ bản là Phase Vocoder trên miền tần sốvà phương pháp trên miền thời gian. Thay đổi tốc độ phát làm co giản ảnh phổ, đồ thị cao độ, đồ thị cường độ theo trục thời gian 6.8. Thay đổi cao độ Thay đổi cao độ làm thay đổi mức cao thấp của đoạn âmthanh mà cố gắng giữ nguyên tốc độ phát. Thay đổi cao độ có hai phương pháp tương tự thay đổi tốc độ phát. Thay đổi cao độ làm co giãn ảnh phổ, đồ thị cao độ theo trục tần số, ít ảnh hưởng tới cường độ. 6.9. Lọc nhiễu Lọc nhiễu dựa vào loại “mẫu nhiễu”. Lọc nhiễu giúp cho việc thu thập thông tin âmthanh dễ dàng hơn 7.Xây dựngcơsở dữ liệu về âmthanh 7.1. Phân đoạn âmthanh Phân đoạn âmthanhcó thể dựa vào khoảng thời gian cố định, khoảng lặng hoặc dựa vào định danh. 7.2. Một ứng dụngcơsở dữ liệu âmthanhÂmthanhcó thể được lưu trữ trực tiếp trong hệ thống, hoặc là tài nguyên bên ngoài, được hệ thống tham khảo tới. Hệ thống được tổ chức thành 4 phần: ứngdụng trực quan, ứngdụng hệ phục vụ, CSDL siêu dữ liệu, hệ thống tập tin. Các bản âmcó thể được tìm kiếm theo cây phân mục hoặc tìm kiếm dựa trên từ khoá. Trong phương pháp tìm kiếm dựa trên từ khoá, các b ản âm kết quả được sắp xếp theo độ phù hợp. Các bản âmthanh còn được tổ chức dạng cây cơsở - dẫn xuất. Có nhiều vấn đề phát triển trong tương lai được đề xuất dựa trên hệ thống này. 8.Kết luận Nghiên cứu về âmthanhvàcơsở dữ liệu âmthanh đang là một vấn đề còn rất mới mẻ, nhất là ở Việt Nam hiện nay. Với đề tài “Một sốkhíacạnhcủacơsở dữ liệu âmthanhvàứng dụng”, tác giả hi vọng góp phần đưa những nghiên cứu như vậy gần gũi hơn và đóng góp vào nghiên cứu chung. Tài liệu tham khảo chính [1] Paul Boersma, David Weenink. Praat: doing phonetics by computer. www.praat.org , 2006. [2] V.S.Subrahmanian. Principles of Multimedia database systems. Morgan Kaufmann Publishers, Inc; San Francisco, California, 1998. [3] Wikipedia, The Free Encyclopedia. www.wikipedia.org , 2006. [4] www.adobe.com . Adobe Audition References. 2006. . về âm thanh và cơ sở dữ liệu âm thanh đang là một vấn đề còn rất mới mẻ, nhất là ở Việt Nam hiện nay. Với đề tài Một số khía cạnh của cơ sở dữ liệu âm thanh. thanh và thu thập thông tin âm thanh 4.Tổng quan về tín hiệu âm thanh số 4.1. Các kiến thức cơ bản về âm thanh và âm tâm lý Sóng âm là một loại sóng cơ.