1.1 Giới thiệu đề tài Đề tài: "Phương pháp số cho DFT để khử nhiễu âm thanh" Đề tài tập trung nghiên cứu và ứng dụng Biến đổi Fourier rời rạc DFT trong lĩnh vực xử lý tín hiệu âm thanh,
Trang 1ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC BÁCH KHOA
BÁO CÁO BÀI TẬP LỚN MÔN PHƯƠNG PHÁP TÍNH
ĐỀ TÀI PHƯƠNG PHÁP SỐ CHO DFT ĐỂ KHỬ NHIỄU ÂM THANH
Thành phố Hồ Chí Minh, tháng 12/2024
Trang 2BẢNG PHÂN CÔNG CÁC THÀNH VIÊN TRONG NHÓM
Nguyễn Phùng Linh Ngọc 2312313 Kiểm tra và hướng phát triển
Trang 3MỤC LỤC
1 MỞ ĐẦU 4
1.1 Giới thiệu đề tài 4
1.2 Mục tiêu 4
1.3 Cách tiếp cận xử lý 5
2 CƠ SỞ LÝ THUYẾT 6
2.1 Đặt vấn đề 6
2.2 Cơ sở lý thuyết 6
2.2.1 Định nghĩa của ánh xạ tuyến tính 6
2.2.2 Nhân của ánh xạ tuyến tính 6
2.2.3 Ánh xạ tuyến tính 7
2.2.4 Biến đổi Fourier 8
3 VÍ DỤ SỐ 10
3.1 Mô tả lệnh code Mathlab 10
3.2 Lệnh code Mathlab 10
3.3 Kết quả sau khi chạy code 10
3.3.1 Tín hiệu gốc 10
3.3.2 Tín hiệu sau lọc với cutoff = 3500 Hz 10
3.3.3 Tín hiệu sau lọc với cutoff = 100 Hz 11
4 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 13
4.1 Kết luận 13
4.2 Hướng phát triển 13
TÀI LIỆU THAM KHẢO 14
Trang 41 MỞ ĐẦU
Bài báo cáo của nhóm 13 chúng em sẽ gồm những nội dung liên quan đến việc sử dụng phương pháp số DFT để khử nhiễu âm thanh Bài báo cáo sẽ chỉ ra cách biến đổi Fourier cũng như các bước lập trình code trong việc khử nhiễu âm thanh Từ đó, hiểu biết thêm về cách xử lí các tạp âm để cho ra một sản phẩm âm thanh hoàn chỉnh
nhất
1.1 Giới thiệu đề tài
Đề tài: "Phương pháp số cho DFT để khử nhiễu âm thanh"
Đề tài tập trung nghiên cứu và ứng dụng Biến đổi Fourier rời rạc (DFT) trong lĩnh vực xử lý tín hiệu âm thanh, nhằm mục đích khử nhiễu và nâng cao chất lượng âm thanh Dựa trên khả năng phân tích phổ tần số của DFT, phương pháp số được xây dựng để tách biệt các thành phần tín hiệu hữu ích và loại bỏ nhiễu không mong muốn
Nghiên cứu này không chỉ trình bày nền tảng lý thuyết về DFT và các thuật toán
xử lý, mà còn triển khai thực nghiệm trên các mẫu tín hiệu thực tế để kiểm chứng hiệu quả Kết quả đạt được sẽ được đánh giá và định hướng ứng dụng trong các lĩnh vực như truyền thông, thu âm, sản xuất âm nhạc và các hệ thống xử lý âm thanh thời gian thực
Đề tài đóng góp vào việc phát triển các giải pháp công nghệ hiện đại, đặc biệt trong bối cảnh nhu cầu cải thiện chất lượng âm thanh ngày càng tăng cao
Mục tiêu chính của nghiên cứu là phát triển một thuật toán khử nhiễu âm thanh hiệu quả dựa trên biến đổi Fourier rời rạc (DFT), nhằm nâng cao chất lượng âm thanh và mở rộng ứng dụng của các công nghệ xử lý tín hiệu số trong thực tế
Cụ thể, nghiên cứu sẽ tập trung vào các mục tiêu sau:
• Phân tích sâu: Nghiên cứu chi tiết các loại nhiễu thường gặp trong tín hiệu âm thanh, bao gồm nhiễu trắng, màu, xung, và nhiễu hài hòa Đánh giá ảnh hưởng của từng loại nhiễu đến chất lượng âm thanh và khả năng nghe hiểu
• Thiết kế thuật toán: Xây dựng một thuật toán khử nhiễu DFT linh hoạt, có khả năng thích ứng với các loại nhiễu khác nhau và các điều kiện làm việc đa dạng Thuật toán sẽ bao gồm các bước tiền xử lý, phân tích phổ, thiết kế bộ lọc thích ứng, tổng hợp lại tín hiệu và hậu xử lý
Trang 5• Đánh giá hiệu quả: Đánh giá hiệu quả của thuật toán thông qua các chỉ số chất lượng âm thanh tiêu chuẩn như PSNR, SNR, và các phép đo chủ quan bằng cách
so sánh âm thanh gốc và âm thanh sau khi khử nhiễu
• Tối ưu hóa: Tìm kiếm các phương pháp tối ưu hóa thuật toán để giảm độ phức tạp tính toán, tăng tốc độ xử lý và giảm thiểu độ trễ, nhằm đáp ứng yêu cầu thực thời của các ứng dụng
Discrete Fourier Transform (DFT): Tìm hiểu về nguyên lý biến đổi Fourier rời rạc (DFT), vai trò của nó trong việc phân tích tín hiệu, và cách nó chuyển đổi tín hiệu từ
miền thời gian sang miền tần số
Nhiễu âm thanh: Phân loại các loại nhiễu phổ biến trong âm thanh (nhiễu trắng, nhiễu
tần số thấp, nhiễu công suất điện, v.v.)
Mục tiêu khử nhiễu: Đảm bảo rằng tín hiệu âm thanh sạch nhưng không làm mất đi
các thông tin quan trọng hoặc làm biến dạng tín hiệu
Chuyển tín hiệu sang miền tần số: Sử dụng DFT để phân tích tín hiệu âm thanh thành
các thành phần tần số
Phát hiện và lọc nhiễu: Tìm các tần số không mong muốn (nhiễu) và loại bỏ hoặc
giảm chúng bằng cách áp dụng ngưỡng lọc
Chuyển lại về miền thời gian: Dùng Inverse DFT (IDFT) để tái tạo tín hiệu âm thanh
đã khử nhiễu
Kiểm tra kết quả: Đánh giá chất lượng tín hiệu âm thanh sau khi khử nhiễu qua các
chỉ số như SNR và nghe thử
Báo cáo và kết luận: Tổng hợp các kết quả thử nghiệm, so sánh phương pháp Đưa ra các hạn chế của phương pháp hiện tại và hướng phát triển tương lai
Trang 62 CƠ SỞ LÝ THUYẾT
2.1 Đặt vấn đề
Trong quá trình hình thành và phát triển của con người, âm thanh là một thứ đóng vai trò vô cùng quan trọng và thiết yếu đối với mỗi cá nhân con người Âm thanh là khởi nguồn của những giai điệu, cảm xúc để từ đó hình thành nên những bản nhạc bất
hủ qua từng thế kỉ Nó giúp truyền đạt thông tin, cảm xúc, tạo ra môi trường và không gian cũng như niềm vui và sự thư giản, làm tăng sự hưng phấn cho cuộc sống Do đó để
có được những buổi xem phim đầy cảm xúc, những chiếc loa phát nhạc du dương, thì tất cả đã được qua xử lí Vì trong quá trình tạo ra nhưng âm thanh đó thì luôn có những tạp âm không cần thiết làm giảm đi chất lượng âm thanh chính, nên ta cần loại
bỏ đi những tạp âm này hay nói cách khác là khử nhiễu âm thanh Và một trong những cách để khử nhiễu phổ biến hiện nay là phép biến đổi Fourier Đây chính là phép biển đổi mà nhóm chúng em muốn trình bày trong bài báo cáo này
2.2 Cơ sở lý thuyết
2.2.1 Định nghĩa của ánh xạ tuyến tính
Ánh xạ giữa hai tập hợp X và Y là một quy tắc sao cho mỗi x thuộc X tồn tại duy nhất một y thuộc Y để y = f(x):
f : X → Y ; ∀x ∈ X ; ∃! y ∈ Y : y = f (x)
Cho V và W là hai không gian vecto trên cùng trường số K Ánh xạ tuyến tính f: V
→ W giữa hai không gian vecto V, W là một ánh xạ thỏa:
• (∀v1, v2 ∈ V ): f (v1 + v2) = f (v1) + f (v2)
• (∀α ∈ K , ∀v ∈ V ) : f (αv) = αf (v)
2.2.2 Nhân của ánh xạ tuyến tính
Nhân của ánh xạ tuyến tính
Cho ánh xạ tuyến tính: f : V → W, ta có nhân của ánh xạ tuyến tính f là tập
hợp tất cả các vecto x của không gian vecto V, sao cho f(x) = 0:
Kerf = {x ∈ V | f (x) = 0}
Trang 7Ảnh của ánh xạ tuyến tính
Cho ánh xạ tuyến tính: f : V → W, ta có ảnh của ánh xạ tuyến tính f là tập
hợp tất cả các phần tử y của không gian vecto W sao cho tồn tại x ∈ V để y = f(x):
Imf = { y ∈ W| ∃x ∈ V : y = f (x)}
Định lý
Cho ánh xạ tuyến tính: f : V → W, ta có:
• Nhân của ánh xạ tuyến tính f (kerf) là không gian con của V
• Ảnh của ánh xạ tuyến tính f (Imf) là không gian con của W
• dim(kerf) + dim(Imf) = dim(V)
2.2.3 Ánh xạ tuyến tính
Cho ánh xạ tuyến tính f : V → W:E = e1, e2, e3, e n là một cơ sở của V
• F = f1, f2, f3, f n là một cơ sở của W
• Nếu tồn tại ma trận A mxn sao cho [ f (x) F ] = A E,F [x] E thì ma trận A được gọi
là ma trận ánh xạ tuyến tính của f trong hai cơ sở của E và F
Trang 82.2.4 Biến đổi Fourier
Mục đích
Phép biến đổi Fourier giúp tách tín hiệu dạng sóng thành các tần số riêng lẻ
tạo ra nó tức là thay đổi thông tin dựa trên thời gian thành thông tin dựa trên tần số
Nó là một quá trình mà tín hiệu được biểu diễn dưới dạng sin và cos với các mức tần số
khác nhau
Biến đổi Fourier rời rạc
Các sản phẩm dùng kỹ thuật số, như là video, âm thanh, tín hiệu và hình ảnh
đồ họa, liên tục sử dụng các phép biến đổi Fourier Chúng lọc thông tin theo cách thức
kỹ thuật số bằng một dòng mã được gọi là biến đổi Fourier rời rạc
Trong toán học, phép biến đổi Fourier rời rạc (DFT), đôi khi còn được gọi là biến đổi Fourier hữu hạn, là một biến đổi trong giải tích Fourier cho các tín hiệu thời gian rời rạc Đầu vào của biến đổi này là một chuỗi hữu hạn các số thực hoặc số phức, biến đổi này là một công cụ lý tưởng để xử lý thông tin trên máy tính Đặc biệt, biến đổi này được sử dụng rộng rãi trong xử lý tín hiệu và các ngành liên quan đến phân tích tần số chứa trong một tín hiệu Biến đổi này có thể được tính nhanh bởi thuật toán biến đổi Fourier nhanh (FFT)
Ứng dụng của biến đổi Fourier rời rạc trong khử nhiễu âm thanh
Phép biến đổi Y = F n X được gọi là phép biến đổi fourier rời rạc của vecto X với:
• Vecto Y = F n X có dạng Y = A + iB
𝑛
𝑛−1 0
• Vecto A chứa các hệ số βt trong ∑ 𝛽𝑡𝑐𝑜𝑠2𝜋𝑡
𝑛
𝑛−1 0
⇒ Như vậy dùng phép biến đổi Fourier rời rạc, ta chuyển tín hiệu X ở miền thời
𝑛 và 𝑠𝑖𝑛2𝜋𝑡
𝑛
⇒ Sau khi biến đổi Fourier rời rạc Y = F n X ta có thể xác định tần số tín hiệu chính
và tần số tín hiệu nhiễu từ đó ta loại bỏ các tín hiệu gây nhiễu và giữ lại tín hiệu
chính
Nhờ đó mà ta có thể:
Trang 9- Loại bỏ nhiễu tần số cố định: Fourier cho phép xác định các tần số nhiễu
cố định trong tín hiệu âm thanh vì vậy ta có thể loại bỏ các tần số gây nhiễu để cải thiện chất lượng âm thanh
- Phân tích tín hiệu và tìm hiểu cấu trúc tần số: Fourier cho phép phân tích tín hiệu âm thanh để tìm hiểu cấu trúc tần số của nó
- Loại bỏ nhiễu từ quá trình thu thập: Giúp loại bỏ những tạp âm trong quá trình thu thập dữ liệu
- Chuyển đổi tín hiệu vào miền tần số: Biến đổi Fourier giúp chuyển đổi tín hiệu từ miền thời gian sang miền tần số Trong miền tần số ta có thể phân tích tần số và xử lí để loại bỏ nhiễu hoặc cải thiện tín hiệu
Trang 103 VÍ DỤ SỐ
Hình 1
3.3.1 Tín hiệu gốc
Miền thời gian: Tín hiệu gốc hiển thị sự dao động mạnh và không đồng đều Điều này cho thấy sự hiện diện của nhiều tần số khác nhau, bao gồm cả tần số quan trọng và tạp âm Biên độ biến đổi lớn là dấu hiệu của tín hiệu thô, chưa qua bất kỳ xử lý nào Miền tần số: Phổ tần số của tín hiệu gốc chứa rất nhiều đỉnh, trải dài từ tần số thấp đến hơn 4000 Hz Các đỉnh ở tần số thấp và trung thường đại diện cho các thành phần chính, chứa nội dung âm thanh quan trọng Ngược lại, các đỉnh cao trên 3500 Hz thường
là nhiễu hoặc tín hiệu không mong muốn, gây ra hiện tượng "nhiễu trắng," làm tín hiệu trở nên rối rắm và khó nghe Phổ tần số sau khi lọc đã giữ lại các tần số quan trọng và loại bỏ các tạp âm, dẫn đến âm thanh sạch hơn
Kết luận: Tín hiệu có cả âm thanh mong muốn và tạp âm Các đỉnh cao có thể
biểu thị các âm thanh mạnh hoặc các sự kiện âm thanh nổi bật Điều này có thể làm cho
âm thanh trở nên khó nghe hoặc không rõ ràng
3.3.2 Tín hiệu sau lọc với cutoff = 3500 Hz
Miền thời gian: Sau khi lọc, tín hiệu trở nên mượt mà hơn Biên độ dao động giảm đi đáng kể, đặc biệt là các biến động mạnh đã được kiểm soát Điều này chứng tỏ các thành phần nhiễu, đặc biệt là tần số cao, đã bị loại bỏ
Miền tần số: Các đỉnh tần số trên 3500 Hz đã hoàn toàn biến mất, chứng minh hiệu
Trang 11quả của bộ lọc thông thấp Các thành phần quan trọng ở tần số thấp và trung được giữ lại, đảm bảo tín hiệu không mất nội dung
Kết luận: Bộ lọc thông thấp (Low-Pass Filter) hoạt động như một "cửa ngõ," chỉ cho
phép các tần số dưới 3500 Hz đi qua Đây là ngưỡng cắt hợp lý để loại bỏ nhiễu mà vẫn giữ lại nội dung âm thanh quan trọng, phù hợp với giọng nói hoặc âm thanh nhạc cụ Lọc với cutoff = 3500 Hz đạt được sự cân bằng tối ưu: tín hiệu sạch, rõ ràng mà vẫn tự nhiên
Hình 2
3.3.3 Tín hiệu sau lọc với cutoff = 100 Hz
Miền thời gian: Biên độ tín hiệu sau lọc giảm mạnh, gần như chỉ còn những dao động yếu Các thành phần chính của tín hiệu gần như biến mất, dẫn đến tín hiệu bị mất thông tin
Miền tần số: Biểu đồ phổ tần số cho thấy chỉ còn các thành phần tần số dưới 100 Hz, trong khi các tần số trung và cao – nơi chứa phần lớn thông tin âm thanh – đã bị loại bỏ Khi đặt cutoff quá thấp (100 Hz), bộ lọc loại bỏ gần như toàn bộ dải tần chứa nội dung thông tin Điều này dẫn đến tín hiệu không còn giá trị sử dụng trong thực tế Các tần số dưới 100 Hz thường chỉ chứa tiếng ồn nền hoặc các thành phần âm trầm yếu, không đủ
để tái hiện tín hiệu ban đầu
Hệ quả: Tín hiệu mất đi hầu hết thông tin quan trọng, trở nên không còn giá trị sử dụng Thay vì cải thiện chất lượng, việc lọc quá mức làm tín hiệu bị ngắt quãng, khiến nó gần như không còn đại diện được cho tín hiệu gốc
Trang 12Kết luận: Cutoff = 100 Hz không phù hợp với tín hiệu âm thanh thực tế, cho thấy
tầm quan trọng của việc chọn giá trị cutoff đúng đắn
Thông qua 2 hình ta thấy :
+ Đối với cutoff = 3500 Hz, thì sau khi lọc tín hiệu thì vẫn giữ được những nội dung quan trọng, loại bỏ các loại tần số nhiễu Cải thiện được chất lượng của âm thanh
+ Đối với cutoff = 100Hz, thì sau khi lọc tín hiệu bị biến dạng, mất phần nội dung quan trọng Hầu như các tần số chỉnh đều bị loại bỏ vì thế đã gây mất mát âm thanh, tín hiệu trở nên vô dụng
Tóm lại: Tính hiệu sau khi lọc miền thời gian với 2 giá trị cut off bắt buộc ta cần
phải chú ý đến việc khi đặt cut off phù hợp ( chọn 3500 Hz) thì HÌNH DẠNG SÓNG của tín hiệu trước và sau lọc vẫn giống nhau, không bị biến dạng, thay đổi chứng tỏ, tần số phù hợp giúp cho việc lọc âm thanh mang tính hiệu quả cao" Ngược lại với khi chọn cut off ko phù hợp thì tín hiệu sau khi lọc đã bị biến dạng và mất phần tín hiệu quan trọng ban đầu
Trang 134 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN
4.1 Kết luận
Phép biến đổi Fourier hữu hạn (DFT- Discrete Fourier Transform) là một phép biến đổi sử dụng trong xử lí âm thanh và tín hiệu để chuyển đổi một tín hiệu thời gian thành một tín hiệu tần số
Thông qua bài tập lớn tìm hiểu đề tài này và với sự phân chia công việc hợp lý cho từng thành viên trong nhóm, ý thức trách nhiệm của mỗi người mà nhóm em đã hoàn thành được bài tập với sự cố gắng chỉn chu nhất
- Hiểu được cách lọc nhiễm một file âm thanh bất kì trên MATLAB
- Nắm rõ các ứng dụng của môn học, đặc biệt là Fourier hữu hạn trong khử
nhiễu âm
- Tăng khả năng nghiên cứu học tập có ý thức
- Biết cách phối hợp hỗ trợ làm việc nhóm hiệu quả và tăng tính đoàn kết của
nhóm
- Ứng dụng môn học thực tiễn tạo sự hứng thú với môn học
4.2 Hướng phát triển
Nếu như chúng ta có thể xử lí tốt một tập tin âm thanh theo các tiêu chí (trọng tâm, chính xác, hiệu quả và tiết kiệm thời gian) thì việc đó sẽ giúp ích cho ta rất nhiều:
- Trong nghiên cứu về âm thanh, phép biến đổi Fourier hữu hạn sẽ giúp ta
tiết kiệm thời gian khi phân tích âm thanh của một chủ thể
- Trong doanh nghiệp chuyên về lĩnh vực truyền thông đa phương tiện, nếu xử lí tốt file âm thanh, sẽ tiết kiệm được rất nhiều chi phí trong việc thiết kế một phần mềm nào đó, hay chỉ đơn giản là tăng chất lượng âm thanh trong quá trình edit video chuyên nghiệp Từ đó sẽ hướng đến nhiều đối tượng khách hàng hơn với một trải nghiệm về chất lượng âm thanh tuyệt vời, chân thật và đặt biệt không còn tạp âm nữa
- Ngoài ra phép biến đổi Fourier hữu hạn trong khử nhiễu âm thanh cũng có thể được phát triển để hỗ trợ phát minh ra các công nghệ cao như điện thoại,
microphone, trợ lí ảo với chức năng lọc âm thanh tân tiến hơn
Trang 14TÀI LIỆU THAM KHẢO
[1] Burden, Numerical analysis, Boston, MA: Cengage Learning, 2016
[2] Proakis and John G, Digital Signal Processing: Principles, Algorithms and Ap- plications, Upper Saddle River, N.J.: Pearson Prentice Hall; London:
Pearson Edu- cation, Ltd, 2007
[3] https://vi.wikipedia.org/wiki/Bi%E1%BA%BFn_%C4%91%E1%BB%95i_Fo urier_r%E1% BB%9Di_r%E1%BA%A1c, truy cập cuối cùng ngày 10/12/2024