Như chúng ta đã biết, vói số lượng lớn các bài nhạc sưu tầm được thì việc sưutầm nhạc có thể tiến hành từ nhiều nguồn, vói nhiều nguồn chất lượng âm thanhkhác nhau, cũng như thông tin về
Trang 1TRƯỜNG ĐẠI HỌC sư PHẠM HÀ NỘI 2
THÔNG TIN
NGUYỄN LAN HƯƠNG
ÁP DỤNG THUẬT TOÁN K - NEAREST NEIGHBOR ĐẺ PHÂN LOẠI NHẠC THEO
THẺ LOẠI
KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC
Chuyên ngành: Khoa học máy tính
TRƯỜNG ĐẠI HỌC sư PHẠM HÀ NỘI 2
THÔNG TIN
Trang 2HÀ NỘI -
NGUYỄN LAN HƯƠNG
ÀP DỤNG THUẬT TOAN K - NEAREST NEIGHBOR ĐẺ PHÂN LOẠI NHẠC THEO
THẺ LOẠI
KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC
Chuyên ngành: Khoa học máy tính
TS BÙI THẾ HỒNG
Trang 3LỜI CẢM ƠN
Lời đầu tiên em xin chân thành cảm ơn sự hướng dẫn tận tình của thầygiáo PGS TS BÙI THẾ HỒNG đã trực tiếp hướng dẫn và chỉ bảo tận tình cho em hoàn thành khóa luận này
Em cũng xin chân thành cảm ơn các thầy , cô giáo trong khoa Công nghệ Thông tin, cũng như các thầy cô giáo trong trường đã giảng dạy và giúp đỡ em trong các năm học vừa qua Chinh các thầy, cô giáo đã xây dựngcho chúng em những kiến thức nền tảng và kiến thức chuyên môn để em có thể hoàn thành khóa luận tốt nghiệp và chuẩn bị cho những công việc của mình sau này
Cuối cùng em xin bày tỏ lòng biết ơn tói gia đình và bạn bè đã giúp đỡđộng viên em rất nhiều trong suốt quá trình học tập để em có thể thực hiệntốt khóa luận này
Do kiến thức và thòi gian còn hạn chế nên khóa luận không tránh khỏi những thiếu sót Kính mong nhận được sự đóng góp ý kiến của các thầy cô
và các bạn để khóa luận được hoàn thiện hơn
Hà Nội, tháng 05 năm 2015 Sinh viên
Nguyễn Lan Hương
Trang 4LỜI CAM ĐOAN
4
Tên em là: NGUYỄN LAN HƯƠNG
Sinh viên lớp : K37 - CNTT, khoa Công nghệ Thông tin , trường Đại học sư
phạm Hà Nội 2
Em xin cam đoan:
1 Đề tài: “Áp dụng thuật toán K - Nearest Neighbor để phân loại nhạc theo thể loại” là nghiên cứu của riêng em , dưới sự hướng dẫn của thầy giáo PGS TS Bùi Thế Hồng
2 Khóa luận hoàn toàn không sao chép của tác giả nào khác
Nếu sai em xin hoàn toàn chịu trách nhiệm
Hà Nội, tháng 05 năm 2014 Người cam đoan
Nguyễn Lan Hương MỤC LỤC
Mở đầu 8
CHƯƠNG 1 Cơ SỞ LÝ THUYẾT 11
1.1 Lịch sử hệ thống xử lí âm thanh 11
1.2 Âm thanh và số hóa âm thanh 14
1.2.1 Ấm thanh 14
1.2.2 Các tham số của sóng âm 15
1.2.3 Số hóa âm thanh 17
1.3 Tổng quan về âm nhạc 20
1.3.1 Nốt nhạc 21
Trang 5LỜI CAM ĐOAN
1.3.2 Bát độ 22
1.4 Các phương pháp phân loại nhạc 25
1.5 Biến đổi Fourier ròi rạc 26
CHƯƠNG 2 THUẬT TOÁN K - NEAREST NEIGHBOR ĐÊ PHÂN LOẠI NHẠC THEO THÊ LOẠI 29
2.1 Khai phá dữ liệu 29
2.2 Phân lớp 30
2.3 Mô tả thuật toán phân lớp k - Nearest Neighbor 32
2.4 Phân lớp K - Nearest Neighbor 33
CHƯƠNG 3 XÂY DựNG ỨNG DỤNG PHÂN LOẠI NHẠC THEO THÊ LOẠI 36
3.1 Giới thiệu bài toán 36
3.2 Thuật toán 37
3.2.1 Trích rút đặc trưng 37
3.2.2 Các đặc trưng liên quan đến bố cục âm sắc (Timbrai Texture Features) 38
3.2.3 Cân bằng hệ số các đặc trưng liên quan đến bố cục âm sắc 41
3.2.4 Khoảng cách giữa hai mẫu 42
3.2.5 Huấn luyện nhận dạng 43
3.3 Xây dựng chương trình 43
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 49
TÀI LIỆU THAM KHẢO 51
DANH MỤC HÌNH • Hình 1.1 Sự truyền chuyển động của các phần tử khí 14
Hình 1.2 Sóng âm truyền theo mọi hướng 15
Trang 6LỜI CAM ĐOAN
6
Hình 1.3 Chất điểm M dao động xung quanh vị trí cân bằng 15
Hình 1.4 Sóng âm thanh 18
Hình 1.5 Giai đoạn lấy mẫu 19
Hình 1.6 Độ phân giải 20
Hình 1.7 Chu kì các lớp nốt 22
Hình 1.8 Mô hình biểu diễn vùng bát độ 23
Hình 1.9 Mô hình biểu diễn các mức bán âm trong 1 bát độ 23
Hình 1.10 Khoảng cách giữa các pitch class tương ứng với tỷ lệ tần số 24
Hình 1.11 Tín hiệu xl(t) 26
Hình 1.12 Tín hiệu Xi(f) - biến đổi Fourier của Xi(t) 27
Hình 1.13 Tín hiệu x2(t) 27
Hình 1.14 Tín hiệu x2(t) - biến đổi Fourier của x2(t) 28
Hình 2.1 Phương pháp phâp loại k - nearest neighbor 33
Hình 2.2 Phương pháp phân loại 35
Hình 3.1 Sơ đồ xác định tín hiệu nhạc từ tín hiệu radio 37
Hình 3.2 Sơ đồ một vector đặc trưng từ một tín hiệu nhạc 38
Hình 3.3 Sơ đồ xác định các đặc trưng liên quan đến bố cục âm sắc 38
Hình 3.4 Kết quả thử nghiệm vói 10 thể loại 45
Hình 3.5 Biểu đồ tương quan độ chính xác phân loại 10 thể loại 46
Hình 3.6 Trích xuất giá trị các đặc trưng 46
Hình 3.7 Phân loại vói 10 thể loại (1) 47
Hình 3.8 Phân loại nhạc vói 10 thể loại (2) 48
Trang 7LỜI CAM ĐOAN Mở đầu
Trong những năm gần đây, cùng với sự bùng nổ công nghệ thông tin và cácđịnh dạng nén ra đời, làm cho việc sở hữu những bài nhạc trở nên dễ dàng hơnbao giờ hết Kéo theo đó là sự gia tăng nhu cầu sưu tập nhạc số ở mỗi cá nhânhay tổ chức
Như chúng ta đã biết, vói số lượng lớn các bài nhạc sưu tầm được thì việc sưutầm nhạc có thể tiến hành từ nhiều nguồn, vói nhiều nguồn chất lượng âm thanhkhác nhau, cũng như thông tin về từng bài nhạc tải về cũng có mức độ chính xáckhác nhau, nên việc phân loại nhạc chỉ dựa vào những thông tin lưu giữ trên tậptin lưu trữ còn gặp nhiều hạn chế Thay vì chỉ dựa vào những thông tin có sẵn,người sưu tầm có thể nghe lại từng bài và tự phân loại chúng, tuy nhiên với sốlượng lớn các bài nhạc thì việc làm này không khả thi Điều này đã làm nảy sinhnhu cầu tự động phân loại nhạc trong các hệ thống lưu trữ âm nhạc
Các hệ thống tự động phân loại nhạc là rất cần thiết, nó hỗ trợ hoặc thay thếcon ngưòi trong việc phân loại nhạc, truy tìm thông tin nhạc trên internet, Bêncạnh đó, việc phân loại nhạc tự động cung cấp cơ sở khoa học cho việc phân tíchdựa trên nội dung của tín hiệu âm nhạc
Chính vì những lý do trên, cộng vói những kiến thức đã tìm hiểu từ môn Trítuệ nhân tạo, em đã chọn đề tài "Áp dụng thuật toán K-Nearest Neighbor đểphân loại nhạc theo thể loại" làm đề tài khóa luận
Dựa vào thuật toán K-nearest neighbor để phân loại nhạc theo thể loại
Trang 8LỜI CAM ĐOAN
8
+ Thu thập các đặc trưng của từng thể loại nhạc
Trang 9+ Xác định khoảng cách giữa các vetor đặc trưng của tín hiệu cần phân loạivới các vetor đặc trưng láng giềng gần nó Từ đó xác định thể loại nhạc dựavào thể loại nhạc của vetor gần nó nhất.
+ Xây dựng chương trình và đánh giá kết quả phân loại
Nghiên cứu với 10 thể loại nhạc: Blues, Classical, Country, Disco, Hiphop, Jazz, Metal, Pop, Regguage, Rock
Các đặc trưng chung và riêng của 10 thể loại nhạc được chọn nghiên cứu
Phân loại nhạc tự động là cơ sở khoa học cho việc phân tích các tín hiệuaudio Việc sử dụng thuật toán K - Nearest Neighbor để phân loại nhạc theo thểloại, rút ngắn được thòi gian thực hiện và mang lại kết quả chính xác cao
cạnh đó, nó cung cấp các đặc trưng quan trọng của các tín hiệu audio phục vụcho các hệ thống truy tìm thông tin, chú thích tự động các tập tin nhạc, nhậndạng giọng nói phục vụ trong điều tra,
+ Phương pháp nghiên cứu lí luận:
Nghiên cứu qua việc đọc sách, báo và các tài liệu liên quan nhằm xây dựng
cơ sở lý thuyết của đề tài và các biện pháp cần thiết để giải quyết các vấn đề của
đề tài
+ Phương pháp thực nghiệm:
Thông qua quan sát thực tế, yêu cầu của cơ sở, những lý luận được nghiên cứu và kết quả đạt được qua những phương pháp trên
Trang 10Tham khảo các ý kiến của các chuyên gia để có thể thiết kế chương trìnhphù họp với yêu cầu thực tiễn Nội dung xử lý nhanh đáp ứng được yêu cầungày càng cao của người sử dụng
8 Cấu trúc khóa luận
Ngoài phần mở đầu, kết luận và phương hướng phát triển cấu trúc
khóa luận gồm có các chương sau:
Chương 1: Cơ sở lí thuyết
Chương 2: Thuật toán K- Nearest Neighbor để phân loại nhạc theo thể loại
Chương 3: Xây dựng ứng dụng phân loại nhạc theo thể loại
CHƯƠNG 1 Cơ SỞ LÝ THUYẾT 1.1 Lịch sử hệ thống xử lí âm thanh
Trước Pythagoras, âm nhạc vẫn được xem như một khái niệm thần bí Nhữngbằng chứng khảo cổ học đã cho thấy nhiều nhạc cụ đã có từ 35.000 năm trước.Tuy nhiên, không một lòi giải thích nào được đưa ra cho câu hỏi vì sao có những
âm thanh hài hòa hay đối chọi nhau Vào khoảng năm 500 TCN, ông đã tìm ramối quan hệ mật thiết giữa toán học và âm nhạc, đưa ra một hệ thống những nốtnhạc bắt tai và hài hòa khi đứng chung với nhau, được gọi là thang âm (scale)
Dù trải qua một quá trình lịch sử lâu dài, thang âm của Pythagoras được cho làrất sát với thang âm cơ bản nhất được sử dụng ngày nay “đô rê mi fa son la siđô” Phát hiện của Pythagoras đã đặt nền móng cơ bản nhất cho lịch sử âm nhạc
mà nếu không có nó, có lẽ cũng không thể có những Beethoven, Mozart hay âmnhạc hiện đại
Sự khởi đầu của nhạc điện tử là vào năm 1948, một người Pháp tên PierreSchaeffer đã sản xuất được một mẫu nhạc mới đầu tiên, gọi là musique concrete
Trang 11- một tổ họp âm thanh tò môi trường xung quanh và những âm thanh vô giaiđiệu Mẩu nhạc ấy là sản phẩm của công nghệ, được tạo ra và truyền bá bằngphương tiện điện tò.
Schaeffer tiếp tục nghiên cứu và làm việc cùng với nhà soạn nhạc KarlheinzStockhausen ở phòng thu Cologne, Paris Cologne trở thành phòng nghiên cứunhạc điện tử nổi tiếng nhất với việc sản xuất ra thiết bị synthesizer (tạm dịch:nhạc cụ tổng hợp) đặt tiền đề cho những nhạc cụ điện tử hiện đại sau này
Các nhạc cụ tổng hợp tiếp tục được sử dụng bởi những ban nhạc Rock, tò đótrở nên một phần thiết yếu cho việc sản xuất các thể loại nhạc như hip-hop vàdance Không có những nhạc cụ điện tử và thủ thuật sản xuất âm nhạc thì hầuhết các bài hát cũng như bản phối ngày nay sẽ rất khác
Bản thu âm đầu tiên thuộc về Thomas Alva Edison khi ông chế tạo ra chiếcmáy thu âm vào năm 1877, câu nói được ghi âm đầu tiên trong lịch sử chính là
“Mary had a little lamb” Những cải tiến và hoàn thiện sau đó phải kể đến máyhát rẻ tiền và đĩa cao su của Emile Berliner, đánh dấu một cột mốc mới cho nềncông nghiệp âm nhạc hiện đại Sau đó, Berliner cùng vói kỹ sư Eldridge Johnson
đã thành lập nên công ty Victor Talking Machine, đưa máy hát thâm nhập vào thịtrường và hãng thu âm RCA Victor nổi tiếng
Xử lí âm thanh được định nghĩa nguồn gốc được sử dụng trong giói học thuật
để chỉ đến các vấn đề liên quan đến kĩ thuật tính toán dựa vào cấu tạo của âmnhạc Nó bao hàm những lí thuyết và ứng dụng mới hay kĩ thuật đã tồn tại trong
âm nhạc như tổng hợp âm thanh, xử lí tín hiệu số, thiết kế âm thanh, truyền âmtính, độ vang Phạm vi của tính toán âm nhạc có thể tính là nguồn gốc của nhạcđiện tử (nhạc số), những thử nhiệm ban đầu và sáng tạo vói nhạc dụng cụ điện tửtrong thế kỉ 20 Gần đây vói sự phát triển của của máy tính cá nhân và sự phát
Trang 12âm nhạc hay cấu tạo của bài nhạc mà nó được học.
Máy nhạc máy tính sơ khai đặc trưng không thể chạy thòi gian thực Chươngtrình cần chạy vài giờ, vài ngày với những máy tính hàng triệu dola để có thể tạo
ra vài phút nhạc Việc John Chowning đã làm nên sóng FM từ những năm 1960đến những năm 1970 và sự ra đời của những con chip điện tử, đã mở ra cánh cửa
những bộ vi xử lý tiến tói mức tạo ra âm nhạc máy tính thời gian thực bằng việc
sử dụng chương trình với các thuật toán là khả thi
Truy vấn thông tin nhạc (Music Information Retrieval - MIR) là một nhánh
nhỏ của xử lý âm thanh, MIR liên quan đến việc quản lý thư viện nhạc số, nó baogồm nhiều vấn đề nhỏ như:
+ Phân loại, mô hình hóa âm nhạc + Phương pháp
hình thức và lưu trữ âm nhạc + Phần mềm truy vấn
thông tin âm nhạc + Giao diện tương tác giữa con
ngưòi và máy tính + Cho máy tính có thể “cảm thụ”
âm nhạc + Phân tích và tái hiện lại tri thức + Lưu trữ
âm nhạc, thư viện nhạc kĩ thuật số
Trang 13Ý tưởng ban đầu về kĩ thuật truy vấn thông tin âm nhạc xuất hiện vào nhữngnăm 1966 Tuy nhiên vấn đề chỉ thực sự được tìm hiểu tỉ mỉ gần đây khi bùng nổ
sở thích sưu tầm âm nhạc qua mạng với hình thức nhạc điện tử, mọi thứ còn pháttriển nhanh hơn nữa khi các định dạng nhạc nén ra đời như MP3, các dịch vụchia sẻ âm nhạc như Napster ra đòi
Trang 14tử khí, mà ta gọi là sóng âm Nói như vậy có nghĩ là âm thanh chỉ lan truyềntrong môi trường yật chất Không có sóng âm trong chân không.
Các kết quả thực nghiệm cho thấy sóng âm là sóng dọc, tức là các phần tò khídao động như lò xo (phương chuyển động trùng với phương truyền sóng)
»
• • • • • •
phần tử khí
phần tử khí Giả sử sóng âm truyền từ trái sang phải Khi đó dao động của Axung quanh vị trí cân bằng sẽ dẫn đến dao động của B, rồi dao động của в dẫn
Tất nhiên dao động của A không chỉ dẫn đến dao động của B, mà còn dẫn đếndao động của các phần tử khí gần nó, như Hình 1.2 Chính vì vậy sóng âm đượctruyền đi khắp mọi hướng
Trang 15Hình 1.2 Sóng âm truyền theo mọi hướngKhi nói thanh quản đóng vai trò là nguồn phát sinh sóng Thanh quản rung,truyền động năng cho các phần tử khí khác gần nó Kết quả là ta thu được cácsóng âm truyền theo mọi hướng, trong đó hướng thẳng là hướng sóng âm mạnhnhất Các sóng âm này được duy trì liên tục trong khi thanh quản còn rung.
Khi sóng âm đến tai, nó bị màng nhĩ cản lại Kết quả là động năng của các phần
tử khí phía trước màng nhĩ được truyền cho màng nhĩ làm nó dao động Vì màngnhĩ được kết nối vói các dây thần kinh từ não nên dao động của màng nhĩ sẽ phátsinh ra các xung thần kinh Các xung thần kinh này được truyền đến não và ta cóđược cảm giác nghe
1.2.2 Các tham số của sóng âm
Cũng giống các loại sóng cơ học khác, sóng âm cũng có biên độ và tần số daođộng
< -o -► -►
MHình 1.3 Chất điểm M dao động xung quanh vị trí cân bằng
Xét một phần tử khí tại điểm M trong không gian như Hình 1.3 phần tử khínày dao đông xung quanh vị trí cân bằng trên phương truyền sóng Phương trìnhtruyền sóng của M có thể xem là:
Theo (1.1) thì biên độ A chính là độ dịch chuyển lớn nhất của các phần tử ra khỏi
vị trí cân bằng của nó Như yậy, nó mang ý nghĩ là độ mạnh hay cường độ daođộng của sóng Tần số dao động của sóng ở (1.1) l à / , tức là số chu kỳ mà sóngdao động trong 1 giây Nếu sóng có biên độ càng lớn thì sự biến thiên ly độ củamột chất điểm càng nhanh Do đó, tần số/ mang ý nghĩ là độ gấp của sóng
Trang 16Tai người chỉ có thể cảm nhận được những sóng âm có tần số trong khoảng 16
Hz đến 20 000 Hz Những âm có tần số cao hơn 20 000 Hz gọi là siêu âm vànhững âm có tần số nhỏ hơn 16 Hz gọi là hạ âm
Cường độ âm cho ta cảm giác nghe thấy âm to hay nhỏ, mạnh hay yếu
Cường độ âm được định nghĩa là năng lượng được sóng âm truyền qua mộtđơn vị diện tích đặc vuông góc với phương truyền sóng trong một đơn vị thời
m
Để so sánh cường độ của một âm với cường độ âm tiêu chuẩn, người ta dùng
đại lượng mức cường độ âm đo bằng đơn vị đê-xi-ben (dB) Mức cường độ âm
được định nghĩa bằng công thức:
L(dB) = 101gf
Gọi âm có cường độ bằng cường độ bằng cường độ âm tiêu chuẩn là có mức
Đô to của âm
Do đặc điểm sinh lí của tai, nên để âm thanh gây được cảm giác âm, thì cường
độ âm phải lớn hơn có giá trị cực tiểu nào đó gọi là ngưỡng nghe Ngưỡng nghelại thay đổi theo tần số của âm Ví dụ vói các âm có tần số từ 1000 đến 1500 thì
Cảm giác nghe âm “to” hay “nhỏ” không những phụ thuộc vào cường độ âm
mà còn phụ thuộc vào tần số của âm Vói cùng một cường độ âm, tai nghe được
âm có tần số cao “to” hơn âm có tần số thấp Do đó, phát thanh viên nữ nói nghe
rõ hơn phát thanh viên nam
Trang 17Khi cường độ âm lên tói 10w/m2
ứng với cường độ âm 130dB thì sóng âm vớimọi tần số gây cho tai ta cảm giác nhức nhối, đau đớn Giá trị cực đại của cường
độ âm mà tại ta có thể chịu đụng được gọi là ngưỡng đau Ngưỡng đau ứng với
mức cường độ âm là 130dB
1.2.3 Sổ hóa âm thanh
Đây là quá trình chuyển đổi sóng âm, tức là sóng cơ học thành dữ liệu số đượclưu trữ trong máy tính Quá trình này được chia thành hai giai đoạn: chuyển đổisóng âm thành tín hiệu điện và chuyển tín hiệu điện thành tín hiệu số
Tín hiệu điện là tín hiệu trung gian giữa tín hiệu cơ (sóng âm) và tín hiệu số
Sở dĩ ta chọn tín hiệu điện làm trung gian vì nó có thể truyền đi vói khoảng cách
xa mà không làm mất thông tin, dòng điện có hiệu điện thế dao động điều hòacũng giống như sóng âm, chính vì vậy mà ta có thể biểu diễn sóng âm bằng tínhiệu điện
Trang 18Tín hiệu sóng âm thanh trong thế giới thực có dạng tương tự (analog) Do đó,
để có thể lưu trữ và biểu diễn trên các thiết bị máy tính sử dụng hệ tín hiệu nhịphân, chứng ta cần phải chuyển đổi tín hiệu analog sang tín hiệu số (dỉgỉtal) TÚIhiệu nhị phân không những được biểu diễn và sử dụng ứên máy tính mà nó cònđược ứng dựng trong rất nhiều các vật dụng khác mà chúng ta dùng hàng ngàynhư: đỉện thoại, máy nghe CD, máy nghe MP3,
Các bước chuyển sang tín hiệu được thực hiện như sau:
Lấy mẫu (sampttng)
Xét 1 tín hiệu âm thanh (hình 1.4) Trong đó:
Trục X biểu diễn cho miền thời gian tính theo đơn vị giây (s)
Trục Y biểu diễn cho cường độ tíh hiệu tính theo đơn vị Voltage (V)
Hình 1.4 Sóng âm thanh
Lấy mẫu (sampỉing)
+ Tiến hành lấy mẫu từ tín hiệu analog theo thời gian
18
Trang 19+ Mỗi lần lấy mẫu, giá trị về độ lớn Voltage của tín hiệu sẽ được biểu diễn bằng một con số.
+ Số lần lấy mẫu của chúng ta trong ls được gọi là tần số lấy mẫu hay còn được gọi là tỷ lệ lấy mẫu (sampling rate)
+ Các loại tần số lấy mẫu phổ biến trong máy tính: 8.000Hz, 11.025Hz, 22.050Hz,32.000Hz, 44.056Hz, 44.100Hz, 47.250Hz, 48.000Hz,
50.000Hz, 50.400Hz, 88.200Hz, 96.000Hz
Hình 1.5 Giai đoạn lấy mẫu Nhìn hình 1.5 trong đồ thị, xét giao điểm của đồ thị
màu đỏ với đồ thị màu xanh
ta có:
+ Tung độ chính là con số chúng ta cần lưu trữ +
Độ phân giải (resolution)
+ Như đã nói ở phần trên, mỗi lần lấy mẫu, chúng ta sẽ biểu diễn cường độ của tín hiệu bằng một con số
Trang 20và tình cảm Còn khí nhạc là âm nhạc dựa trên âm thanh thuần túy của các nhạc cụ, nên trừu tượng, gây cảm giác và sự liên tưởng.
Âm nhạc là một môn nghệ thuật phối hợp âm thanh theo những quy luật nhất định Âm nhạc bắt nguồn từ những âm thanh trong cuộc sống Thế
nhưng không phải âm thanh nào cũng là âm nhạc Mà chỉ âm thanh có tính nhạc Chúng phải có đủ 4 tính chất cơ bản sau:
• Cao độ: Mức độ trầm bổng của âm thanh
• Trường độ: Mức độ ngắn dài của âm thanh
• Cường độ: Mức độ mạnh nhẹ của âm thanh
Trang 21• Âm sắc: Mặc dù âm thanh có giống nhau về cao độ, về trường độ, vềcường độ, nhưng vẫn có những tính chất riêng biệt Tính chất riêng của
âm thanh được gọi là âm sắc
Từ những âm thanh có tính nhạc đó, lâu dần con người biết phối họp việc lênxuống trầm bổng để tạo âm yực rộng và phong phú Và cũng từ đó mà âm nhạcđược hình thành và phát triển
1.3.1 Nốt nhac
Để cụ thể hóa đơn vị cao độ trong âm nhạc, người ta đã định nghĩa mỗi nốtnhạc là một giá trị đại diện cho một độ cao nhất định Nốt thấp nhất tương ứngvới tần số thấp nhất khi nghe tiếng nhạc, khoảng từ 20-30HZ Nốt cao nhất tươngứng với tần số cao nhất, khoảng từ 15-20KHZ
F#, G, G#, A, A# và B Các lớp nốt này tạo thành một chu trình Một đường đivòng quay từ C-C#-D-D# và trở về с tạo thành chu trình gọi là 1 bát độ/quãng
Trang 22Từ hình Chu kì các lớp nốt, nếu nốt C4 có tần số là 261,6 Hz thì nốt C5 có tần số
Để dễ hình dung, ta có thể xem các mức bán âm trong 1 bát độ tương ứng vớicác vị trí trên đồng hồ được biểu diễn trong hình Chu kì các lớp nốt
Trang 23Hinh 1.8 Mo hmh biéu diên vùng bât dô
General Internals
i
1st 2nd 3rd 4th 5th 6th 7th octave
Hînh 1.9 Mô hinh biéu diên câc mue ban âm trong 1 bât dô C à vi tri
12 gid, C a vi trï 1 già trên dông h ô , tao thành mçt chu tnnh Sau dây là mot
sô thông tin vè tên câc khoàng câch giüa câc lorp nôt tircmg üng vôi sô ban âm
và tÿ lç giüa câc tân sô:
Trang 241.4 Các phương pháp phân loại nhạc
Các hệ thống phân loại nhạc theo thể loại thường mô phỏng những kĩ năngcủa con người để chúng có thể nhận biết được thể loại của bản nhạc Tuy nhiên,
Trang 25chúng không thể phân loại nhạc chủ yếu dựa vào kinh nghiệm người nghe nhạc
mà cần thiết phải xác định một số đặc trưng chung, phục vụ cho việc nhận dạngthể loại nhạc
Một thể loại nhạc là một tập các đặc trưng mà người nghe nhạc có thể phânbiệt nó vói những loại nhạc khác, từ những bản nhạc khác nhau Đặc trưng củamột thể loại nhạc được mô tả bởi đặc trưng về âm thanh của một nhạc cụ, nhịpnhạc và nhiều yếu tố khác ảnh hưởng đến việc phân loại nhạc Nhiều đặc trưngthuộc về tri giác dựa vào âm thanh nghe được, chẳng hạn như: độ cao thấp nốtnhạc (pitch), âm sắc (timbre), nhịp (rhythm) của một bản nhạc hoặc có những đặctrưng liên quan đến bố cục nhạc (musical texture)
Việc phân loại thường gọi là học giám sát (supurvised learning), ngoài ra còn
có các dạng học khác là học không quan sát, học tăng cường (reinforcementlearning) Có rất nhiều phương pháp phân loại như: K-nearest neighbor, Bayes,HMMS, Neuron Net - work,
tính toán xác suất khả năng đối tượng thuộc về một lớp, chọn tối đa một xác suấthậu nghiệm của lớp như mục tiêu thuộc Phương pháp này được sử dụng trongphân loại văn bản, một bước trong nhận dạng khuôn mặt người, hay trong y họcnhằm phân loại tế bào
Phương pháp Neuron Net - work hay còn gọi là quá tình học của mạng trong
học giám sát bao hàm việc điều chỉnh, cập nhật ma trận trọng số sao cho ứng vớitâp tín hiệu vào xác định, tín hiệu ra của mạng tiệm cận tới giá trị mong muốn
Trang 261.5 Biến đổi Fourier rời
FT sẽ chia nhỏ tín hiệu thành những tín hiệu sin thành phần Chúng biểu diễnnhững tần số tồn tại trong tín hiệu FT của một tín hiệu được xác định bởi côngthức:
X(f) = í^x(t)e~j2nft dt (1.2)
x(t) = xự)ei2nft df (1.3)
Trong đó:
+ x(t) là tín hiệu thời gian và X(f) là tín hiệu tần số tương ứng
Ví du:
1.11 như sau: