1. Trang chủ
  2. » Luận Văn - Báo Cáo

Khoá luận tốt nghiệp áp dụng thuật toán k nearest neighbor để phân loại nhạc theo thể loại

53 1,1K 5

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 53
Dung lượng 187,19 KB

Nội dung

Như chúng ta đã biết, vói số lượng lớn các bài nhạc sưu tầm được thì việc sưutầm nhạc có thể tiến hành từ nhiều nguồn, vói nhiều nguồn chất lượng âm thanhkhác nhau, cũng như thông tin về

Trang 1

TRƯỜNG ĐẠI HỌC sư PHẠM HÀ NỘI 2

THÔNG TIN

NGUYỄN LAN HƯƠNG

ÁP DỤNG THUẬT TOÁN K - NEAREST NEIGHBOR ĐẺ PHÂN LOẠI NHẠC THEO

THẺ LOẠI

KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC

Chuyên ngành: Khoa học máy tính

TRƯỜNG ĐẠI HỌC sư PHẠM HÀ NỘI 2

THÔNG TIN

Trang 2

HÀ NỘI -

NGUYỄN LAN HƯƠNG

ÀP DỤNG THUẬT TOAN K - NEAREST NEIGHBOR ĐẺ PHÂN LOẠI NHẠC THEO

THẺ LOẠI

KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC

Chuyên ngành: Khoa học máy tính

TS BÙI THẾ HỒNG

Trang 3

LỜI CẢM ƠN

Lời đầu tiên em xin chân thành cảm ơn sự hướng dẫn tận tình của thầygiáo PGS TS BÙI THẾ HỒNG đã trực tiếp hướng dẫn và chỉ bảo tận tình cho em hoàn thành khóa luận này

Em cũng xin chân thành cảm ơn các thầy , cô giáo trong khoa Công nghệ Thông tin, cũng như các thầy cô giáo trong trường đã giảng dạy và giúp đỡ em trong các năm học vừa qua Chinh các thầy, cô giáo đã xây dựngcho chúng em những kiến thức nền tảng và kiến thức chuyên môn để em có thể hoàn thành khóa luận tốt nghiệp và chuẩn bị cho những công việc của mình sau này

Cuối cùng em xin bày tỏ lòng biết ơn tói gia đình và bạn bè đã giúp đỡđộng viên em rất nhiều trong suốt quá trình học tập để em có thể thực hiệntốt khóa luận này

Do kiến thức và thòi gian còn hạn chế nên khóa luận không tránh khỏi những thiếu sót Kính mong nhận được sự đóng góp ý kiến của các thầy cô

và các bạn để khóa luận được hoàn thiện hơn

Hà Nội, tháng 05 năm 2015 Sinh viên

Nguyễn Lan Hương

Trang 4

LỜI CAM ĐOAN

4

Tên em là: NGUYỄN LAN HƯƠNG

Sinh viên lớp : K37 - CNTT, khoa Công nghệ Thông tin , trường Đại học sư

phạm Hà Nội 2

Em xin cam đoan:

1 Đề tài: “Áp dụng thuật toán K - Nearest Neighbor để phân loại nhạc theo thể loại” là nghiên cứu của riêng em , dưới sự hướng dẫn của thầy giáo PGS TS Bùi Thế Hồng

2 Khóa luận hoàn toàn không sao chép của tác giả nào khác

Nếu sai em xin hoàn toàn chịu trách nhiệm

Hà Nội, tháng 05 năm 2014 Người cam đoan

Nguyễn Lan Hương MỤC LỤC

Mở đầu 8

CHƯƠNG 1 Cơ SỞ LÝ THUYẾT 11

1.1 Lịch sử hệ thống xử lí âm thanh 11

1.2 Âm thanh và số hóa âm thanh 14

1.2.1 Ấm thanh 14

1.2.2 Các tham số của sóng âm 15

1.2.3 Số hóa âm thanh 17

1.3 Tổng quan về âm nhạc 20

1.3.1 Nốt nhạc 21

Trang 5

LỜI CAM ĐOAN

1.3.2 Bát độ 22

1.4 Các phương pháp phân loại nhạc 25

1.5 Biến đổi Fourier ròi rạc 26

CHƯƠNG 2 THUẬT TOÁN K - NEAREST NEIGHBOR ĐÊ PHÂN LOẠI NHẠC THEO THÊ LOẠI 29

2.1 Khai phá dữ liệu 29

2.2 Phân lớp 30

2.3 Mô tả thuật toán phân lớp k - Nearest Neighbor 32

2.4 Phân lớp K - Nearest Neighbor 33

CHƯƠNG 3 XÂY DựNG ỨNG DỤNG PHÂN LOẠI NHẠC THEO THÊ LOẠI 36

3.1 Giới thiệu bài toán 36

3.2 Thuật toán 37

3.2.1 Trích rút đặc trưng 37

3.2.2 Các đặc trưng liên quan đến bố cục âm sắc (Timbrai Texture Features) 38

3.2.3 Cân bằng hệ số các đặc trưng liên quan đến bố cục âm sắc 41

3.2.4 Khoảng cách giữa hai mẫu 42

3.2.5 Huấn luyện nhận dạng 43

3.3 Xây dựng chương trình 43

KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 49

TÀI LIỆU THAM KHẢO 51

DANH MỤC HÌNH • Hình 1.1 Sự truyền chuyển động của các phần tử khí 14

Hình 1.2 Sóng âm truyền theo mọi hướng 15

Trang 6

LỜI CAM ĐOAN

6

Hình 1.3 Chất điểm M dao động xung quanh vị trí cân bằng 15

Hình 1.4 Sóng âm thanh 18

Hình 1.5 Giai đoạn lấy mẫu 19

Hình 1.6 Độ phân giải 20

Hình 1.7 Chu kì các lớp nốt 22

Hình 1.8 Mô hình biểu diễn vùng bát độ 23

Hình 1.9 Mô hình biểu diễn các mức bán âm trong 1 bát độ 23

Hình 1.10 Khoảng cách giữa các pitch class tương ứng với tỷ lệ tần số 24

Hình 1.11 Tín hiệu xl(t) 26

Hình 1.12 Tín hiệu Xi(f) - biến đổi Fourier của Xi(t) 27

Hình 1.13 Tín hiệu x2(t) 27

Hình 1.14 Tín hiệu x2(t) - biến đổi Fourier của x2(t) 28

Hình 2.1 Phương pháp phâp loại k - nearest neighbor 33

Hình 2.2 Phương pháp phân loại 35

Hình 3.1 Sơ đồ xác định tín hiệu nhạc từ tín hiệu radio 37

Hình 3.2 Sơ đồ một vector đặc trưng từ một tín hiệu nhạc 38

Hình 3.3 Sơ đồ xác định các đặc trưng liên quan đến bố cục âm sắc 38

Hình 3.4 Kết quả thử nghiệm vói 10 thể loại 45

Hình 3.5 Biểu đồ tương quan độ chính xác phân loại 10 thể loại 46

Hình 3.6 Trích xuất giá trị các đặc trưng 46

Hình 3.7 Phân loại vói 10 thể loại (1) 47

Hình 3.8 Phân loại nhạc vói 10 thể loại (2) 48

Trang 7

LỜI CAM ĐOAN Mở đầu

Trong những năm gần đây, cùng với sự bùng nổ công nghệ thông tin và cácđịnh dạng nén ra đời, làm cho việc sở hữu những bài nhạc trở nên dễ dàng hơnbao giờ hết Kéo theo đó là sự gia tăng nhu cầu sưu tập nhạc số ở mỗi cá nhânhay tổ chức

Như chúng ta đã biết, vói số lượng lớn các bài nhạc sưu tầm được thì việc sưutầm nhạc có thể tiến hành từ nhiều nguồn, vói nhiều nguồn chất lượng âm thanhkhác nhau, cũng như thông tin về từng bài nhạc tải về cũng có mức độ chính xáckhác nhau, nên việc phân loại nhạc chỉ dựa vào những thông tin lưu giữ trên tậptin lưu trữ còn gặp nhiều hạn chế Thay vì chỉ dựa vào những thông tin có sẵn,người sưu tầm có thể nghe lại từng bài và tự phân loại chúng, tuy nhiên với sốlượng lớn các bài nhạc thì việc làm này không khả thi Điều này đã làm nảy sinhnhu cầu tự động phân loại nhạc trong các hệ thống lưu trữ âm nhạc

Các hệ thống tự động phân loại nhạc là rất cần thiết, nó hỗ trợ hoặc thay thếcon ngưòi trong việc phân loại nhạc, truy tìm thông tin nhạc trên internet, Bêncạnh đó, việc phân loại nhạc tự động cung cấp cơ sở khoa học cho việc phân tíchdựa trên nội dung của tín hiệu âm nhạc

Chính vì những lý do trên, cộng vói những kiến thức đã tìm hiểu từ môn Trítuệ nhân tạo, em đã chọn đề tài "Áp dụng thuật toán K-Nearest Neighbor đểphân loại nhạc theo thể loại" làm đề tài khóa luận

Dựa vào thuật toán K-nearest neighbor để phân loại nhạc theo thể loại

Trang 8

LỜI CAM ĐOAN

8

+ Thu thập các đặc trưng của từng thể loại nhạc

Trang 9

+ Xác định khoảng cách giữa các vetor đặc trưng của tín hiệu cần phân loạivới các vetor đặc trưng láng giềng gần nó Từ đó xác định thể loại nhạc dựavào thể loại nhạc của vetor gần nó nhất.

+ Xây dựng chương trình và đánh giá kết quả phân loại

Nghiên cứu với 10 thể loại nhạc: Blues, Classical, Country, Disco, Hiphop, Jazz, Metal, Pop, Regguage, Rock

Các đặc trưng chung và riêng của 10 thể loại nhạc được chọn nghiên cứu

Phân loại nhạc tự động là cơ sở khoa học cho việc phân tích các tín hiệuaudio Việc sử dụng thuật toán K - Nearest Neighbor để phân loại nhạc theo thểloại, rút ngắn được thòi gian thực hiện và mang lại kết quả chính xác cao

cạnh đó, nó cung cấp các đặc trưng quan trọng của các tín hiệu audio phục vụcho các hệ thống truy tìm thông tin, chú thích tự động các tập tin nhạc, nhậndạng giọng nói phục vụ trong điều tra,

+ Phương pháp nghiên cứu lí luận:

Nghiên cứu qua việc đọc sách, báo và các tài liệu liên quan nhằm xây dựng

cơ sở lý thuyết của đề tài và các biện pháp cần thiết để giải quyết các vấn đề của

đề tài

+ Phương pháp thực nghiệm:

Thông qua quan sát thực tế, yêu cầu của cơ sở, những lý luận được nghiên cứu và kết quả đạt được qua những phương pháp trên

Trang 10

Tham khảo các ý kiến của các chuyên gia để có thể thiết kế chương trìnhphù họp với yêu cầu thực tiễn Nội dung xử lý nhanh đáp ứng được yêu cầungày càng cao của người sử dụng

8 Cấu trúc khóa luận

Ngoài phần mở đầu, kết luận và phương hướng phát triển cấu trúc

khóa luận gồm có các chương sau:

Chương 1: Cơ sở lí thuyết

Chương 2: Thuật toán K- Nearest Neighbor để phân loại nhạc theo thể loại

Chương 3: Xây dựng ứng dụng phân loại nhạc theo thể loại

CHƯƠNG 1 Cơ SỞ LÝ THUYẾT 1.1 Lịch sử hệ thống xử lí âm thanh

Trước Pythagoras, âm nhạc vẫn được xem như một khái niệm thần bí Nhữngbằng chứng khảo cổ học đã cho thấy nhiều nhạc cụ đã có từ 35.000 năm trước.Tuy nhiên, không một lòi giải thích nào được đưa ra cho câu hỏi vì sao có những

âm thanh hài hòa hay đối chọi nhau Vào khoảng năm 500 TCN, ông đã tìm ramối quan hệ mật thiết giữa toán học và âm nhạc, đưa ra một hệ thống những nốtnhạc bắt tai và hài hòa khi đứng chung với nhau, được gọi là thang âm (scale)

Dù trải qua một quá trình lịch sử lâu dài, thang âm của Pythagoras được cho làrất sát với thang âm cơ bản nhất được sử dụng ngày nay “đô rê mi fa son la siđô” Phát hiện của Pythagoras đã đặt nền móng cơ bản nhất cho lịch sử âm nhạc

mà nếu không có nó, có lẽ cũng không thể có những Beethoven, Mozart hay âmnhạc hiện đại

Sự khởi đầu của nhạc điện tử là vào năm 1948, một người Pháp tên PierreSchaeffer đã sản xuất được một mẫu nhạc mới đầu tiên, gọi là musique concrete

Trang 11

- một tổ họp âm thanh tò môi trường xung quanh và những âm thanh vô giaiđiệu Mẩu nhạc ấy là sản phẩm của công nghệ, được tạo ra và truyền bá bằngphương tiện điện tò.

Schaeffer tiếp tục nghiên cứu và làm việc cùng với nhà soạn nhạc KarlheinzStockhausen ở phòng thu Cologne, Paris Cologne trở thành phòng nghiên cứunhạc điện tử nổi tiếng nhất với việc sản xuất ra thiết bị synthesizer (tạm dịch:nhạc cụ tổng hợp) đặt tiền đề cho những nhạc cụ điện tử hiện đại sau này

Các nhạc cụ tổng hợp tiếp tục được sử dụng bởi những ban nhạc Rock, tò đótrở nên một phần thiết yếu cho việc sản xuất các thể loại nhạc như hip-hop vàdance Không có những nhạc cụ điện tử và thủ thuật sản xuất âm nhạc thì hầuhết các bài hát cũng như bản phối ngày nay sẽ rất khác

Bản thu âm đầu tiên thuộc về Thomas Alva Edison khi ông chế tạo ra chiếcmáy thu âm vào năm 1877, câu nói được ghi âm đầu tiên trong lịch sử chính là

“Mary had a little lamb” Những cải tiến và hoàn thiện sau đó phải kể đến máyhát rẻ tiền và đĩa cao su của Emile Berliner, đánh dấu một cột mốc mới cho nềncông nghiệp âm nhạc hiện đại Sau đó, Berliner cùng vói kỹ sư Eldridge Johnson

đã thành lập nên công ty Victor Talking Machine, đưa máy hát thâm nhập vào thịtrường và hãng thu âm RCA Victor nổi tiếng

Xử lí âm thanh được định nghĩa nguồn gốc được sử dụng trong giói học thuật

để chỉ đến các vấn đề liên quan đến kĩ thuật tính toán dựa vào cấu tạo của âmnhạc Nó bao hàm những lí thuyết và ứng dụng mới hay kĩ thuật đã tồn tại trong

âm nhạc như tổng hợp âm thanh, xử lí tín hiệu số, thiết kế âm thanh, truyền âmtính, độ vang Phạm vi của tính toán âm nhạc có thể tính là nguồn gốc của nhạcđiện tử (nhạc số), những thử nhiệm ban đầu và sáng tạo vói nhạc dụng cụ điện tửtrong thế kỉ 20 Gần đây vói sự phát triển của của máy tính cá nhân và sự phát

Trang 12

âm nhạc hay cấu tạo của bài nhạc mà nó được học.

Máy nhạc máy tính sơ khai đặc trưng không thể chạy thòi gian thực Chươngtrình cần chạy vài giờ, vài ngày với những máy tính hàng triệu dola để có thể tạo

ra vài phút nhạc Việc John Chowning đã làm nên sóng FM từ những năm 1960đến những năm 1970 và sự ra đời của những con chip điện tử, đã mở ra cánh cửa

những bộ vi xử lý tiến tói mức tạo ra âm nhạc máy tính thời gian thực bằng việc

sử dụng chương trình với các thuật toán là khả thi

Truy vấn thông tin nhạc (Music Information Retrieval - MIR) là một nhánh

nhỏ của xử lý âm thanh, MIR liên quan đến việc quản lý thư viện nhạc số, nó baogồm nhiều vấn đề nhỏ như:

+ Phân loại, mô hình hóa âm nhạc + Phương pháp

hình thức và lưu trữ âm nhạc + Phần mềm truy vấn

thông tin âm nhạc + Giao diện tương tác giữa con

ngưòi và máy tính + Cho máy tính có thể “cảm thụ”

âm nhạc + Phân tích và tái hiện lại tri thức + Lưu trữ

âm nhạc, thư viện nhạc kĩ thuật số

Trang 13

Ý tưởng ban đầu về kĩ thuật truy vấn thông tin âm nhạc xuất hiện vào nhữngnăm 1966 Tuy nhiên vấn đề chỉ thực sự được tìm hiểu tỉ mỉ gần đây khi bùng nổ

sở thích sưu tầm âm nhạc qua mạng với hình thức nhạc điện tử, mọi thứ còn pháttriển nhanh hơn nữa khi các định dạng nhạc nén ra đời như MP3, các dịch vụchia sẻ âm nhạc như Napster ra đòi

Trang 14

tử khí, mà ta gọi là sóng âm Nói như vậy có nghĩ là âm thanh chỉ lan truyềntrong môi trường yật chất Không có sóng âm trong chân không.

Các kết quả thực nghiệm cho thấy sóng âm là sóng dọc, tức là các phần tò khídao động như lò xo (phương chuyển động trùng với phương truyền sóng)

»

• • • • • •

phần tử khí

phần tử khí Giả sử sóng âm truyền từ trái sang phải Khi đó dao động của Axung quanh vị trí cân bằng sẽ dẫn đến dao động của B, rồi dao động của в dẫn

Tất nhiên dao động của A không chỉ dẫn đến dao động của B, mà còn dẫn đếndao động của các phần tử khí gần nó, như Hình 1.2 Chính vì vậy sóng âm đượctruyền đi khắp mọi hướng

Trang 15

Hình 1.2 Sóng âm truyền theo mọi hướngKhi nói thanh quản đóng vai trò là nguồn phát sinh sóng Thanh quản rung,truyền động năng cho các phần tử khí khác gần nó Kết quả là ta thu được cácsóng âm truyền theo mọi hướng, trong đó hướng thẳng là hướng sóng âm mạnhnhất Các sóng âm này được duy trì liên tục trong khi thanh quản còn rung.

Khi sóng âm đến tai, nó bị màng nhĩ cản lại Kết quả là động năng của các phần

tử khí phía trước màng nhĩ được truyền cho màng nhĩ làm nó dao động Vì màngnhĩ được kết nối vói các dây thần kinh từ não nên dao động của màng nhĩ sẽ phátsinh ra các xung thần kinh Các xung thần kinh này được truyền đến não và ta cóđược cảm giác nghe

1.2.2 Các tham số của sóng âm

Cũng giống các loại sóng cơ học khác, sóng âm cũng có biên độ và tần số daođộng

< -o -► -►

MHình 1.3 Chất điểm M dao động xung quanh vị trí cân bằng

Xét một phần tử khí tại điểm M trong không gian như Hình 1.3 phần tử khínày dao đông xung quanh vị trí cân bằng trên phương truyền sóng Phương trìnhtruyền sóng của M có thể xem là:

Theo (1.1) thì biên độ A chính là độ dịch chuyển lớn nhất của các phần tử ra khỏi

vị trí cân bằng của nó Như yậy, nó mang ý nghĩ là độ mạnh hay cường độ daođộng của sóng Tần số dao động của sóng ở (1.1) l à / , tức là số chu kỳ mà sóngdao động trong 1 giây Nếu sóng có biên độ càng lớn thì sự biến thiên ly độ củamột chất điểm càng nhanh Do đó, tần số/ mang ý nghĩ là độ gấp của sóng

Trang 16

Tai người chỉ có thể cảm nhận được những sóng âm có tần số trong khoảng 16

Hz đến 20 000 Hz Những âm có tần số cao hơn 20 000 Hz gọi là siêu âm vànhững âm có tần số nhỏ hơn 16 Hz gọi là hạ âm

Cường độ âm cho ta cảm giác nghe thấy âm to hay nhỏ, mạnh hay yếu

Cường độ âm được định nghĩa là năng lượng được sóng âm truyền qua mộtđơn vị diện tích đặc vuông góc với phương truyền sóng trong một đơn vị thời

m

Để so sánh cường độ của một âm với cường độ âm tiêu chuẩn, người ta dùng

đại lượng mức cường độ âm đo bằng đơn vị đê-xi-ben (dB) Mức cường độ âm

được định nghĩa bằng công thức:

L(dB) = 101gf

Gọi âm có cường độ bằng cường độ bằng cường độ âm tiêu chuẩn là có mức

Đô to của âm

Do đặc điểm sinh lí của tai, nên để âm thanh gây được cảm giác âm, thì cường

độ âm phải lớn hơn có giá trị cực tiểu nào đó gọi là ngưỡng nghe Ngưỡng nghelại thay đổi theo tần số của âm Ví dụ vói các âm có tần số từ 1000 đến 1500 thì

Cảm giác nghe âm “to” hay “nhỏ” không những phụ thuộc vào cường độ âm

mà còn phụ thuộc vào tần số của âm Vói cùng một cường độ âm, tai nghe được

âm có tần số cao “to” hơn âm có tần số thấp Do đó, phát thanh viên nữ nói nghe

rõ hơn phát thanh viên nam

Trang 17

Khi cường độ âm lên tói 10w/m2

ứng với cường độ âm 130dB thì sóng âm vớimọi tần số gây cho tai ta cảm giác nhức nhối, đau đớn Giá trị cực đại của cường

độ âm mà tại ta có thể chịu đụng được gọi là ngưỡng đau Ngưỡng đau ứng với

mức cường độ âm là 130dB

1.2.3 Sổ hóa âm thanh

Đây là quá trình chuyển đổi sóng âm, tức là sóng cơ học thành dữ liệu số đượclưu trữ trong máy tính Quá trình này được chia thành hai giai đoạn: chuyển đổisóng âm thành tín hiệu điện và chuyển tín hiệu điện thành tín hiệu số

Tín hiệu điện là tín hiệu trung gian giữa tín hiệu cơ (sóng âm) và tín hiệu số

Sở dĩ ta chọn tín hiệu điện làm trung gian vì nó có thể truyền đi vói khoảng cách

xa mà không làm mất thông tin, dòng điện có hiệu điện thế dao động điều hòacũng giống như sóng âm, chính vì vậy mà ta có thể biểu diễn sóng âm bằng tínhiệu điện

Trang 18

Tín hiệu sóng âm thanh trong thế giới thực có dạng tương tự (analog) Do đó,

để có thể lưu trữ và biểu diễn trên các thiết bị máy tính sử dụng hệ tín hiệu nhịphân, chứng ta cần phải chuyển đổi tín hiệu analog sang tín hiệu số (dỉgỉtal) TÚIhiệu nhị phân không những được biểu diễn và sử dụng ứên máy tính mà nó cònđược ứng dựng trong rất nhiều các vật dụng khác mà chúng ta dùng hàng ngàynhư: đỉện thoại, máy nghe CD, máy nghe MP3,

Các bước chuyển sang tín hiệu được thực hiện như sau:

Lấy mẫu (sampttng)

Xét 1 tín hiệu âm thanh (hình 1.4) Trong đó:

Trục X biểu diễn cho miền thời gian tính theo đơn vị giây (s)

Trục Y biểu diễn cho cường độ tíh hiệu tính theo đơn vị Voltage (V)

Hình 1.4 Sóng âm thanh

Lấy mẫu (sampỉing)

+ Tiến hành lấy mẫu từ tín hiệu analog theo thời gian

18

Trang 19

+ Mỗi lần lấy mẫu, giá trị về độ lớn Voltage của tín hiệu sẽ được biểu diễn bằng một con số.

+ Số lần lấy mẫu của chúng ta trong ls được gọi là tần số lấy mẫu hay còn được gọi là tỷ lệ lấy mẫu (sampling rate)

+ Các loại tần số lấy mẫu phổ biến trong máy tính: 8.000Hz, 11.025Hz, 22.050Hz,32.000Hz, 44.056Hz, 44.100Hz, 47.250Hz, 48.000Hz,

50.000Hz, 50.400Hz, 88.200Hz, 96.000Hz

Hình 1.5 Giai đoạn lấy mẫu Nhìn hình 1.5 trong đồ thị, xét giao điểm của đồ thị

màu đỏ với đồ thị màu xanh

ta có:

+ Tung độ chính là con số chúng ta cần lưu trữ +

Độ phân giải (resolution)

+ Như đã nói ở phần trên, mỗi lần lấy mẫu, chúng ta sẽ biểu diễn cường độ của tín hiệu bằng một con số

Trang 20

và tình cảm Còn khí nhạc là âm nhạc dựa trên âm thanh thuần túy của các nhạc cụ, nên trừu tượng, gây cảm giác và sự liên tưởng.

Âm nhạc là một môn nghệ thuật phối hợp âm thanh theo những quy luật nhất định Âm nhạc bắt nguồn từ những âm thanh trong cuộc sống Thế

nhưng không phải âm thanh nào cũng là âm nhạc Mà chỉ âm thanh có tính nhạc Chúng phải có đủ 4 tính chất cơ bản sau:

• Cao độ: Mức độ trầm bổng của âm thanh

• Trường độ: Mức độ ngắn dài của âm thanh

• Cường độ: Mức độ mạnh nhẹ của âm thanh

Trang 21

• Âm sắc: Mặc dù âm thanh có giống nhau về cao độ, về trường độ, vềcường độ, nhưng vẫn có những tính chất riêng biệt Tính chất riêng của

âm thanh được gọi là âm sắc

Từ những âm thanh có tính nhạc đó, lâu dần con người biết phối họp việc lênxuống trầm bổng để tạo âm yực rộng và phong phú Và cũng từ đó mà âm nhạcđược hình thành và phát triển

1.3.1 Nốt nhac

Để cụ thể hóa đơn vị cao độ trong âm nhạc, người ta đã định nghĩa mỗi nốtnhạc là một giá trị đại diện cho một độ cao nhất định Nốt thấp nhất tương ứngvới tần số thấp nhất khi nghe tiếng nhạc, khoảng từ 20-30HZ Nốt cao nhất tươngứng với tần số cao nhất, khoảng từ 15-20KHZ

F#, G, G#, A, A# và B Các lớp nốt này tạo thành một chu trình Một đường đivòng quay từ C-C#-D-D# và trở về с tạo thành chu trình gọi là 1 bát độ/quãng

Trang 22

Từ hình Chu kì các lớp nốt, nếu nốt C4 có tần số là 261,6 Hz thì nốt C5 có tần số

Để dễ hình dung, ta có thể xem các mức bán âm trong 1 bát độ tương ứng vớicác vị trí trên đồng hồ được biểu diễn trong hình Chu kì các lớp nốt

Trang 23

Hinh 1.8 Mo hmh biéu diên vùng bât dô

General Internals

i

1st 2nd 3rd 4th 5th 6th 7th octave

Hînh 1.9 Mô hinh biéu diên câc mue ban âm trong 1 bât dô C à vi tri

12 gid, C a vi trï 1 già trên dông h ô , tao thành mçt chu tnnh Sau dây là mot

sô thông tin vè tên câc khoàng câch giüa câc lorp nôt tircmg üng vôi sô ban âm

và tÿ lç giüa câc tân sô:

Trang 24

1.4 Các phương pháp phân loại nhạc

Các hệ thống phân loại nhạc theo thể loại thường mô phỏng những kĩ năngcủa con người để chúng có thể nhận biết được thể loại của bản nhạc Tuy nhiên,

Trang 25

chúng không thể phân loại nhạc chủ yếu dựa vào kinh nghiệm người nghe nhạc

mà cần thiết phải xác định một số đặc trưng chung, phục vụ cho việc nhận dạngthể loại nhạc

Một thể loại nhạc là một tập các đặc trưng mà người nghe nhạc có thể phânbiệt nó vói những loại nhạc khác, từ những bản nhạc khác nhau Đặc trưng củamột thể loại nhạc được mô tả bởi đặc trưng về âm thanh của một nhạc cụ, nhịpnhạc và nhiều yếu tố khác ảnh hưởng đến việc phân loại nhạc Nhiều đặc trưngthuộc về tri giác dựa vào âm thanh nghe được, chẳng hạn như: độ cao thấp nốtnhạc (pitch), âm sắc (timbre), nhịp (rhythm) của một bản nhạc hoặc có những đặctrưng liên quan đến bố cục nhạc (musical texture)

Việc phân loại thường gọi là học giám sát (supurvised learning), ngoài ra còn

có các dạng học khác là học không quan sát, học tăng cường (reinforcementlearning) Có rất nhiều phương pháp phân loại như: K-nearest neighbor, Bayes,HMMS, Neuron Net - work,

tính toán xác suất khả năng đối tượng thuộc về một lớp, chọn tối đa một xác suấthậu nghiệm của lớp như mục tiêu thuộc Phương pháp này được sử dụng trongphân loại văn bản, một bước trong nhận dạng khuôn mặt người, hay trong y họcnhằm phân loại tế bào

Phương pháp Neuron Net - work hay còn gọi là quá tình học của mạng trong

học giám sát bao hàm việc điều chỉnh, cập nhật ma trận trọng số sao cho ứng vớitâp tín hiệu vào xác định, tín hiệu ra của mạng tiệm cận tới giá trị mong muốn

Trang 26

1.5 Biến đổi Fourier rời

FT sẽ chia nhỏ tín hiệu thành những tín hiệu sin thành phần Chúng biểu diễnnhững tần số tồn tại trong tín hiệu FT của một tín hiệu được xác định bởi côngthức:

X(f) = í^x(t)e~j2nft dt (1.2)

x(t) = xự)ei2nft df (1.3)

Trong đó:

+ x(t) là tín hiệu thời gian và X(f) là tín hiệu tần số tương ứng

Ví du:

1.11 như sau:

Ngày đăng: 24/09/2015, 09:20

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w