1. Trang chủ
  2. » Luận Văn - Báo Cáo

Áp dụng thuật toán k nearest neighbor để phân loại nhạc theo thể loại

51 1K 2

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 51
Dung lượng 1,34 MB

Nội dung

Như chúng ta đã biết, với số lượng lớn các bài nhạc sưu tầm được thì việc sưu tầm nhạc có thể tiến hành từ nhiều nguồn, với nhiều nguồn chất lượng âm thanh khác nhau, cũng nh

Trang 1

1

TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2 KHOA CÔNG NGHỆ THÔNG TIN

*************

NGUYỄN LAN HƯƠNG

ÁP DỤNG THUẬT TOÁN

K – NEAREST NEIGHBOR ĐỂ

PHÂN LOẠI NHẠC THEO THỂ LOẠI

KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC

Chuyên ngành: Khoa ho ̣c máy tính

HÀ NỘI – 2015

Trang 2

2

TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2 KHOA CÔNG NGHỆ THÔNG TIN

*************

NGUYỄN LAN HƯƠNG

ÁP DỤNG THUẬT TOÁN

K – NEAREST NEIGHBOR ĐỂ

PHÂN LOẠI NHẠC THEO THỂ LOẠI

KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC

Chuyên ngành: Khoa ho ̣c máy tính

Người hướng dẫn khoa học

PGS TS BÙI THẾ HỒNG

HÀ NỘI –2015

Trang 3

3

LỜI CẢM ƠN

Lời đầu tiên em xin chân thành cảm ơn sự hướng dẫn tâ ̣n tình của thầy giáo PGS TS BÙI THẾ HỒNG đã trực tiếp hướng dẫn và chỉ bảo tận tình cho

em hoàn thành khóa luâ ̣n này

Em cũng xin chân thành cảm ơn các thầy , cô giáo trong khoa Công nghê ̣ Thông tin, cũng như các thầy cô giáo trong trường đã giảng dạy và giúp đỡ em trong các năm ho ̣c vừa qua Chính các thầy, cô giáo đã xây dựng cho chúng em những kiến thức nền tảng và kiến thức chuyên môn để em có thể hoàn thành khóa luận tốt nghiệp và chuẩn bị cho những công việc của mình sau này

Cuối cùng em xin bày tỏ lòng biết ơn tới gia đình và ba ̣n bè đã giúp đỡ

đô ̣ng viên em rất nhiều trong suốt quá trình ho ̣c tâ ̣p để em có thể thực hiê ̣n tốt khóa luận này

Do kiến thức và thời gian còn ha ̣n chế nên khóa luâ ̣n không tránh khỏi những thiếu sót Kính mong nhận được sự đóng góp ý kiến của các thầy cô và các bạn để khóa luận được hoàn thiện hơn

Hà Nội, tháng 05 năm 2015

Sinh viên

Nguyễn Lan Hương

Trang 4

4

LỜI CAM ĐOAN

Tên em là: NGUYỄN LAN HƯƠNG

Sinh viên lớp : K37 – CNTT, khoa Công nghê ̣ Thông tin , trường Đa ̣i ho ̣c sư phạm Hà Nội 2

Em xin cam đoan:

1 Đề tài: “Áp dụng thuật toán K – Nearest Neighbor để phân loại nhạc theo thể loại” là nghiên cứu của riêng em , dưới sự hướng dẫn của thầy giáo PGS TS Bùi Thế Hồng

2 Khóa luận hoàn toàn không sao chép của tác giả nào khác

Nếu sai em xin hoàn toàn chi ̣u trách nhiê ̣m

Hà Nội, tháng 05 năm 2014 Người cam đoan

Nguyễn Lan Hương

Trang 5

5

MỤC LỤC

Mở đầu 8

CHƯƠNG 1 CƠ SỞ LÝ THUYẾT 11

1.1 Lịch sử hệ thống xử lí âm thanh 11

1.2 Âm thanh và số hóa âm thanh 14

1.2.1 Âm thanh 14

1.2.2 Các tham số của sóng âm 15

1.2.3 Số hóa âm thanh 17

1.3 Tổng quan về âm nhạc 20

1.3.1 Nốt nhạc 21

1.3.2 Bát độ 22

1.4 Các phương pháp phân loại nhạc 25

1.5 Biến đổi Fourier rời rạc 26

CHƯƠNG 2 THUẬT TOÁN K – NEAREST NEIGHBOR ĐỂ PHÂN LOẠI NHẠC THEO THỂ LOẠI 29

2.1 Khai phá dữ liệu 29

2.2 Phân lớp 30

2.3 Mô tả thuật toán phân lớp k – Nearest Neighbor 32

2.4 Phân lớp K – Nearest Neighbor 33

CHƯƠNG 3 XÂY DỰNG ỨNG DỤNG PHÂN LOẠI NHẠC THEO THỂ LOẠI 36

3.1 Giới thiệu bài toán 36

3.2 Thuật toán 37

3.2.1 Trích rút đặc trưng 37

3.2.2 Các đặc trưng liên quan đến bố cục âm sắc (Timbral Texture Features) 38

Trang 6

6

3.2.3 Cân bằng hệ số các đặc trưng liên quan đến bố cục âm sắc 41

3.2.4 Khoảng cách giữa hai mẫu 42

3.2.5 Huấn luyện nhận dạng 43

3.3 Xây dựng chương trình 43

KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 49

TÀI LIỆU THAM KHẢO 51

Trang 7

7

DANH MỤC HÌNH

Hình 1.1 Sự truyền chuyển động của các phần tử khí 14

Hình 1.2 Sóng âm truyền theo mọi hướng 15

Hình 1.3 Chất điểm M dao động xung quanh vị trí cân bằng 15

Hình 1.4 Sóng âm thanh 18

Hình 1.5 Giai đoạn lấy mẫu 19

Hình 1.6 Độ phân giải 20

Hình 1.7 Chu kì các lớp nốt 22

Hình 1.8 Mô hình biểu diễn vùng bát độ 23

Hình 1.9 Mô hình biểu diễn các mức bán âm trong 1 bát độ 23

Hình 1.10 Khoảng cách giữa các pitch class tương ứng với tỷ lệ tần số 24

Hình 1.11 Tín hiệu x1(t) 26

Hình 1.12 Tín hiệu X1(f) - biến đổi Fourier của x1(t) 27

Hình 1.13 Tín hiệu x2(t) 27

Hình 1.14 Tín hiệu X2(t) – biến đổi Fourier của x2(t) 28

Hình 2.1 Phương pháp phâp loại k – nearest neighbor 33

Hình 2.2 Phương pháp phân loại 35

Hình 3.1 Sơ đồ xác định tín hiệu nhạc từ tín hiệu radio 37

Hình 3.2 Sơ đồ một vector đặc trưng từ một tín hiệu nhạc 38

Hình 3.3 Sơ đồ xác định các đặc trưng liên quan đến bố cục âm sắc 38

Hình 3.4 Kết quả thử nghiệm với 10 thể loại 45

Hình 3.5 Biểu đồ tương quan độ chính xác phân loại 10 thể loại 46

Hình 3.6 Trích xuất giá trị các đặc trưng 46

Hình 3.7 Phân loại với 10 thể loại (1) 47

Hình 3.8 Phân loại nhạc với 10 thể loại (2) 48

Trang 8

Như chúng ta đã biết, với số lượng lớn các bài nhạc sưu tầm được thì việc sưu tầm nhạc có thể tiến hành từ nhiều nguồn, với nhiều nguồn chất lượng âm thanh khác nhau, cũng như thông tin về từng bài nhạc tải về cũng có mức độ chính xác khác nhau, nên việc phân loại nhạc chỉ dựa vào những thông tin lưu giữ trên tập tin lưu trữ còn gặp nhiều hạn chế Thay vì chỉ dựa vào những thông tin có sẵn, người sưu tầm có thể nghe lại từng bài và tự phân loại chúng, tuy nhiên với số lượng lớn các bài nhạc thì việc làm này không khả thi Điều này đã làm nảy sinh nhu cầu tự động phân loại nhạc trong các hệ thống lưu trữ âm nhạc

Các hệ thống tự động phân loại nhạc là rất cần thiết, nó hỗ trợ hoặc thay thế con người trong việc phân loại nhạc, truy tìm thông tin nhạc trên internet, Bên cạnh đó, việc phân loại nhạc tự động cung cấp cơ sở khoa học cho việc phân tích dựa trên nội dung của tín hiệu âm nhạc

Chính vì những lý do trên, cộng với những kiến thức đã tìm hiểu từ môn Trí tuệ nhân tạo, em đã chọn đề tài "Áp dụng thuật toán K-Nearest Neighbor để phân loại nhạc theo thể loại" làm đề tài khóa luận

2 Mục đích nghiên cứu

Dựa vào thuật toán K-nearest neighbor để phân loại nhạc theo thể loại

3 Nhiệm vụ nghiên cứu

 Thu thập các đặc trưng của từng thể loại nhạc

Trang 9

9

 Xác định khoảng cách giữa các vetor đặc trưng của tín hiệu cần phân loại với các vetor đặc trưng láng giềng gần nó Từ đó xác định thể loại nhạc dựa vào thể loại nhạc của vetor gần nó nhất

 Xây dựng chương trình và đánh giá kết quả phân loại

4 Đối tượng nghiên cứu

Nghiên cứu với 10 thể loại nhạc: Blues, Classical, Country, Disco, Hiphop, Jazz, Metal, Pop, Regguage, Rock

5 Phạm vi nghiên cứu

Các đặc trưng chung và riêng của 10 thể loại nhạc được chọn nghiên cứu

6 Ý nghĩa kha học và ý nghĩa thực tiễn của đề tài

Phân loại nhạc tự động là cơ sở khoa học cho việc phân tích các tín hiệu audio Việc sử dụng thuật toán K – Nearest Neighbor để phân loại nhạc theo thể loại, rút ngắn được thời gian thực hiện và mang lại kết quả chính xác cao

Các hệ thống phân loại nhạc tự động là rất cần thiết, nó hỗ trợ hoặc thay thế con người trong việc sưu tập nhạc, truy tìm thông tin trên internet, Bên cạnh đó, nó cung cấp các đặc trưng quan trọng của các tín hiệu audio phục vụ cho các hệ thống truy tìm thông tin, chú thích tự động các tập tin nhạc, nhận dạng giọng nói phục vụ trong điều tra,

7 Phương pháp nghiên cứu

 Phương pháp nghiên cứu lí luận:

Nghiên cứu qua việc đọc sách, báo và các tài liệu liên quan nhằm xây dựng cơ sở lý thuyết của đề tài và các biện pháp cần thiết để giải quyết các vấn

đề của đề tài

 Phương pháp thực nghiệm:

Thông qua quan sát thực tế, yêu cầu của cơ sở, những lý luận được nghiên cứu và kết quả đạt được qua những phương pháp trên

Trang 10

10

 Phương pháp chuyên gia:

Tham khảo các ý kiến của các chuyên gia để có thể thiết kế chương trình phù hợp với yêu cầu thực tiễn Nội dung xử lý nhanh đáp ứng được yêu cầu ngày càng cao của người sử dụng

8 Cấu trúc khóa luận

Ngoài phần mở đầu, kết luận và phương hướng phát triển cấu trúc khóa luận gồm có các chương sau:

Chương 1: Cơ sở lí thuyết

Chương 2: Thuật toán K- Nearest Neighbor để phân loại nhạc theo thể loại Chương 3: Xây dựng ứng dụng phân loại nhạc theo thể loại

Trang 11

âm thanh hài hòa hay đối chọi nhau Vào khoảng năm 500 TCN, ông đã tìm ra mối quan hệ mật thiết giữa toán học và âm nhạc, đưa ra một hệ thống những nốt nhạc bắt tai và hài hòa khi đứng chung với nhau, được gọi là thang âm (scale)

Dù trải qua một quá trình lịch sử lâu dài, thang âm của Pythagoras được cho là rất sát với thang âm cơ bản nhất được sử dụng ngày nay “đô rê mi fa son la si đô” Phát hiện của Pythagoras đã đặt nền móng cơ bản nhất cho lịch sử âm nhạc

mà nếu không có nó, có lẽ cũng không thể có những Beethoven, Mozart hay âm nhạc hiện đại

Sự khởi đầu của nhạc điện tử là vào năm 1948, một người Pháp tên Pierre Schaeffer đã sản xuất được một mẫu nhạc mới đầu tiên, gọi là musique concrete

- một tổ hợp âm thanh từ môi trường xung quanh và những âm thanh vô giai điệu Mẫu nhạc ấy là sản phẩm của công nghệ, được tạo ra và truyền bá bằng phương tiện điện tử

Schaeffer tiếp tục nghiên cứu và làm việc cùng với nhà soạn nhạc Karlheinz Stockhausen ở phòng thu Cologne, Paris Cologne trở thành phòng nghiên cứu nhạc điện tử nổi tiếng nhất với việc sản xuất ra thiết bị synthesizer (tạm dịch: nhạc cụ tổng hợp) đặt tiền đề cho những nhạc cụ điện tử hiện đại sau này

Các nhạc cụ tổng hợp tiếp tục được sử dụng bởi những ban nhạc Rock, từ đó trở nên một phần thiết yếu cho việc sản xuất các thể loại nhạc như hip-hop và

Trang 12

Xử lí âm thanh được định nghĩa nguồn gốc được sử dụng trong giới học thuật

để chỉ đến các vấn đề liên quan đến kĩ thuật tính toán dựa vào cấu tạo của âm nhạc Nó bao hàm những lí thuyết và ứng dụng mới hay kĩ thuật đã tồn tại trong

âm nhạc như tổng hợp âm thanh, xử lí tín hiệu số, thiết kế âm thanh, truyền âm tính, độ vang… Phạm vi của tính toán âm nhạc có thể tính là nguồn gốc của nhạc điện tử (nhạc số), những thử nhiệm ban đầu và sáng tạo với nhạc dụng cụ điện tử trong thế kỉ 20 Gần đây với sự phát triển của của máy tính cá nhân và sự phát triển của các phòng thu tại nhà, tính toán âm nhạc đôi lúc còn được sử dụng để chỉ đến mọi thứ âm thanh đã được tạo ra nhờ sử dụng kĩ thuật tính toán

Máy tính đầu tiên trên thế chơi được nhạc là CSIRAC, nó được thiết kế và xây dựng bởi Trevor Pearcey và Maston Beard Nhà toán học Geoff Hill đã lập trình CSIRAC để có thể chơi được các nhạc điệu thông dụng của đầu thập kỉ những năm 1950 Trong lần công bố vào năm 1951 nó đã chơi bản nhạc Colonel Bogey March, đáng tiếc là hiện không có bản thu nào được biết đến Tuy nhiên, CSIRAC chỉ chơi theo những chuẩn từ trước và nó không thể mở rộng để có thế hiểu về âm nhạc hay cấu tạo của bài nhạc mà nó được học

Trang 13

sử dụng chương trình với các thuật toán là khả thi

Truy vấn thông tin nhạc (Music Information Retrieval – MIR) là một nhánh

nhỏ của xử lý âm thanh, MIR liên quan đến việc quản lý thư viện nhạc số, nó bao gồm nhiều vấn đề nhỏ như:

 Phân loại, mô hình hóa âm nhạc

 Phương pháp hình thức và lưu trữ âm nhạc

 Phần mềm truy vấn thông tin âm nhạc

 Giao diện tương tác giữa con người và máy tính

 Cho máy tính có thể “cảm thụ” âm nhạc

 Phân tích và tái hiện lại tri thức

 Lưu trữ âm nhạc, thư viện nhạc kĩ thuật số

Ý tưởng ban đầu về kĩ thuật truy vấn thông tin âm nhạc xuất hiện vào những năm 1966 Tuy nhiên vấn đề chỉ thực sự được tìm hiểu tỉ mỉ gần đây khi bùng nổ

sở thích sưu tầm âm nhạc qua mạng với hình thức nhạc điện tử, mọi thứ còn phát triển nhanh hơn nữa khi các định dạng nhạc nén ra đời như MP3, các dịch vụ chia sẻ âm nhạc như Napster ra đời

Trang 14

tử khí, mà ta gọi là sóng âm Nói như vậy có nghĩ là âm thanh chỉ lan truyền trong môi trường vật chất Không có sóng âm trong chân không

Các kết quả thực nghiệm cho thấy sóng âm là sóng dọc, tức là các phần tử khí dao động như lò xo (phương chuyển động trùng với phương truyền sóng)

Hình 1.1 Sự truyền chuyển động của các phần tử khí Hình 1.1 giải thích một cách trực quan mô hình sóng Trên đó A, B, C, D là các phần tử khí Giả sử sóng âm truyền từ trái sang phải Khi đó dao động của A xung quanh vị trí cân bằng sẽ dẫn đến dao động của B, rồi dao động của B dẫn đến dao động của C,

Tất nhiên dao động của A không chỉ dẫn đến dao động của B, mà còn dẫn đến dao động của các phần tử khí gần nó, như Hình 1.2 Chính vì vậy sóng âm được truyền đi khắp mọi hướng

Trang 15

15

Hình 1.2 Sóng âm truyền theo mọi hướng Khi nói thanh quản đóng vai trò là nguồn phát sinh sóng Thanh quản rung, truyền động năng cho các phần tử khí khác gần nó Kết quả là ta thu được các sóng âm truyền theo mọi hướng, trong đó hướng thẳng là hướng sóng âm mạnh nhất Các sóng âm này được duy trì liên tục trong khi thanh quản còn rung

Khi sóng âm đến tai, nó bị màng nhĩ cản lại Kết quả là động năng của các phần tử khí phía trước màng nhĩ được truyền cho màng nhĩ làm nó dao động Vì màng nhĩ được kết nối với các dây thần kinh từ não nên dao động của màng nhĩ

sẽ phát sinh ra các xung thần kinh Các xung thần kinh này được truyền đến não và ta có được cảm giác nghe

1.2.2 Các tham số của sóng âm

Cũng giống các loại sóng cơ học khác, sóng âm cũng có biên độ và tần số dao động

D"

C"

Trang 16

16

Xét một phần tử khí tại điểm M trong không gian như Hình 1.3 phần tử khí này dao đông xung quanh vị trí cân bằng trên phương truyền sóng Phương trình truyền sóng của M có thể xem là:

𝑥 = 𝐴1sin 2𝜋𝑓𝑡 (1.1)

Trong đó A là biên độ và f là tần số Đồ thị của hàm x được cho bởi Hình 1.4

Theo (1.1) thì biên độ A chính là độ dịch chuyển lớn nhất của các phần tử ra khỏi vị trí cân bằng của nó Như vậy, nó mang ý nghĩ là độ mạnh hay cường độ

dao động của sóng Tần số dao động của sóng ở (1.1) là f , tức là số chu kỳ mà

sóng dao động trong 1 giây Nếu sóng có biên độ càng lớn thì sự biến thiên ly độ

của một chất điểm càng nhanh Do đó, tần số f mang ý nghĩ là độ gấp của sóng

Tai người chỉ có thể cảm nhận được những sóng âm có tần số trong khoảng 16

Hz đến 20 000 Hz Những âm có tần số cao hơn 20 000 Hz gọi là siêu âm và những âm có tần số nhỏ hơn 16 Hz gọi là hạ âm

Cường độ âm cho ta cảm giác nghe thấy âm to hay nhỏ, mạnh hay yếu

Cường độ âm được định nghĩa là năng lượng được sóng âm truyền qua một đơn vị diện tích đặc vuông góc với phương truyền sóng trong một đơn vị thời gian Đơn vị đo cường độ âm là 𝑊

𝑚 2

Để so sánh cường độ của một âm với cường độ âm tiêu chuẩn, người ta dùng

đại lượng mức cường độ âm đo bằng đơn vị đê-xi-ben (dB) Mức cường độ âm

được định nghĩa bằng công thức:

Trang 17

, còn với tần số 50 Hz, ngưỡng nghe lớn gấp 10lần

5-Cảm giác nghe âm “to” hay “nhỏ” không những phụ thuộc vào cường độ âm

mà còn phụ thuộc vào tần số của âm Với cùng một cường độ âm, tai nghe được

âm có tần số cao “to” hơn âm có tần số thấp Do đó, phát thanh viên nữ nói nghe

rõ hơn phát thanh viên nam

Khi cường độ âm lên tới 10W/m2

ứng với cường độ âm 130dB thì sóng âm với mọi tần số gây cho tai ta cảm giác nhức nhối, đau đớn Giá trị cực đại của

cường độ âm mà tại ta có thể chịu đựng được gọi là ngưỡng đau Ngưỡng đau

ứng với mức cường độ âm là 130dB

1.2.3 Số hóa âm thanh

Đây là quá trình chuyển đổi sóng âm, tức là sóng cơ học thành dữ liệu số được lưu trữ trong máy tính Quá trình này được chia thành hai giai đoạn: chuyển đổi sóng âm thành tín hiệu điện và chuyển tín hiệu điện thành tín hiệu số

Tín hiệu điện là tín hiệu trung gian giữa tín hiệu cơ (sóng âm) và tín hiệu số

Sở dĩ ta chọn tín hiệu điện làm trung gian vì nó có thể truyền đi với khoảng cách

xa mà không làm mất thông tin, dòng điện có hiệu điện thế dao động điều hòa cũng giống như sóng âm, chính vì vậy mà ta có thể biểu diễn sóng âm bằng tín hiệu điện

Trang 18

18

Tín hiệu sóng âm thanh trong thế giới thực có dạng tương tự (analog) Do đó,

để có thể lưu trữ và biểu diễn trên các thiết bị máy tính sử dụng hệ tín hiệu nhị phân, chúng ta cần phải chuyển đổi tín hiệu analog sang tín hiệu số ( digital) Tín hiệu nhị phân không những được biểu diễn và sử dụng trên máy tính mà nó còn được ứng dụng trong rất nhiều các vật dụng khác mà chúng ta dùng hàng ngày như: điện thoại, máy nghe CD, máy nghe MP3,…

Các bước chuyển sang tín hiệu được thực hiện như sau:

Lấy mẫu (sampling)

Xét 1 tín hiệu âm thanh (hình 1.4) Trong đó:

Trục X biểu diễn cho miền thời gian tính theo đơn vị giây (s)

Trục Y biểu diễn cho cường độ tín hiệu tính theo đơn vị Voltage (V)

Hình 1.4 Sóng âm thanh

Lấy mẫu (sampling)

 Tiến hành lấy mẫu từ tín hiệu analog theo thời gian

Trang 19

 Hoành độ chính là thời gian t1,t2,

 Tung độ chính là con số chúng ta cần lưu trữ

 Độ phân giải (resolution)

 Như đã nói ở phần trên, mỗi lần lấy mẫu, chúng ta sẽ biểu diễn cường độ của tín hiệu bằng một con số

Trang 20

Âm nhạc là một môn nghệ thuật phối hợp âm thanh theo những quy luật nhất định Âm nhạc bắt nguồn từ những âm thanh trong cuộc sống Thế nhưng không phải âm thanh nào cũng là âm nhạc Mà chỉ âm thanh có tính nhạc Chúng phải có đủ 4 tính chất cơ bản sau:

 Cao độ: Mức độ trầm bổng của âm thanh

 Trường độ: Mức độ ngắn dài của âm thanh

Trang 21

21

 Cường độ: Mức độ mạnh nhẹ của âm thanh

 Âm sắc: Mặc dù âm thanh có giống nhau về cao độ, về trường độ, về cường độ, nhưng vẫn có những tính chất riêng biệt Tính chất riêng của

âm thanh được gọi là âm sắc

Từ những âm thanh có tính nhạc đó, lâu dần con người biết phối hợp việc lên xuống trầm bổng để tạo âm vực rộng và phong phú Và cũng từ đó mà âm nhạc được hình thành và phát triển

1.3.1 Nốt nhạc

Để cụ thể hóa đơn vị cao độ trong âm nhạc, người ta đã định nghĩa mỗi nốt nhạc là một giá trị đại diện cho một độ cao nhất định Nốt thấp nhất tương ứng với tần số thấp nhất khi nghe tiếng nhạc, khoảng từ 20-30Hz Nốt cao nhất tương

ứng với tần số cao nhất, khoảng từ 15-20KHZ

Lớp nốt là tên của 1 tiếng nhạc Có 12 lớp nốt được đặt tên là: C, C#, D, D#,

E, F, F#, G, G#, A, A# và B Các lớp nốt này tạo thành một chu trình Một đường đi vòng quay từ C-C#-D-D# và trở về C tạo thành chu trình gọi là 1 bát độ/quãng tám(Octave), nửa đường đi vòng quanh chu trình từ C đến F# gọi là

quãng năm

Trang 22

Từ hình Chu kì các lớp nốt, nếu nốt C4 có tần số là 261,6 Hz thì nốt C5 có tần số gấp đôi tần số của nốt C4 là 523,2Hz Cả C4 và C5 có cùng lớp nốt C

Để dễ hình dung, ta có thể xem các mức bán âm trong 1 bát độ tương ứng với các vị trí trên đồng hồ được biểu diễn trong hình Chu kì các lớp nốt

Trang 23

23

Hình 1.8 Mô hình biểu diễn vùng bát độ

Hình 1.9 Mô hình biểu diễn các mức bán âm trong 1 bát độ

C ở vị trí 12 giờ, C ở vị trí 1 giờ trên đồng hồ, … tạo thành một chu trình Sau đây là một số thông tin về tên các khoảng cách giữa các lớp nốt tương ứng với số bán âm và tỷ lệ giữa các tần số:

Trang 24

24

Hình 1.10 Khoảng cách giữa các pitch class tương ứng với tỷ lệ tần số

Khi một trong số các tiếng nhạc được chơi, chẳng hạn cặp C-F#, C#-G, người nghe sẽ có cảm nhận tiếng nhạc có khuynh hướng giảm dần Tuy nhiên, khi các tiếng nhạc khác được chơi, chẳng hạn F#-C, G-C#, G#-D sẽ có tiếng nhạc theo hướng tăng dần

Trang 25

25

1.4 Các phương pháp phân loại nhạc

Các hệ thống phân loại nhạc theo thể loại thường mô phỏng những kĩ năng của con người để chúng có thể nhận biết được thể loại của bản nhạc Tuy nhiên, chúng không thể phân loại nhạc chủ yếu dựa vào kinh nghiệm người nghe nhạc

mà cần thiết phải xác định một số đặc trưng chung, phục vụ cho việc nhận dạng thể loại nhạc

Một thể loại nhạc là một tập các đặc trưng mà người nghe nhạc có thể phân biệt nó với những loại nhạc khác, từ những bản nhạc khác nhau Đặc trưng của một thể loại nhạc được mô tả bởi đặc trưng về âm thanh của một nhạc cụ, nhịp nhạc và nhiều yếu tố khác ảnh hưởng đến việc phân loại nhạc Nhiều đặc trưng thuộc về tri giác dựa vào âm thanh nghe được, chẳng hạn như: độ cao thấp nốt nhạc (pitch), âm sắc (timbre), nhịp (rhythm) của một bản nhạc hoặc có những

đặc trưng liên quan đến bố cục nhạc (musical texture)

Việc phân loại thường gọi là học giám sát (supurvised learning), ngoài ra còn

có các dạng học khác là học không quan sát, học tăng cường (reinforcement learning) Có rất nhiều phương pháp phân loại như: K-nearest neighbor, Bayes,

HMMS, Neuron Net - work,

Phương pháp Bayes là phương pháp phân loại dựa vào công thức Bayes để

tính toán xác suất khả năng đối tượng thuộc về một lớp, chọn tối đa một xác suất hậu nghiệm của lớp như mục tiêu thuộc Phương pháp này được sử dụng trong phân loại văn bản, một bước trong nhận dạng khuôn mặt người, hay trong y học

nhằm phân loại tế bào

Phương pháp Neuron Net – work hay còn gọi là quá trình học của mạng

trong học giám sát bao hàm việc điều chỉnh, cập nhật ma trận trọng số sao cho ứng với tâp tín hiệu vào xác định, tín hiệu ra của mạng tiệm cận tới giá trị mong muốn

Ngày đăng: 24/09/2015, 08:48

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w