Cơ sở lý thuyết

Một phần của tài liệu Nhận dạng bản nhạc dựa trên việc phân tích ký âm (Trang 39 - 40)

4. Phạm vi luận án Error! Bookmark not defined.

4.1.Cơ sở lý thuyết

Như đã đề cập trong chương 3 về khuôn dạng lưu trữ file âm thanh số, dữ liệu âm thanh có thể được lưu trữ ở nhiều định dạng khác nhau, và tùy vào mục đích yêu cầu làm gì mà ta chọn cách lưu trữ sao cho đáp ứng được với nhu cầu cụ thể của từng ứng dụng. Với mục đích tạo một cơ sở dữ liệu gồm các bản nhạc, phục vụ cho việc tìm kiếm tên bài hát sau này, sẽ đòi hỏi một số yêu cầu như: tốc độ tìm kiếm nhanh, dữ liệu đối chiếu so sánh phải chứa được đặc trưng của bài hát đó…

Để giải quyết vấn đề đó, thì sự lựa chọn file định dạng midi là không thể chối bỏ, trong tất cả các khuôn dạng lưu trữ thì file dạng midi chiếm một dung lượng rất nhỏ, nhỏ hơn 100 lần so với file mp3, 1000 lần với file wav,…khi lưu trữ cùng một bài hát, với dung lượng nhỏ như vậy thì ta có thể tạo ra một cơ sở dữ liệu chứa hàng trăm đến hàng ngàn bài hát và khi thực hiện bước tìm kiếm sẽ giải quyết được vấn đề về tốc độ. Điểm thứ 2 là về nội dung mà file midi lưu trữ, không giống như file wav, lưu trữ bài hát đã được play và lưu chúng dưới dạng các mẫu đã được lượng tử hóa từ sóng âm thanh, như vậy sẽ rất khó để ta biết được đâu là đặc trưng của bài hát( nốt nhạc nào và thơi gian tồn tại ), … trái lại, với file midi, dữ liệu mà file midi chứa đựng sẽ dễ dàng cho ta biết được các đặc trưng bài hát (ký âm và thời gian), ví dụ như khi ta bắt gặp kiểu event là 0x90 thì ta sẽ biết được byte dữ liệu tiếp theo là tên nốt nhạc được phát, và thời gian tồn tại của chúng là khoảng delta time tiếp theo của event đứng phía sau nó,…

Như vậy với định dạng file midi là đáp ứng được những yêu cầu của ứng dụng, tuy nhiên bên cạnh đó có rất nhiều dữ liệu trong file midi là không cần thiết, dư thừa. Chẳng hạn như ta chỉ cần lấy thông tin khi nào một nốt nhạc được bật lên, khi nào nó được tắt đi, đó gọi là ký âm của bản nhạc, còn đối với những dữ liệu điều khiển chuyển kênh phát, các

tố nữa đó là sự rắc rối nằm ở delta time trong file midi, … Chính vì thế mà ta cần phải xây dựng một định dạng riêng cho cơ sở dữ liệu của mình dựa trên những ưu điểm sẵn có từ file midi. Nói tóm lại, là ta sẽ rút trích những thông tin cần thiết từ file midi, đơn giản hóa những sự rắc rối trong file midi, ghi ra một file mới ( định dạng mới), và đặt tên file đó là *.3t. Cơ sở dữ liệu sẽ là tập các file bài hát theo định dạng *.3t.

Một phần của tài liệu Nhận dạng bản nhạc dựa trên việc phân tích ký âm (Trang 39 - 40)