Lấy mẫu tín hiệu (signal sampling)

Một phần của tài liệu Giải quyết vấn đề nhận dạng tiếng Việt bằng phân tích cú pháp (Trang 50 - 52)

Tín hiệu là hàm vô hạn và liên tục theo thời gian, ví dụ như hàm sin(t) xác định từ -∞ đến +∞. Nhưng chúng ta chỉ thu thập một phần hữu hạn của tín hiệu và trong phần hữu hạn đó, ta cũng chỉ lấy một số các điểm cách đều nhau một khoảng hay các điểm rời rạc nhau. Do đó tín hiệu mà chúng ta nghiên cứu trong nhận dạng

là một dạng xấp xỉ hữu hạn (finite) và rời rạc (discrete) của tín hiệu thực tế. Quá trình thu thập phần xấp xỉ như vậy gọi là quá trình lấy mẫu. Kết quả của quá trình lấy mẫu là một mẫu, nghĩa là một tín hiệu hữu hạn rời rạc hay một chuỗi các giá trị. Xem trong [22] và [25]

Giả sử chúng ta cần lấy mẫu tín hiệu f(t) trong khoảng thời gian [t0, t1] theo cách trong 1 đơn vị thời gian chúng ta lấy F giá trị. Vậy khi thời gian t biến đổi trong đoạn [t0, t1], chỉ số i sẽ biến đổi trong đoạn [0, (t1-t0).F], và chúng ta có mối quan hệ

s[0] = f(t0 + 0/F) = f(t0 + 0) = f(t0) s[F] = f(t0 + F/F) = f(t0 + 1)

s[i] = f(t0 + i/F)

s[(t1-t0).F] = f(t0 + (t1-t0).F/F) = f(t1)

Cụ thể hơn, giả sử chúng ta cần lấy mẫu f(t) = A.sin(2.π.f.t) từ thời điểm t=0 đến thời điểm t =2 với số mẫu trong một giây là 44100. Chúng ta sẽ được một dãy số gồm 44100×2 = 88200 con số như sau

s[0] = A.sin(2.π.f.0/44100) = 0 s[1] = A.sin(2.π.f.1/44100) ... s[44100] = A.sin(2.π.f.44100/44100) = A.sin(2.π.f.1) s[44101] = A.sin(2.π.f.44101/44100) ... s[88200] = A.sin(2.π.f.88200/44100) = A.sin(2.π.f.2)

Do đó, khi lấy mẫu một tín hiệu chúng ta không những cần quan tâm đến các tham số của tín hiệu mà còn cần quan tâm đến các thông số lấy mẫu, ví dụ như tần số lấy mẫu F, thời gian lấy mẫu D, độ phân giải mẫu B. Tần số lấy mẫu F là số mẫu cần lấy trong một đơn vị thời gian. Thời gian lấy mẫu D là khoảng thời gian cần thiết để lấy mẫu, tỷ lệ thuận với số lượng giá trị lấy được. Và độ phân giải mẫu B sẽ quyết định kích thước của mỗi giá trị. Chúng ta sẽ chấp nhận các giá trị của B với ý nghĩa như sau

Giá trị Giải thích

MONO8 Một kênh, mỗi giá trị dài 8(bit), mỗi mẫu chiếm 1(byte) STEREO8 Hai kênh, mỗi giá trị dài 8(bit), mỗi mẫu chiếm 2(byte) MONO16 Một kênh, mỗi giá trị dài 16(bit), mỗi mẫu chiếm 2(byte) STEREO16 Hai kênh, mỗi giá trị dài 16(bit), mỗi mẫu chiếm 4(byte)

Bảng 3-1. Các giá trị của độ phân giải mẫu

Một phần của tài liệu Giải quyết vấn đề nhận dạng tiếng Việt bằng phân tích cú pháp (Trang 50 - 52)

Tải bản đầy đủ (PDF)

(107 trang)