IV.1 MÔI TRƯỜNG LẬP TRÌNH SDK ĐỐI VỚI TRUYỀN ÂM THANH

Một phần của tài liệu Thiết kế chương trình truyền tiếng nói qua mạng LAN thông qua sự trợ giúp của công cụ SDKXây dựng ứng dụng truyền thông âm thanh trên mạng cục bộ (Trang 39 - 58)

Môi trường Windows SDK là môi trường lập trình đa phương tiện dưới Windows, cung cấp các hàm cấp thấp rất thích hợp cho các ứng dụng trên mạng. Một cách thức đơn giản nhất trong việc xuất dữ liệu waveform ra loa là dùng hàm PlaySound. Chúng ta có thể thao tác với dạng dữ liệu waveform bằng các hàm cấp thấp do hệ thống cung cấp. Ngoài ra hệ thống còn cung cấp một cơ chế giúp người lập trình giao tiếp dễ dàng hơn với thiết bị, đó là các hàm MCI. [6]

IV.1.1 CẤU TRÚC FILE WAVE VÀ HÀM PLAYSOUND

IV.1.1.1 Cấu trúc file âm thanh wave

Một file wave thật sự là một phần của một lớp file lớn hơn dùng bởi các hàm multimedia của windows là các file RIFF ( Resource Interchange File Format). Một file Riff bao gồm một hoặc nhiều chunk. Trong mỗi chunk có con trỏ chỉ đến chunk kế tiếp. Mỗi chunk có một mô tả kiểu theo sau bởi một số dữ liệu. Một ứng dụng để đọc các file RIFF có thể bước qua một số chunk, đọc các chunk cần quan tâm và bỏ qua các chunk không liên quan. Chunk file RIFF luôn luôn bắt đầu bằng header sau:

Typedef struct {

FOURCC ckID; DWORD cksize;

Trong đó:

FOURCC là một vùng 4 bytes định nghĩa loại chunk. Vùng này sẽ chứa từ WAVE đối với file wave.

ckSize đặc tả kích thước dữ liệu trong chunk, sau header này chúng ta sẽ tìm thấy cSize bytes dữ liệu.

Các chunk có thể chứa các subchunks. Cấu trúc thật sự một file wave cơ bản bao gồm một chunk fmt theo sau là một chunk dữ liệu. Có thể có những chunk khác phía sau chunk WAVE nhưng thiết bị sử dụng file WAVE sẽ bỏ qua các chunk này. Hình sau mô tả cấu trúc file RIFF chứa dữ liệu WAVE.

ID SIZE FROM TYPE "fmt" SIZE "data" SIZE

Hai subchunk trong chunk wave đặc tả thông tin về một âm thanh file wave và sau đó là chính dữ liệu âm thanh. Chunk fmt chứa chủ yếu đối tượng

WAVEFORMAT và một số dữ liệu thêm vào gắn ở cuối chunk. Một đối tượng WAVEFORMAT được định nghĩa như sau :

Typedef struct waveformar_tag{

WORD wFormatTag; WORD nChannels; DWORD nSamplesPerSec; DWORD nAvgBytesPerSec; WORD nBlockAlign; } WAVEFORMAT; Trong đo :

wFormatTag : Chứa hằng WAVE_FORMAT_PCM được định nghĩa trong MMSYSTEM.H như sau:

# define WAVE_FORMAT_PCM1

Giá trị WAVE_FORMAT_PCM báo cho phần mềm đọc file wave biết cách âm thanh trong nó được mã hoá.

nChannels : Của đối tượng WAVEFORMAT có 2 giá trị :  1 đối với âm thanh mono.

 2 đối với âm thanh stereo.

nSamplePerSec : Cho biết tần số lấy mẫu của âm thanh để có thể thu và phát cùng một tốc độ, giá trị thông thường của field này nhận một những giá trị sau:

22055 - 22,050Khz 44100 - 44,1 Khz

nAvgBytesPerSec : Cho biết số bytes trung bình trong mỗi giây để thu và phát dữ liệu wave.

nBlockAlign : Xác định số bytes yêu cầu chứa trong một mẫu

 Những mẫu có độ phân giải nhỏ hơn hoặc bằng 8 bits có thể lưu vào 1 bytes.

 Những mẫu có độ phân giải từ 9 đến 16 bits yêu cầu 2 bytes. Những mẫu stereo yêu cầu số bytes gấp đôi những mono.

Trong cấu trúc trên không định nghĩa số bits thật sự trong một mẫu dữ liệu âm thanh file wave, để định nghĩa số bits trong một mẫu ta dùng cấu trúc sau:

Typedef struct pvmwaveformat_tag{ WAVEFORMAT wf;

WORD wBitsPerSample; } PCMWAVEFORMAT;

Trong đó:

wf: Đối với dữ liệu subchunk fmt của một chunk WAVE chúng ta thật sự làm việc với đối tượng PCMWAVEFORMAT. (adsbygoogle = window.adsbygoogle || []).push({});

nBitsPerSample: Xác định số bits thật sự trong một mẫu .

Trong một mẫu mono 8 bits dữ liệu của chunk dữ liệu gồm một chuỗi dài có giá trị 1 byte. Những mẫu stereo được chia ra với byte đầu dùng cho kênh bên trái

và byte thứ hai dùng cho kênh bên phải, như vậy mỗi mẫu stereo 8 bits sẽ cần 2 bytes.[6]

Để làm việc với một file RIFF bao gồm các bước sau : Mở file.

Vào chunk cần thiết.

Chuyển con trỏ file vào vị trí bắt đầu dữ liệu của chunk. Hoàn tất, ra khỏi chunk.

Vào chunk kế tiếp.

IV.1.1.2 Hàm Playsound

Chúng ta dùng hàm PlaySound để play dữ liệu dạng waveform hoặc chúng ta có thể dùng hàm sndPlaySound. Tuy nhiên trong môi trường Win32 thì nên dùng hàm PlaySound.

Hàm PlaySound cho phép chúng ta chỉ định các thông số nguồn âm thanh theo các cách sau:

• Dùng tên alias khai báo trong file WIN.INI

• Dùng tên file.

• Dùng chỉ số nhận dạng tài nguyên

Waveform-Audio Files

Ví dụ dưới đây minh họa cho việc phát file âm thanh “AmThanh.WAV” PlaySound("C:\\SOUNDS\\AmThanh.WAV", NULL, SND_SYNC);

Play sound theo các hiện tượng

Hàm PlaySound còn cho phép chúng ta xuất âm thanh tùy theo một sự kiện nào đó xảy ra trong hệ thống như click mouse hay nhấn một phím nào đó. Hệ thống sẽ phát âm thanh tùy theo hiệc tượng xảy ra để cảnh báo người sử dụng. Am thanh dạng này được gọi là sound events.

Để xác định sound event, hàm PlaySound sẽ được gọi với thông số pszSound trỏ đến bảng đăng ký sự kiện. Ví dụ chúng ta sẽ gọi hàm PlaySound ứng với sự kiện mouse click như sau:

PlaySound("MouseClick", NULL, SND_SYNC);

IV.1.2 GIAO TIẾP AUDIO VỚI BẰNG CÁC DỊCH VỤ CẤP THẤP

Trong phần này chúng ta sẽ khảo sát việc giao tiếp với thiết bị audio bằng các hàm cấp thấp, các hàm này phù hợp với các ứng dụng cần giao tiếp. Các hàm và cấu trúc cấp thấp này đều có prefix là wave.[6]

Thiết bị và dữ liệu

Khi muốn giao tiếp với thiết bị, chúng ta phải mở thiết bị để sử dụng và sau khi sử dụng xong thì phải đóng thiết bị lại. Trong khi sử dụng chúng ta sẽ truy xuất các tính năng của thiết bị và theo dõi thiết bị thực thi bằng các handles và Identifiers.

IV.1.3 SỬ DỤNG CÁC THIẾT BỊ XUẤT NHẬP, HỖ TRỢ WAVEFORM AUDIO

Chúng ta dùng hàm waveOutOpen để mở thiết bị đầu ra nhằm xuất dữ liệu dạng waveform. Hàm sẽ mở thiết bị waveOut và trả handle về cho ứng dụng. Hệ thống multimedia sẽ hỗ trợ nhiều dạng output dữ liệu khác nhau do đó khi mở thiết bị nếu cần chúng ta phải chỉ định rõ thông số dữ liệu. Ví dụ chúng ta dùng cờ WAVE_MAPPER để xác định thiết bị output sẽ xuất âm thanh dạng waveform.

Dò tìm thiết bị

Windows cung cấp các hàm sau giúp chúng ta xác định các thiết bị trong hệ thống phù hợp cho yêu cầu của mình.

Hàm Chức năng

AuxGetNumDevs Truy xuất số lượng các thiết bị sẵn có trong hệ thống

WaveInGetNumDevs Truy xuất số lượng các thiết bị nhập hỗ trợ waveform audio sẵn có trong hệ thống WaveOutGetNumDev (adsbygoogle = window.adsbygoogle || []).push({});

s

Truy xuất số lượng các thiết bị xuất hỗ trợ waveform audio sẵn có trong hệ thống

Các thiết bị khai báo trong hệ thống được đánh các chỉ số nhận dạng bắt đầu từ 0. Sau khi xác định số lượng các thiết bị sẵn có trong hệ thống, chúng ta

Hàm Chức năng

AuxGetDevCaps Truy xuất khả năng của thiết bị xuất

WaveInGetDevCaps Truy xuất khả năng của thiết bị nhập dạng waveform

WaveOutGetDevCaps Truy xuất khả năng của thiết bị xuất dạng waveform

Các hàm truy xuất này sẽ truy xuất này sẽ lấy các cấu trúc liên quan đến khả năng của thiết bị. Các cấu trúc dưới đây sẽ tương ứng với các hàm liệt kê ở trên:

Hàm Structure

AuxGetDevCaps AUXCAPS

WaveInGetDevCaps WAVEINCAPS WaveOutGetDevCaps WAVEOUTCAPS

Thiết bị waveform có khả năng hỗ trợ các dạng format không chuẩn. Dạng format không chuẩn này được dùng trong cấu trúc WAVEFORMATEX.

Handle và Identifier của thiết bị

Khi mở thiết bị, chúng ta sẽ nhận được handle hay thông số Identify của thiết bị. Chúng ta sẽ điều khiển thiết bị qua các thông số này.

Sự khác biệt giữa handle và identify là khó thấy nhưng rất quan trọng.

Identitier của thiết bị được chỉ định ngầm định từ số lượng các thiết bị sẵn có trong hệ thống. Identifier sẽ được trả về khi chúng ta dùng các hàm auxGetNumDevs, waveInGetNumDevs, or waveOutGetNumDevs Hàm.

Handle của thiết bị là thông số trả về của device driver khi chúng ta dùng các hàm waveInOpen hay waveOutOpen.

Waveform-Audio Output Data Types

Các thông số dưới đây được dùng cho thiết bị waveform output

Cấu trúc Chức năng

HWAVEOUT Handle của thiết bị waveform output WAVEFORMATE

X

Cấu trúc dùng chỉ định dạng format thiết bị output/ input

WAVEHDR Cấu trúc dùng làm header cho khối dữ liệu waveform. Cấu trúc được dùng cho cả thiết bị output và input

WAVEOUTCAPS Cấu trúc dò hỏi khả năng của thiết bị output.

Chỉ định dạng format của dữ liệu waveform audio

Khi chúng ta mở thiết bị output bằng hàm waveOutOpen, thông số pwfx sẽ chỉ định cấu trúc WAVEFORMATEX xác định dạng format của dữ liệu waveform. Đây là cấu trúc mở rông của cấu trúc WAVEFORMAT.

Ghi dữ liệu waveform

Sau khi mở thiết bị xuất, chúng ta có thể xuất dữ liệu bằng cách gọi hàm waveOutWrite. Hàm sẽ gửi khối dữ liệu âm thanh ra thiết bị xuất. Chúng ta

Header này gồm con trỏ tới khối dữ liệu đã lock, chiều dài khối dữ liệu và một số thông số cờ. Khối dữ liệu phải được prepare trước khi đem ra sử dụng. (adsbygoogle = window.adsbygoogle || []).push({});

Sau khi gửi khối dữ liệu đến thiết bị output, chúng ta phải chờ driver hoàn tất việc xử lý khối dữ liệu trước khi giải phóng nó. Khi chúng ta cần gửi nhiều khối dữ liệu liên tục, chúng ta sẽ phải theo dõi việc xử lý hoàn tất khối dữ liệu để có thể gửi khối tiếp theo.

PCM Waveform-Audio Data Format

Thông số lpData trong cấu trúc WAVEHDR sẽ trỏ đến dữ liệu đã được lấy mẫu. Đối với dữ liệu PCM 8-bit, mỗi giá trị lấy mẫu được biểu diễn bằng một số 8 bit không dấu. Đối với dữ liệu PCM 16-bit, mỗi giá trị lấy mẫu được biểu diễn bằng một số 16 bit không dấu. Bảng dưới đây cho chúng ta thấy các giá trị cao nhất, thấp nhất cũng như giá trị trung bình của dữ liệu PCM:

Data format Maximum value Minimum value Midpoint value 8-bit PCM 255(0xFF) 0 128 (0x80) 16-bit PCM 32,767 (0x7FFF) -32,768 (0x8000) 0

Các gói dữ liệu PCM

Thứ tự của dữ liệu thay đổi tùy theo dạng format 8-bit hay 16-bit, stereo hay mono. Bảng dưới đây trình bày các gói dữ liệu của các dạng PCM khác nhau:

PCM waveform

Chức năng

8-bit mono Mỗi giá trị lấy mẫu là 1 byte tương ứng một kênh. Các giá trị mẫu xếp theo thứ tự 1, 2, 3, 4 . . .

8-bit stereo Mỗi giá trị lấy mẫu là 2 byte. Các giá trị mẫu xếp theo thứ tự 1, 2, 3, 4 . . . Với mỗi giá trị mẫu byte đầu là kênh 0 (trái) còn byte sau là kênh 1 (phải). 16-bit mono Mỗi giá trị lấy mẫu là 2 byte. Các giá trị mẫu xếp

theo thứ tự 1, 2, 3, 4 . . . Với mỗi giá trị mẫu byte đầu là byte thấp của kênh 0 còn byte sau là byte cao của kênh 0.

16-bit stereo Mỗi giá trị lấy mẫu là 4 byte. Các giá trị mẫu xếp theo thứ tự 1, 2, 3, 4 . . . Với mỗi giá trị mẫu byte đầu là byte thấp của kênh 0 (trái), byte thứ 2 là byte cao của kênh 0, byte thứ 3 là byte thấp của kênh 1 (phải) còn byte thứ 4 là byte cao của kênh 1.

Đóng thiết bị waveform-Audio Output

Sau khi thực thi công việc xong, chúng ta sẽ gọi hàm waveOutClose để đóng thiết bị. Khi thiết bị đang thực thi mà gọi hàm này thì lỗi sẽ xảy ra. Nếu

waveOutReset trước khi đóng thiết bị. Nhưng trước đó cũng cần gọi hàm waveOutUnprepareHeader để unprepare tất cả các khối dữ liệu.

Playing Waveform-Audio Files

Chúng ta có thể dùng các hàm sau đây để xuất dữ liệu dạng âm thanh ra loa:

Hàm Chức năng

MessageBeep Xuất âm thanh dưới dạng thông báo của hệ thống SndPlaySound Xuất âm thanh dưới dạng đăng ký trước trong hệ

thống hay là nội dung của một file wave

PlaySound Giống như hàm trên và thêm cơ chế truy xuất trực tiếp tài nguyên.

Các hàm PlaySound và sndPlaySound sẽ nạp hoàn toàn nội dung file wave vào bộ nhớ và xuất ra ngõ output. Khả năng bộ nhớ của chúng có giới hạn nên chúng chỉ quản lý được các nội dung dưới 100KB. Khi làm việc với các file có nội dung lớn hơn thì chúng ta có thể sử dụng các dịch vụ do MCI cung cấp.

Sử dụng Windows message trong việc quản lý khi playback

Các Thông báo dưới đây có thể được sử dụng trong quá trình xuất dữ liệu:

Thông báo Chức năng

E waveOutClose

MM_WOM_DONE Được gửi đi sau khi driver hoàn tất việc xuất dữ liệu bằng hàm wafveOutWrite.

MM_WOM_OPEN Được gửi đi khi thiết bị được mở bằng hàm waveOutOpen.

Các thông số wParam và lParam cũng rất cần thiết. Thông số wParam luôn luôn xác định handle của thiết bị waveform-audio. Đối với thông số lParam, Thông báo MM_WOM_DONE dùng thông số này trỏ tới cấu trúc WAVEHDR chỉ định sụ hoàn tất của dữ liệu trong khi thông số này không được hai Thông báo còn lại dùng. Việc dùng này rất hữu hiệu, Thông báo MM_WOM_DONE sẽ là tín hiệu được báo về sau khi việc playback khối dữ liệu hoàn tất. Ta sẽ tiếp nhận Thông báo này và giải phóng các biến có liên quan.

Thay đổi volume của quá trình playback dữ liệu waveform audio (adsbygoogle = window.adsbygoogle || []).push({});

Chúng ta sẽ dùngcác hàm sau đây để lấy thông số volume cũng như thiết lập các thông số này theo yêu cầu.

Hàm Chức năng

WaveOutGetVolume Truy xuất mức volume của thiết bị xuất WaveOutSetVolume Thiết lập mức volume cho thiết bị

channel trái. Còn nếu ở các thiết bị không hỗ trợ 2 kênh thì 16 bit thấp sẽ được sử dụng chỉ giá trị volume còn 16 bit cao sẽ không dùng đến.

Giá trị volume thay đổi từ giá trị 0x0 (silence) cho đến mức 0xFFFF (maximum)

Recording Waveform Audio

Chúng ta có thể sử dụng dịch vụ thu âm thanh theo chuẩn MCI. Tuy nhiên nếu thấy cần thiết, chúng ta có thể sử dụng các hàm thu âm thanh cấp thấp.

Các thông số dữ liệu dưới đây sẽ đặc trưng cho dạng dữ liệu waveform audio input

Structure Chức năng

HWAVEIN Handle của thiết bị input

WAVEFORMATEX Cấu trúc của dạng dữ liệu được thiết bị input hỗ trợ

WAVEHDR Cấu trúc dùng làm header của khối dữ liệu input. Nó cũng được dùng khi xuất dữ liệu ra Output

WAVEINCAPS Cấu trúc dùng dò hỏi các khả năng của thiết bị input

Trước khi bắt đầu công việc thu dữ liệu, chúng ta phải dùng hàm waveInGetDevCaps để dò hỏi khả năng cũng như xác định các thuôc tính của

thiết bị. Hàm sẽ trả về cấu trúc WAVEINCAPS xác định các thông số mong muốn.

Opening Waveform-Audio Input Devices

Để thu dữ liệu, trước hết chúng ta dùng hàm waveInOpen để mở thiết bị waveform input. Nếu thực thi thành công, hàm sẽ trả về cho chúng ta handle của thiết bị.

Managing Waveform-Audio Recording

Sau khi mở thiết bị, chúng ta có thể tiến hành việc thu dữ liệu. Dạng dữ liệu waveform thu được sẽ được đưa vào buffer, buffer này được trỏ đến trong cấu trúc WAVEHDR. Trước khi được sử dụng, chúng ta phải prepare buffer này.

Windows cung cấp cho chúng ta các hàm sau đây dùng thu dữ liệu waveform:

Hàm Chức năng

WaveInAddBuffer Gửi một buffer cho device driver, thiết bị sẽ thu dữ liệu vào khối này

WaveInReset Ngừng thu dữ liệu và đánh dấu tất cả các buffer đã thu xong

WaveInStart Bắt đầu thu dữ liệu. WaveInStop Kết thúc việc thu dữ liệu

window Thông báo, callback Thông báo, thread Thông báo, hay event, tùy theo cờ thông báo được chỉ định trong hàm open device.

Trước khi bắt đầu thu dữ liệu, chúng ta phải gửi ít nhất một buffer dữ liệu cho thiết bị input và khi đóng thiết bị, chúng ta gọi hàm waveInReset để đánh dấu các buffer đã được thu xong.

Using Window Messages to Manage Waveform-Audio Recording

Các Thông báo sau đây sẽ được dùng để quản lý việc thu dữ liệu dạng waveform audio:

Thông báo Chức năng

MM_WIM_CLOS E (adsbygoogle = window.adsbygoogle || []).push({});

Được gửi đi khi thiết bị đóng lại khi gọi hàm waveInClose

MM_WIM_DATA Được gửi đi khi thiết bị thu đầy một buffer khi gọi hàm waveInAddBuffer

MM_WIM_OPEN Được gửi đi khi thiết bị được open khi gọi hàm waveInOpen

Thông số lParam của MM_WIM_DATA là pointer trỏ đến cấu trúc WAVEHDR để nhận dạng buffer dữ liệu. Buffer có thể không chứa đầy dữ liệu vì việc thu dữ liệu có thể kết thúc trước khi buffer được thu đầy. Chúng ta có thể biết được kích thước thật sự của dữ liệu bằng thông số dwBytesRecorded.

Một phần của tài liệu Thiết kế chương trình truyền tiếng nói qua mạng LAN thông qua sự trợ giúp của công cụ SDKXây dựng ứng dụng truyền thông âm thanh trên mạng cục bộ (Trang 39 - 58)