Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 103 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
103
Dung lượng
1,11 MB
Nội dung
Website: http://www.tailieu.vn
Phương phápmãhoávà
nén âmthanhtheo
chuẩn Mpeg
Website: http://www.tailieu.vn
Lời nói đầu
Công nghệ thông tin là ngành công nghiệp mũi nhọn của thế giới nói
chung và của việt nam nói riêng, nó đã phát triển mạnh mẽ không ngừng trong
những năm gần đây. Khi đời sống được nâng lên khoa học kỹ thuật phát triển
nhu cầu về giải trí cũng đa dạng lên, các loại hình giải trí không ngừng gia tăng
và ngày càng phong phú, đa dạng các loại hình giải trí như: trò chơi điện tử,
nghe nhạc xem phim, xem ca nhạc(video), và đặc biệt là những trong chơi dạng
không gian ba chiều. Sự phát triển ồ ạt này đã dẫn tới ngành công nghệ phần
cứng đã không thể đáp ứng được những đòi hỏi về lưu trữ, đồng hành với sự
phát triển này là mạng máy tính đó chính là Internet ngày càng phát triển số
lượng người tham gia truy cập ngày càng lớn và nhu cầu của họ thì ngày càng
phong phú và đa dạng về tất cả các loại hình nói trên. Do đó tốc độ truy cập, tốc
độ truyền tải trên mạng được quan tâm hơn để cho người dùng không phải sốt
ruột ngồi chờ những trang web mà mình truy cập, họ không phải bực mình khi
download những file âmthanhvà những bài hát mà họ ưa thích vì đường truyền
quá chậm trong khi công nghệ phần cứng đã phát triển mạnh. Chính vì vậy các
nhà nghiên cứu phần mềm đã chú ý đến việc phát triển phần mềm để hỗ trợ phần
cứng. Họ đã tạo ra những chương trình phần mềm hỗ trợ tích cực phần cứng, từ
đó đã ra đời những phần mềm nénâm thanh, hình ảnh, nén video, tách âmthanh
từ những file video…để tạo ra những dạng âm thanh, hình ảnh, video như mindi,
mpeg, mp3, mp4… những file ảnh dạng gif, jpeg…với dung lượng lưu trữ vô
cùng nhỏ mặc dù chất lượng có giảm đi đôi chút nhưng không đáng kể so với
những gì nó đạt được để truyền tải, truy cập nhanh hơn.
Sự tồn tại của chuẩn JPEG (Joint Photographic Experts Group) chỉ để
giảm tốc độ bit và chủ yếu phục vụ cho hình ảnh, rõ ràng là không đủ đáp ứng
cho hình ảnh động có kèm âm thanh. Để đáp ứng nhu cầu của thị trường, một
nhóm các chuyên gia về hình ảnh động (Moving Picture Experts Group), gọi tắt
là MPEG, được thành lập để nghiên cứu đưa ra những lược đồ mãhóa phù hợp
Website: http://www.tailieu.vn
cho việc truyền hình ảnh động và ghi lại chúng theo tiêu chuẩn trong các thiết bị
lưu trữ số như CD-ROM, Video CD
Phần trình bày của luận văn chỉ nằm trong khuôn khổ "Aâm thanh". Do
đó mọi vấn đề liên quan tới hình ảnh sẽ không được đề cập tới, dù chuẩnMPEG
là dùng cho cả âmthanhvà hình ảnh.
Mục tiêu của đề tài chủ yếu chỉ để tìm hiểu về các phươngphápmãhoá
và nénâmthanhtheochuẩn Mpeg, từ đó dựa trên một số source code (viết bằng
C) đã có trên mạng Internet viết lại bằng ngôn ngữ Visual C++, nhằm hiểu sâu
hơn về giải thuật, đồng thời tạo ra một giao diện thân thiện hơn.
Do trình độ và kiến thức có hạn nên không tránh khỏi những thiếu sót, em
kính mong thầy tham gia và giúp đỡ em để em hoàn thành được tốt hơn.
Em xin chân thành cám ơn thầy đã tạo điều kiện thuân lợi nhất giúp em
hoàn thành báo cáo này.
Website: http://www.tailieu.vn
PHẦN I
LÝ THUYẾT CƠ BẢN
Website: http://www.tailieu.vn
CHUƠNG 1. CÁC KIẾN THỨC CƠ BẢN VỀ ÂM THANH.
I. NHỮNG KHÁI NIỆM CƠ BẢN - SÓNG CƠ
1.1. Sự hình thành sóng trong môi trường đàn hồi.
a. Định nghĩa:
Các môi trường chất khí, chất lỏng, chất rắn là môi trường đàn hồi.
Môi trường đàn hồi có thể coi là những môi trường liên tục gồm
những phân tử liên kết chặt chẽ với nhau, lúc bình thường mỗi phân tử có
một vị trí cân bằng bền.
b. Sự hình thành sóng trong môi trường đàn hồi:
Do tính chất của môi trường đàn hồi, cho nên nếu tác dụng lên
phân tử nào đó của môi trường thì phân tử này rời khỏi vị trí cân bằng
bền.
Do tương tác, các phân tử lân cận một mặt kéo phân tử A về vị
trí cân bằng, mặt khác nhận một phần năng lượng do phân tử A truyền
sang, do đó cũng dao động theo, hiện tượng này xảy ra liên tiếp tạo thành
sóng. Sóng đàn hồi (sóng cơ) là sự lan truyền dao động trong môi trường
đàn hồi. Sóng cơ không thể truyền được trong chân không, vì chân không
không phải là môi trường đàn hồi.
Cần lưu ý trong khi truyền dao động, các phân tử của môi
trường không di chuyển theo các dao động được lan truyền mà chỉ dao
động quanh vị trí cân bằng của nó.
c. Một số khái niệm về sóng:
Nguồn sóng: là ngoại vật gây ra kích động sóng.
Tia sóng: là phương truyền sóng.
Môi trường sóng: là không gian mà sóng truyền qua.
Mặt sóng: là mặt chứa những điểm (phân tử) có cùng trạng thái
dao động tại một thời điểm nào đó. Tia sóng luôn vuông góc với mặt
sóng.
Website: http://www.tailieu.vn
Sóng cầu: mặt sóng là những mặt cầu phân bố đều trong không
gian, tâm là nguồn sóng. Trong môi trường đồng chất và đẳng hướng sẽ
có sóng cầu. Đối với sóng cầu tia sóng trùng với bán kính của mặt cầu.
Sóng phẳng: mặt sóng là những mặt phẳng song song nhau, tia
sóng vuông góc với mặt sóng. Nếu nguồn sóng ở rất xa môi trường đang
xét thì mặt sóng có thể coi là những mặt phẳng song song.
Sóng dọc: là sóng trong đó các phân tử của môi trường dao động
quanh vị trí cân bằng trên phương trùng với tia sóng. Khi có sóng dọc,
trên phương của tia sóng các phân tử của môi trường khi thì bị nén chặt,
khi thì giãn ra làm cho các phân tử của môi trường có chỗ dày chỗ thưa.
Sóng ngang: là sóng trong đó các phân tử của môi trường dao
động quanh vị trí cân bằng trên phương vuông góc với tia sóng.
d. Nguyên nhân gây ra sóng ngang và sóng dọc:
Tùy tính chất của môi trường đàn hồi mà trong đó có thể xuất
hiện sóng ngang hay sóng dọc.
- Khi một lớp của môi trường bị lệch đối với lớp khác làm xuất hiện
các lực đàn hồi có xu hướng kéo lớp bị lệch về vị trí cân bằng thì trong
môi trường đó có thể truyền được sóng ngang. Vậy vật rắn là một môi
trường có tính chất đó.
- Nếu trong môi trường không có các lực đàn hồi khi các lớp song
song bị lệch đối với nhau thì sóng ngang không thể hình thành được. Chất
lỏng và chất khí là những môi trường đó.
- Khi bị biến dạng nén hay căng mà trong môi trường có các lực
đàn hồi xuất hiện thì trong môi trường đó có thể truyền được sóng dọc.
Chẳng hạn khi bị nén, chất lỏng hay chất khí sẽ tăng áp suất, lực nén giữ
vai trò lực đàn hồi.
Như vậy trong chất lỏng và chất khí chỉ có sóng dọc truyền
được, còn trong chất rắn có thể truyền được cả hai loại sóng.
1.2. Các đặc trưng của sóng.
Website: http://www.tailieu.vn
a. Vận tốc truyền sóng (C) :
Là quãng đường mà sóng truyền được trong một đơn vị thời gian.
b. Bước sóng :
Là quãng đường mà sóng truyền được sau một thời gian bằng 1 chu
kỳ T. Như vậy là khoảng cách bé nhất giữa các phân tử dao động cùng
pha. Theo định nghĩa ta có : = CT.
c. Chu kỳ và tần số:
Chu kỳ T là thời gian cần thiết để sóng truyền được 1 bước sóng
.
Tần số f là số chu kỳ thực hiện được trong 1 giây :
F = 1/T (Hz)
1.3. Phương trình sóng.
Sóng phẳng truyền dọc theophương OY với vận tốc C thì
phương trình sóng biểu thị mối quan hệ giữa độ chuyển dời X của phân tử
dao động kể từ vị trí cân bằng với thời gian t và khoảng cách y đến các vị
trí cân bằng các phân tử dao động trên phương truyền sóng như sau :
X = asin(t – y/c)
Nếu sóng phẳng truyền theo hướng ngược với hướng tính
khoảng cách y thì :
X = asin(t + y/c)
Đối với sóng cầu thì biên độ a của dao động sóng tại vị trí cách
nguồn bằng bán kính r, tỉ lệ nghịch với r, phương trình sóng có dạng:
X =
a
/
r
sin(t – r/c)
II. SÓNG ÂM.
2.1. Dao động âmvà sự truyền dao động.
Sóng âm là một loại sóng cơ có biên độ dao động nhỏ mà thính
giác nhận biết được. Thí dụ dao động phát ra từ dây đàn, mặt trống đang
rung động. Sóng âm là một loại sóng cơ nên mọi khái niệm và hiện tượng
về dao động và sóng cơ trên đây đều áp dụng cho sóng âm.
Website: http://www.tailieu.vn
Trong không khí cũng như trong mọi chất khí khác, những dao
động truyền đi dưới dạng sóng dọc, khi đến tai người những dao động có
tần số từ 16 đến 20000 Hz sẽ gây cảm giác đặc biệt về âm.
Các dao động đàn hồi có tần số f>20.000 Hz là sóng siêu âm.
Các dao động đàn hồi có tần số f<16 Hz là sóng hạ âm
Mỗi âm có một tần số riêng, đơn vị của tần số là héc (Hz) với
định nghĩa:”Héc là tần số của một qúa trình dao động âm trong đó mỗi
giây thực hiện được một dao động”.
1 Héc (Hz) = 1 dao động / 1 giây
Việc phân chia sóng hạ âm, sóng siêu âmvà sóng âm (âm thanh)
liên quan tới khả năng sinh lý của thính giác
2.2. Đơn vị vật lý của âm thanh.
Âmthanh hay tiếng động mà con người nhận biết được do tác
động của sóng âm lên màng nhĩ tai.
Các dao động âm phát ra từ nguồn lan truyền trong môi trường
đàn hồi như không khí dưới dạng sóng đàn hồi gọi là sóng âm. Sóng âm
đến kích động màng nhĩ tai gây cảm giác về âm, do đó cần phân biệt hai
loại đại lượng về âm:
- Đại lượng âm khách quan: những đại lượng thuần túy vật lý,
không phụ thuộc vào tai người.
- Đại lượng âm chủ quan: những đại lượng tâm lý vật lý phụ thuộc
vào tai người.
2.2.1. Đơn vị âm khách quan:
a. Aùp suất âm:
Khi sóng âm tới một mặt nào đó, do các phân tử môi trường dao
động tác dụng lên mặt đó một lực gây ra áp suất. Aùp suất ở đây là áp suất
dư do sóng âm gây ra ngoài áp suất khí quyển.
Trong phạm vi nghe được, áp suất âm trong khoảng từ 2.10
-4
đến
2.10
2
bar, chênh lệch 10
6
lần, đó là một phạm vi rất rộng.
Website: http://www.tailieu.vn
b. Cường độ âm (I):
- Cường độ âm ở một điểm nào đó trên phương đã cho trong trường
âm là số năng lượng âm đi qua đơn vị diện tích của mặt S vuông góc với
phương truyền âm, tại điểm đó trong đơn vị thời gian.
- Một vài cường độ âm đáng chú ý:
Người nói thường I = 2.10
-3
W/m
2
Còi ô-tô I = 5 W/m
2
Còi báo động I = 3.000 W/m
2
- Trong điều kiện chuẩn (t
o
= 20
o
C, áp suất 760mmHg):
Vận tốc âm trong không khí : C = 340 m/s
= 0,00121 gr/cm
3
.
= C
p
/C
v
= 1,4
- Trong tính toán người ta quy ước lấy âm đơn tần số f = 1000 Hz
làm chuẩn để so sánh (gọi là âm chuẩn).
- Đối với âm chuẩn, trong phạm vi nghe được
Áp suất âm nhỏ nhất P
min
= 2.10
-4
bar
Cường độ âm nhỏ nhất I
min
= 10
-16
W/cm
2
.
- Aùp suất âmvà cường độ âm lớn nhất mà tai người có thể chịu
được là:
P
max
= 2.10
2
bar
I
max
= 10
-4
W/cm
2
.
- Công suất âm nhỏ nhất có thể nghe thấy được W
min
= 10
-12
Watt.
2.2.2. Đơn vị âm chủ quan:
Tai người trung bình có thể nhận được những sóng âm có tần số
từ 16 đến 20000 Hz, hiệu qủa này có liên quan tới khả năng sinh lý của tai
người.
Như vậy, âmthanh là một hiện tượng tâm lý vật lý, không phải
bất cứ sóng âm nào tới tai cũng gây ra cảm giác âmthanh như nhau. Aâm
có tần số khác nhau gây ra cảm giác khác nhau.
Website: http://www.tailieu.vn
Cường độ âm nhỏ nhất của một sóng âm xác định mà tai người
nghe thấy được gọi là “Ngưỡng nghe”. Aâm có tần số khác nhau giá trị
ngưỡng nghe cũng khác nhau. Tai người thính nhất với âm có tần số trong
khoảng từ 1000 đến 3000 Hz, trong phạm vi này cường độ âm ngưỡng
nghe nhỏ nhất. Những tần số khác, tai kém thính hơn, ngưỡng nghe có giá
trị lớn hơn.
Đối với âm chuẩn, cường độ và áp suất ở ngưỡng nghe bằng:
P
o
= 2.10
-5
N/ m
2
.
I
o
= 10
-12
W/m
2
.
Do cảm giác âmthanh phụ thuộc vào đặc tính sinh lý của tai
người, cho nên phải có một số đại lượng đặc trưng cho cảm giác âmthanh
phụ thuộc vào tai người, những đại lượng như vậy gọi là đại lượng âm chủ
quan.
a. Bel và decibel (db):
Theo định lý sinh lý của Vebe-Fécne, cảm giác nghe to đối với một
âm không tỉ lệ thuận với cường độ âm của âm đó. Khi cường độ âm tăng
từ I
o
tới I thì cảm giác nghe to tăng tỉ lệ với lg(I/I
o
). Do đó người ta dùng
thang lô-ga-rít cơ số 10 để đo mức cảm giác so với mức ngưỡng.
Mức ngưỡng gọi là mức zero qui ước :
lg(I/I
o
) = lg(10
-12
/ 10
-12
) = 0 bel.
Đơn vị là Bel hay db. 10db = 1 bel.
b. Mức cường độ âm (L
I
):
Nếu gọi I là cường độ âm của âm đang xét và I
o
là cường độ âm của
mức zero qui ước của âmchuẩn thì mức cường độ âm L
I
bằng :
L
I
= 10lg(I/I
o
) db
I tính bằng W/m
2
.
c. Mức áp suất âm (Lp):
Mức áp suất âm suy dẫn từ mức cường độ âm Lp = 20lg(P/P
o
) db.
Trong đó:
[...]... THIỆU 1 MPEG là gì? MPEG, viết tắt của cụm từ “Moving Picture Experts Group”, là một nhóm chuyên nghiên cứu phát triển các tiêu chuẩn về hình ảnh số vànénâmthanhtheochuẩn ISO/IEC Ngày nay, nhóm làm việc MPEG đã phát triển và phát hành các tiêu chuẩn MPEG- 1, MPEG- 2 và MPEG- 4 Chuẩn MPEG- 3 được kết hợp vào MPEG- 2 và không còn tách riêng nữa Nhóm MPEG hiện nay đã phát triển đến chuẩn MPEG- 7 MPEG chỉ... Aâm điệu vàâm sắc: Âm điệu chỉ âm cao hay thấp, trầm hay bổng Âm điệu chủ yếu phụ thuộc vào tần số của âm, tần số càng cao, âm nghe càng cao, tần số càng thấp âm nghe càng trầm Âm sắc chỉ sắc thái của âm du dương hay thô kệch, thanh hay rè, trong hay đục Âm sắc phụ thuộc vào cấu tạo của sóng âm điều hòa, biểu thị bằng số lượng các loại tần số, cường độ và sự phân bố của chúng quanh âm cơ bản Âm. .. thànhâmthanh Dạng thứ hai là MIDI Khác với âmthanh dạng sóng, MIDI chỉ lưu lại những thông điệp điều khiển bộ tổng hợp phát ra âmthanh Do đó kích thước của tập tin MID nhỏ hơn nhiều so với tập tin.WAV II CẤU TRÚC WAVE FILE 1 RIFF file Wave File là tập tin chứa các dữ liệu của mẫu âmthanh đã được số hóa Phươngpháp số hóa âmthanh hiện nay là phươngpháp PCM Phươngpháp này sẽ lấy mẫu âm thanh. .. chất lượng VHS, Karaoke MPEG- 2 định nghĩa cho một tiêu chuẩn kỹ thuật truyền hình số Chuẩn MPEG- 2 khắc phục một vài nhược điểm của chuẩn MPEG- 1 Ví dụ, MPEG- 2 có thể tạo hình ảnh lớn gấp 4 lần MPEG- 1 với độ nét cao hơn và rõ hơn (720 x 480 và 1280 x 720) Các đặc tính của MPEG- 2 bao gồm hình ảnh chất lượng cao và âm thanh nổi Website: http://www.tailieu.vn MPEG- 3 định nghĩa một tiêu chuẩn cho High Difinition... biết được sức mạnh của âm thanh đo bằng tai người Mức to, độ to của một âm là sức mạnh cảm giác do âm thanh gây nên trong tai người, nó không những phụ thuộc vào áp suất âmmà còn phụ thuộc vào tần số của âm đó Thí dụ 2 âm có tần số 100 Hz và 1000 Hz áp suất âm đều bằng 0,02 bar nhưng nghe to nhỏ khác nhau, âm 1000 Hz nghe to hơn âm 100 Hz Muốn nghe to bằng âm 1000 Hz thì âm 100 Hz phải có áp suất... (HDTV), là thế hệ tiếp theo của công nghệ truyền hình theo định dạng số đầy đủ Tiêu chuẩn này đã không được phát triển hoàn thiện và cuối cùng được kết hợp vào với chuẩn MPEG- 2 MPEG- 3 đi đến mục tiêu là các ứng dụng HDTV với kích thước mẫu lên đến 1920x1080x30 Hz và được mãhoá ở tốc độ bit 20 đến 40 Mbits/s Cuối cùng người ta đã nhận ra rằng với một vài điều chỉnh thích hợp, MPEG- 1 và MPEG- 2 làm việc rất... và MPEG- 6 vẫn chưa được công bố MPEG- 7 định nghĩa một tiêu chuẩn về việc biểu diễn nội dung cho các nghiên cứu thông tin hình ảnh vàâmthanh Tên chính thức là “Multimedia Content Description Interface” Mục tiêu của MPEG- 7 là chuẩnhoá việc biểu diễn các mô tả về nội dung nghe nhìn Tuy nhiên chuẩn không định nghĩa các công cụ để nhận ra nội dung nghe nhìn thật sự 3 ÂmthanhMPEG Khả năng của âm thanh. .. Group 11 (moving picture with audio) 2 So sánh các chuẩn MPEG: MPEG- 1 định nghĩa một tiêu chuẩn cho việc lưu trữ và phục hồi các hình ảnh động vàâmthanh trên các thiết bị lưu trữ Tiêu chuẩn này định nghĩa rằng hình ảnh được phát lại ở tốc độ 30 frames một giây vàâmthanh được phát lại ở chất lượng như CD-audio, độ phân giải hình ảnh là 352 x 240 Chuẩn MPEG- 1 được dùng điển hình trong các phần mềm huấn... HDTV MPEG- 4 định nghĩa một tiêu chuẩn cho các ứng dụng Multi-media Đặc biệt nó định nghĩa tiêu chuẩn truyền cho dòng phức tạp các hình ảnh, âmthanhvà dữ liệu đồ hoạvà việc tái hợp chúng trên thiết bị thu MPEG4 được phát triển theo 2 giai đoạn, 1 và 2 Chuẩn MPEG- 4 định nghĩa các đối tượng hình ảnh mà trong đó các phần của một cảnh có thể được thao tác trong khi những phần khác vẫn không đổi MPEG- 5 và. .. tính đó của âm chính là âm sắc Âm sắc là một đặc tính sinh lý của âm, được hình thành trên cơ sở các đặc tính vật lý của âm là tần số và biên độ Thực nghiệm chứng tỏ rằng khi một nhạc cụ phát ra một âm có tần số f1 thì đồng thời cũng phát ra các âm có tần số f2=2f1, f3=3f1 Âm có tần số f1 gọi là âm cơ bản hay họaâm thứ nhất, các âm có tần số f2 , f3 gọi là các họaâm thứ hai, thứ ba Âm cơ bản . các dữ liệu của mẫu âm thanh đã được số
hóa. Phương pháp số hóa âm thanh hiện nay là phương pháp PCM.
Phương pháp này sẽ lấy mẫu âm thanh với tần số khoảng.
Mục tiêu của đề tài chủ yếu chỉ để tìm hiểu về các phương pháp mã hoá
và nén âm thanh theo chuẩn Mpeg, từ đó dựa trên một số source code (viết bằng
C)