1. Trang chủ
  2. » Luận Văn - Báo Cáo

Luận văn: Nghiên cứu và xây dựng chương trình truyền thông đa phương tiện docx

119 833 2

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 119
Dung lượng 1,5 MB

Nội dung

Mục tiêu của đề tài là tìm hiểu các chuẩn truyền thông thời gian thực, các chuẩn nén âm thanh, hình ảnh, nghiên cứu bộ thư viện giao diện lập trình OpenH323 và từ những kết quả tìm hiểu

Trang 2

Trần Thanh Long - Nguyễn Thành Nam 1

CHƯƠNG 0: GIỚI THIỆU 4

CHƯƠNG 1: TÌM HIỂU CÁC CHUẨN NÉN ÂM THANH 6

1 Giới thiệu: 6

2 Chuẩn nén G.711: 6

2.1 Giới thiệu: 6

2.2 Tốc độ lấy mẫu: 6

2.3 Quy luật mã hoá: 7

2.4 Truyền tín hiệu ký tự: 7

2.5 Mối liên hệ giữa luật mã hóa và cấp độ âm thanh: 7

2.6 Sự chuyển đổi giữa A-law và µ-law : 8

2.7 Sự chuyển đổi giữa µ-law và A-law: 9

3 Chuẩn nén G.723: 12

3.1 Giới thiệu: 12

3.2 Cơ chế mã hóa: 12

3.3 Cơ chế giải mã: 14

4 Chuẩn nén G.729: 15

4.1 Giới thiệu: 15

4.2 Mô tả chung về bộ mã CS-ACELP: 15

4.2.1.Nguyên lý mã hóa: 16

4.2.2.Nguyên lý giải mã: 18

CHƯƠNG 2: TÌM HIỂU CÁC CHUẨN NÉN HÌNH ẢNH 20

1 Giới thiệu: 20

2 Chuẩn nén H.261: 20

2.1 Giới thiệu: 20

2.2 Đinh dạng ảnh nguồn của chuẩn H.261 20

2.3 Ghép kênh H.261 (H.261 Multiplexing): 22

2.3.1.Picture layer: 22

2.3.2.Group of blocks (GOB): 23

2.3.3.Macroblocks: 24

2.3.4.Block: 26

3 Chuẩn nén H.263: 26

3.1 Giới thiệu: 26

3.2 Những khác biệt giữa H.263 và H.261: 27

3.2.1.SubQCIF: 27

3.2.2.Cách tính độ sai lệch tốt hơn: 27

3.2.3.Độ chính xác trong việc dự đoán: 27

3.2.4.Cách xử lý truyền macroblock: 27

CHƯƠNG 3: TÌM HIỂU VỀ VOICE OVER IP 28

1 Giới thiệu về VoIP: 28

2 Ưu điểm của VoIP so với PSTN: 28

2.1 Tiết kiệm băng thông: 28

2.2 Đơn giản hóa: 29

2.3 Khả năng tích hợp: 29

2.4 Uyển chuyển trong quản lý: 29

2.5 Quản lý tốt: 29

2.6 Giá thành thấp: 30

3 Các hình thức truyền thoại trên mạng IP: 30

Trang 3

Trần Thanh Long - Nguyễn Thành Nam 2

3.1 PC-PC : 30

3.2 PC – Phone : 30

3.3 Phone - Internet - Phone : 30

4 Nguyên tắc và mô hình hoạt động của VoIP: 31

4.1 Quá trình thiết lập một kết nối VoIP : 31

4.2 Mô hình hoạt động của VoIP: 31

5 Các nghi thức được sử dụng trong hệ thống VoIP: 31

5.1 Giao thức UDP (User Datagram Protocol): 31

5.2 Giao thức RTP (Realtime Protocol): 32

5.3 Giao thức RTCP ( RTP Control Protocol ): 32

5.4 Giao thức RSVP: 32

5.5 SGCP: 33

5.6 MGCP: 34

6 Các vấn đề liên quan đến chất lượng dịch vụ : 34

6.1 Mất gói và các giải pháp khắc phục tình trạng này: 34

6.1.1.Tổng quan: 34

6.1.2.Các giải pháp khắc phục: 34

6.2 Trễ gói 35

6.2.1.Tổng quan 35

6.2.2.Có hai giải pháp: 35

6.3 Network Jitter 35

6.4 Kết luận: 36

CHƯƠNG 4: TÌM HIỂU CÁC NGHI THỨC TRUYỀN THÔNG THỜI GIAN THỰC RTP (REALTIME PROTOCOL) 37

1 Giới thiệu giao thức RTP (Realtime Protocol): 37

2 Các khái niệm và định nghĩa được sử dụng trong RTP: 37

3 Thứ tự byte, alignment và định dạng thời gian: 40

4 Nghi thức truyền dữ liệu RTP (RTP Data Transfer Protocol): 40

4.1 Các trường cố định trong RTP header: 40

4.2 Ghép kênh các phiên RTP (Multiplexing RTP sessions): 43

4.3 Những thay đổi trong đặc tả profile của RTP Header: 44

4.3.1.Phần RTP header mở rộng (RTP Header Extension): 45

5 Giao thức điều khiển RTP (RTP Control Protocol – RTCP): 46

5.1 Cấu Trúc của gói RTP (RTP Packet Format): 47

5.2 Các thông báo của bên gửi và bên nhận ( Sender and Receiver reports ):.49 CHƯƠNG 5: TÌM HIỂU CHUẨN H.323 VÀ THƯ VIỆN OPENH323 56

1 Giới thiệu: 56

2 Chuẩn H.323: 56

2.1 Các ưu điểm của chuẩn H.323: 56

2.2 Kiến trúc hệ thống H.323: 58

2.2.1.Terminal: 59

2.2.2.Gateway: 60

2.2.3.Gatekeeper: 61

2.2.4.MCU (Multipoint Control Unit): 63

2.3 Sơ đồ cấu trúc phân lớp: 64

2.3.1.Video Codec: 65

2.3.2.Audio Codec: 65

2.3.3.Data Channel (Kênh dữ liệu): 66

Trang 4

Trần Thanh Long - Nguyễn Thành Nam 3

2.4 Điều khiển hệ thống: 66

2.4.1.Chức năng điều khiển H.245: 66

2.4.2.Chức năng báo hiệu RAS H.225.0: 67

2.4.3.Chức năng báo hiệu cuộc gọi H.225.0: 68

2.5 Hội nghị đa điểm: 70

2.5.1.Hội nghị đa điểm tập trung: 70

2.5.2.Hội nghị đa điểm phân tán: 71

2.5.3.Hội nghị đa điểm tập trung và phân tán kết hợp: 71

2.6 Quy trình thiết lập cuộc gọi qua mạng H.323: 71

2.7 Mối quan hệ giữa nghi thức H323 và mô hình OSI: 77

2.8 Tổng kết: 77

3 Thư viện OpenH323 78

3.1 Giới thiệu: 78

3.2 Cấu trúc phân lớp và phương thức hoạt động: 78

3.2.1.Cấu trúc phân lớp: 78

3.2.2.Ý nghĩa một số lớp trong thư viện: 81

3.3 Phương thức hoạt động: 85

CHƯƠNG 6: XÂY DỰNG ỨNG DỤNG TRUYỀN THÔNG ĐA PHƯƠNG TIỆN THỂ NGHIỆM 88

1 Mô hình thực tế: 88

2 Xác định các yêu cầu: 88

2.1 Các yêu cầu chức năng: 88

2.2 Các yêu cầu phi chức năng: 89

2.3 Mô hình giao tiếp giữa các thành phần trong hệ thống: 90

3 Đặc tả chung cho hệ thống và sơ đồ khối của các yêu cầu: 91

3.1 Đặc tả chung cho hệ thống: 91

3.2 Sơ đồ khối của một vài chức năng của client: 92

4 Thiết kế cơ sở dữ liệu: 100

4.1 Các trường của bảng lưu thông tin user như sau: 100

4.2 Các trường của bảng lưu thông tin danh sách các user trong contact list101 5 Thiết kế giao diện: 101

6 Cách thực thi hệ thống: 110

7 Cài đặt chương trình: 111

8 Đánh giá kết quả xây dựng ứng dụng: 111

9 Hướng phát triển chương trình: 112

TỔNG KẾT 114

BẢNG THAM CHIẾU CÁC TỪ VIẾT TẮT 115

CÁC TÀI LIỆU THAM KHẢO 118

Trang 5

Trần Thanh Long - Nguyễn Thành Nam 4

CHƯƠNG 0: GIỚI THIỆU

Hiện nay với sự phát triển của xã hội, các dịch vụ, các ứng dụng về truyền thông đa phương tiện như điện thoại, nhắn tin, nghe nhac, xem phim, v.v… không còn xa lạ với mọi người Song song với sự phát triển của xã hội hiện nay là sự phát triển của mạng máy tính, trong đó có mạng truyền thông

đa phương tiện Trong những năm trước đây, các dịch vụ truyền thông đa phương tiện đều rất khó thực hiện bởi vì ít có sự hỗ trợ về phần cứng, băng thông chính là điểm khó khăn cho việc truyền và nhận các tín hiệu âm thanh

và hình ảnh Tuy nhiên, với kỹ thuật phát triển như hiện nay, các tín hiệu âm thanh và hình ảnh có thể được nén và giải nén môt cách dễ dàng và băng thông không còn là vấn đề trở ngại đối với việc truyền nhận tín hiệu âm thanh, hình ảnh Hội nghị video (video conference) là một minh chứng rất thuyết phục cho khả năng này của mạng truyền thông đa phương tiện hiện nay

Những kỹ thuật để phục vụ cho mạng truyền thông đa phương tiện hiện nay đã được nhiều người đi trước nghiên cứu chuyên sâu, tuy nhiên việc kết hợp các kỹ thuật này lại là một vấn đề mới, thú vị và rất cần thiết cho cuộc sống hiện nay Do vậy, chúng em đã chọn đề tài “Nghiên cứu và xây dựng chương trình truyền thông đa phương tiện tích hợp” để làm đề tài luận văn tốt nghiệp của mình Mục tiêu của đề tài là tìm hiểu các chuẩn truyền thông thời gian thực, các chuẩn nén âm thanh, hình ảnh, nghiên cứu bộ thư viện giao diện lập trình OpenH323 và từ những kết quả tìm hiểu được, xây dựng một

hệ thống truyền thông giao tiếp trực tuyến sử dụng máy tính giữa nhiều người dùng trong các tổ chức hoặc công ty hoạt động phân tán tại nhiều vùng địa lý khác nhau, hoặc giữa các trường đại học, sử dụng cơ sở hạ tầng mạng nối kết giữa các vị trí đó (mạng cục bộ, đường truyền thuê bao riêng hoặc Internet)

Trang 6

Trần Thanh Long - Nguyễn Thành Nam 5

Phương thức giao tiếp cho phép đa dạng, gồm nhiều phương thức thông qua nhiều loại phương tiện thông tin khác nhau (thông điệp ngắn, âm thanh, hình ảnh ) nhằm đáp ứng những nhu cầu thông tin và điều kiện môi trường trong thực tế

Ngoài ra hệ thống còn cần có khả năng nối kết với phương tiện truyền thông truyền thống đang được sử dụng phổ biến như điện thoại để bàn nối kết với hệ thống điện thoại công cộng, điện thoại di động và hệ thống thư điện tử

Sự kết nối tích hợp này sẽ giúp làm tăng khả năng thông tin liên lạc xuyên suốt giữa các người dùng

Với khả năng còn hạn chế, luận văn này vẫn còn nhiều điều chưa hoàn tất, kính mong sự đóng góp ý kiến và giúp đỡ của quý thầy cô

Thành phố Hồ Chí Minh, 7/2003 Trần Thanh Long - Nguyễn Thành Nam

Trang 7

Trần Thanh Long - Nguyễn Thành Nam 6

CHƯƠNG 1: TÌM HIỂU CÁC CHUẨN NÉN ÂM THANH

1 Giới thiệu:

Như chúng ta đã biết, các tín hiệu âm thanh có dung lượng rất lớn nên rất khó khăn cho việc truyền dẫn mà vẫn đạt được một chất lượng tương đối trên cơ sở hạ tầng mạng hiện nay Do vậy, việc nén các luồng âm thanh để có thể truyền trên băng thông thấp với chất lượng dịch vụ cao là một điều rất cần thiết

Hiệp hội viễn thông quốc tế, ITU-T ( International Telecommunication Union – Telecommunication ) đã đưa ra những chuẩn nén âm thanh mới nhất như G728, G729, G723.1 v.v… dành cho băng thông thoại thấp với tần số

300 Hz đến 3,4kHz Tất cả các chuẩn này đều dựa trên chuẩn mã hóa CELP (Code-Excited Linear Prediction) Chuẩn nén âm thanh đã được tiêu chuẩn hóa trong mã ANSI-C với 2 lý do chính:

• Độ tin cậy khi tương tác giữa các thiết bị

• Giá thành thấp và những tiện ích thực thi dựa trên 16 bit fixpoint DSP

2 Chuẩn nén G.711:

2.1 Giới thiệu:

Chuẩn G.711 là một chuẩn nén âm thanh được sử dụng rộng rãi cho các hội nghị âm thanh Chuẩn này mô tả phương pháp mã hoá và giải mã âm thanh với tốc độ 64Kbps

2.2 Tốc độ lấy mẫu:

Một giá trị được đề nghị của tần số lấy mẫu là 8000 samples/giây Độ sai sót thường là +/- 50 phần triệu

Trang 8

Trần Thanh Long - Nguyễn Thành Nam 7

2.3 Quy luật mã hoá:

Mỗi mẫu âm thanh là một số nhị phân có tám bit được sử dụng cho phạm vi toàn cầu ITU – T đưa ra hai quy luật mã hóa là mã hóa theo quy luật

A và mã hóa theo quy luật µ

Khi sử dụng luật mã hóa µ trong mạng truyền thông thì việc chặn tất cả các tín hiệu ký tự 0 là yêu cầu nhất thiết Giá trị lượng tử hóa là kết quả của luật mã hóa Bất cứ sự chuyển đổi cần thiết giữa các quốc gia đều sử dụng quy luật µ

Sự chuyển đổi PCM: Giá trị ấn định (decision value) và giá trị lượng

tử (quantizer value) của A-law được kết hợp với giá trị đồng dạng PCM Sự chuyển đổi từ A-law hoặc µ-law từ giá trị đồng dạng PCM tương ứng với giá trị ấn đinh là một phần chỉ định của giá trị riêng lẽ

2.4 Truyền tín hiệu ký tự:

Khi tín hiệu ký tự được truyền tuần tự trong một tầng vật lý, bit số 1 (bit dấu) được truyền trước tiên và bit số 8 (bit ít có ý nghĩa nhất) được truyền cuối cùng

2.5 Mối liên hệ giữa luật mã hóa và cấp độ âm thanh:

Tín hiệu sóng hình sin 1kHz ở cấp độ nhỏ của 0 dBm0 được thể hiện ở bất cứ tần số âm thanh nào ở đẩu ra của bộ ghép kênh PCM khi một chuổi tín

hiệu định kỳ của A-law (table 1) và µ-law (table 2) được dùng ở đẩu vào của

bộ giải mã Theo kết quả lý thuyết, giá trị Tmax = +3.14 dBm0 ứng với A-law

và Tmax = +3.17 dBm0 ứng với µ-law

Trang 9

Trần Thanh Long - Nguyễn Thành Nam 8

2.6 Sự chuyển đổi giữa A-law và µ-law :

Trang 10

Trần Thanh Long - Nguyễn Thành Nam 9

• Tương tự như vậy, nếu bộ chuyển đổi A-µ được thay bằng µ-A chỉ có các octet tương ứng với bộ giải mã A-law ở đầu ra có số 26,28,30,32,45,47,63

và 80 bị thay đổi và bit thứ 8 cũng thay đổi Kết quả là hầu hết dãy tín hiệu tần số âm thanh tương tự được đưa vào lượng tử hóa thường không cho kết quả chính xác bởi vì bộ chuyển đổi kép µ-A-µ hay A-µ-A không cho kết quả tốt hơn bộ chuyển đổi đơn µ-A hay A-µ

2.7 Sự chuyển đổi giữa µ-law và A-law:

Xem Table 4

Trang 11

Trần Thanh Long - Nguyễn Thành Nam 10

Table 3

Trang 12

Trần Thanh Long - Nguyễn Thành Nam 11

Table 4

Trang 13

Trần Thanh Long - Nguyễn Thành Nam 12

3 Chuẩn nén G.723:

3.1 Giới thiệu:

Chuẩn G.723 giới thiệu một bộ nén có thể dùng để nén tín hiệu thoại hoặc những tín hiệu âm thanh khác của các dịch vụ đa phương tiện ở tốc độ bit rất thấp Trong thiết kế của chuẩn này, nguyên lý ứng dụng làm việc ở tốc

độ truyền bit rất nhỏ Bộ mã hóa này được tích hợp hai tốc độ khác nhau: 5.3

và 6.3kbit/s Cả hai tốc độ đều hỗ trợ bởi bộ mã hóa và giải mã Chúng có thể chuyển đổi qua lại tại bất kì khung truyền (30 ms) nào Với tốc độ 6.3 kbit/s chất lượng âm thanh tốt hơn Bộ mã hóa này nén thoại với chất lượng cao ở

cả hai tốc độ nhưng ít sử dụng kĩ thuật phức tạp Các tín hiệu âm thanh khác sau khi được nén cho âm thanh có chất lượng không thực lắm Về độ trễ, bộ

mã hóa này mã hóa tín hiệu thoại và những tín hiệu âm thanh khác bằng những khung 30 ms, thêm độ trễ của phần chuyển đổi giữa các khung 7.5 ms, thời gian trễ tổng cộng là 37.5 ms

3.2 Cơ chế mã hóa:

Bộ mã hóa này được thiết kế để thực thi với một tín hiệu số Tín hiệu này có được bằng cách thực hiện lọc tín hiệu tương tự đầu vào trong băng tần thoại, sau đó tiến hành lấy mẫu ở tần số 8000 Hz, tiếp theo nó chuyển đổi thành PCM tuyến tính 16 bit để đưa vào đầu vào của bộ mã hóa Đầu ra của

bộ mã hóa phải được chuyển đổi ngược lại sang tín hiệu tương tự bằng những cách tương tự Những kiểu dữ liệu có đầu vào/đầu ra(input/output) khác, như

dữ liệu PCM 64 kbit/s trong Khuyến nghị G711, phải được chuyển đổi sang PCM tuyến tính 16 bit trước khi mã hóa hoặc từ PCM tuyến tính 16 bit đến định dạng đúng sau khi giải mã Luồng bit từ bộ mã hóa sang bộ giải mã được định nghĩa rõ trong chuẩn này

Bộ mã hóa dựa trên nguyên lý mã hóa phân tích bằng cách tổng hợp( analysis-by-synthesis) dự đoán tuyến tính và cố gắng tối thiểu tín hiệu trọng

số lỗi một cách trực quan( conceptual) Bộ mã hóa hoạt động dựa trên những khối (frame 240 mẫu), tương đương với thời gian lấy mẫu là 30 ms ở tốc độ

Trang 14

Trần Thanh Long - Nguyễn Thành Nam 13

lấy mẫu 8 kHz Với mỗi block, trước tiến nó được đưa qua bộ lọc tần số cao

để loại bỏ thành phần DC, sau đó chia vào 4 subframe, mỗi subframe có 60 mẫu Ứng với mỗi subframe, bộ lọc mã hóa dự đoán tuyến tính (LPC filter– Linear Prediction Coder filter) cấp 10 được tính toán dùng những tín hiệu đầu vào chưa được xử lý LPC filter cho subframe cuối cùng được lượng tử hóa dùng PSVQ (Predictive Split Vector Quantizer) Các hệ số LPC không được lượng tử hóa được sử dụng để xây dựng bộ lọc trọng số ngắn hạn(short-term perceptual weighting filter) Bộ lọc này dùng để lọc toàn bộ frame để nhận được tín hiệu trong số thoại

Ứng với 2 subframe (120 mẫu), vòng lặp mở định kỳ cường độ, LOL, được tính toán dùng tín hiệu trọng số thoại Sự đánh giá về cường độ âm thanh được thực thi trên một khối 120 mẫu Định kỳ về cường độ được dò tìm trong một khoảng từ 18 đến 142 mẫu Từ điểm này âm thoại được xử lí với 60 mẫu trên một subframe

Bằng cách dùng sự ước lượng về cường độ âm thanh được tính toán ở phía trước ta xây dựng được bộ lọc định dạng nhiễu điều hòa( harmonic noise shaping filter) Sự kết hợp của bộ lọc tổng hợp LPC, bộ lọc trọng số và bộ lọc điều hòa tạp âm được dùng để tạo nên các xung hồi đáp sử dụng cho những

sự tính toán về sau

Vòng lặp đóng của sự dự đoán cường độ âm thanh được tính toán dựa trên sự ước lượng định kỳ cường độ âm thanh và đáp ứng xung Chu kì cường độ được tính toán như là một giá trị sai biệt nhỏ xung quanh sự ước đoán cường độ vòng lặp mở Ứng với trường hợp tốc độ bit cao (6.3 kbit/s),

kĩ thuật lượng tử Multi-pulse Maximum Likelihood Quantization( MP-MLQ) được dùng, còn đối với trường hợp tốc độ bit thấp (5.3 kbit/s), sự kích thích các mã đại số được dùng (ACELP) Biểu đồ khối của bộ mã hóa được thể hiện trong hình dưới đây

Trang 15

Trần Thanh Long - Nguyễn Thành Nam 14

3.3 Cơ chế giải mã:

Bộ giải mã được thực thi dựa trên cơ sở frame-by-frame Trước tiên các chỉ mục LPC đã lượng tử hóa được giải mã, tiếp theo bộ giải mã tạo ra bộ lọc tổng hợp LPC Ứng với mỗi subframe, cả bộ dự đoán adaptive codebook

và fixed codebook được giải mã và được đưa vào bộ lọc tổng hợp Tín hiệu kích hoạt được đưa vào bộ lọc chuyển (postfilter) cường độ âm thanh, bộ lọc này được kích hoạt để đưa vào bộ lọc tổng hợp

Biểu đồ khối của bộ mã hóa tín hiệu thoại

Trang 16

Trần Thanh Long - Nguyễn Thành Nam 15

4 Chuẩn nén G.729:

4.1 Giới thiệu:

Chuẩn này sử dụng thuật toán Conjugate-Structure Excited Linear-Prediction (CS-ACELP) để mã hóa tín hiệu âm thanh với tốc

Algebraic-Code-độ 8kbit/s Bộ mã hóa này được thiết kế để thực thi với tín hiệu số nhận được

từ bộ lọc băng thông thoại đầu tiên (được giới thiệu ở chuẩn G.712) của tín hiệu tương tự ở đầu vào, sau đó tiến hành lấy mẫu ở tần số 8000 Hz và chuyển đổi các mẫu âm thanh này thành PCM tuyến tính 16 bits để chuyển đến bộ mã hóa ở đầu vào Đầu ra của bộ giải mã phải chuyển đổi ngược sang tín hiệu tương tự bằng cách giống như ở đầu vào

4.2 Mô tả chung về bộ mã CS-ACELP:

Bộ mã CS-ACELP được dựa trên nền tảng của mô hình mã hóa CELP (Code-Excited Linear-Prediction) Bộ mã này thực thi trên những khung âm thanh 10 ms tương đương với tốc độ lấy mẫu 8000 sample/s Cứ mỗi khung

10 ms, tín hiệu âm thanh được phân tích để trích ra những tham số của mô hình CELP, những tham số này được mã hóa và truyền đi

Tại bộ phận giải mã, các tham số này được dùng vào việc khởi tạo và tổng hợp các tham số trong bộ lọc Âm thanh được khôi phục bằng cách lọc

Biểu đồ khối của bộ giải mã tín hiệu thoại

Trang 17

Trần Thanh Long - Nguyễn Thành Nam 16

khởi tạo này thông qua các bộ lọc tổng hợp và bộ lọc dự đoán Sau khi tính toán xong luồng, âm thanh vừa được tổng hợp lại được nâng cao hơn nữa bằng một bộ postfilter

4.2.1 Nguyên lý mã hóa:

Nguyên lý mã hóa được biểu diễn trong hình dưới đây Tín hiệu đầu vào được chuyển lên bộ lọc chất lượng cao và được chia tỷ lệ trong những khối trước khi xử lý Tín hiệu tiền xử lý cung cấp như là tín hiệu đầu vào để dùng cho tất cả những việc phân tích tiếp theo Việc phân tích dự đoán tuyến tính (Linear Prediction - LP) được làm một lần trên một khung 10 ms để tiến hành tính toán hệ số lọc LP Các hệ số này được chuyển sang dạng quang phổ vạch dạng đôi (Line Spectrum Pairs - LSP) và dạng lượng tử hóa sử dùng dự đoán hai giai đoạn vector lượng tử (Vector Quantization – VQ) 18 bits Sự kích hoạt tín hiệu được chọn bằng cách dùng một thủ tục tìm kiếm phân tích tổng hợp, trong đó những lỗi giữa âm thanh nguồn và âm thanh sau khi được tổng hợp lại giảm đến mức tối thiểu theo một quan niệm về việc đo lường trọng lượng không chính xác Việc này được thực hiện bằng cách lọc những tín hiệu lỗi theo quan niệm về trọng lượng mà các hệ số của nó nhận được từ

bộ lọc LP chưa được lượng tử hóa Hầu hết các quan niệm về trọng lượng được tương thích hóa để cải thiện hiệu năng của tín hiệu đầu vào với một tần

số đáp ứng không thay đổi Sự kích hoạt các tham số (các tham số cố định và

Biểu đồ khối của mô hình quan niệm tổng hợp CELP

Trang 18

Trần Thanh Long - Nguyễn Thành Nam 17

tương thích các ký hiệu điện tử) được xác định trên mỗi khung phụ (subframe) 5 ms (40 mẫu) Các hệ số trong bộ lọc LP đã được lượng tử hóa

và chưa được lượng tử hóa được sử dụng trong một khung phụ thứ hai, trong khi khung phụ thứ nhất được tự động thêm vào các hệ số trong bộ lọc LP để

sử dụng ( cả hệ số lượng tử và hệ số chưa được lượng tử hóa) Một vòng lặp

mở với độ delay của chất lượng tiếng nói được đánh giá một lần trên một khung 10 ms dựa trên quan niệm về trọng lượng của tín hiệu tiếng nói Sau

đó các thao tác này được lặp lại cho mỗi khung phụ Tín hiệu cần đạt đến x(n) được tính toán bằng cách lọc LP còn dư lại qua một bộ lọc phân tích trọng lượng W(z)/Â(z) Trạng thái khởi tạo của các bộ lọc này được cập nhật bằng cách lọc các lỗi giữa LP còn dư và LP kích thích, nó tương đương với việc trừ đi những tín hiệu zero ở đầu vào của bộ lọc tổng hợp trọng lượng từ trọng lượng của tín hiệu tiếng nói Những xung đáp ứng h(n) của bộ lọc tổng hợp trọng lượng được tính toán Sau đó vòng lặp đóng của chất lượng âm thanh được thi hành (để tìm độ delay của bộ mã tương thích các ký hiệu điện

tử và tăng tốc cho nó), dùng x(n) và h(n), và bằng cách tìm kiếm xung quanh những giá trị của vòng lặp mở độ delay của chất lượng âm thanh Độ trể của chất lượng âm thanh được mã hóa 8 bits rong khung phụ thứ nhất và mã hóa

5 bit cho khung phụ thứ hai Tín hiệu đạt được x(n) được cập nhật bằng cách trừ đi (lọc) các codebook tương thích tham gia vào, và một tín hiệu đạt được khác x’(n) được dùng trong việc tìm kiếm các fixed_codebook để tìm ra một

sự kích thích tương thích nhất Codebook đại số 17 bits được dùng cho sự kích thích fixed_codebook Sự gia tăng của độ tương thích và những mã cố định đóng góp vào là một vector lượng tử hóa 7 bits Cuối cùng bộ nhớ của

bộ lọc được cập nhật lại dùng tín hiệu kích thích đã được xác định trước

Trang 19

Trần Thanh Long - Nguyễn Thành Nam 18

4.2.2 Nguyên lý giải mã:

Cơ chế mã hóa của bộ mã hóa CS-ACELP

Cơ chế giải mã của bộ mã hóa CS-ACELP

Trang 20

Trần Thanh Long - Nguyễn Thành Nam 19

Trước tiên, tham số chỉ mục được trích ra từ luồng bits nhận được Những tham số chỉ mục này được giải mã để nhận được tham số mã hóa tương ứng với các khung thoại 10 ms Các tham số này đều là các hệ số LSP (Line Spectrum Pairs), hai phân số độ trễ chất lượng âm thanh, 2 vector fixed-codebook, và 2 tập hợp tính tương thích và fixed-codebook được tăng lên Các hệ số LSP được tự động thêm vào và chuyển đổi sang hệ số bộ lọc

LP (Linear Prediction) cho mỗi khung phụ Sau đó các bước sau được thực hiện cho mỗi subframe 5 ms:

Sự kích thích được xây dựng bằng cách thêm độ tương thích và chia tỷ

lệ các vector fixed-codebook bằng cách tăng những phần riêng của nó

Âm thanh được khôi phục lại bằng cách lọc sự kích thích thông qua một bộ lọc tổng hợp LP

Tín hiệu thoại sau khi đã được tái tạo, nó được chuyển qua công đoạn post-processing, nó bao gồm bộ tương thích postfilter dựa trên bộ lọc tổng hợp ngắn hạn và dài hạn, chuyển sang bộ lọc high-pass và tiến hành chia tỷ

lệ

Trang 21

Trần Thanh Long - Nguyễn Thành Nam 20

CHƯƠNG 2: TÌM HIỂU CÁC CHUẨN NÉN HÌNH ẢNH

1 Giới thiệu:

Cũng giống như các tín hiệu âm thanh, tín hiệu hình cũng gặp rất nhiều khó khăn trong việc truyền dẫn tín hiệu do sự hạn chế về băng thông Về điều này, Hiệp hội viễn thông quốc tế ITU-T cũng đưa ra một vài chuẩn nén dùng cho video như H.261, H.263 v.v… để có thể truyền các tín hiệu hình ảnh trên băng thông thấp nhưng vẫn đạt được chất lượng dịch vụ tốt Các chuẩn kỹ thuật này đang được sử dụng rộng rãi trong các hội nghị truyền hình

Ngoài ra, chúng ta có thể sử dụng các kỹ thuật nén hình khác như MPEG I & II phục vụ cho nhu cầu mã hoá chung các hình ảnh động Tuy nhiên, luận văn này đi sâu vào nghiên cứu hai chuẩn nén do ITU-T đưa ra là H.261 và H.263

2 Chuẩn nén H.261:

2.1 Giới thiệu:

Chuẩn H.261được ITU-T đưa ra vào năm 1990 Chuẩn này đưa ra những phương pháp mã hoá và giải mã hình ảnh, dùng trong việc truyền hình ảnh video của các dịch vụ nghe nhìn với tốc độ px64Kbps ( p = 1- 30 ) Chuẩn này thực sự hiệu quả khi sử dụng cho các ứng dụng sử dụng trong mạng chuyển mạch điện tử (SCN) H.261 thường được dùng với các chuẩn khác như: H221, H230, H242 và H320 hoặc những chuẩn mới

2.2 Đinh dạng ảnh nguồn của chuẩn H.261

Bộ mã nguồn chỉ có tác dụng với loại ảnh không đan xen interlaced) Ảnh được mã hoá theo độ sáng và hai thành phần màu khác nhau (Y, Cb,Cr) Ma trận Cb, Cr có kích thước bằng một nửa ma trận Y

(non-H261 hỗ trợ hai độ phân giải ảnh khác nhau: QCIF(144*176 pixel) và CIF(288*352 pixel)

Trang 22

Trần Thanh Long - Nguyễn Thành Nam 21

Trong bộ mã hoá H.261, có ba thành phần chính là prediction, block tranformation, quantization & entropy coding Chúng ta sẽ đi sau vào các phần trên đây

a Prediction:

H261 định nghĩa hai loại mã khác nhau:

• INTRA coding: mỗi block 8*8 pixel được mã hoá một cách độc

lập và được gởi đi trực tiếp đến tiến trình chuyển đổi block (block transformation process)

• INTER coding: mỗi frame được mã hoá có sự liên quan đến các

frame khác Độ sai lệch được tính toán giữa một vùng 16*16 pixel (gọi là macroblock) với một macroblock của frame trước

b Block transformation:

H261 hỗ trợ việc bù đắp những mất mát của quá trình chuyển động trong bộ mã hoá như một tùy chọn Trong việc bồi thường chuyển động, một vùng tìm kiếm được xây dựng dựa trên frame trước

để xác định macroblock tham chiếu tốt nhất (reference macroblock)

Cả độ sai lệch ước tính cũng như vector chuyển động, xác định giá trị

và hướng di chuyển giữa macroblock được mã hóa và vùng tham chiếu

đã chọn đều được gửi đi Cùng tìm kiếm cũng như làm thế nào để tính toán vector chuyển động không tùy thuộc và sự chuẩn hóa Thành

Y

Y

Y

YCb

Cr

H.1

Trang 23

Trần Thanh Long - Nguyễn Thành Nam 22

phần nằm ngang và thẳng đứng của vector phải có giá trị nguyên nằm trong khoảng -15 đến 15

Trong sự biến đổi khối, những frame mã hóa theo kiểu INTRA cũng như những sai số dự đoán đều được đưa vào trong khối 8*8 Mỗi khối sẽ được xử lý bởi một hàm FDCT hai chiều

c Quantization & Entropy Coding:

Mục đích của bước này là đạt được sự nén tốt hơn bằng các hệ

số DCT (Discrete Cosine Transform) để đạt được chất lượng đòi hỏi

Số lượng tử hóa là 1 đối với các hệ số INTRA và là 31 cho tất cả các

hệ số khác

Mã hóa entropy kéo theo sự nén tốt hơn được thực hiện bằng cách gán những từ mã ngắn hơn cho những sự kiện phổ biến và sử dụng những sự kiện ít phổ biến hơn Mã hóa Huffman thường được sử dụng trong trường hợp này

Nói cách khác, chúng ta có thể mất một vài hệ số trong việc chuyển đổi bằng cách sử dụng ít bit hơn so với số bit cần thiết cho tất

cả các giá trị Chúng ta sẽ dùng những từ mã ngắn hơn đối với những giá trị thông thường (giống như việc sử dụng 8 bit cho việc mã hóa 3 kí

tự trong tiếng Anh)

H.2 Structure of picture layer

Trang 24

Trần Thanh Long - Nguyễn Thành Nam 23

• PSC : Picture Start Code (20 bit), có giá trị 0000 0000 0001 0000 0000

• TR : Temperal Reference (5 bit):

Có 32 giá trị khác nhau, nó được thành lập bằng cách tăng giá trị đó

ở header của ảnh đã chuyển trước lên 1 cộng với số lượng ảnh chưa được chuyển kể từ ảnh notice chuyển cuối cùng

• PTYPE : Type Information (6 bit):

Thông số này lưu thông tin về toàn bộ ảnh

Bit 1: Split screen indicator, “0”: off , “1”: on Bit 2: Document camera indicator, “0”: off, “1”: on Bit 3: Freeze Picture Release, “0”: off , “1”: on Bit 4: Source Format, “0”: QCIF , “1”: CIF

Bit 5,6 Space

• PEI : Extra Insertion Information (1 bit)

Được bật lên 1 nếu có trường data tùy chọn theo sau

• PSPARE : Spare Information (0, 8, 16 …bits)

Nếu trường PEI được bật lên 1 thì 9 bits bao gồm 8 bits data và 1 bit PEI dùng để chỉ tiếp 9 bits theo sau và cứ tiếp tục như thế cho đến khi bit PEI = 0

2.3.2 Group of blocks (GOB):

Ứng với 1/12 CIF (Common Image Format) picture hoặc 1/3 QCIF (Quarter Common Image Format)

H.3 Trật tự của một GOB trong một ảnh

Trang 25

Trần Thanh Long - Nguyễn Thành Nam 24

Dữ liệu cho một group of block bao gồm một GOB header theo sau là macroblock data Cẩu trúc của nó như sau:

• GBSC : Group of Blocks Start Code (16 bits)

Một word 16 bits, có giá trị là 0000 0000 0000 0001

• GN : Group of Number (4 bits)

4 bits này dùng để chỉ vị trí của group of blocks

• GQUANT : Quantizer Information (5 bits)

Dùng để chỉ ra lượng tử hóa (quantizer) được dùng trong group of block cho đến khi bị loại bỏ bởi bất kỳ một MQUANT nào theo sau Đây

là giá trị của lượng tử có trị số từ 1-31

• GEI : Extra Insertion Information (1 bit)

Được bật lên 1 khi có trường data

• GSPARE : Spare Information (0,8,16,…bits)

Khi thông số GEI bật lên thì 9 bits theo sau sẽ bao gồm 8 bits data

và 1 bit GEI khác dùng để 9 bits tiếp theo và cứ tiếp tục như thế cho đến khi gặp bit GEI = 0

2.3.3 Macroblocks:

Mỗi GOB (Group of Block) được chia thành 33 macroblock ứng với 16*16 pixel của cường độ sáng và 2 thành phần màu (8*8)

H.4 Structure of GOB Layer

12 13 14 15 16 17 18 19 20 21 22

23 24 25 26 27 28 29 30 31 32 33

H.5 Trật tự của các macroblock trong một GOB

H.6 Cấu trúc một lớp macroblock

Trang 26

Trần Thanh Long - Nguyễn Thành Nam 25

• MBA : Macroblock Address

Có độ dài thay đổi dùng để chỉ vị trí của macroblock trong một group of block Trật tự được truyền đi theo đúng thứ tự như hình 5 ở trên Đối với macroblock đẩu tiên trong GOB thì MBA chính là địa chỉ tuyệt đối theo như hình 5 Còn đối với các macroblock cuối cùng notice chuyển

đi Những macroblock nào không chứa thông tin của phần ảnh đó sẽ không được chuyển đi

• MTYPE : Type Information

Là từ mã có độ dài thay đổi cung cấp thông tin về macroblock và những yếu tố data có mặt

• MQUANT : Quantizer (5 bit)

Giá trị của MQUANT cũng giống GQUANT

• MVD : Motion Vector Data

Giá trị MVD tính được từ macroblock vector bằng cách trừ đi vector của macroblock đi trước được xem là bằng 0 trong 3 trường hợp sau:

9 Macroblock 1,12,23

9 Các macroblock mà MBA có độ sai lệch khác 1

9 MTYPE của macroblock trước không phải là MC MVD bao gồm một word mã hóa thành phần ngang và theo sau là môt word mã hóa thành phần dọc

• CPB : Coded block pattern

Trường này chỉ có khi nó được chỉ định bởi trường MTYPE Từ mã (codeword) cung cấp 1 con số chỉ định những block ở trong macroblock nào có ít nhất một hệ số biến đổi được truyền đi

Trang 27

Trần Thanh Long - Nguyễn Thành Nam 26

2.3.4 Block:

Ứng với 8*8 pixel Dữ liệu cho mỗi block bao gồm các codewords cho các hệ số biến đổi theo sau là kí hiệu kết thúc block Trật tự của các block trong một macroblock như sau:

Cấu trúc của block layer như sau:

• TCOEFF : (Transform Coefficients)

Hệ số biến đổi luôn luôn biểu thị cho tất cả 6 blocks trong một macroblock khi trường MTYPE chỉ định là INTRA Các hệ số biến đổi đã được lượng tử hóa được truyền đi một cách tuần tự theo một dãy như sau:

3 Chuẩn nén H.263:

3.1 Giới thiệu:

H263 ra đời khoảng 5 năm sau chuẩn H261, là phần mới thêm vào trong loạt chuẩn H của ITU và mục đích là để mở rộng khả năng mã hóa video cho việc truyền thông tốc độ thấp (Low Bit Rate Communication) H.263 được thiết kế cho mạng có tốc độ nhỏ hơn 64 Kbps, rất thích hợp cho các mạng truyền thông có băng thông thấp Chuẩn này chỉ mở rộng thêm một vài phần so với chuẩn H.261 nên trong mục này, ta chỉ nêu lên sự khác biệt giữa hai chuẩn này

Trang 28

Trần Thanh Long - Nguyễn Thành Nam 27

3.2 Những khác biệt giữa H.263 và H.261:

3.2.1 SubQCIF:

H263 ngoài việc hỗ trợ các độ phân giải QCIF (176*144), CIF(352*288), 4CIF(704*576), 16CIF (1048*1152), nó còn hỗ trợ dạng mới gọi là SubQCIF(352*288)

3.2.2 Cách tính độ sai lệch tốt hơn:

H263 xem xét trước tất cả khả năng có thể để lựa chon vùng tham chiếu tốt nhất Tùy chọn APM (Advanced Prediction Mode) cho phép tính vector chuyển động sử dụng 4 block 8*8 thay vì 1 block 16*16 Nếu tùy chọn này được xác định thì thuật toán tính độ sai lệch sẽ tính 4 vector chuyển động V1,V2,V3,V4

3.2.3 Độ chính xác trong việc dự đoán:

H263 đưa ra một cách tính phần phải chuyển đi (carrier of motion) với

độ chính xác cao hơn Một khi nó quyết định mã hóa INTER và đã tính được vector chuyển động của macroblock, H263 đưa ra một thuật toán để tính một phần chuyển đi mới (carrierer motion) dựa vào search pixel (Half Pixel Search)

3.2.4 Cách xử lý truyền macroblock:

Một macroblock sẽ không được chuyển đi nếu nó giống với macroblock trước H261 truyền MBA (macroblock address) với độ dài từ mã khác nhau trong khi H263 thì chỉ truyền có 1 bit

Trang 29

Trần Thanh Long - Nguyễn Thành Nam 28

CHƯƠNG 3: TÌM HIỂU VỀ VOICE OVER IP

1 Giới thiệu về VoIP:

VoIP là từ viết tắt của Voice Over Internet Protocol Đúng như tên gọi của chúng, nghi thức truyền âm thanh này sử dụng phương pháp truyền tín hiệu âm thanh thông qua truyền các gói tin thông qua mạng IP Bằng cách này, VoIP có thể sử dụng tốc độ của phần cứng để hoàn thành mục đích và có thể hữu dụng trên môi trường PC

VoIP có khả năng kết hợp thoại và dữ liệu trong quá trình xử lý truyền, phân phối thông, cuộc gọi điện thoại, hội nghị truyền hình, các trò chơi tương tác trực tuyến cũng như phân phối các ứng dụng truyền thanh, truyền hình và phát quảng bá

Đây là công nghệ viễn thông hấp dẫn và được chú ý nhiều nhất hiện nay Việc sử dụng VoIP làm cho quá trình phân phối thông tin và dịch vụ toàn cầu hiệu quả hơn và kinh tế hơn so với sử dụng mạng chuyển mạch thoại công cộng truyền thống (PSTN), trong khi đó vẫn cho phép sử dụng các ứng dụng và dữ liệu trước đây VoIP có thể thực hiện tất cả các chức năng tương

tự với mạng truyền thống với chất lượng dịch vụ tốt

2 Ưu điểm của VoIP so với PSTN:

2.1 Tiết kiệm băng thông:

Mạng VoIP hiệu quả hơn mạng PSTN trên cơ sở các kênh chuyên dùng được thiết lập giữa các điểm cuối Ðối với cuộc gọi thông thường có đến 40% thời gian bị lãng phí bởi những khoảng lặng (không nói chuyện) Trong mạng VoIP, các gói chỉ được gởi qua mạng khi có tín hiệu cần truyền

đi Ðiều này cho phép mạng có thể điều khiển được một lưu lượng nhiều hơn qua độ rộng băng thông sẵn có

Trang 30

Trần Thanh Long - Nguyễn Thành Nam 29

2.2 Đơn giản hóa:

VoIP là môt mô hình tổng hợp, chấp nhận mọi dạng thông tin cho phép thực hiện việc chuẩn hoá và giảm bớt một phần trang thiết bị dùng riêng cho từng loại hình Tích hợp các ứng dụng về thoại và dữ liệu

2.3 Khả năng tích hợp:

Khả năng này được minh họa một cách rõ nhất bằng việc hỗ trợ phối hợp giữa mạng không dây và mạng có dây, khả năng hợp nhất các ứng dụng riêng lẽ trong truyền thống qua các giao thức gắn kết

Sự tích hợp qua mạng IP đưa ra các giải pháp truy cập hợp nhất các dịch vụ trong mạng diện rộng WAN bao gồm thoại, dữ liệu, Internet, hình ảnh qua một hệ thống các đường truy cập tốc độ cao dùng chung

2.4 Uyển chuyển trong quản lý:

Được thể hiện qua khả năng mở rộng của địa chỉ IP, có thể mở rộng hay thu hẹp phạm vi của mạng một cách dễ dàng mà không gây nên sự biến đổi lớn nào về phần cứng và phần mềm

Việc thêm hay bớt người sử dụng điện thoại, sắp xếp lại các số trên mạng IP đều dễ dàng hơn so với hệ thống chuyển mạch thoại truyền thống Việc định dạng và chuyển nhượng địa chỉ IP có thể được thực hiện bằng cách

sử dụng giao thức DHCP, áp dụng cho điện thoại IP qua LAN khiến việc lập

và quản lý địa chỉ gần như tự động

Đối với việc kết nối với tổng dài nội bộ (PBX) qua mạng IP được đưa

ra bởi PSINet’s Voice iPEnterprise, phân phối lưu lượng thoại nội bộ qua kết nối tượng tự như dữ liệu của Internet, cho phép các nhà kinh doanh truyền các dịch vụ thoại tới văn phòng của họ

2.5 Quản lý tốt:

Giao thức quản lý SNMP có thể áp dụng vào cho dữ liệu và thoại dùng trong VoIP để có thể loại bỏ sai sót và củng cố hệ thống

Trang 31

Trần Thanh Long - Nguyễn Thành Nam 30

Được phát triển trên mạng IP, VoIP sử dụng các giải pháp bảo mật cho Internet gồm mã hoá, tạo đường hầm, xác nhận sự xâm nhập tự động, quét virus được thực hiện bởi các máy chủ, firewall, các bộ định tuyến đã giải quyết được các vấn đề về gian lận cước phí, toàn vẹn dữ liệu

3 Các hình thức truyền thoại trên mạng IP:

3.1 PC-PC :

Mỗi PC trang bị thêm các thiết bị truyền thông và được kết nối trực tiếp vào mạng Internet thông qua giao diện NIC với mạng LAN hoặc thông qua Modem / cable modem khi kết nối qua ISP (Internet Sevice Provider)

3.2 PC – Phone :

Người dùng PC hình thành cuộc gọi với người dùng mạng thoại PSTN thông thường Cấu trúc này là đường dẫn tới việc kết hợp giữa mạng IP và PSTN

3.3 Phone - Internet - Phone :

Là mô hình mở rộng của PC – Phone, sử dụng Internet làm cơ sở để tính cước phí điện thoại cho người sử dụng mạng PSTN Mô hình này sử dụng một mã số đặc biệt là giá trị cổng kết nối giữa PSTN và mạng Internet rồi mới nhấn số điện thoại cần gặp Mọi quá trình lấy mẫu và mã hoá đều diễn ra ở gateway

Trang 32

Trần Thanh Long - Nguyễn Thành Nam 31

4 Nguyên tắc và mô hình hoạt động của VoIP:

4.1 Quá trình thiết lập một kết nối VoIP :

- Bộ phận ADC chuyển đổi âm thanh dạng tín hiệu tương tự sang tín hiệu số, được biểu diễn bằng các chuỗi bit

- Các chuỗi bit này được nén với một định dạng để truyền bằng các nghi thức nén dữ liệu phù hợp tuỳ chọn

- Đóng gói âm thanh vào gói dữ liệu và truyền đi bằng nghi thức RTP(real-time transport protocol), thông thường sử dụng RTP over UDP

- Dùng nghi thức báo hiệu ITU-T H323 để gọi các user

- Bên RX sẽ mở gói tin, giải nén dữ liệu, chuyển dữ liệu từ tín hiệu

số sang tín hiệu âm thanh dạng tương tự và gửi tới card âm thanh (hay phone)

4.2 Mô hình hoạt động của VoIP:

5 Các nghi thức được sử dụng trong hệ thống VoIP:

5.1 Giao thức UDP (User Datagram Protocol):

UDP thực hiện truyền dữ liệu với số header hạn chế tối đa vì giao thức này không đòi hỏi kiểm tra qua lại giữa bên nhận và bên phát Các gói tìm đường độc lập để đến nơi nhận, do đó không đảm bảo dữ liệu được nhận đầy

Trang 33

Trần Thanh Long - Nguyễn Thành Nam 32

đủ và đúng thứ tự Tuy nhiên, thời gian truyền dữ liệu ngắn với độ hiệu quả

sử dụng các gói cao nên UDP được sử dụng là giao thức chính trong VoIP

5.2 Giao thức RTP (Realtime Protocol):

Giao thức này cung cấp các dịch vụ về dữ liệu mang tính thời gian thực như video và audio tương tác Các ứng dụng này chạy dựa trên nền UDP để tận dụng được khả năng multiplexing và checksum Cả hai giao thức này góp phần tạo nên các tính năng của nghi thức truyền dữ liệu RTP có thể được dùng hiệu quả hơn trong các hệ thống mạng hay nghi thức thích hợp RTP cũng hỗ trợ truyền dữ liệu đến nhiều địa chỉ khác nhau bằng cách dùng cơ chế multicast nếu được sự hỗ trợ của hệ thống mạng Chúng ta sẽ tìm hiểu rõ hơn về nghi thức này trong phần tìm hiểu về các nghi thức mạng truyền dữ liệu theo thời gian thực

5.3 Giao thức RTCP ( RTP Control Protocol ):

Giao thức điều khiển RTP truyền các gói điều khiển theo chu kỳ cho mọi thành viên trong phiên làm việc, sử dụng cùng một cơ chế phân phối như đối với các gói dữ liệu RTCP thực hiện bốn chức năng sau: Cung cấp các phản hồi về chất lượng của quá trình phân phối dữ liệu, giữ vết các thành phần tham gia, kiểm soát tốc độ để có thể phục vụ cho một số lượng lớn các thành phần tham gia, kiểm soát phiên làm việc

5.4 Giao thức RSVP:

Hỗ trợ cho giao thức RTP, giao thức RSVP có thể giải quyết tạm thời các lỗi có thể xảy ra trên đường truyền để đảm bảo các tham số chất lượng Giao thức RTP chỉ kiểm tra sự truyền thông điểm - điểm, không quản lý các tham số liên kết trên mạng trong khi RSVP không những tác động ở máy phát

và máy thu mà còn tác động trên các router trên mạng

RSVP thiết lập và duy trì kết nối duy nhất cho một luồng dữ liệu, xác lập một hệ thống quản lý các nguồn tài nguyên của các nút mạng khác nhau

Trang 34

Trần Thanh Long - Nguyễn Thành Nam 33

RSVP hoạch định một mô hình tối ưu để liên kết các dữ liệu đa điểm (

từ một nguồn đến nhiều điểm đích) RSVP đóng vai trò quản lý một cách độc lập các máy đích để tự thích nghi các tham số chất lượng giữa khả năng cung cấp và yêu cầu đáp ứng

Ðể đảm bảo đường truyền thông suốt, các hệ thống đầu cuối phải hoạt động ở chế độ kết nối Máy thu phải thường xuyên gởi các thông điệp RSVP đến các router để đảm bảo thông suốt đường truyền

5.5 SGCP:

Giao thức này cho phép các thành phần điều khiển cuộc gọi có thể điều khiển kết nối giữa các trung kế, các Endpoint và cácVoIP gateway Các thành phần điều khiển gọi là Call Agent SGCP được dùng để thiết lập duy trì và giải phóng cuộc gọi qua mạng IP Call Agent thực hiện chức năng báo hiệu cuộc gọi và Gateway cung cấp chức năng truyền tín hiệu âm thanh SGCP yêu cầu các Gateway thực hiện chức năng thiết lập, điều chỉnh, giải phóng kết nối và báo hiệu về Call Agent các sự kiện xảy ra tại gateway SGVP có 5 lệnh chính như sau:

- NotificationRequest: yêu cầu Gateway phát hiện các tín hiệu nhấc

máy và tín hiệu quay số DTMF

- Notify: Gateway sử dụng lệnh này để báo ngược về Call Agent các

tín hiệu trên

- CreateConnection: Call Agent yêu cầu tạo kết nối giữa cá đầu cuối

tham gia liên lạc trong gateway

- ModifyConnection: Call Agent dùng lệnh này để thay đổi các

thông số về kết nối đã thiết lập Lệnh này để thay đổi các thông số

về kết nối đã thiết lập Lệnh này cũng có thể dùng các gói RTP thay đổi lộ trình từ Gateway này sang Gateway khác

- Deleteconnection: Call Agent và Gateway dùng lệnh này để giải

phóng kết nối

Trang 35

Trần Thanh Long - Nguyễn Thành Nam 34

5.6 MGCP:

MGCP xác định cách thức truyền thông giữa các đại lý(call agent) và các cổng điện thoại (telephony gateway) Call agent điều khiển cuộc gọi, quản lý các telephony gateway được dùng để chuyển đổi giao thức MGCP

có bốn lệnh chính như sau:

- EndPointConfiguration: Call Agent dùng lệnh này để yêu cầu

Gateway xác định kiểu mã hoá ở phía đường dây kết nối tới EndPoint

- AudiEndpoint và AudiConnection: Call Agent kiểm tra trạng thái

và kết nối ở một Endpoint

- RestarIn_Progress: Gateway báo hiệu cho Call Agent khi nào các

Endpoint ra khỏi dịch vụ hoặc quay lại sử dụng dịch vụ

6 Các vấn đề liên quan đến chất lượng dịch vụ :

Chất lượng của các dịch vụ truyền thông đa phương tiện được xem là vấn đề quan quyết định sự phát triển của dịch vụ đó Mọi dịch vụ truyền thông đa phương tiện phát triển trên mạng VoIP đều phải khắc phục chất lượng về âm thanh sau khi nén và điều này là một trong những lý do quan trọng nhất khiến VoIP không cạnh tranh được với mạng điện thoại truyền thống PSTN Có 3 yếu tố chính gây ảnh hưởng trực tiếp đến chất lượng tín hiệu thoại trong VoIP là : mất gói, trễ gói và jitter

6.1 Mất gói và các giải pháp khắc phục tình trạng này:

6.1.1 Tổng quan:

• Là hiện tượng chung trong môi trường chuyển mạch gói

• Các gói được truyền giữa các đầu cuối thông qua các router trung gian Khi các router này quá tải, nghẽn mạch sẽ dẫn đến mất gói

6.1.2 Các giải pháp khắc phục:

• Nâng cấp mạng

• Lấp gói mất bằng khoảng lặng

Trang 36

Trần Thanh Long - Nguyễn Thành Nam 35

• Thay thế các gói mất bằng cách chèn nhiễu trắng

• Phát lại gói cuối nhận được với âm lượng nhỏ hơn

• Thêm gói dựa vào đặc tính sóng âm của các gói lân cận

• Chèn khung thoại vào các gói khác nhau

• Nguyên nhân: do độ trễ của quá trình mã hoá, giải mã tiếng nói gây

ra, thời gian truyền, hay do xếp hàng trong các buffer tại các nút chuyển mạch và nút truyền số liệu, …

• jitter là khoảng thời gian đến nơi nhận khác nhau của các gói thoại,

là yếu tố ảnh hưởng nghiêm trọng đến chất lượng thoại trong VoIP

• Để giải quyết vấn đề này, phía thu phải có một bộ đệm jitter để sắp xếp các gói nhận theo đúng thứ tự phát Thời gian lưu trữ làm tăng thêm thời gian delay

• Các gateway cần có khả năng thay đổi kích thước bộ đệm jitter để thích nghi với thời gian trễ trong mạng

• Kích thước chung của buffer là 50-100ms

Trang 37

Trần Thanh Long - Nguyễn Thành Nam 36

• Ngoài ra nghẽn mạch trên mạng cũng ảnh hưởng rất lớn đến chất lượng thoại

6.4 Kết luận:

Cần giải quyết tốt các vấn đề nêu trên để chất lượng dịch vụ được cung cấp trên môi trường mạng VoIP được cải tiến, nâng khả năng cạnh tranh với mạng truyền thống PSTN

Trang 38

Trần Thanh Long - Nguyễn Thành Nam 37

CHƯƠNG 4: TÌM HIỂU CÁC NGHI THỨC TRUYỀN THÔNG THỜI

GIAN THỰC RTP (Realtime Protocol)

Trong môi trường truyền thông trên mạng hiện nay, việc truyền các tín hiệu được truyền đều được dựa trên các chuẩn kỹ thuật khác nhau Các nghi thức truyền thông thời gian thực cũng là một trong số các chuẩn kỹ thuật được đưa ra cho hạ tầng mạng hiện nay nhằm truyền các gói tin trong thời gian thực, phục vụ cho các ứng dụng truyền thông đa phương tiện trực tuyến như hội nghị truyền hình (video conference), hội nghị thoại (voice conference) v.v… Trong chương này, chúng ta sẽ cùng đi sâu tìm hiểu rõ về hai chuẩn kỹ thuật tryền thông thời gian thực hiện nay là RTP và RTCP

1 Giới thiệu giao thức RTP (Realtime Protocol):

Realtime Protocol là một chuẩn Internet để truyền các luồng thông tin giữa các thành phần tương tác trên mạng RTP cung cấp các dịch vụ về dữ liệu mang tính thời gian thực như video và audio Thông thường các ứng dụng chạy RTP dựa trên UDP để tận dụng khả năng multiplexing và kiểm lỗi RTP hỗ trợ việc truyền dữ liệu đến nhiều địa chỉ đích bằng cách dùng cơ chế multicast nếu được hỗ trợ bởi hệ thống mạng

RTP không có sẵn các cơ chế để đảm bảo việc truyền theo thời gian hay các kỹ thuật về QoS mà dựa vào các dịch vụ ở lớp dưới để thực hiện những khả năng này RTP không đảm bảo an toàn hay thứ tự các packet khi truyền, số thứ tự trong RTP packet cho phép bên nhận sắp xếp lại các packet theo thứ tự khi truyền của bên gửi Ngoài ra số thứ tự cũng có thể được tận dụng để xác định vị trí thích hợp của một packet, ví dụ trong việc giải mã video, mà không cần phải giải mã các packet theo thứ tự

2 Các khái niệm và định nghĩa được sử dụng trong RTP:

RTP payload: Dữ liệu được chuyển trong RTP packet, ví dụ như các

mẫu âm thanh (audio samples ) hay các dữ liệu hình ảnh nén (compressed video data)

Trang 39

Trần Thanh Long - Nguyễn Thành Nam 38

RTP packet: Một gói dữ liệu bao gồm RTP header, danh sách các

nguồn cung cấp (contributing sources) có thể rỗng và dữ liệu payload Một số nghi thức mạng nền có thể yêu cầu phải xác định cơ chế đóng gói cho RTP packet Thông thường một gói của nghi thức mạng nền chứa một RTP packet, nhưng cũng có thể chứa nhiều tùy theo cơ chế đóng gói (encapsulation)

RTCP packet: Một gói điều khiển bao gồm phần header tương tự như

của RTP packet, phần còn lại là các thành phần có cấu trúc tùy thuộc loại của gói RTCP Thông thường nhiều gói RTCP được gởi cùng lúc như một gói RTCP tổng hợp được chứa trong một gói của nghi thức mạng nền

Transport address: Sự kết hợp của địa chỉ mạng và cổng (port) để

xác định một điểm cuối (endpoint) ở mức transport, ví dụ như một địa chỉ IP

và cổng UDP Các packets được truyền từ địa chỉ nguồn đến địa chỉ đích

RTP session: Là sự kết hợp của các thành phần tham gia trao đổi

thông tin Đối với mỗi thành phần tham gia, phiên (session) được xác định bởi một cặp địa chỉ truyền đích Cặp địa chỉ đích này có thể là chung cho mọi thành phần tham gia hoặc riêng cho từng thành phần Trong một phiên đa phương tiện, mỗi phương tiện được chuyển tải bởi một RTP session riêng cùng với các gói RTCP của nó Các phiên RTP khác nhau được phân biệt bởi các cặp ports và địa chỉ multicast

Synchronization source (SSRC): Nguồn của luồng các gói RTP được

xác định bởi một số định danh 32 bit trong header của gói RTP để độc lập với địa chỉ network Mỗi gói từ nguồn đồng bộ (SSRC) có cùng một không gian

về thời gian và số thứ tự, do đó bên nhận có thể nhóm các gói để phát lại (playback) Một nguồn đồng bộ có thể thay đổi định dạng dữ liệu của nó vào bất cứ lúc nào Định danh nguồn đồng bộ là một giá trị ngẫu nhiên, giá trị này mang ý nghĩa duy nhất (không trùng lắp) trong một RTP session riêng biệt Một thành viên tham gia hội thảo không cần phải dùng cùng một định danh SSRC trong một phiên đa phương tiện

Trang 40

Trần Thanh Long - Nguyễn Thành Nam 39

Contributing source (CSRC): Là nguồn của luồng các gói RTP đã

góp phần tạo nên luồng kết hợp thông qua một bộ trộn RTP (RTP mixer) Bộ trộn RTP chèn một danh sách các định danh nguồn đồng bộ (SSRC identifier) của các nguồn vào RTP header của một gói RTP Danh sách này được gọi là danh sách CSRC

End system: Là một ứng dụng có khả năng tạo ra các nội dung để

truyền trong các gói RTP, hay nhận và xử lý nội dung của gói RTP Một endsystem có thể hoạt động như một hoặc nhiều nguồn đồng bộ trong một phiên RTP riêng, nhưng thường là một

Mixer: Là một hệ thống trung gian nhận các gói RTP từ một hay nhiều

nguồn, có thể thay đổi định dạng dữ liệu rồi kết hợp các gói đó lại theo một cách thức nào đó tạo thành một gói RTP mới và truyền đi Vì sự phối hợp thời gian giữa các nguồn có thể không hoàn toàn đồng bộ nên bộ trộn sẽ đồng

bộ thời gian giữa các nguồn và sau đó, luồng ra sẽ có một sự định thời của mixer Do đó các gói được tạo ra từ một mixer đều xác định mixer là nguồn đồng bộ

Translator: Là một hệ thống trung gian có nhiệm vụ chuyển tiếp các

gói RTP mà không làm thay đổi các nguồn đồng bộ

Monitor: Là một ứng dụng tiếp nhận các gói RTCP được gửi từ các

thành viên của một phiên RTP, báo cáo cụ thể sự tiếp nhận, ước lượng chất lượng của dịch vụ hiện thời và dự đoán lỗi Chức năng monitor thường được xây dựng trong các ứng dụng tham gia trong phiên, hoặc cũng có thể được xây dựng như một ứng dụng tách biệt, có thể là thành viên hoặc không và không gởi, nhận các gói dữ liệu RTP Chúng được gọi là những monitor tham gia thứ ba

Non-RTP means: Là các nghi thức hay cơ chế có thể được dùng để

thêm vào RTP để làm tăng tính khả dụng của các dịch vụ

Ngày đăng: 18/06/2014, 20:20

HÌNH ẢNH LIÊN QUAN

Hình 2: Hệ thống kênh phân phối sản phẩm - Luận văn: Nghiên cứu và xây dựng chương trình truyền thông đa phương tiện docx
Hình 2 Hệ thống kênh phân phối sản phẩm (Trang 11)
Hình 3: Mô hình tổ chức bộ máy quản lý của - Luận văn: Nghiên cứu và xây dựng chương trình truyền thông đa phương tiện docx
Hình 3 Mô hình tổ chức bộ máy quản lý của (Trang 28)
Bảng 1: Tình hình doanh thu tiêu thụ sản phẩm chính  của Công ty bánh kẹo Hải Châu (2001 - 2003) - Luận văn: Nghiên cứu và xây dựng chương trình truyền thông đa phương tiện docx
Bảng 1 Tình hình doanh thu tiêu thụ sản phẩm chính của Công ty bánh kẹo Hải Châu (2001 - 2003) (Trang 32)
Bảng 4: Tình hình tiêu thụ theo quí (2002 - 2003) - Luận văn: Nghiên cứu và xây dựng chương trình truyền thông đa phương tiện docx
Bảng 4 Tình hình tiêu thụ theo quí (2002 - 2003) (Trang 36)
Bảng 5: Kết quả hoạt động sản xuất kinh doanh năm 2001 - 2003 - Luận văn: Nghiên cứu và xây dựng chương trình truyền thông đa phương tiện docx
Bảng 5 Kết quả hoạt động sản xuất kinh doanh năm 2001 - 2003 (Trang 37)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w