Truyền thông ngữ nghĩa hay Semantic communications đang nổi lên như một bước đột phá nhằm vượt qua giới hạn về dung lượng kênh của định lý Shannon bằng cách truyền và nhận thông tin ngữ nghĩa thay vì các bit dữ liệu hoặc ký hiệu bất kể nội dung của bản tin. Đồ án này đề xuất một quá trình truyền thông ngữ nghĩa hai giai đoạn để nâng cao hiệu suất của hệ thống. Trong giai đoạn đầu, dữ liệu hình ảnh đầu tiên được giải mã khỏi tín hiệu nhận được. Hình ảnh được giải mã sau đó sẽ được xử lý tăng cường bởi một bộ lọc thông thấp nhằm nâng cao chất lượng hình ảnh ở giai đoạn hai. Các thông số đánh khác nhau được sử dụng để đánh giá chất khả năng khôi phục hình ảnh của mô hình được xem xét so với chất lượng hình ảnh ngay sau khi được khôi phục. Các thông số đánh giá khác nhau sử dụng cho việc đánh giá hiệu suất hệ thống dựa trên tiêu chí riêng của chúng có thể sẽ cho kết quả không đồng nhất với nhau, từ đó có thể đưa ra các nhận xét về hiệu quả của hệ thống truyền thông ngữ nghĩa này
GIỚI THIỆU ĐỀ TÀI
Đặt vấn đề
Các công nghệ truyền thông xuất hiện đã thay đổi đáng kể cách con người liên lạc lẫn nhau Nó đã trở thành một trong những động lực chính thúc đẩy sự phát triển của xã hội Trong 40 năm trở lại đây, mạng di động đã phát triển qua bốn thế hệ khác nhau, tính trung bình cứ 10 năm sẽ có một thế hệ mạng di động mới xuất hiện Mạng di động thế hệ đầu tiên (1G) đã xuất hiện vào những năm 80 của thế kỉ trước cho phép con người đàm thoại không dây sử dụng tín hiệu tương tự Các mạng di động tiếp theo càng ngày càng cho phép con người liên lạc và giao tiếp một cách dễ dàng và thuận tiện hơn với sự dịch chuyển từ việc sử dụng kỹ thuật tương tự sang kỹ thuật số, hỗ trợ các hình thức truyền thông đa phương tiện như gọi video, tin nhắn hình ảnh hay kết nối mạng di động với internet [1] Qua mỗi thế hệ, tốc độ xử lý và khả năng truyền tải dữ liệu lại tăng gấp bội, cho phép các công nghệ mới được hiện thực hóa.
Sự phát triển của các kỹ thuật và các công nghệ tiên tiến, có thể kể tới như trí tuệ nhân tạo (AI), công nghệ thực tế ảo (VR), đa phương tiện ba chiều ( 3D), Internet vạn vật (IoT) đã kéo theo một lưu lượng dữ liệu khổng lồ Bên cạnh đó, nhu cầu kết nối không dây của con người đã tăng nhanh không ngừng, đặc biệt với sự triển khai của mạng di động thế hệ thứ 5 (5G) với khả năng truyền tải dữ liệu vượt trội hơn so với thế hệ thứ 4 (4G), có thể lên tới 10Gbps, cùng khả năng đáp ứng một lượng cực lớn các thiết bị, lên tới 10,000 thiết bị dữ liệu thấp cùng các thiết bị di động truyền thống [2] Hiệp hội viễn thông thế giới (ITU) đã ước tính rằng, tổng lưu lượng dữ liệu di động toàn cầu vào năm 2010 là 7.462 EB/tháng, có thể đạt 144 EB/tháng vào năm 2022 và tăng nhanh lên tới 5016 EB/tháng vào năm 2030 [3].
Các thống kê trên cho thấy rằng, các yêu cầu về lưu lượng mạng không dây sẽ còn tăng theo cấp số mũ trong tương lai, đòi hỏi những mô hình mạng mới để đáp ứng các nhu cầu được đưa ra cho sự phát triển của công nghiệp và xã hội Tuy nhiên, một vấn đề được đặt ra ở đây là việc các hệ thống thông tin hiện tại đang dần tiếp cận tới ngưỡng giới hạn dung lượng kênh được đặt ra theo lý thuyết thông tin của Claude D Shannon vào năm 1948 Ở dưới góc nhìn của Shannon, góc độ ngữ nghĩa của thông tin được truyền đi được coi là không có tác động tới các vấn đề về kỹ thuật [4] Cho tới mạng 5G, các hệ thống vẫn được phát triển dựa vào học thuyết này và đang dần đi tới giới hạn khi những kỹ thuật nén, điều chế và giải điều chế cho phép tiếp cận gần hơn tới ngưỡng dung lượng kênh.
Các dữ liệu đa phương tiện đã chiếm một lượng lớn lưu lượng truyền tải của
CHƯƠNG 1 GIỚI THIỆU ĐỀ TÀI mạng Internet Cisco ước tính rằng, lưu lượng truyền tải đa phương tiện sẽ chiếm tới 82% lưu lượng Internet toàn cầu vào năm 2022, tăng từ 73% vào năm 2017 [5].
Dữ liệu đa phương tiện như hình ảnh, video là những dữ liệu có ngữ nghĩa, cấu trúc dữ liệu của chúng có sự tương quan chặt chẽ tới nhau Trong tương lai, sự phát triển của mạng di động thế hệ thứ 6 (6G) sẽ tìm giải pháp phá vỡ giới hạn lý thuyết của Shannon Một trong các hướng đi nhận được nhiều sự quan tâm là mạng truyền thông ngữ nghĩa, hay tiếng anh làSemantic communication (SemCom).
Mục tiêu và phạm vi đề tài
Hiện nay, đã có một số công trình nghiên cứu về Semcom, tuy nhiên các nghiên cứu này đang chủ yếu mang tính khảo sát [6], [7] Một số bài nghiên cứu khác cũng ứng dụng các thuật toán học máy (ML) và học sâu (DL) vào để giải quyết một số bài toán SemCom như khôi phục tín hiệu giọng nói trong quá trình truyền tin, hay đảm bảo chất lượng dữ liệu trong quá trình truyền [8], [9].
Qua sự tìm hiểu của tác giả, vẫn chưa có một nghiên cứu ứng dụng thông tin ngữ nghĩa để tăng cường chất lượng khôi phục tín hiệu phía thu Do đó đồ án này sẽ xem xét một hệ thống truyền thông không dây sử dụng cho hệ thống 5G mà tại đó, tín hiệu truyền đi sẽ là các hình ảnh Hình ảnh khi đó được mã hóa và điều chế trước khi truyền đi Tín hiệu nhận được sẽ được giải điều chế và khôi phục và tăng cường chất lượng sử dụng các bộ lọc số Sau đó, hiệu quả của quá trình sẽ được đánh giá sử dụng các chỉ số chất lượng khác nhau, cụ thể là PSNR cùng SSIM là hai chỉ số được sử dụng ở lớp ứng dụng và được áp dụng để so sánh trong xử lý ảnh BER là chỉ số đặc trưng để đánh giá hiệu quả một hệ thống viễn thông.
Phạm vi đề tài này chỉ xem xét một hệ thống truyền dẫn tuyến lên sử dụng công nghệ nhiều ăng-ten phát, nhiều ăng-ten thu (MIMO), một trong những công nghệ cốt lõi của mạng 5G Hệ thống sẽ xem xét trường hợp một thiết bị người dùng (UE) và một trạm thu phát tín hiệu (BS) với kênh truyền vô tuyến chịu ảnh hưởng của hiệu ứng đa đường để việc thiết kế và tính toán được đơn giản Mô hình được áp dụng này có thể dễ dàng mở rộng để tính toán các hệ thống đa người dùng (MU).
Bố cục đồ án
Phần còn lại của báo cáo đồ án tốt nghiệp này được tổ chức như sau:
Chương 2 trình bày kĩ hơn về các nghiên cứu và khảo sát tương tự về đề tài truyền thông ngữ nghĩa, từ đó rút ra các nguyên tắc chung, định hướng phát triển và những thách thức sẽ gặp phải của công nghệ này; các công nghệ cốt lõi sẽ được sử dụng và vai trò của SemCom đối với các thế hệ truyền thông trong tương lai mà gần nhất là hệ thống 6G.
CHƯƠNG 1 GIỚI THIỆU ĐỀ TÀI
Trong chương 3, tác giả sẽ giới thiệu về những cơ sở lý thuyết cần có để xây dựng một hệ thống truyền thông sử dụng công nghệ MIMO và Massive MIMO - công nghệ MIMO sử dụng số lượng ăng-ten rất lớn và lợi ích của công nghệ này. Tiếp đó, tác giả cũng sẽ nêu ra những cơ sở lý thuyết của Shannon về dung lượng kênh trong kênh đơn ăng-ten (SISO) và mở rộng ra đối với kênh MIMO, cũng như góc nhìn khác nhau của Shannon và Weaver về vấn đề ngữ nghĩa của tin truyền. Cuối cùng, các cơ sở toán học về xác suất thống kê, bộ lọc ảnh số, các thông số đánh giá chất lượng sẽ được đưa ra làm tiền đề cho quá trình mô phỏng và đánh giá ở các chương tiếp theo. Ở chương 4, một mô hình hệ thống truyền dẫn 5G sẽ được thiết kế, tính toán và mô phỏng như đã nêu, sử dụng công nghệ Massive MIMO Sau đó, bài toán khôi phục sẽ được khái quát lại Đây sẽ là mục tiêu chúng ta cần giải quyết và đánh giá.
Dựa vào mô hình hệ thống đã được thiết kế ở chương 4, chương 5 sẽ đưa ra các kết quả mô phỏng và đánh giá cũng như nhận xét các kết quả thu được này, từ đó rút ra kết luận về khả năng nâng cao hiệu quả dẫn truyền của hệ thống truyền thông ngữ nghĩa. Ở chương 6, tác giả sẽ tóm tắt lại kết quả nghiên cứu của đồ án, đưa ra nhận xét về ưu nhược điểm của việc sử dụng mô hình truyền tin này, các tiềm năng của truyền thông ngữ nghĩa và khả năng ứng dụng hoặc áp dụng các công nghệ khác vào để nâng cao hơn nữa chất lượng, đáp ứng bài toán nhu cầu truyền tải tăng cao trong tương lai.
Kết luận chương
Trong chương này, tác giả đã đưa ra nguyên nhân lựa chọn và tầm quan trọng của đề tài Ứng dụng truyền thông ngữ nghĩa trong truyền dẫn ảnh số , từ đó đưa ra mục tiêu và phạm vi của đề tài cũng như bố cục của đồ án Nội dung chi tiết của đồ án sẽ được trình bày trong các chương tiếp theo sau.
CÁC NGHIÊN CỨU LIÊN QUAN
Nghiên cứu khảo sát
Đã có nhiều bài khảo sát cũng như những tầm nhìn được đưa ra để định hướng sự phát triển của mạng 6G mà trong đó có sự xuất hiện của các mô hình SemCom được áp dụng Trong [10], tác giả đã đưa ra những tầm nhìn cho hệ thống mạng trong tương lai, thúc đẩy việc thay đổi những mô hình hệ thống viễn thông theo hướng ứng dụng SemCom vào để phục vụ những đòi hỏi của các dịch vụ mới sẽ xuất hiện trong tương lai như VR hay xe tự hành Tác giả đã định nghĩa việc giao tiếp giữa con người là sự trao đổi thông tin, cụ thể hơn là ngữ nghĩa của thông tin, là việc truyền tải một khái niệm từ nguồn tới đích Khía cạnh quan trọng được nhắc tới ở đây là việc truyền đạt ý nghĩa hay nội dung của thông tin, chứ không phải cách đưa thông tin tới đích Điều này có nghĩa là nếu ý nghĩa của gói tin được hiểu chính xác ở đích, không nhất thiết toàn bộ các chuỗi bit tín hiệu cần được truyền đi chính xác và không có lỗi Nghiên cứu cũng đưa ra thách thức đối với cách tiếp cận này là việc làm sao để trích xuất khi nghĩa của dữ liệu và khai thác các thông tin này một cách hiệu quả theo định hướng mục tiêu, tương tự như cách não bộ của con người hoạt động Các công nghệ như học máy, học sâu, học phân tán (FL), tính toán tại rìa (MEC) chắc chắn sẽ đóng những vai trò quan trọng trong thế hệ mạng tiếp theo.
Q Lan và các đồng sự trong nghiên cứu [6] đã đưa ra các mô hình giao tiếp bao gồm: giao tiếp người với người (H2H), giao tiếp người với máy (H2M), giao tiếp máy với máy (M2M) Trong đó ở hai mô hình phía sau, truyền thông ngữ nghĩa đóng một vai trò quan trọng nhằm truyền tải ý đồ của con người tới cho máy tính, từ đó để các chương trình có thể xử lý và đưa ra quyết định Mặt khác, truyền thông
CHƯƠNG 2 CÁC NGHIÊN CỨU LIÊN QUAN
M2M ứng dụng SemCom cho phép khả năng giao tiếp một cách hiệu quả, từ đó giúp các quá trình tính toán và ra quyết định được tự động hóa, nhanh chóng và chính xác Các tác giả đã đưa ra hai mô hình kiến trúc hệ thống để có thể ứng dụng ngữ nghĩa, bao gồm việc thiết kế ghép nối các lớp, gồm một lớp ngữ nghĩa sẽ được ghép nối vào các tầng thấp trong mô hình OSI (lớp liên kết dữ liệu, lớp MAC, lớp vật lý), hoặc truyền thông đầu cuối sử dụng một mạng tế bào thần kinh (NN) Tác giả nhấn mạnh vào tầm quan trọng của các thuật toán ML cũng như DL trong tương lai.
Các lý thuyết về truyền thông ngữ nghĩa đã được đưa ra trong [11] bởi J Bao và các đồng sự, trong đó các khái niệm về Entropy, kênh truyền, nhiễu, dung lượng kênh trong mô hình truyền thông ngữ nghĩa đã được đưa ra Ngoài ra, tác giả cũng đưa ra các khái niệm về biến dạng ngữ nghĩa và nút cổ chai thông tin Mặc dù vẫn chưa thể xây dựng một mô hình hệ thống truyền tin hoàn hảo như hệ thống truyền tin truyền thống của Shannon, tuy nhiên việc đưa ra được những khái niệm trên cho chúng ta những cách tiếp cận mới, làm tiền đề cho việc xây dựng và ứng dụngSemCom vào thực tế.
Nghiên cứu ứng dụng
Bên cạnh những bài khảo sát mang tính định hướng, có nhiều bài nghiên cứu mang tính ứng dụng thực tiễn hơn, thiết kế và xây dựng những hệ thống SemCom để giải quyết các bài toán truyền dẫn tin tức, có thể kể đến các dạng tín hiệu hình ảnh, video, giọng nói, văn bản Mô hình chung của các hệ thống này là việc nén hoặc trích xuất ra những thông tin chính của thông tin cần truyền, sau đó đưa gói tin đã được nén đó qua kênh truyền và khôi phục nó bên thu, tìm cách vượt qua nhiễu và suy hao của kênh truyền.
Một biện pháp được đưa ra là sử dụng phối hợp mã hóa nguồn và mã hóa kênh (JSCC) Các tác giả của [12] đã đưa ra một mô hình mạng NN bộ nhớ dài-ngắn hạn (LSTM) cho phép mã hóa văn bản tương tự JSCC để truyền Hàm mất mát được sử dụng trong mô hình này là entropy chéo và tỉ lệ sai khác kí tự được sử dụng để tính toán hiệu suất mô hình Mặc dù trong [12] không nhắc tới khái niệm SemCom, tuy nhiên đây là một trong những nghiên cứu đưa ra một mô hình truyền thông ngữ nghĩa, sử dụng ngữ nghĩa của dữ liệu để đánh giá hiệu suất mô hình.
H Xie và các đồng sự trong năm sau đó đã đưa ra mô hình Transformer cho phép kết hợp mã hóa kênh cùng mã hóa ngữ nghĩa và được sử dụng trong một hệ thống truyền tin đầu-tới-cuối (E2E) được đặt tên là DeepSC Bằng việc kết hợp như vậy, hệ thống có thể được đảm bảo rằng những thông tin chính của tin truyền và đảm bảo rằng chúng sẽ được gửi đi một cách chính xác nhất Mô hình này đã
CHƯƠNG 2 CÁC NGHIÊN CỨU LIÊN QUAN được chứng minh là vượt trội hơn so với các mô hình truyền thống, đặc biệt là trong trường hợp chất lượng kênh truyền kém Trong [9], một nghiên cứu sử dụng mô hình DeepSC cho giọng nói, tác giả so sánh sự tương đồng về câu và giữa mô hình DeepSC và mô hình truyền thống Kết quả cho thấy DeepSC cho kết quả hoàn toàn vượt trội so với các mô hình truyền tin cũ sử dụng mã hóa Huffman để mã hóa nguồn và mã hóa Turbo là mã hóa kênh.
P Jiang và đồng sự trong [8] đã kết hợp mã hóa ngữ nghĩa và mã hóa kênh Reed-Solomon và một cơ chế yêu cầu lặp lại tự động kết hợp (HARQ) có thể tự động thích ứng với tình trạng kênh truyền Sự kết hợp này được sử dụng trong một hệ thống hội nghị từ xa qua video giúp tăng cường chất lượng của cuộc họp Nghiên cứu này đặc biệt có ý nghĩa trong thời điểm ra mắt, bởi sự lây lan của dịch bệnhCovid19 khiến cho việc họp mặt và làm việc từ xa trở nên phổ biến, kéo theo nhu cầu cho việc gặp mặt từ xa qua video tăng cao.
Kết luận chương
Qua chương 2 này, các nghiên cứu về truyền thông ngữ nghĩa đã được tóm lược, qua đó nhằm hiểu rõ hơn về ứng dụng của SemCom và vai trò của nó trong các hệ thống viễn thông trong tương lai Kết quả của nghiên cứu này cho thấy việc tích hợp SemCom vào hệ thống cho kết quả truyền dẫn cao hơn đáng kể so với các phương pháp chỉ sử dụng mã hóa truyền thống Tuy nhiên, vẫn còn những điểm yếu của mô hình này cần được cải thiện trong tương lai, bao gồm việc thiếu đi một bộ lý thuyết đầy đủ tương tự như lý thuyết thông tin của Shannon [4] làm nền tảng cho sự phát triển của công nghệ này, bên cạnh đó là việc đo đạc tính toán hiệu quả của các mô hình SemCom và so sánh chúng với các mô hình truyền thống trên các khía cạnh như hiệu quả sử dụng năng lượng hay phổ tần số, việc phân bổ tài nguyên của hệ thống sao cho tối ưu hay một hệ đo lường nhằm đánh giá quá trình truyền tin, tương tự thông số BER và SER ở các hệ thống cổ điển.
Trong chương 3, các cơ sở lý thuyết cho đồ án này sẽ được nêu ra, dựa vào đó tác giá sẽ xây dựng và tiến hành các bước mô phỏng cùng đánh giá hệ thống.
CỞ SỞ LÝ THUYẾT
Lý thuyết truyền tin và lý thuyết ngữ nghĩa
Lý thuyết thông tin do Claude Shannon đưa ra vào năm 1949 đã là nền móng cho sự phát triển của ngành viễn thông trên thế giới Shannon đưa ra một vấn đề căn bản của viễn thông đó là "tái tạo lại một bản tin ở địa điểm này tại một địa điểm khác với sự chính xác tuyệt đối hay xấp xỉ." [4] Trong đó, bản tin được truyền đi cho tới hiện tại luôn được biểu diễn dưới dạng các bit, sau đó được điều chế thành các symbol và được truyền tải thông qua kênh truyền có tổn hao Trong nghiên cứu đó, Shannon đã cho rằng khía cạnh ngữ nghĩa của thông tin không nên được tính là một vấn đề kỹ thuật, tức là ý nghĩa của một thông tin không ảnh hưởng tới các giải pháp kỹ thuật nhằm truyền tải thông tin đó từ nơi này tới nơi khác Nguyên nhân được tác giả chỉ ra rằng, nếu đưa các khái niệm về ngữ nghĩa vào các mô hình toán học sẽ gây ảnh hưởng đến tính tổng quan của lý thuyết Kể từ đó tới nay, mạng viễn thông đã phát triển mạnh mẽ qua nhiều thế hệ, các tiên đề nền tảng do Shannon đặt ra vẫn được sử dụng với việc hầu hết các công nghệ viễn thông hiện nay đều hướng tới mục đích tối đa hoá các tham số về thông lượng và tốc độ bit mà bỏ qua các khía cạnh ngữ nghĩa, nội dung của thông tin, hay tổng quát hơn là những thông tin nằm ở các lớp cao hơn trong mô hình OSI (cụ thể là lớp ứng dụng).
Với sự phát triển của công nghệ hiện nay, con người ngày càng chuyển dịch sự chú ý sang các vấn đề liên quan tới dữ liệu, ý nghĩa của thông tin và tìm cách khai thác các tiềm năng từ đó Với sự giới hạn của lý thuyết Shannon về dung lượng của một kênh vật lý, chúng ta đang định hướng sự phát triển của mạng di động 6G theo hướng nhìn nhận ngữ nghĩa là một khía cạnh quan trọng trong truyền thông để có thể tiến tới một bước nhảy vọt về công nghệ, nhằm đáp ứng các yêu cầu về những dịch vụ và nền tảng trong tương lai như thực tế ảo, mạng ngữ nghĩa, trí tuệ nhân tạo, ảnh ba chiều khả tương tác, Vấn đề này thực chất đã được Weaver và Shannon đưa ra về việc lý thuyết viễn thông nên đưa chia thành ba lớp vấn đề [13]:
LEVEL A Độ chính xác của các symbol được truyền đi có thể được tới đâu? (Vấn đề kỹ thuật.)
LEVEL B Độ chính xác về ý nghĩa của tin tức mà symbol đó truyền tải được tới đâu? (Vấn đề ngữ nghĩa.)
CHƯƠNG 3 CỞ SỞ LÝ THUYẾT
Hình 3.1: Mô hình hệ thống thông tin cơ bản.
LEVEL C Ý nghĩa của thông tin đó được tận dụng hiệu quả tới đâu? (Vấn đề hiệu quả)
Từ ba câu hỏi này, những lý thuyết cho viễn thông được phát triển Các vấn đề về kỹ thuật ở LEVEL A quan tâm tới việt độ chính xác của việc truyền dẫn các bit hay symbol thông tin từ điểm phát tới điểm thu Vấn đề ở LEVEL B đưa ra là ý nghĩa của thông tin đó, nghĩa là việc ở điểm thu có hiểu đúng thông điệp từ điểm phát không.
3.1.1 Lý thuyết thông tin (LEVEL A) Ở lý thuyết thông tin của Shannon, một hệ truyền thông có thể được mô hình như ở hình 3.1 Trong đó, bản tin sẽ được mã hoá, đưa tới hệ thống truyền tin Thông tin sẽ được biến đổi thành tín hiệu, gửi qua kênh truyền có tổn hao, quá trình đó xảy ra ngược lại ở phía thu Trong quá trình này, thông tin sẽ bị biến đổi không mong muốn, những sự biến đổi này còn được gọi là nhiễu Những câu hỏi được đặt ra khi xem xét quá trình này là [13]:
1 Làm sao để đo được lượng thông tin?
2 Làm sao để đo được dung lượng của một kênh thông tin?
3 Quá trình biến đổi bản tin thành tín hiệu được gọi là mã hoá, đâu là các đặc trưng cho quá trình này, và làm sao để tối ưu hoá nó? Khi mã hoá đã tối ưu, ở mức nào mà kênh truyền có thể truyền tín hiệu đó đi được?
4 Đâu là những đặc điểm đặc trưng của nhiễu, và nhiễu ảnh hưởng như thế nào tới tín hiệu và bản tin sau khi truyền? Làm sao để tối thiểu hoá ảnh hưởng của nhiễu?
5 Nếu tín hiệu là liên tục (như giọng nói hay âm nhạc) thay vì các symbol rời
CHƯƠNG 3 CỞ SỞ LÝ THUYẾT rạc (như ký tự, chữ viết, v.v.), vấn đề sẽ bị ảnh hưởng như thế nào?
Các câu hỏi này đã được giải đáp khi Shannon đưa ra các khái niệm về lượng tin, entropy của thông tin, dung lượng kênh truyền và khái niệm về mã hoá thông tin, mã hoá tối ưu.Định nghĩa 1:Cho nguồn tinX ∈ {x 1 , x 2 , , x m }với xác suất mỗi tin là p i , hay còn gọi là đặc trưng thống kê của nguồn tin Entropy của nguồn tin được xác định bằng:
Entropy được hiểu là lượng tin trung bình chứa trong một tin tức của nguồn, hay lượng thông tin được phát đi chứa trong một ký hiệu của nguồn Từ đây, ta có khái niệm về lượng tin tương hỗI(X; Y )là lượng tin đúng được truyền qua kênh truyền từX tớiY:
Trong đó, H(Y |X) = −PM i=1 p(x i )PN j=1 p(y j |x i )log 2 p(y j |x i ) là Entrotry có điều kiện của Y khi biết X, trong đó M,N là số bản tin truyền và nhận được của mỗi bên. Định lý 1:Qua một kênh truyền có nhiễu, vớip(y i |x i )là đặc trưng thống kê của kênh truyền Ta có khái niệm về dung lượng kênh:
Từ các định nghĩa này, Shannon phát triển ra lý thuyết về mã hoá nguồn và mã hoá kênh Ở đây, mã hoá là quá trình biến đổi cấu trúc thống kê sao cho phù hợp với mong muốn và mục đích truyền tin. Định lý 2: Nếu nguồn tin x i , i = 1, , m thoả mãn thuộc tính phân vùng trang bị tiệm cận (Asymptotic equipartition property - AEP) vàH(X) ≤ C, tồn tại một bộ mã với xác suất lỗip(ˆ x i ̸= x i ) → 0.Ngược lại, nếuH(x) > C sẽ tồn tại tỉ lệ lỗi dương.
Các hệ thống viễn thông hiện tại đều dựa trên định lý phân tách mã hoá nguồn - kênh của Shannon, bao gồm 2 bước: i) nén dữ liệu nguồn tới dạng hiệu quả nhất; và ii) ánh xạ bộ mã hoá nguồn tới mã hoá kênh.
Trên đây là những định nghĩa cơ bản nhất trong lý thuyết thông tin, những lý thuyết này đã phát triển trong hơn 70 năm qua và đã có nhiều sự thay đổi, cải tiến nhưng nền tảng của chúng vẫn là lý thuyết toán học của truyền tin được phát triển bởi Shannon, Wiener và những người khác.
CHƯƠNG 3 CỞ SỞ LÝ THUYẾT
Hình 3.2: Mô hình truyền thông hiện tại so sánh với mô truyền thông ngữ nghĩa
3.1.2 Từ lý thuyết thông tin tới lý thuyết ngữ nghĩa (LEVEL B)
Những lý thuyết thông tin về mặt kỹ thuật của Shannon chắc chắn sẽ là tiền đề để xây dựng những mô hình truyền thông ở các lớp cao hơn như lớp B và lớp C. Ở lớp A, Shannon đã thành công mô hình hoá các định nghĩa về lượng thông tin thành các công thức toán học dựa trên đặc trưng thống kê của nguồn tin đó, tuy nhiên để đo được lượng ngữ nghĩa chứa trong một thông tin hay chính là độ quan trọng của thông tin đó thì vẫn chưa có một phương pháp tính toán cụ thể Một lý do là bởi, mỗi bài toán lại đòi hỏi một dạng thông tin khác nhau, các vấn đề hiện tại được giải quyết đều thực hiện quá trình đó sau khi đã nhận được thông tin theo cách truyền thống, ví dụ như phân loại, nhận diện.
Hình 3.2 mô hình lại hai hướng phát triển khác nhau của truyền thông cổ điển và truyền thông ngữ nghĩa Với truyền thông cổ điển, thông tin được truyền nguyên vẹn tới đích, ở đó ngữ nghĩa sẽ được chắt lọc và dùng nó để thực hiện giải quyết bài toán Đối với SemCom, ngữ nghĩa đã được chiết xuất ngay từ trước khi truyền, và sau quá trình truyền có thể được sử dụng để giải quyết bài toán ngay lập tức Điều này sẽ làm giảm đi lượng dữ liệu cần truyền qua kênh truyền một cách rất đáng kể. Các nhà nghiên cứu vẫn đang nghiên cứu và tìm cách đưa ra một bộ khái niệm bao
Hình 3.3: Một ví dụ về mô hình mã hoá ngữ nghĩa [14]
CHƯƠNG 3 CỞ SỞ LÝ THUYẾT quát tương tự như Shannon để biểu diễn các khái niệm về Entropy ngữ nghĩa, kênh ngữ nghĩa và dung lượng kênh, mã hoá ngữ nghĩa cũng như các thông số xác định hiệu quả chung nhất cho các dạng thông tin khác nhau Hình 3.3 là một ví dụ cho hệ thống truyền thông ngữ nghĩa, với một thành phần đáng chú ý khác là một kênh ngữ nghĩa tồn tại phi thực chất Ngữ nghĩa này có thể là sự chia sẻ về kiến thức giữa con người, hay một mô hình mạng ngữ nghĩa (semantic network) được phát triển trong tương lai Với sự phát triển của công nghệ hiện tại, việc SemCom xuất hiện như một kỹ thuật đột phá trong các thế hệ mạng tiếp theo hoàn toàn có thể xảy ra.
Kỹ thuật Massive MIMO trong 5G
Hình 3.4: Kịch bản ứng dụng 5G Nguồn: GOV.UK Factsheet 5G [15].
Tại thời điểm năm 2022 mạng di động 5G đã và đang được triển khai rộng khắp trên toàn thế giới và sắp trở thành một tiêu chuẩn mới cho mạng viễn thông toàn cầu Ngay tại Việt Nam, các nhà mạng cũng đang từng bước phát triển và triển khai công nghệ này tại các tỉnh thành phố lớn [16] Theo tiêu chuẩn của Liên minh Viễn thông quốc tế ITU, hệ thống thông tin di động quốc tế 2020 (IMT-2020) hay hệ thống thông tin 5G phải đáp ứng các yêu cầu kĩ thuật tối thiểu bao gồm: tốc độ dữ liệu đỉnh lên tới 10Gbit/s, hiệu suất phổ đỉnh 15bit/s/Hz, tốc độ dữ liệu người dùng lên tới 100Mb, độ trễ giảm thấp còn 4ms hoặc 1ms trong từng trường hợp sử dụng, mật độ kết nối lên tới 1 triệu thiết bị trên 1km 2 , băng thông hệ thống tối thiểu 100MHz và nhiều yêu cầu kĩ thuật khác [17]–[19] Dựa vào các thông số
CHƯƠNG 3 CỞ SỞ LÝ THUYẾT này, IMT-2020 sẽ cung cấp được đa dạng các dịch vụ, được phân thành ba kịch bản ứng dụng là thông tin di động nâng cao (eMBB), truyền thông độ trễ cực thấp và độ tin cậy cực cao (URLLC), truyền thông cho số lượng thiết bị máy cực cao (mMTC) Ứng dụng của từng kịch bản này là khác nhau và được minh họa trong hình 3.4 [17], [20] Để đáp ứng các yêu cầu khắt khe trên, nhiều kỹ thuật mới đã được đưa vào sử dụng, có thể kể tới như việc sử dụng truyền thông bước sóng milimét (mmWave)[21], giao tiếp thiết bị với thiết bị (D2D communication)[22], đa truy nhập phi trực giao (NOMA)[23], truyền thông Massive MIMO[24].
Giới hạn của tất cả các mạng không dây để đạt tới các yêu cầu kỹ thuật trên chủ yếu nằm ở tầng vật lý (Physical layer) bởi giới hạn của phổ tần số, các định luật truyền dẫn sóng điện từ và lý thuyết thông tin Thông lượng của một hệ thống thông tin có thể tính một cách đơn giản như sau:
Thông lượng (bits/s) = Băng thông (Hz)×Hiệu suất phổ tế bào (bits/s/Hz)
Từ đây, ta có thể thấy ba cách đơn giản để tăng hiệu quả của một mạng không dây là: (i) tăng mật độ các điểm truy cập; (ii) sử dụng phổ tần số lớn hơn và (iii) tăng hiệu quả sử dụng phổ (SE), có nghĩa là số bit truyền đi mỗi giây trên một đơn vị phổ tần số (bits/sec/Hz) Các phương pháp (i) hoặc (ii) vốn đã được tận dụng gần như triệt để trong các thế hệ mạng di động trước đây với việc tăng mật độ điểm truy cập trong khu vực hay phân bổ thêm băng tần để tăng thông lượng, do đó yêu cầu tăng cao hiệu quả sử dụng phổ tần số (iii) Tuy nhiên, chưa có nhiều các kĩ thuật mang tính cách mạng nhằm nâng cao hiệu quả sử dụng phổ tần số ở các các thế hệ mạng cũ Theo đó, kỹ thuật Massive MIMO được giới thiệu lần đầu bởi Marzetta vào năm 2010 [24] được coi là bước đột phá và thu hút nhiều sự quan tâm bởi khả năng làm tăng hiệu quả sử dụng phổ và sử dụng năng lượng của mạng [25],
[26] Do các kỹ thuật MIMO hiện được chia làm ba nhóm chính: MIMO điểm tới điểm (P2P-MIMO), MIMO đa người dùng(MU-MIMO) và massive MIMO, trong đó massive MIMO được coi là phiên bản nâng cấp mở rộng của MU-MIMO, ta sẽ bắt đầu phân tích kỹ thuật MU-MIMO
Kỹ thuật MIMO nhiều người dùng như được minh họa ở hình 3.5 dựa trên ý tưởng sử dụng một BS có nhiều ăng-ten để phục vụ được nhiều thiết bị đầu cuối, các thiết bị này có thể sử dụng chung lượng tài nguyên về tần số và thời gian vốn bị giới hạn Nếu như ở kỹ thuật P2P MIMO, một BS với nhiều ăng-ten sẽ phục vụ chỉ cho một thiết bị đầu cũng cũng có nhiều ăng-ten, thì MU-MIMO được tiếp cận theo hướng chia nhỏ thiết bị đầu cuối có K ăng-ten thành K thiết bị đầu cuối hoạt động độc lập với nhau, như minh họa ở hình 3.5 Việc này nhằm tận dụng kỹ
CHƯƠNG 3 CỞ SỞ LÝ THUYẾT
Hình 3.5: Minh họa MU-MIMO thuật ghép kênh phân chia theo không gian (spatial multiplexing), ở đó nhiều người dùng cùng lúc được phục vụ, kể cả khi mỗi thiết bị đầu cuối chỉ có một ăng-ten - một điều quan trọng khi các thiết bị di động nhỏ gọn khó có thể thiết kế với nhiều ăng-ten bên trong.
MU-MIMO không chỉ giữ lại toàn bộ các ưu điểm mà một hệ thống MIMO có thể có, mà còn vượt qua một số điểm yếu cố hữu của việc lan truyền sóng trong MIMO, ví dụ như việc lan truyền trong tầm nhìn thẳng (LoS), một trường hợp gây suy giảm đáng kể hiệu quả truyền tin của một hệ thống MIMO, không còn là vấn đề trong hệ thống MIMO đa người dùng nữa Tuy nhiên, để có được các điểm mạnh như vậy, MU-MIMO vẫn phải chịu các điểm yếu riêng:
• Can nhiễu giữa các người dùng: Tín hiệu của một người dùng có thể bị suy giảm đáng kể do sự can nhiễu bởi những người dùng khác Để giải quyết vấn
CHƯƠNG 3 CỞ SỞ LÝ THUYẾT đề này, một số kỹ thuật giúp giảm can nhiễu đã được đưa sử dụng, có thể kể tới như ước lượng hợp lý cực đại đa người dùng (Maximum likelihood multiuser detection) cho tuyến lên, mã hóa dirty paper (DPC) cho tuyến xuống [27] Các kĩ thuật này thường phức tạp và có độ tính toán cao.
• Trao đổi thông tin trạng thái kênh: Để đạt được độ lợi ghép kênh không gian, trạm BS cần phải xử lý tín hiệu nhận được một cách chính xác Điều này đòi hỏi thông số CSI cần được xử lý chuẩn xác, một thách thức đặc biệt nếu trong các hoàn cảnh dịch chuyển liên tục như trên xe hay tàu.
• Sắp xếp thứ tự người dùng: vì người dùng được phục vụ trên cùng một tài nguyên tần số và thời gian, do đó cần xem xét việc lập lịch cho từng nhóm người dùng một cách tối ưu tùy thuộc vào các lược đồ phát hiện / mã hóa trước, thông tin CSI, v.v., cần được xem xét Điều này làm tăng chi phí triển khai hệ thống. a Mô hình hệ thống
Trong hệ thống MIMO đa người dùng, chúng ta giả định rằng các thiết bị di động chỉ có một ăng-ten Trên thực tế, thiết bị di động đều có thể trang bị được nhiều ăng-ten, tuy nhiên để giữ cho các phân tích gọn gàng, ta xét trường hợp các thiết bị chỉ có một ăng-ten Xem xét hệ thống đơn tế bào, gồm 1 trạm BS và K người dùng, mỗi thiết bị người dùng chỉ có một ăng-ten như ở hình 3.6 Tất cả K người dùng đều dùng chung tài nguyên về thời gian và tần số Coi rằng cả BS và các thiết bị người dùng đều nhận được thông tin trạng thái kênh (CSI) là chính xác tuyệt đối H ∈ C M ×K là ma trận kênh truyền giữa K người dùng và ăng-ten của
BS, cột thứ kcủaH được ký hiệuh k, là véc-tơ kênh truyềnM × 1của người dùng thứ k Trong thực tế, kênh truyền được mô hình hóa dựa trên fading quy mô lớn (large-scale fading) và fading quy mô nhỏ (small-scale fading), tuy nhiên trong mô phỏng này ta sẽ chỉ xem xétH là một kênh truyền tuân theo phân phối Gauss độc lập. b Truyền dẫn đường lên
Trường hợp truyền dẫn đường lên là khi K người dùng truyền tín hiệu về BS. Gọis k là tín hiệu được truyền từ người dùng thứk Do tất cảK người dùng đều sử dụng một tài nguyên thời gian và tần số, véc-tơ tín hiệu nhận được ở BS có kích thước M × 1sẽ là tổng hợp của tất cả tín hiệu từK người dùng gửi về: y ul = √ ρ u
CHƯƠNG 3 CỞ SỞ LÝ THUYẾT
Hình 3.6: Mô hình hệ thống Multiuser MIMO được xét, trường hợp 1 cell bao gồm 1 BS và K người dùng chia sẻ chung tài nguyên thời gian và tần số.
Cơ sở xử lý ảnh số
Việc truyền tải các dạng dữ liệu đa phương tiện như hình ảnh hoặc video từ lâu đã là một phần quan trọng trong viễn thông Các dạng dữ liệu này đã, đang và sẽ chiếm một lượng lớn lưu lượng mạng trong tương lai gần, như đã đề cập trong phần 1.1 Chính vì thế, chúng ta cần phải nghiên cứu việc xử lý dạng dữ liệu này, khi mà chúng đang hiện diện ở khắp mọi nơi trong đời sống của chúng ta hiện nay Trong đó, dữ liệu ảnh lại là dạng dữ liệu phổ biến và trực quan nhất đối với con người, do có thể trực tiếp nhận biết bằng mắt một cách tự nhiên, do đó ta có thể ngay lập tức nhận ra được sự sai khác của dữ liệu nếu xảy ra lỗi Với phạm vi nghiên cứu của đề tài dừng lại ở việc truyền dẫn hình ảnh trong hệ thống viễn thông, ta sẽ phân tích những ảnh hưởng của quá trình truyền dẫn đối với hình ảnh, cụ thể là các loại nhiễu trên hình ảnh, và các bộ lọc số được sử dụng để khôi phục chất lượng ảnh sau truyền.
3.3.1 Nhiễu trong xử lý ảnh
Hình 3.10: Phân nhóm nhiễu trong xử lý ảnh
Nhiễu là một thành phần quan trọng gây giảm chất lượng của hình ảnh Nhiễu có thể sinh ra từ nhiễu nguyên nhân trong quá trình chụp ảnh, truyền dẫn hay xử lý ảnh như do thiết bị phần cứng, môi trường truyền dẫn không hoàn hảo hay do quá trình
CHƯƠNG 3 CỞ SỞ LÝ THUYẾT nén ảnh nhằm làm giảm kích thước lưu trữ Khử nhiễu là một trong những nhiệm vụ quan trọng nhằm nâng cao chất lượng của ảnh, đặc biệt khi xét trên phạm vi đề tài của đồ án này là truyền dẫn hình ảnh trong hệ thông thông tin vô tuyến, một quá trình gây ảnh hưởng đáng kể tới chất lượng truyền dẫn hình ảnh [31] Chúng khiến giá trị các điểm ảnh (hay pixel) thay đổi sai khác, tạo nên sự không đồng nhất hoặc khiến độ nét của hình ảnh bị giảm đi rõ ràng Có nhiều loại nhiễu tồn tại được phân vào các nhóm khác nhau, một số loại nhiễu phổ biến thường xuất hiện trong xử lý ảnh số bảo gồm: Nhiễu trắng (nhiễu Gauss), nhiễu muối tiêu (salt and pepper), nhiễu đốm và nhiễu Poisson Sau đây ta đi xem xét một số loại nhiễu kể trên và phương pháp khử nhiễu hợp lý Các nhóm phổ biến mà các loại nhiễu được nhóm vào được nêu trong hình 3.10 a Nhiễu Gauss
Nhiễu Gauss thường xuất hiện xuất hiện trong hình ảnh trong quá trình truyền dẫn, nguyên nhân là do nhiễu nhiệt trong các máy hay các bộ khuếch đại Nhiễu Gauss được đặt tên theo nhà khoa học Carl Friedrich Gauss, bởi đặc tính thống kê hàm mật độ xác suất (PDF) của nhiễu này tuân theo phân bố Gauss.
Hàm mật độ phân bố xác suất p của một biến ngẫu nhiên tuân theo phân bố Gauss xđược xác định như sau: p G(x) = 1 σ √ 2π e −
Hình 3.11 mô tả hàm mật độ phân bố xác suất theo hàm Gauss, với giá trị kỳ vọng à = 0và phương saiσ = 3. Đây là một dạng nhiễu cộng sinh ra một cách tự nhiên và thường gặp, do đó nó được sử dụng rất nhiều trong quá trình tính toán mô phỏng và xử lý tín hiệu Hình 3.12 mô tả sự ảnh hưởng của nhiễu Gauss nên hình ảnh ban đầu Hình 3.12a là ảnh gốc và hình 3.12b là hình ảnh đã chịu tác động của nhiễu này, với giá trị kì vọng x = 0 và phương saiσ = 0.01 b Nhiễu muối tiêu
Nhiễu muối tiêu là một dạng nhiễu xung, nhiễu này xuất hiện từ trong cảm biến máy ảnh, do lỗi phần mềm hay phần cứng, hoặc cũng cũng có thể xảy ra trong quá trình truyền dẫn ảnh Nó gây cho một số điểm ảnh với giá trị nhất định bị nhiễu,khiến giá trị đó trở thành tối thiểu hoặc tối đa Khi giá trị trở thành tối thiểu sẽ hiển một đốm đen trên ảnh giống hạt tiêu, hoặc đốm trắng như hạt muối trong trường hợp ngược lại Ví lý do đó, loại nhiễu này đặt tên là nhiễu muối tiêu Nếu nói một ảnh có mật độ nhiễu 10%, tức là trong ảnh có 10% số điểm ảnh bị ảnh hưởng bởi
CHƯƠNG 3 CỞ SỞ LÝ THUYẾT
Hình 3.11: Đồ thị mật độ phân bố xác suất Gauss
(a) Ảnh gốc (b) Ảnh nhiễu Gauss (c) Ảnh nhiễu muối tiêu
(d) Ảnh nhiễu Poisson (e) Ảnh nhiễu đốm
Hình 3.12: Minh hoạ và so sánh tương quán các loại nhiễu, trong đó: (a) là ảnh gốc; (b) Ảnh bị ảnh hưởng bởi nhiễu Gauss với kỳ vọng à = 0 và phương sai σ = 0.01; (c) Ảnh bị ảnh hưởng bởi nhiễu muối tiêu với mật độ d = 5%; (d) Ảnh bị ảnh hưởng bởi nhiễu
Poisson; (e) Ảnh bị ảnh hưởng bởi nhiễu đốm (Speckle) với phương sai λ = 0.05.
CHƯƠNG 3 CỞ SỞ LÝ THUYẾT nhiễu này, với tỉ lệ xấp xỉ 5% với điểm đen và 5% với điểm trắng Hình 3.12c minh hoạ loại nhiễu muối tiêu này, tới mật độ nhiễu là 5%, hay 0.05.
Loại nhiễu này gây suy giảm chất lượng ảnh rất đáng kể do các điểm ảnh bị hỏng một cách tuyệt đối tức là giá trị của chúng trở nên sai lệch gần như hoàn toàn (trắng hoặc đen) Một cách hiệu quả để xử lý loại nhiễu này là việc sử dụng bộ lọc
Median, cụ thể hơn sẽ được nói tiếp ở phần sau. c Nhiễu Poisson
Nhiều Poisson, hay còn gọi là nhiễu lượng tử, nhiễu bắn, nhiễu photon Nhiễu này sinh ra do trong quá trình thu nhận, số lượng lớn hạt photon đã tập trung vào một điểm và chúng đã tạo ra nhiễu tại điểm đó Nhiễu được đặc trưng bởi hàm mật độ phân bố xác suất Poisson, nên được gọi là nhiễu Poisson:
Hình 3.12d là ví dụ minh hoạ cho trường hợp ảnh bị ảnh hưởng bởi nhiễu Poisson này Loại nhiễu này xuất hiện do bản chất các loại sóng điện từ và các tia như tia
X, tia Gamma Do đó dạng nhiễu này thường xuất hiện trong các dạng ảnh y tế như ảnh chụp X-Quang. d Nhiễu đốm
Hình 3.13: Hàm phân bố mật độ xác suất gamma Ảnh: Matlab [32].
Nhiễu đốm hay speckle noiselà một dạng nhiễu nhân thường xuất hiện và làm suy giảm chất lượng của ảnh laser, radar, siêu âm y tế và hình chụp cắt lớp (CT).
CHƯƠNG 3 CỞ SỞ LÝ THUYẾT
Trong quá trình giao thoa của các thành phần tín hiệu phản xạ khi đi qua một vật gây ra loại nhiễu có dạng hạt mà có thể quan sát trên ảnh siêu âm Dạng nhiễu này có hàm mật độ xác suất tuân theo phân bố gamma: y = f (x|a, b) = 1 b a Γ(a) x a−1 e −x b (3.27) Ảnh 3.13 minh hoạ cho hàm mật độ xác suất phân bố gamma.
Do ảnh hưởng bởi nhiễu và các yếu tố khác, sau khi nhận được hình ảnh, chất lượng của chúng thường không đủ đáp ứng yêu cầu sử dụng một cách trực tiếp, do đó hệ thống cần thực hiện một bước tiếp theo là nâng cao chất lượng hình ảnh, loại bỏ các thành phần nhiễu không mong muốn Ở bước này, người ta thường sử dụng các cách triển khai bộ lọc số Về cơ bản, bộ lọc số có thể sắp xếp vào hai nhóm lớn chính: Pixel-based và Patch-based như ở hình 3.14.
(a) Pixel-based filter (b) Patch-based filter
Hình 3.14: Hai loại bộ lọc số
• Kỹ thuật Pixel-based có nghĩa là bộ lọc hoạt động dựa trên các pixel lân cận.
Cụ thể hơn, các bộ lọc dựa trên điểm ảnh sẽ sử dụng sự tương quan lân cận của các điểm ảnh xung quanh để làm giảm nhiễu và nâng cao chất lượng ảnh.
Kết luận chương
Trong phần cơ sở lý thuyết này, tác giả đã trình bày các khái niệm và lý thuyết căn bản về mô hình lý thuyết thông tin của Shannon, góc nhìn của Warren Weaver về mô hình ba lớp trong truyền thông cũng như cách mà truyền thông ngữ nghĩa đang được xây dựng dựa trên các nền tảng có sẵn Tiếp đến là phần cơ sở kỹ thuật của truyền thông Massive MIMO, cách tính toán cũng như mô hình hệ thống.Cuối cùng các vấn đề cơ bản trong bài toán xử lý ảnh bao gồm nhiễu, các bộ lọc khôi phục chất lượng cũng như các thông số đánh giá chất lượng ảnh bao gồm PSNR vàSSIM Các lý thuyết này sẽ là cơ sở để xây dựng và thiết kế, mô phỏng hệ thống truyền dẫn ảnh số là nội dung chính của đồ án ở chương tiếp theo.
MÔ HÌNH VÀ ĐÁNH GIÁ
Mở đầu
Đồ án này nghiên cứu một kịch bản truyền dẫn tuyến lên, sử dụng công nghệ massive MIMO kết hợp cùng công nghệ truyền thông ngữ nghĩa mà ở đó thiết bị người dùng sẽ gửi dữ liệu tới base station Dữ liệu truyền trong kịch bản này là dạng dữ liệu hình ảnh, bởi dạng dữ liệu này có mang theo thông tin và bên trong bức ảnh cũng có những sự tương quan về cấu trúc, thay vì sử dụng các dạng dữ liệu khởi tạo ngẫu nhiên để xem xét hệ thống như cách làm phổ biến thường thấy Dữ liệu này sau đó được mã hoá, điều chế và đưa lên kênh truyền môi trường vô tuyến có tổn hao Ở phía thu (BS), một thuật toán tối ưu là phương pháp định hướng nhân tử luân phiên (Alternating Direction Method of Multipliers - ADMM) được sử dụng để tái cấu trúc lại dữ liệu nhận bằng việc xem xét bài toán tối thiểu hoá lỗi truyền dẫn gây ra bởi những thành phần ngẫu nhiên của kênh fading Sau đó, các bộ lọc ảnh số được ứng dụng để nâng cao chất lượng của ảnh sau quá trình tái cấu trúc bên trên Ở phần này, ba loại bộ lọc truyền thống sử dụng trong trường hợp này là bộ lọc Gauss, bộ lọc median và bộ lọc khớp khối ba chiều (BM3D) Cuối cùng, chất lượng của dữ liệu ảnh sau khi khôi phục sẽ được đánh giá sử dụng các thông số nằm ở các lớp khác nhau.
Các thông số đánh giá đã nêu ở phần trước là các thông số đo đạc phổ biến dùng trong các lĩnh vực xử lý ảnh và viễn thông, trong đó, tỉ lệ lỗi bit (BER) sử dụng nhằm đánh giá chất lượng của hệ thống cũng như của đường truyền; tỉ lệ tín hiệu cực đại trên nhiễu (PSNR) và chỉ số tương đồng cấu trúc (SSIM) sử dụng để đánh giá chất lượng của ảnh trước và sau khi truyền Các thông số đo đạc này sẽ được đo với nhiều chỉ số tín hiệu trên nhiễu (SNR) khác nhau ứng với các điều kiện truyền dẫn khác nhau Sau đó, tác giả sẽ phân tích kết quả để làm rõ tầm quan trọng của nội dung bức ảnh thay vì chỉ xét tới sự chính xác của các bit truyền Các thông số đánh giá có thể sẽ xảy ra hiện tượng không đồng nhất, bởi các thông số này vốn ứng dụng ở các tầng khác nhau (tầng vật lý và tầng ứng dụng).
Mô hình hệ thống và đặt vấn đề
Hệ thống được xét là một hệ thống truyền thông ngữ nghĩa được chia làm hai giai đoạn: i) Giai đoạn điều chế và dẫn truyền thông tin và ii) Giai đoạn khôi phục tín hiệu sau xử lý Đồ án này xem xét trường hợp cả thiết bị người dùng và BS đều được trang bị nhiều ăng ten Đầu tiên người dùng sẽ mã hoá dữ liệu ảnh về dạng bit, tiến hành điều chế và gửi qua kênh truyền tới BS Sau khi nhận được tín hiệu, BS sẽ tiến hành xử lý và tái cấu trúc Tại giai đoạn thứ hai, chất lượng hình ảnh được
CHƯƠNG 4 MÔ HÌNH VÀ ĐÁNH GIÁ
Hình 4.1: Mô hình hệ thống được xét tiếp tục xử lý tăng cường bằng một bộ lọc thông thấp nhằm nâng cao chất lượng.
Một hệ thống Massive MIMO trong đó BS được trang bị M ăng-ten, giao tiếp cùng với người dùng được trang bị K ăng-ten Người dùng gửi dữ liệu ảnhI tới BS, trong đóI được sắp xếp thành các véc-tơ cột:I → {i 1 , i 2 , , i Z }vớiZ là số cột có trongI Những véc-tơ cột này sau đó được ánh xạ lên các điểm chòm sao thuộc tập chòm sao O Mỗi giá trị của véc-tơ i z , ∀k = 1, , Z, ứng với một hay nhiều điểm chòm sao Quá trình này có thể được mô hình về mặt toán học như sau:
(4.1) trong đóx z ∈C , ∀z, là các symbol sau khi được điều chế Các symbol này sau đó sẽ được truyền qua kênh MIMO và thu được tại BS; Mthể hiện quá trình ánh xạ của các bit lên các chòm sao Ký hiệuy z là tín hiệu nhận được tại BS sau quá trình truyền dẫny z khi đó được biểu diễn toán học như sau: y z = √ ρHx z + n z , (4.2) vớiH ∈C M ×K là ma trận kênh truyền giữa người dùng và BS;n z ∼ CN (0, σ 2 I M ) đại diện cho nhiễu Gauss trắng (AWGN), mỗi thành phần củaN đều tuân theo phân phối Gauss đối xứng vòng với phương sai σ 2 và kỳ vọng bằng 0 CN (0, σ 2 I M )đại diện cho nhiễu Gauss phức đối xứng vòng và ρ là công suất phát được phân cho mỗi ký hiệu điều chế truyền đi Tỷ lệ công suất tín hiệu trên công suất nhiễu khi
CHƯƠNG 4 MÔ HÌNH VÀ ĐÁNH GIÁ này được xác định bởi SNR = ρ/σ 2 Khi BS đã nhận được tín hiệu truyền sau khi chịu ảnh hưởng của nhiễu và kênh truyền {y z }, quá trình ánh xạ ngược sẽ được thực hiện để thu được tậpI ˜ :
7−→ I, ˜ (4.3) trong đó,M − 1đại diện cho quá trình giải điều chế hay ánh xạ ngược Để cho đơn giản, ta có thể ký hiệu quá trình này thànhI ˜ = M −1 ({y z }), vớiI ˜ = { ˜ i 1 , , ˜ i Z } là tập dữ liệu ảnh giải mã được Cần phải nhấn mạnh lại rằng, từ tín hiệu nhận được tại (4.2), với kênh truyền tức thời, BS có thể giải mã dữ liệu ảnh bằng mô hình sẽ được trình bày phía sau đây.
Dữ liệu ảnh sau khi giải điều chế thu được tại BS đã bị ảnh hưởng bởi nhiễu và các mất mát từ môi trường Sự ảnh hưởng này có thể đặc biệt lớn, đặc biệt là ở những vùng SNR thấp Mục tiêu của chúng ta là tái tạo lại ảnh I ˜ với lượng thông tin được lưu giữ lại so với ảnh gốc I là lớn nhất có thể Vấn đề này có thể khái quát trở thành một bài toán tối ưu như sau: minimize ˜ I
(4.4) trong đú ∥ ã ∥ F là ký hiệu cho Frobenius norm Mục tiờu của bài toỏn (4.4) là để khôi phục lại dữ liệu ảnh gần với dữ liệu gốc hết mức có thể Đây là một bài toán non-covex nếu nhìn dưới góc độ một bài toán tối ưu Bên cạnh đó, bài toán (4.4) chỉ xem xét tới các đặc tính kỹ thuật ở lớp vật lý, chưa cân nhắc đặc điểm của dữ liệu với tư cách là một điều kiện ràng buộc Do đó vẫn có những khả năng để nâng cao chất lượng hình ảnh hơn là chỉ xem xét vấn đề tối ưu.
Tái tạo và khôi phục ảnh
4.3.1 Tái tạo hình ảnh (giai đoạn 1) Ở giai đoạn một của hệ thống bên thu, BS sử dụng một thuật toán tối ưu như đã đề cập tới ở phần trước, cụ thể là thuật toán ADMM Thuật toán này được đề cập cụ thể trong các bài báo [38] và [39], với hướng giải quyết là xấp xỉ bài toán tối ưu non-convex ở (4.4) về một vấn đề tối ưu convex Từ tín hiệu thu được {y z } và ma trận kênhH, thuật toán ADMM thực hiện các vòng lặp để cập nhật lại giá trị các điểm chòm sao mà từ đó có thể giải điều chế ra được dữ liệu ảnh x ˜ z Mong muốn của chúng ta là tập{˜ x z }sẽ trùng với tập các symbol X ban đầu Từ đây, ta có thể giải điều chế và thu được ảnh sau truyềnI ˜ Như đã nhắc tới ở bên trên, ảnh sau khi
CHƯƠNG 4 MÔ HÌNH VÀ ĐÁNH GIÁ
Hình 4.2: Minh hoạ khả năng chống nhiễu muối tiêu, ảnh bị nhiễu muối tiêu nặng với d% được giải điều chế và tái tạo có thể sẽ chịu ảnh hưởng bởi kênh truyền và nhiễu Do đó, ở giai đoạn tiếp theo, chúng ta sẽ tiến hành khôi phục ảnh sau khi truyền, tận dụng các cấu trúc tự nhiên của hình ảnh Sự tương quan bên trong cấu trúc của hình ảnh này trên thực tế đã được nghiên cứu tới trong các bộ lọc số sử dụng trong kỹ thuật xử lý ảnh, do đó chúng ta sẽ tận dụng các kỹ thuật này vào bài đề tài nghiên cứu này.
4.3.2 Khôi phục hình ảnh (giai đoạn 2) Ở giai đoạn hai này, các thành phần nhiễu nói chung sẽ được xử lý và làm suy giảm bởi kênh truyền, sử dụng các bộ lọc đã được nhắc tới là bộ lọc Gauss, bộ lọc trung vị và bộ lọc BM3D. a Bộ lọc trung vị Ở đây, bộ lọc trung vị được sử dụng do sự hiệu quả của nó trong việc chống lại các loại nhiễu muối tiêu, loại nhiễu thường gặp trong viễn thông do sự sai sót của các bit truyền dẫn Đặc điểm của bộ lọc này cho phép loại bỏ các loại nhiễu mà vẫn giữ được các đường viền sắc nét của bức ảnh. b Bộ lọc Gauss
Bộ lọc này được sử dụng để làm mờ ảnh, và qua đó cũng làm giảm đi các chi tiết các loại nhiễu sai lệch đến toàn bộ điểm ảnh như nhiễu Gauss, nhiễu đốm, Ảnh sau khi xử lý thu được nhờ phép nhân tích chập của ảnh nhiễu ban đầu với cửa sổ filterG, vớiG ∈R u×u Gđược xác định như sau:
CHƯƠNG 4 MÔ HÌNH VÀ ĐÁNH GIÁ cặp(x; y)ở đây là toạ độ của nhân filter, −u ≤ x; y ≤ u vàσ là độ lệch chuẩn của bộ lọc Độ làm mịn của filter Gauss được điều chỉnh dựa vào thông sốσ. Đối với hai bộ lọc pixel based này, mỗi bộ lọc đều xem xét cửa sổ filter với kích thước cố định Kích thước phổ biến được sử dụng 3 × 3 Ảnh sau khi khôi phục được tính qua phép tích chập với cửa sổ này
I ˆ = ˜ I⊛ G (4.6) vớiI ˆ là ảnh cuối cùng nhận được, với kích thước không đổi so với kích thước ảnh ban đầu. c Bộ lọc BM3D
Các bộ lọc đều có chung một mục đích là giảm nhiễu Vì nhiễu có giá trị trung bình bằng 0 nên khi ta lấy trung bình nhiều điểm ảnh có giá trị giống nhau sẽ xóa được nhiễu Đây là ý tưởng chính trong các thuật toán xóa nhiễu dựa trên pixel hoặc patch, hay group-patch Bộ lọc Gauss ở trên chính là một ví dụ cho trường hợp xóa nhiễu dựa trên pixel Không giống như bộ lọc Gauss, bộ lọc patch-based sử dụng patch hay group-patch để giảm nhiễu Nó dựa trên cơ sở rằng tín hiệu ảnh chứa cả tương quan lân cận và tương quan không lân cận: các pixel lân cận nhau thì có giá trị giống nhau, các pixel không lân cận hay xa nhau thì có cấu trúc giống nhau. Thuật toán này hoạt động dựa trên việc giả định rằng các loại nhiễu sẽ có giá trị kỳ vọng bằng không, tức là khi ta chồng tất cả các patch hình lên với nhau, mỗi hình với cấu trúc tương đồng với nhau, tương tự như trong hình minh hoạ 4.3.
Hình 4.3: Các block tương đồng trong BM3D.[35]
Về mặt toán học, mỗi path ¨ icủa tín hiệu ảnh có nhiễuI ˆ có một vector thưa thớt
CHƯƠNG 4 MÔ HÌNH VÀ ĐÁNH GIÁ
Hình 4.4: Bộ lọc BM3D với nhiễu AWGN, σ = 0.02 α z được định nghĩa qua một tập dictionaryD: ¨ i ≈ Dα z , (4.7) sau đó toàn bộ ảnhI ˆ có thể được biểu diễn bởi tập các vectorα z Để tìm được các vector thưa thớt này, ta phải giải quyết bài toán tối ưu sau: minimize 1
Trong đóν z là một thông số điều chuẩn Nghiệm của bài toán tối ưu ở trên hay các vector thưa thớt α z không phải là duy nhất, nó dựa vào tập dictionary D ứng với miền biến đổi Với phương pháp tiếp cận tương tự, trong trường hợp này ta sử dụng bộ lọc nâng cao BM3D sau thuật toán ADMM để giảm nhiễu, cải thiện chất lượng ảnh khôi phục Hình 4.4 là một minh hoạ cho khả năng khử nhiễu của bộ lọc này.
Các thông số đánh giá
Phần này của đồ án sẽ đưa ra cụ thể các phương án đánh giá chất lượng hình ảnh, dựa trên ba thông số đã được nêu ở phần lý thuyết là BER, PSNR và SSIM.
4.4.1 Tỉ lệ lỗi bit BER
Sau quá trình giải điều chế, tái cấu trúc và khôi phục chất lượng ảnh, ta tiến hành tính toán giá trị bit error rate của tín hiệu này so với tín hiệu gốc ban đầu Bằng cách quy đổi các giá trị điểm ảnh ra các giá trị nhị phân và so sánh số bit sai khác giữa hai dữ liệu ảnh:
BER= Tổng số bit lỗi
Tổng số bit truyền (4.9) Ứng với mỗi bộ lọc khác nhau, giá trị BER tìm được cũng khác nhau Các giá trị này sẽ được so sánh với nhau cùng với giá trị BER.
CHƯƠNG 4 MÔ HÌNH VÀ ĐÁNH GIÁ
4.4.2 Chỉ số tín hiệu cực đại trên nhiễu PSNR
Theo cơ sở lý thuyết đã được đề cập trong chương 3, tỉ số tín hiệu cực đại trên nhiễu được xác định bằng công thức (3.33):
, (4.10) đối với trường hợp chúng ta đang xét, giá trị MSE bây giờ sẽ được tính bằng cách lỗi trung bình giá trị của ảnhI ˆ vàI:
, (4.11) vớim, nlà kích thước của ảnhI.
4.4.3 Chỉ số tương tự cấu trúc SSIM
Tương tự với trường hợp của PSNR, chỉ số SSIM cũng được tính trên tín hiệu ảnh trước truyềnI được sử dụng là ảnh tham chiếu và ảnh sau khi khôi phụcI ˆ Các chỉ số về độ rọi, độ tương phản và cấu trúc sẽ được tính ứng với từng ảnh, từ đó để tính đượcSSIM (I , I) ˆ.
Kết luận chương
Chương này đã trình bày về mô hình hệ thống được xét, chi tiết các giai đoạn xử lý tín hiệu và khôi phục hình ảnh, cũng như việc sử dụng các bộ lọc đã nêu trong phần lý thuyết để nâng cao chất lượng những hình ảnh sau khi nhận Các ảnh nhận được sẽ được sử dụng để so sánh với nhau bằng các thông số đánh giá gồm BER,PSNR và SSIM Kết quả mô phỏng sẽ được trình bày cụ thể hơn ở chương sau, sử dụng công cụ Matlab để tính toán, mô phỏng và biểu diễn.
CÁC KẾT QUẢ VÀ ĐÓNG GÓP NỔI BẬT
Thông số mô phỏng
Xem xét hệ thống được trình bày ở chương 4 với trạm thu phát gốc cóM = 64 ăng-ten, giao tiếp với thiết bị người dùng cóK = 4ăng-ten Dữ liệu ảnh trước khi được gửi qua kênh truyền sẽ được điều chế sử dụng phương pháp điều chế biên độ cầu phương (Quadrature Amplitude Modulation - QAM) với số mức điều chế
M = 256, tức là mỗi 8 bit sẽ nhóm lại thành một nhóm và ánh xạ lên một chòm sao tương ứng thuộc tậpO Các tín hiệu chòm sao này sẽ gửi qua kênh truyền với SNR chạy từ 0dB tới 20dB Kênh truyền được xét là kênh truyền fading quy mô nhỏ, tức small-scale fading; nhiễu được phân bố theo phân bố Gauss phức đối xứng vòng hay nhiễu Gauss trắng Tín hiệu thu được sẽ xử lý thông qua thuật toán ADMM để xác định được dữ liệu tương ứng và giải điều chế Sau khi tái cấu trúc lại được dữ liệu ảnh đầy đủ, dữ liệu ảnh này sẽ được cho đi qua các bộ lọc Ở đây, các bộ lọc với thông số có thể tuỳ chỉnh được là bộ lọc Gauss và bộ lọc BM3D sẽ được tuỳ chỉnh sao theo thông số PSNR, tức là làm sao để chỉ số PSNR đo được là cao nhất có thể ứng với mỗi mức SNR.
So sánh trực quan
Trước tiên, ta xem xét với mức SNR = 5dB để xem xét tín hiệu nhận được sau quá trình truyền nhận dữ liệu Với các hình minh hoạ ở hình 5.1, ta có thể nhận thấy rằng, tuy ảnh có thể tái cấu trúc nhưng vẫn chịu ảnh hưởng bởi nhiễu rất nặng do vùng SNR thấp Quan sát trong hình, 5.1b và 5.1d, ta có thể nhận thấy những ảnh sau khi truyền không chỉ chịu tác động của chỉ một loại nhiễu và là nhiều loại. Các nhiễu này phân bố một cách không đồng đều, cụ thể hơn, có ở những vùng tối như ở phần bóng của mái nhà ở ảnh đã phóng to 5.2a, có một dải nhiễu màu trắng như các hạt muối, nhưng trên nóc nhà lại có nhiều hạt đen Điều này thể hiện đây là hiện tượng nhiễu muối tiêu, tuy nhiên các nhiễu này không phân bố đồng đều mà tập trung theo từng vùng hình ảnh, hay từng vùng cấu trúc của hình ảnh Điều tương tự xảy ra trong hình máy bay ở 5.2b, xung quanh phần đuôi máy bay có thể nhìn rõ vùng nhiễu đen, còn trên đuôi máy bay lại có nhiễu màu trắng Từ đây, ta có thể dự đoán được rằng, bộ lọc trung vị sẽ có mang lại hiệu quả tốt trong việc khôi phục chất lượng ảnh.
CHƯƠNG 5 CÁC KẾT QUẢ VÀ ĐÓNG GÓP NỔI BẬT
(a) House, ảnh gốc (b) House, ảnh nhiễu
(c) Plane, ảnh gốc (d) Plane, ảnh nhiễu
Hình 5.1: So sánh giữa ảnh gốc và sau khi truyền
(a) House, ảnh nhiễu phóng to (b) Plane, ảnh nhiễu phóng to
Hình 5.2: Quan sát rõ hơn ở hai vùng ảnh đã được phóng to
CHƯƠNG 5 CÁC KẾT QUẢ VÀ ĐÓNG GÓP NỔI BẬT
Từ dự đoán này, ta đi tới việc sử dụng các bộ lọc số để nâng cao chất lượng ảnh được truyền Ở đây, ta xem xét hai hình ảnh là Cameraman và ảnh Monarch; xem xét ở trạng thái kênh truyền với SNR = 10[dB], với mỗi hình ảnh sẽ theo thứ tự lần lượt là ảnh chịu nhiễu sau khôi phục bằng thuật toán ADMM, ảnh khử nhiễu lần lượt dùng bộ lọc Gauss, Median và BM3D Hình 5.3 là các hình ảnh minh hoạ sau quá trình tái cấu trúc và phục hồi chất lượng ảnh.
Có thể thấy, dù ở điều kiện chất lượng kênh đã tốt hơn nhiều (10dB), ảnh vẫn phải chịu nhiễu một cách đáng kể, tuy nhiên khi được xử lý với các bộ lọc, chất lượng ảnh cho ra đã được cải thiện một cách đáng kể Đáng chú ý nhất là việc sử dụng hai bộ lọc là Median và BM3D Kết quả khi sử dụng hai bộ lọc này đối với ảnh Cameraman cho ra kết quả rất tốt, khi hầu hết nhiễu đã được loại bỏ đi, trong khi vẫn giữ lại được các chi tiết sắc nét của ảnh như vùng chân máy ảnh, các toà nhà ở phía sau hay tóc của người thợ chụp ảnh Ở ảnh Monarch, bộ lọc trung vị thực hiện nhiệm vụ có phần nhìn hơn khi chất lượng cho ra là rất tốt, gần như không còn nhiễu ở trên cánh bướm Chất lượng ảnh lúc này nếu chỉ đánh giá bằng mắt thường có thể coi như tương đương với ảnh gốc Thực vậy, nếu ta đặt song song ảnh gốc và ảnh qua bộ lọc Median của Monarch như ở hình 5.4 Nếu để ý thật kỹ, ta có thể nhận ra ảnh 5.4b đã bị mờ đi đôi chút so với ảnh gốc Tuy nhiên kết quả này cho thấy rằng nhận định ban đầu là đúng khi cho rằng bộ lọc Median sẽ hoạt động hiệu quả với trường hợp nhiễu trong mô hình đang được xét Việc đánh giá bằng mắt thường ở đây vẫn còn mang tính chủ quan, do đó chúng ta cần phải xem xét các thông số so sánh một cách cụ thể và rõ ràng hơn Kết quả số liệu của hình 5.3 được nêu cụ thể ở bảng 5.1. Ảnh (a) (b) (c) (d) (e) (f) (g) (h)
Bảng 5.1: Bảng các số liệu mô phỏng của hình 5.3 Để tiện theo dõi, sau đây là từng trường hợp ứng với mỗi giá trị trong bảng: (a) và (b) Ảnh Cameraman và ảnh Monarch sau tái cấu trúc bằng ADMM
(b) và (d) Ảnh Cameraman và ảnh Monarch sau bộ lọc Gauss
(c) và (f) Ảnh Cameraman và ảnh Monarch sau bộ lọc Median
(d) và (h) Ảnh Cameraman và ảnh Monarch sau bộ lọc BM3D
Bước đầu nhận xét các số liệu của bảng, ta thấy rằng tỉ lệ lỗi BIT ở các trường
CHƯƠNG 5 CÁC KẾT QUẢ VÀ ĐÓNG GÓP NỔI BẬT
Hình 5.3: Visual comparison by using the Cameraman and Monarch images from Set12 with the SNR equal to 10 [dB]
CHƯƠNG 5 CÁC KẾT QUẢ VÀ ĐÓNG GÓP NỔI BẬT
(a) Monarch, ảnh gốc (b) Monarch, ảnh qua lọc trung vị
Hình 5.4: So sánh trực tiếp hai ảnh Monarch hợp sau khi lọc (c) - (h) cho kết quả rất cao, gấp nhiều lần so với BER của hai trường hợp trước khi lọc Trong khi ứng với các thông số PSNR, SSIM, kết quả rõ ràng là được cải thiện rõ rệt Ứng với trường hợp hai ảnh Monarch ta đang xét ở bên trên (hình 5.4) có thể thấy rằng ở (f) các chỉ số PSNR và SSIM đạt giá trị rất cao, SSIM có thể đạt tới 0.83 Với giá trị SSIM = 1 là tối đa, ta có thể nói rằng ảnh sau khi lọc đã giống ảnh gốc tới trên 80% Đồng thời nếu chỉ so sánh hai chỉ số PSNR và SSIM, ta cũng thấy có một chút sự trái ngược, khi PSNR của trường hợp (c) và(g), ứng với hai bộ lọc Gauss và BM3D có chênh lệch đáng kể lên tới hơn 2dB,chỉ số SSIM ngược lại giảm từ 0.48 về 0.42 Điều này thể hiện rõ ràng rằng chỉ sốPSNR hay MSE, còn gọi là sai số trung bình bình phương giữa hai ảnh không hoàn toàn thể hiện sự tương đồng giữa hai ảnh Chỉ số SSIM cao hơn cho chúng ta cảm quan rằng hình ảnh đó tốt hơn.
Đánh giá hiệu quả hệ thống
Hình 5.5 biểu thị kết quả mô phỏng giá trị BER trung bình của 12 hình ảnh trong tập dữ liệu Set12 [40], gồm các hình ảnh phổ biến thường được sử dụng trong việc thẩm định kết quả bài toán xử lý ảnh Có thể thấy rằng đường màu xanh lam tương ứng với trường hợp hình ảnh được khôi phục mà không có bộ lọc cho tỷ lệ lỗi bit thấp nhất và giảm dần theo tỷ lệ nghịch với SNR của kênh, có nghĩa là khi trạng thái của kênh tốt hơn, BER sẽ giảm Tuy nhiên trong trường hợp có sử dụng bộ lọc,khi SNR tăng lên, BER của hình ảnh được lọc ngược lại vẫn rất cao và dường như không được cải thiện Từ đây ta có thể đưa đến kết luận rằng các bộ lọc số không thể khôi phục hình ảnh đã khôi phục về phiên bản ban đầu của nó Thay vào đó,
CHƯƠNG 5 CÁC KẾT QUẢ VÀ ĐÓNG GÓP NỔI BẬT
Hình 5.5: Đồ thị BER và SNR nó sẽ hy sinh các chi tiết hình ảnh để tăng chất lượng, như có thể thấy trong Hình. 5.3 Điều này có vẻ mâu thuẫn vì trong phần trước, chúng ta đã nhận thấy rằng việc sử dụng các bộ lọc cải thiện chất lượng hình ảnh đáng kể so với hình ảnh bị nhiễu sau khi truyền và khôi phục bằng thuật toán ADMM Để làm rõ sự bất đồng này, chúng ta cần hiểu rằng mục đích của thuật toán ADMM là giải quyết vấn đề tối ưu hóa và giảm thiểu lỗi truyền dẫn Do đó, bất kỳ hành động tiếp theo nào của bộ lọc sẽ làm tăng sự khác biệt của các bit dữ liệu, dẫn đến BER cao hơn Đây là lý do tại sao giá trị BER trung bình trong trường hợp sử dụng bộ lọc không tốt bằng giá trị BER trong trường hợp không sử dụng bộ lọc Nó dẫn đến một kết luận thứ hai:Đối với dữ liệu có cấu trúc như tín hiệu hình ảnh kỹ thuật số, BER không còn là tiêu chí quyết định để đánh giá chất lượng của dữ liệu được phục hồi.
5.3.2 Tỉ lệ tín hiệu cực đại trên nhiễu
Như đã đề cập ở trên, chỉ số BER trong trường hợp này không phù hợp để đánh giá chất lượng của ảnh khôi phục Do đó, chúng ta cần sử dụng các thước đo thường được sử dụng trong xử lý ảnh Hình 5.6 mô tả kết quả giá trị PSNR trung bình của các trường hợp khác nhau được đề cập trước đó Kết quả cho thấy với chỉ số PSNR,chất lượng ảnh sau khi qua bộ lọc cao hơn đáng kể so với ảnh ở đầu ra của thuật toán ADMM Điều này cũng có thể được kiểm chứng trong bảng 5.1 Ở trong bảng
CHƯƠNG 5 CÁC KẾT QUẢ VÀ ĐÓNG GÓP NỔI BẬT
Hình 5.6: Đồ thị PSNR và SNR có thể thấy thông số PSNR sau khi sử dụng bộ lọc tăng một cách rất đáng kể, từ 21.22dB đối với ảnh Monarch trước khôi phục tăng lên tới 29.11dB ứng với bộ lọc Median, hay đối với ảnh Cameraman tăng từ 24.84dB lên tới 29.51dB trong trường hợp sử dụng bộ lọc BM3D.
Hình 5.7: Ảnh Lenna qua kênh truyền 16dB, chưa qua bộ lọc.
Bộ lọc trung vị và bộ lọc BM3D cho kết quả gần giống nhau, nhưng điểm yếu của bộ lọc trung vị là nó không có thông số kiểm soát, dẫn đến chất lượng hình ảnh giảm ở SNR của kênh cao hơn.
Không giống với bộ lọc Median, hai bộ lọc còn lại dựa trên các thông số điều khiển có thể làm giảm hiệu quả lọc đi ở vùng SNR cao, và nhờ đó hội tụ với ảnh trước lọc Một kết luận nữa có thể đưa ra: ứng với điều kiện kênh tốt trong mô hình được xét, việc sử dụng các bộ lọc gần như không cần thiết do chất lượng hình ảnh đã được tối ưu Như quan sát trong hình 5.7,
CHƯƠNG 5 CÁC KẾT QUẢ VÀ ĐÓNG GÓP NỔI BẬT chất lượng ảnh Lenna đã rất tốt và bị ảnh hưởng chút ít bởi nhiễu muối tiêu Một lưu ý nữa có thể đưa ra: nếu giảm kích thước cửa sổ của bộ lọc Median cũng giúp giảm nhẹ tác động của bộ lọc.
5.3.3 Chỉ số tương đồng cấu trúc
Một thông số khác thường được sử dụng trong xử lý ảnh để đánh giá chất lượng là chỉ số SSIM Hình 5.8 là kết quả SSIM trung bình của các hình ảnh trong tập dữ liệu Set12 Nhìn chung, ảnh sau khi qua bộ lọc cho kết quả SSIM tốt hơn đáng kể so với ảnh gốc, đặc biệt là ở vùng SNR thấp và trung bình Bộ lọc Trung vị hoạt động tốt nhất khi tính toán tới thông số này, nhưng khi chất lượng kênh tốt hơn - tương tự như PSNR - hình ảnh đầu ra không còn được cải thiện Điều này là do ở các vùng SNR cao hơn mức 16dB, chất lượng ảnh đã rất tốt, do đó những sự can thiệp vào các điểm ảnh sẽ gần như chắc chắn làm sai lệch cái điểm ảnh, dẫn để chỉ số SSIM Bộ lọc BM3D ở đây do được tối ưu hóa cho kết quả PSNR cao nhất đã không cho hiệu suất tốt ở số liệu SSIM.
Hình 5.8: Đồ thị SSIM và SNR
Kết luận chương
Chương này đã trình bày các kết quả mô phỏng và thí nghiệm, cũng như các kết luận, nhận xét và lý giải cho kết quả mô phỏng hệ thống truyền thông ngữ nghĩa kết hợp cũng Massive MIMO tuyến lên Kết quả thu được cho thấy, không thể chỉ dựa vào một thông số BER để cân nhắc đánh giá chất lượng tín hiệu nhận được, mà còn phải lưu ý tới cấu trúc và nội dung của tín hiệu.