GIỚI THIỆU
Massive MIMO là công nghệ mạng không dây sử dụng nhiều anten tại các trạm cơ sở để phục vụ nhiều thiết bị người dùng thông qua ghép kênh không gian Gần đây, công nghệ này đã được tích hợp vào tiêu chuẩn 5G Nghiên cứu đã giải quyết vấn đề ô nhiễm thí điểm lâu dài, cho thấy rằng việc sử dụng lỗi bình phương trung bình tối thiểu (MMSE) trong thu/nhận các tia hỗ trợ truyền đa đường có thể tăng công suất mà không bị ràng buộc khi số lượng anten tăng Nghiên cứu này áp dụng Deep learning để tối ưu hóa phân bổ công suất max-prod trong đường xuống của mạng Massive MIMO, được thúc đẩy bởi sự phát triển mạnh mẽ của các ứng dụng máy học.
Đề tài nghiên cứu chứng minh rằng vị trí của các thiết bị người dùng, thu được qua hệ thống định vị toàn cầu, có thể được sử dụng hiệu quả bởi một mạng nơ-ron để đạt hiệu suất gần tối ưu Điều này giúp giảm đáng kể sự phức tạp trong phân bổ công suất, cho phép thực hiện phân bổ này trong thời gian thực theo các vị trí khác nhau của người dùng Hơn nữa, việc tạo ra mạng nơ-ron này rất thuận tiện vì các mẫu huấn luyện có thể dễ dàng thu thập thông qua các thuật toán tối ưu hóa hiện có.
MỤC TIÊU VÀ YÊU CẦU CỦA ĐỀ TÀI
Mục đích của nghiên cứu này là khám phá việc xây dựng hệ thống Massive MIMO, áp dụng các công thức tính toán truyền thống để phân bổ công suất truyền từ trạm cơ sở đến người dùng Kết quả phân bổ công suất sẽ được lưu trữ và tạo thành một mẫu dữ liệu.
Đề tài này sử dụng một cơ sở dữ liệu lớn để huấn luyện mẫu, kết hợp với các thư viện và hàm có sẵn trong Deep Learning nhằm thực hiện phân bổ công suất tối đa (max-prod) trong đường xuống của các mạng Massive MIMO.
Đề tài này áp dụng mạng nơ-ron để xác định vị trí của các thiết bị người dùng và tối ưu hóa phân bổ công suất Mục tiêu là dự đoán cách phân bổ công suất cho các vị trí mới, từ đó chứng minh rằng việc sử dụng Deep Learning mang lại cải thiện rõ rệt về hiệu suất phân bổ công suất so với các phương pháp tối ưu hóa truyền thống.
GIỚI HẠN ĐỀ TÀI
Để huấn luyện hiệu quả một mạng nơ-ron, nhóm nghiên cứu sử dụng cơ sở dữ liệu chứa nhiều mẫu đã được tính toán sẵn Họ chỉ có khả năng bổ sung thêm mẫu mà không thể tự tạo ra số lượng mẫu lớn như vậy.
PHƯƠNG PHÁP NGHIÊN CỨU
Để hoàn thành đề tài một cách hiệu quả, việc áp dụng đúng phương pháp nghiên cứu là rất quan trọng, giúp định hướng rõ ràng các vấn đề cần tập trung Nhóm sẽ thực hiện một số phương pháp phù hợp xuyên suốt quá trình nghiên cứu để đạt được kết quả tốt nhất.
Phân tích, tổng hợp để trình bày các vấn đề
Liệt kê, sưu tầm tài liệu.
ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU
Để thực hiện nghiên cứu một cách hệ thống và hiệu quả, nhóm cần xác định rõ đối tượng và phạm vi nghiên cứu của đề tài.
Kênh truyền vô tuyến, MIMO, Massive MIMO, Deep Learning
Các yếu tố ảnh hưởng kênh truyền: Hiệu ứng đa đường, Doppler, fading
Tìm hiểu các công thức tính toán công suất truyền, nhiễu
Các công thức mô phỏng mô hình Massive MIMO
Các mô hình mạng nơ-ron, thư viện có sẵn trong Deep learning như keras.
BỐ CỤC ĐỀ TÀI
Đề tài “PHÂN BỔ CÔNG SUẤT TRUYỀN TRONG HỆ THỐNG MASSIVE MIMO SỬ DỤNG DEEP LEARNING” được chia làm 5 chương:
Trong chương này sẽ trình bày về tình hình nghiên cứu, giới hạn, mục tiêu, yêu cầu, đối tượng, phạm vi nghiên cứu của đề tài
Chương 2: Cơ sở lý thuyết
Chương này sẽ trình bày về kênh truyền vô tuyến và cung cấp kiến thức cơ bản về MIMO, Massive MIMO và Deep Learning Ngoài ra, nội dung cũng sẽ đề cập đến các hàm tính toán và thư viện trong mạng nơ-ron.
Chương 3: Thiết kế hệ thống
Chương này sẽ trình bày về việc xây dựng hệ thống Massive MIMO, bao gồm các công thức liên quan để tìm công suất tối ưu thông qua các phương pháp max-min và max-prod trong đường xuống của mạng Massive MIMO.
Phân tích dữ liệu SE và xây dựng mô hình mạng nơ-ron phù hợp giúp đạt được kết quả quá trình đào tạo gần giống như khi tính toán bằng công thức trong Matlab.
Chương 4: Kết quả mô phỏng và đánh giá
Trong chương này sẽ trình bày về kết quả thực hiện mô phỏng công suất truyền đường xuống trong mô hình Massive MIMO và việc chạy với Deep Learning
Cuối cùng, chúng ta sẽ phân tích kết quả thu được từ việc huấn luyện mạng nơ-ron và so sánh với các phép tính thực hiện trên Matlab để đưa ra những nhận xét và đánh giá chính xác.
Chương 5: Kết Luận và hướng phát triển
4 Trong chương này sẽ trình bày những kết quả đạt được của đề tài, những hạn chế của đề tài và đống thời đưa ra hướng phát triển
KÊNH TRUYỀN VÔ TUYẾN
Truyền thông vô tuyến là phương pháp truyền dẫn không dây, khác biệt so với kênh truyền có dây ổn định và dễ phân tích Tín hiệu trong kênh truyền vô tuyến hoàn toàn ngẫu nhiên, khó khăn trong việc phân tích do bị ảnh hưởng bởi các yếu tố như cản trở, nhiễu xạ, tán xạ và phản xạ, được gọi là fading Hệ quả là tại máy thu, nhiều phiên bản khác nhau của tín hiệu phát được nhận, ảnh hưởng trực tiếp đến chất lượng của hệ thống thông tin vô tuyến.
2.1.1 Các hiện tượng ảnh hưởng đến chất lượng kênh truyền vô tuyến
Trong hệ thống thông tin vô tuyến, anten phát sóng sẽ phát tín hiệu sóng mang cùng với tín hiệu quang, và những tín hiệu này sẽ lan tỏa trong không gian Trong quá trình truyền tải, chúng có thể va chạm với các vật cản, ảnh hưởng đến chất lượng tín hiệu.
Tín hiệu mong muốn thường là tín hiệu truyền thẳng, nhưng có thể bị mất khi bị che khuất bởi tòa nhà, phản xạ hoặc khúc xạ qua kính trong nhà, và thậm chí tán xạ khi va chạm với cây cối Kết quả là tín hiệu nhận được là sự chồng lấp của nhiều tín hiệu đến từ các hướng khác nhau, hiện tượng này được gọi là hiệu ứng đa đường.
Hình 2.1 Hiệu ứng đa đường
Hiệu ứng Doppler là hiện tượng vật lý xảy ra khi tần số và bước sóng của sóng thay đổi do chuyển động tương đối giữa nguồn phát và người quan sát Trong truyền thông không dây, sự di chuyển giữa máy phát và máy thu dẫn đến việc tần số sóng bị dịch chuyển Cụ thể, tần số sẽ tăng khi máy phát tiến lại gần máy thu và giảm khi máy phát di chuyển ra xa Hiệu ứng này tỉ lệ thuận với tốc độ của thiết bị di động.
Fading là hiện tượng sai lệch tín hiệu thu bất thường trong các hệ thống vô tuyến, chủ yếu do ảnh hưởng của môi trường truyền dẫn Hiện tượng này có thể được chia thành hai loại chính: fading quy mô lớn và fading quy mô nhỏ.
Fading quy mô lớn là hiện tượng suy hao tín hiệu do chuyển động trên diện rộng, khi máy phát và máy thu di động di chuyển qua khoảng cách dài, dẫn đến sự biến động nhanh chóng của hình bao tín hiệu nhận được Hiện tượng này thường xảy ra trong truyền thông di động tại các môi trường đô thị, ngoài trời và trong nhà.
Fading quy mô nhỏ là hiện tượng thay đổi lớn về biên độ và pha của tín hiệu do sự thay đổi nhỏ về vị trí của máy phát hoặc máy thu Hai biểu hiện chính của fading quy mô nhỏ là thời gian lan truyền của tín hiệu và độ lệch thời gian của kênh, gây ra bởi kênh đa đường và hiệu ứng Doppler Cả hai hiện tượng này có thể được mô tả trong miền thời gian hoặc miền tần số.
2.1.2 Các kỹ thuật tối ưu kênh truyền
Ghép kênh theo tần số (FDM) là phương pháp chia sẻ băng thông lớn thành nhiều băng thông nhỏ hơn không chồng lấn Để đảm bảo hiệu quả sử dụng, giữa các khoảng tần số cần có khoảng bảo vệ, giúp sử dụng bộ lọc để tách biệt và lấy được khoảng tần mong muốn.
Ghép kênh theo thời gian (TDM - Time Division Multiplexing) là phương pháp có hiệu suất sử dụng kênh truyền cao, khi trục tần số được chia thành nhiều khe thời gian Mỗi kênh dữ liệu sẽ chiếm giữ toàn bộ trục tần số trong những khoảng thời gian nhất định, cho phép luồng bit tốc độ thấp của từng kênh được ghép lại thành một luồng bit tốc độ cao duy nhất TDM được ứng dụng rộng rãi trong các hệ thống thông tin số.
KỸ THUẬT MIMO
Kỹ thuật MIMO (Multiple Input Multiple Output) là phương pháp sử dụng nhiều anten ở cả phía thu và phát, kết hợp với các kỹ thuật xử lý tín hiệu để nâng cao hiệu suất hệ thống và khả năng cung cấp dịch vụ Nghiên cứu gần đây đã chỉ ra rằng các hệ thống MIMO có thể cải thiện đáng kể tốc độ truyền dữ liệu và giảm tỷ lệ lỗi bit (BER) mà không cần tăng công suất hay băng thông.
Hình 2.2 Mô hình hệ thống MIMO cơ bản
Kỹ thuật MIMO giúp tăng dung lượng hệ thống do đó tăng tốc độ dữ liệu
Kỹ thuật MIMO cải thiện chất lượng hệ thống trong kênh truyền đa đường bằng cách lặp lại một ký hiệu ở các khoảng thời gian khác nhau và mã hóa một cách thích hợp.
Giúp tăng tỉ số tín hiệu trên nhiễu và phạm vi hoạt độngcủa hệ thống
Hệ thống không cần tăng số lượng trạm gốc hay quá nhiều anten để đạt được vùng bao phủ như mong muốn, làm giảm giáthành khi triển khai
Hệ thống MIMO chứa nhiều anten dẫn đến tăng độ phức tạp
Trong hệ thống MIMO, các anten cần được bố trí cách nhau một khoảng cách tối thiểu nhằm tránh nhiễu lẫn nhau và đảm bảo hiệu quả phân tập không gian Tuy nhiên, yêu cầu này cũng dẫn đến việc tăng kích thước thiết bị theo số lượng anten được sử dụng.
Hệ thống MIMO chỉ phát huy hiệu quả trong môi trường kênh truyền có suy hao lớn và ảnh hưởng của đa đường mạnh mẽ Trong các kênh truyền ít suy hao và lý tưởng, hiệu suất của MIMO không vượt trội so với hệ thống thông thường, mặc dù độ phức tạp của nó lại cao hơn.
HỆ THỐNG MASSIVE MIMO
Massive MIMO, hay mô hình MIMO cỡ rất lớn, là một công nghệ mạng không dây tiên tiến, trong đó các trạm cơ sở được trang bị nhiều anten để phục vụ đồng thời nhiều thiết bị người dùng thông qua việc ghép kênh không gian.
Hệ thống Massive MIMO cơ bản được mô tả trong Hình 2.3, với mỗi trạm cơ sở trang bị M anten phục vụ K máy đầu cuối đơn anten Các trạm cơ sở hoạt động trong các cell khác nhau, tối đa hóa tài nguyên không gian-tần số trên cả đường truyền lên và xuống Trên đường lên, trạm cơ sở khôi phục tín hiệu riêng biệt từ các đầu cuối, trong khi trên đường xuống, đảm bảo rằng mỗi thiết bị đầu cuối chỉ nhận được tín hiệu của mình.
Kênh truyền được xác định qua pha huấn luyện giữa người dùng và trạm phát, tùy thuộc vào giao thức của hệ thống, có thể là FDD (song công phân chia theo tần số) hoặc TDD (song công phân chia theo thời gian) Các tín hiệu mong muốn sẽ được truyền tải qua đường lên và đường xuống.
Hình 2.3 Đường lên và đường xuống tín hiệu trong mô hình Massive MIMO 2.3.2 Hoạt động Massive MIMO
Trong hệ thống Massive MIMO, hàng trăm hoặc hàng nghìn anten tại trạm phát có khả năng phục vụ đồng thời hàng chục đến hàng trăm người dùng trên cùng một nguồn tài nguyên tần số Vì vậy, giao thức truyền được sử dụng trong hệ thống này là giao thức truyền song công phân chia theo thời gian (TDD).
Hệ thống FDD sử dụng phổ tần số khác nhau cho đường lên và đường xuống, dẫn đến kênh Uplink và Downlink không đối xứng Để truyền tín hiệu xuống, trạm phát cần thông tin kênh (CSI) để mã hóa tín hiệu trước khi phát đến K người dùng M anten tại trạm phát sẽ phát M tín hiệu pilot (tín hiệu hoa tiêu) trực giao đến K người dùng.
Mỗi người dùng ước lượng kênh dựa trên tín hiệu pilot nhận được và phản hồi lại M kênh đến trạm phát Quy trình này cần ít nhất M kênh đường xuống và M kênh đường lên Đối với đường lên, K người dùng phát K tín hiệu pilot trực giao đến trạm phát, nơi thực hiện ước lượng kênh và phản hồi Tổng quá trình ước lượng kênh trong hệ thống FDD yêu cầu tối thiểu M + K kênh trên đường lên và M kênh cho đường xuống.
T ký hiệu Đường lên Đường xuống
Trong hệ thống TDD, kênh truyền đường lên và đường xuống chia sẻ cùng một dải tần số nhưng sử dụng các khe thời gian khác nhau Sự đối xứng giữa kênh đường lên và đường xuống cho phép thông tin thu được từ kênh đường lên có thể được sử dụng trực tiếp cho kênh đường xuống.
Trên đường lên K, người dùng phát K chuỗi pilot trực giao đến trạm phát Trạm phát sử dụng thông tin kênh này để mã hóa tín hiệu gửi xuống và đồng thời tạo búp sóng pilot Toàn bộ quá trình này yêu cầu sử dụng 2K kênh truyền.
Pilot đường xuống (M pilot trực giao)
Pilot đường lên (K pilot trực giao)
MK kênh ước lượng phản hồi
11 thời gian cần thiết để truyền pilot tỉ lệ với số anten người dùng và không phụ thuộc vào số anten ở trạm cơ sở
Truyền dữ liệu đường lên
Búp sóng Pilot đường xuống
Truyền dữ liệu đường xuống
Hình 2.5 Cấu trúc ước lượng kênh truyền trong TDD [8].
Giao thức truyền FDD phụ thuộc vào số lượng anten trạm phát M, trong khi hệ thống Massive MIMO có số anten M rất lớn Do đó, giao thức TDD được lựa chọn để ước lượng kênh vì nó không phụ thuộc vào M.
DEEP LEARNING
Deep Learning là một lĩnh vực con của máy học, sử dụng mạng nơ-ron nhân tạo để xử lý và phân tích một lượng lớn dữ liệu Công nghệ này hoạt động bằng cách tìm kiếm các mối quan hệ giữa dữ liệu đầu vào và đầu ra thông qua các quá trình tính toán và dự đoán Mục tiêu là xác định con đường ngắn nhất dẫn đến kết quả đầu ra chính xác Để đánh giá hiệu quả của mạng nơ-ron, kết quả từ mô hình sẽ được kiểm tra trên một tập dữ liệu mới, từ đó so sánh với dữ liệu ban đầu để xác định mức độ huấn luyện của mạng nơ-ron.
Bộ não loài người được hình thành từ sự hiểu biết về sinh học, với các nơ-ron (nút) liên kết qua các khớp thần kinh (liên kết) Mỗi nơ-ron nhận dữ liệu, thực hiện thao tác và chuyển tiếp dữ liệu mới đến nơ-ron khác qua các liên kết Những liên kết này chứa thông tin có ảnh hưởng đến hoạt động của nơ-ron tiếp theo.
Hình 2.6 Một mạng nơ-ron nhân tạo
Do Deep Learning đó sử dụng nhiều dữ liệu hơn nhiều thuật toán hơn giúp
“huấn luyện” máy nhìn được nhiều đặc điểm ẩn giúp thực hiện tác vụ tốt hơn
2.4.1 Hoạt động của mạng nơ-ron nhân tạo
Mạng nơ-ron nhân tạo có thể được hình dung như một đồ thị có hướng và có trọng số, trong đó các nơ-ron nhân tạo đóng vai trò là các nút, còn các cạnh có hướng và trọng số biểu thị các kết nối giữa đầu ra của nơ-ron và đầu vào của nơ-ron khác.
Hình 2.7 Mô tả hoạt động mạng nơ-ron
Mạng nơ-ron nhân tạo tiếp nhận thông tin từ môi trường bên ngoài dưới dạng mẫu và hình ảnh được biểu diễn dưới dạng vector Các đầu vào này được ký hiệu toán học là x(n), trong đó n đại diện cho số lượng đầu vào.
Mỗi đầu vào trong mạng nơ-ron được nhân với trọng lượng tương ứng, phản ánh sức mạnh của mối liên kết giữa các nơ-ron Trọng lượng này là thông tin quan trọng giúp mạng nơ-ron giải quyết các vấn đề một cách hiệu quả.
Hàm kích hoạt là thành phần quan trọng trong mạng nơ-ron, được sử dụng để tạo ra đầu ra mong muốn Các loại hàm kích hoạt bao gồm hàm tuyến tính và hàm phi tuyến, trong đó một số hàm phổ biến như Sigmoid, Tanh, Softmax và ReLu thường được áp dụng.
2.4.2.Các hàm tính toán trên các lớp mạng nơ-ron (hàm tuyến tính, sigmoid, tanh, relu,elu)
Hàm kích hoạt nhận một giá trị duy nhất và thực hiện phép toán cố định, tính toán tổng số có trọng số đầu vào, cộng thêm bias, và khi đạt ngưỡng nhất định, nó truyền thông tin đến các nơ-ron tiếp theo Hàm kích hoạt ánh xạ giá trị kết quả trong khoảng từ 0 đến 1 hoặc -1 đến 1, tùy thuộc vào chức năng Chúng có thể được chia thành hai loại chính: hàm kích hoạt tuyến tính và hàm kích hoạt phi tuyến tính.
Linear function (Hàm tuyến tính) f(x) = ax
Đồ thị tuyến tính với a là một hằng số có thể dẫn đến kết quả lớn, nhưng hàm tuyến tính không thể phản ánh được những cấu trúc phức tạp trong dữ liệu.
Các Sigmoid phi tuyến tính có dạng toán học σ(x) = 1
1+e −x và được biểu diễn như hình bên dưới:
Hình 2.9 Đồ thị hàm Sigmoid
Hàm Sigmoid nhận đầu vào là giá trị thực và nén nó trong khoảng từ 0 đến 1, trong đó số âm lớn trở thành 0 và số dương lớn trở thành 1 Điều này khiến hàm Sigmoid trở thành lựa chọn lý tưởng cho các mô hình dự đoán xác suất, vì xác suất luôn nằm trong khoảng từ 0 đến 1 Trong khi đó, hàm Softmax là một hàm kích hoạt logistic tổng quát hơn, thường được sử dụng cho phân loại đa lớp.
𝟏+𝒆 −𝟐𝒙 − 𝟏 được hiển thị trên hình dưới:
Hình 2.10 Đồ thị hàm tanh
Hàm Tanh, tương tự như hàm Sigmoid (tanh = 2sigmoid(2x) - 1), có phạm vi từ -1 đến 1, mang lại lợi thế trong việc ánh xạ các đầu vào âm mạnh mẽ và gần 0 cho các đầu vào bằng 0 Tanh thường được sử dụng để phân loại giữa hai lớp và trong thực tế, các phi tuyến Tanh thường được ưa chuộng hơn so với phi tuyến Sigmoid.
Hàm ReLu (Rectified Linear Unit)
ReLu là một hàm kích hoạt phổ biến nhất hiện nay, được áp dụng rộng rãi trong các mạng nơ-ron tích chập và Deep Learning.
Nó tính toán hàm f(x) = max(0, x), khi x=0 thì f(x)=x
Hàm ReLu và đạo hàm của nó đều có tính đơn điệu, nhưng vấn đề phát sinh khi tất cả các giá trị âm trở thành “0”, điều này làm giảm khả năng phù hợp và huấn luyện mô hình từ dữ liệu Khi đầu vào âm được cung cấp cho hàm kích hoạt ReLu, giá trị sẽ ngay lập tức chuyển thành 0, ảnh hưởng đến biểu đồ kết quả và không ánh xạ đúng các giá trị âm.
Hàm Elu (Exponential Linear Unit)
Hàm tính toán f(x)=x, khi x≥0 và f(x)=α(e x -1)
Hàm Elu là một hàm kích hoạt có khả năng hội tụ nhanh chóng về 0 và mang lại kết quả chính xác hơn so với các hàm khác Điểm khác biệt của ELU là nó có thêm một hằng số alpha dương Hàm này tương tự như hàm RELU, nhưng có sự điều chỉnh cho các đầu vào âm, trong khi cả hai đều hoạt động hiệu quả với các đầu vào không âm.
MÔ HÌNH MASSIVE MIMO
Trong mạng Massive MIMO với L cell, mỗi cell bao gồm một trạm gốc có M anten và K người dùng Ký hiệu ℎ 𝑙𝑖 𝑗 ∈ ∁ 𝑀 đại diện cho kênh giữa người dùng i trong cell l và trạm gốc j.
ℎ 𝑙𝑖 𝑗 là đáp ứng kênh truyền giữa trạm gốc j và người dùng i trong cell l.
𝒩 𝒞 (0 𝑀 ,𝑅 𝑙𝑖 𝑗 ) là phân phối Gauss đối xứng tròn của 0 𝑀 𝑣à 𝑅 𝑙𝑖 𝑗
0 𝑀 𝑙à là mã trận Mx1 chỉ có vector 0.
𝑅 𝑙𝑖 𝑗 ∈ ∁ 𝑀𝑥𝑀 là ma trận tương quan không gian, được biết đến tại trạm gốc.
Hình 3.1 mô tả mô hình Massive MIMO gồm 8 cell mỗi cell gồm 1 trạm gốc truyền tín hiệu cho 4 người dùng
Hình 3.1 Mô hình Massive MIMO [10].
𝛽 𝑙𝑖 𝑗 = 1/𝑀 tr (𝑅 𝑙𝑖 𝑗 ) chiếm mức tăng kênh trung bình từ anten tại trạm gốc j đến người dùng i trong cell l và được mô hình hóa là (tính bằng dB):
Υ= -148 dB xác định mức tăng kênh trung bình ở khoảng cách tham chiếu là 1 km.
α = 3.76 là hệ số pathloss trong mô hình fading quy mô lớn.
𝑑 𝑙𝑖 𝑗 là khoảng cách của người dùng i trong cell l từ trạm gốc j.
𝑑 𝑙𝑖 𝑗 = || 𝑥 𝑙𝑖 𝑗 || với 𝑥 𝑙𝑖 𝑗 ∈ 𝑅 2 là vị trí người dùng trong không gian Euclide.
tr (𝑅 𝑙𝑖 𝑗 ) là vết của ma trận vuông của 𝑅 𝑙𝑖 𝑗
Hình 3.2 minh họa tín hiệu đường xuống lý tưởng từ trạm gốc đến người dùng trong cùng một cell Tuy nhiên, trạm gốc cũng có khả năng truyền tín hiệu đến người dùng ở các cell khác.
Hình 3.2 Tín hiệu nhiễu do các anten khác cell tác động vào [10].
Mô hình hóa bằng phân phối log-normal thường dẫn đến sự không nhất quán trong mô hình kênh không gian Điều này có nghĩa là hai người dùng ở gần nhau sẽ không có cùng trải nghiệm về kênh.
3.1.1 Ước lượng kênh Để huấn luyện ước lượng kênh truyền các vectơ tại trạm gốc j Ta giả định rằng trạm gốc và người dùng được đồng bộ hoàn hảo và hoạt động theo giao thức song công theo thời gian (TDD) trong đó giai đoạn truyền dữ liệu đường xuống được đặt trước trong giai đoạn huấn luyện để ước tính kênh Có τp = K pilots (tức là, hệ số tái sử dụng pilot là 1) và người dùng i trong mỗi cell sử dụng cùng một pilot Sử dụng tổng công suất pilots đường lên là ρ tr trên mỗi người dùng và tuân theo các kỹ thuật ước tính MMSE tiêu chuẩn
Lỗi ước tính ℎ̃ 𝑙𝑖 𝑙 = ℎ 𝑙𝑖 𝑗 - ℎ̂ 𝑙𝑖 𝑙 ~𝒩 𝒞 (0, 𝑅 𝑙𝑖 𝑗 − Φ 𝑙𝑖 𝑗 ) độc lập với ℎ̂
ℎ̂ 𝑙𝑖 𝑗 là ước lượng kênh truyền giữa trạm gốc j và người dùng i trong cell l.
𝐼 𝑀 là ma trận đơn vị MxM.
τ 𝑝 là số lượng mẫu phân bổ cho các pilots trong mỗi khối kết hợp.
Φ là trình tự thí điểm liên kết với người dùng k trong cell l.
3.1.2 Hiệu suất phổ đường xuống
Trạm gốc trong cell l truyền tín hiệu đường xuống x l = Σ 𝑙 ′ =1
Tín hiệu dữ liệu đường xuống cho người dùng i trong cell l được biểu diễn bởi ς 𝑙𝑖 ~𝒩 𝒞 (0, ρ 𝑙𝑖 ), với vectơ tiền mã hóa wli ∈ C M xác định không gian chỉ thị của truyền Đồng thời, vectơ này phải thỏa mãn điều kiện ||wli|| 2.
ρ 𝑙𝑖 đại diện cho công suất truyền.
Qua hình 3.3 Gọi vectơ kênh giữa trạm gốc j và người dùng k trong cell l là h jk j
Hình 3.3 Minh họa việc truyền đường xuống trong cell j và cell l [10]
Hiệu suất đường xuống trong Massive MIMO có thể được tính toán thông qua các ràng buộc cứng Theo Định lý 1, dung lượng kênh đường xuống ergodic của thiết bị k trong cell j bị giới hạn bởi một số yếu tố nhất định.
𝑆𝐸 𝑗𝑘 𝑑𝑙 = τ 𝑑 τ 𝑐 𝑙𝑜𝑔 2 (1 + 𝛾 𝑗𝑘 𝑑𝑙 ) [bit/s/HZ] (3.4)Với việc đặt
∑ 𝐿 𝑙=1 ∑ 𝐾 𝑖=1 ρ li {𝔼|w jk H h jk j | 2 }−ρ jk |𝔼{w jk H h jk j }| 2 +ℴ 2
τ 𝑑 là mẫu dữ liệu đường xuống trên mỗi khối kết hợp
τ 𝑐 là tổng số lượng mẫu trên mỗi khối kết hợp.
ℴ là phương sai đường xuống
ρ jk là công suất truyền đường xuống được phân bổ trên người dùng k trong cell j
Hệ số τ 𝑑 τ 𝑐 chiếm tỷ lệ mẫu trên mỗi khối kết hợp được sử dụng cho dữ liệu đường xuống
Công thức (3.4) bị giới hạn bởi công thức (3.5), được áp dụng khi người dùng xem giá trị trung bình của kênh tiền mã hóa là chính xác Mặc dù đây là một giả định hợp lý cho các kênh có độ cứng, nhưng nó cũng dẫn đến một số mất mát nhất định đối với các kênh có độ cứng thấp hoặc không có.
3.1.3 Thiết kế bộ tiền mã hóa
Tìm kiếm các bộ tiền mã hóa tối ưu là một thách thức lớn, khác với quá trình trên đường lên, vì hiệu suất đường xuống phụ thuộc vào các vectơ tiền mã hóa {wli} của tất cả người dùng trong mạng Để giải quyết vấn đề này, một phương pháp heuristic phổ biến được áp dụng là tính đối ngẫu giữa đường lên và đường xuống, trong đó wjk được xác định theo công thức wjk = 𝑣𝑗𝑘.
vjk biểu thị vectơ kết hợp được sử dụng để phát hiện tín hiệu đường lên được truyền bởi người dùng k trong cell j.
Trong nghiên cứu này, đề tài giả định vjk đó được thiết kế theo [7]:
𝜎 𝑢𝑙 2 là phương sai của nhiễu đường lên.
𝜌 𝑢𝑙 là công suất truyền đường lên.
M-MMSE được chọn do tính tối ưu của nó, mặc dù có độ phức tạp tính toán cao Ngược lại, MR không chỉ tối ưu cho các giá trị hữu hạn của M mà còn khi M tiến tới vô cực, đồng thời có độ phức tạp thấp nhất trong số các sơ đồ kết hợp phía nhận.
PHÂN BỔ CÔNG SUẤT
SE đường xuống của người dùng k trong cell j có thể được viết lại thành
𝐿 𝑙=1 b lijk +σ 2 ) ∀𝑗, 𝑘 (3.9) Khi đặt a jk = |𝔼 {w jk H h jk j }| 2 (3.10)
Và đặt b lijk = {𝔼 |w jk H h jk j | 2 , (l, i) ≠ (j, k)
Độ lợi kênh trung bình và độ lợi trung bình nhiễu là hai yếu tố quan trọng trong việc tính toán hiệu suất của hệ thống Phép tính trung bình này liên quan đến fading quy mô nhỏ, cho thấy rằng SE đường xuống chỉ phụ thuộc vào thống kê fading quy mô lớn và lựa chọn tiền mã hóa Massive MIMO nổi bật với khả năng đơn giản hóa vấn đề phân bổ công suất, vượt trội hơn so với các hệ thống anten đơn.
Trong số các phương pháp phân bổ công suất, hai phương pháp nổi bật là max prod SINR và max-min, có thể được diễn đạt một cách toán học.
{ρ jk :∀𝑗,𝑘} min SE jk dl
Công suất truyền đường xuống tối đa được ký hiệu là 𝑃 𝑚𝑎𝑥 𝑑𝑙 Để tính toán các công suất tối ưu, phương pháp Monte Carlo là một phương pháp cần thiết.
Hiệu ứng lan truyền vĩ mô
Thả ngẫu nhiên các thiết bị người dùng vào vị trí 𝑥 𝑙𝑖 𝑗
Tính fading quy mô lớn β 𝑙𝑘 𝑗
Tính ma trận tương quan kênh R 𝑗 𝑙𝑘
Hiệu ứng lan truyền kính hiển vi
Tạo các vectơ kênh ước tính ngẫu nhiên ℎ̂ 𝑙𝑘 𝑗 bằng cách sử dụng công cụ ước tính MMSE
Tính toán các vectơ tiền mã hóa wjk với tiền mã hóa MR hoặc M-MMSE
Tính toán ước lượng kênh truyền trung bình {a jk } và {b lijk }.
Tính phân bổ công suất bằng cách giải (3.12) hoặc (3.13).
PHÂN BỔ CÔNG SUẤT DỰA TRÊN DEEP LEARNING
Mục tiêu của phần này là mô tả thông tin vị trí của người dùng nhằm tối ưu công suất tại bất kỳ cell nào, khác với các phương pháp tối ưu hóa truyền thống yêu cầu kiến thức về {ajk} và {blijk}.
Nghiên cứu về việc sử dụng các vị trí của người dùng là cần thiết, vì chúng ta đã hiểu rõ tính năng chính của sự truyền dẫn trong các kênh và ảnh hưởng của nhiễu trong mạng.
Vì vậy, cho bất kỳ cell j nào, vấn đề là tìm hiểu vị trí chưa biết giữa ρ j ∗ = [ρ j1 ∗ ,…, ρ jK ∗ ]
ρ j ∗ (n) tương ứng với phân bổ công suất tối ưu cho đầu vào huấn luyện x(n)
Để xây dựng một mạng nơ-ron hiệu quả, kích thước lớp mạng ngõ vào được xác định là 2KL, với vị trí thiết bị người dùng x {x li j ;∀j,l,i} ∈ 𝑅 2𝐾𝐿 Nghiên cứu tập trung vào việc áp dụng mạng nơ-ron feedforward với các lớp kết nối đầy đủ, bao gồm lớp ngõ vào kích thước 2KL, N lớp ẩn và ước tính năng suất lớp ngõ ra kích thước K+1, ρ̂ 𝑗 ∗ =[ρ̂ j1 , … , ρ̂ jK ] Để huấn luyện các trọng số W và khoảng sai lệch b của mạng nơ-ron, cần một tập huấn luyện với NT mẫu {ρ j ∗ (n); x (n); n= 1,…, NT} Quá trình huấn luyện nhằm tối thiểu hóa độ mất mát thông qua đầu ra ρ̂ j (n) của mạng nơ-ron.
Với ℓ (ã, ã) là phép đo thích hợp, mạng nơ-ron có khả năng ước tính phân bổ công suất tối ưu cho các vectơ đầu vào không nằm trong tập huấn luyện khi các tham số W và b được cấu hình Điều này cho phép việc cập nhật phân bổ công suất diễn ra dễ dàng mỗi khi vị trí người dùng thay đổi, chỉ cần cung cấp các vị trí mới mà không cần phải giải quyết các phương trình phức tạp (3.12) hoặc (3.13).
Phương pháp nghiên cứu gặp phức tạp chủ yếu trong việc xây dựng tập huấn luyện, với giả định rằng mỗi lớp bao gồm Ni nơ-ron Để tính toán đầu ra của mạng nơ-ron, chỉ cần thực hiện phép nhân thực ∑ 𝑁+1 𝑖=1 𝑁 𝑖−1 𝑁 𝑖.
Huấn luyện có thể thực hiện ngoại tuyến, cho phép cung cấp độ phức tạp cao hơn mà không bị ràng buộc bởi thời gian thực.
Việc huấn luyện có thể được cập nhật trong thời gian dài hơn so với sự thay đổi vị trí người dùng trong mạng Điều này cho phép tập huấn luyện được cập nhật hiệu quả hơn, đặc biệt khi đối mặt với vấn đề kiểm soát công suất bằng phương pháp phân bổ tài nguyên truyền thống Cách tiếp cận nghiên cứu sẽ giảm đáng kể độ phức tạp, cho phép cập nhật phân bổ năng lượng dựa trên vị trí người dùng theo thời gian thực.
Cách tiếp cận nghiên cứu này sẽ giảm thiểu đáng kể mức độ phức tạp, cho phép cập nhật phân bổ công suất theo vị trí người dùng một cách thời gian thực.
THÔNG SỐ MÔ PHỎNG
Nghiên cứu về mạng Massive MIMO được trình bày trong Bảng 1 với 4 ô (L = 4), mỗi ô có kích thước 250 × 250 m Đề tài giả định có 5 thiết bị người dùng (K = 5) được phân bố ngẫu nhiên và đồng đều trong mỗi ô, ở khoảng cách lớn hơn.
Kết quả được tính trung bình từ hơn 100 phân phối thiết bị người dùng, với băng thông 20 MHz và tổng công suất nhiễu ở máy thu là σ 2 = −94 dBm Giả sử hệ số tái sử dụng thí điểm p = K (tức là 1) và công suất phát đường lên mỗi người dùng là 20 dBm.
Bảng 1 Số liệu mô phỏng hệ thống Massive MIMO
Diện tích tất cả cell 1KMx1KM
Số lượng người dùng mỗi cell K=5
Công suất nhiễu đường lên -94dBm
Công suất truyền đường lên 20dBm
Mạng nơ-ron được huấn luyện dựa trên bộ dữ liệu NT = 330000 mẫu thực hiện độc lập của các thiết bị người dùng
Vị trí {x(n); n = 1,…, NT} và phân bổ công suất tối ưu {ρj *(n); n = 1,…, NT} cho j = 1,…,L được xác định thông qua việc giải quyết các phương trình (3.12) và (3.13) bằng các phương pháp tối ưu hóa truyền thống Trong quá trình này, 90% mẫu được sử dụng cho việc huấn luyện, trong khi 10% còn lại được dùng để thẩm định chất lượng huấn luyện Thêm vào đó, 10.000 mẫu khác được tạo ra để hình thành tập dữ liệu thử nghiệm, hoàn toàn độc lập với bộ dữ liệu huấn luyện.
Trong quá trình phân tích dữ liệu SE của từng người dùng, nhóm nhận thấy đồ thị SE max product có xu hướng tăng dần, với cả giá trị âm và dương Hình dạng này tương tự như đồ thị của hàm ELU, vì vậy nhóm đã phát triển nhiều hàm ẩn ELU nhằm cải thiện kết quả huấn luyện mạng nơ-ron.
Bảng 2 Số liệu mô phỏng mạng nơ-ron huấn luyện Max product SINR
Kích thước Thông số Chức năng
LƯU ĐỒ GIẢI THUẬT
Hình 3.4 Lưu đồ giải thuật
KẾT QUẢ MÔ PHỎNG
Để đánh giá hiệu suất của kỹ thuật mã hóa MR và M-MMSE, chúng tôi tập trung vào hiệu suất phổ Bài viết minh họa chức năng phân phối tích lũy (CDF) của hiệu suất phổ đường xuống trên từng thiết bị người dùng, chỉ thay đổi số vị trí, trong đó yếu tố ngẫu nhiên phụ thuộc vào vị trí của thiết bị Chúng tôi tiến hành xem xét MR và M-MMSE thông qua việc tạo ra 100 mẫu.
Hình 4.1 Hình giao diện mô phỏng 100 vị trí ngẫu nhiên trên Matlab
Kết quả mô phỏng max product SINR so sánh giữa 2 phương pháp MR và M-MMSE
Hình 4.2 Kết quả mô phỏng Max Product SINR
Phương pháp max product SINR cho thấy đường cong MR có hiệu suất vượt trội hơn so với M-MMSE Theo Bảng 2, tại cùng một mức hiệu suất phổ, hàm CDF của MR cao hơn, tức là xác suất xảy ra lớn hơn so với M-MMSE Điều này chỉ ra rằng với tiền mã hóa MR, hiệu suất phân bổ trên người dùng đạt hiệu quả cao hơn ở mức xác suất xảy ra lớn khi so sánh với M-MMSE.
Bảng 3 Số liệu CDF Max product SINR tương ứng với SE mỗi người dùng
SE[bit/s/Hz] CDF Max product SINR
Kết quả mô phỏng max-min fairness so sánh giữa hai phương pháp MR và M- MMSE
Hình 4.3 Kết quả mô phỏng Max-min fairness
Với phương pháp max min fairness, đường cong MR cho thấy hiệu suất vượt trội hơn so với M-MMSE Bảng 4 chỉ ra rằng tại cùng một mức hiệu suất, sự khác biệt giữa hai phương pháp này là rõ rệt.
Phương pháp MR có hàm CDF cao hơn, cho thấy xác suất xảy ra lớn hơn so với M-MMSE Điều này đồng nghĩa với việc hiệu suất phân bổ trên người dùng của MR đạt hiệu quả cao hơn ở mức xác suất lớn khi so sánh với M-MMSE.
Tương tự với thành phần fairness (độ tin cậy), ta thấy đường cong MR tốt hơn so với M-MMSE
Bảng 4 Số liệu CDF Max-min fairness tương ứng với SE mỗi người dùng
SE[bit/s/Hz] CDF Max-min fairness
KẾT QUẢ HUẤN LUYỆN BẰNG DEEP LEARNING
Để đánh giá hiệu suất mạng nơ-ron dựa trên phân bổ công suất, bài viết này minh họa chức năng phân phối tích lũy (CDF) của công suất đường xuống cho từng thiết bị người dùng Kết quả được trình bày thông qua đường dữ liệu phân bổ công suất đường xuống trong Matlab.
Khi sử dụng 330.000 mẫu để tính toán với các công thức tối ưu phức tạp, mạng nơ-ron sẽ được huấn luyện để tạo ra kết quả tính toán nhanh chóng Chỉ cần đưa vào 10.000 mẫu dữ liệu mới, mạng nơ-ron đã được mô hình hóa và huấn luyện sẽ nhanh chóng xử lý và đưa ra kết quả.
Hình 4.4 cho thấy mạng nơ-ron rất phù hợp với phương pháp tối ưu với M-MMSE
Hình 4.4 Kết quả mô phỏng M-MMSE max prod khi sử dụng với mạng nơ-ron và tính toán với Matlab
Nhận xét cho thấy rằng cả hai phương pháp tính toán bằng Matlab và mạng nơ-ron đều cho kết quả tương tự, không có sự khác biệt đáng kể Điều này chứng minh rằng mạng nơ-ron hoạt động hiệu quả trong việc tối ưu hóa Max product SINR.
Hình 4.5 cho thấy đường cong trong tiền mã hóa MR sử dụng mạng nơ-ron có hiệu quả cao hơn so với phương pháp tính toán bằng Matlab Tuy nhiên, mục tiêu của đề tài là đạt được sự trùng khớp giữa hai đường cong này.
Hình 4.5 Kết quả mô phỏng MR max prod khi sử dụng với mạng mạng nơ-ron và tính toán với Matlab
Nhận xét cho thấy rằng, ở mức công suất thấp, sự khác biệt giữa hai phương pháp sử dụng mạng nơ-ron và tính toán bằng Matlab là không đáng kể Tuy nhiên, khi mức công suất tăng lên trên 100W, phương pháp sử dụng tính toán mạng nơ-ron bắt đầu thể hiện ưu thế rõ rệt.
Việc sử dụng phân bổ công suất cho mạng nơ-ron giúp tối ưu hóa hiệu suất, với 33 nơ-ron hoạt động ở mức công suất cao và cùng một xác suất xảy ra Điều này cho thấy rằng việc áp dụng phương pháp này có thể mang lại hiệu quả gần như tối ưu cho mạng nơ-ron.
Kết quả cho thấy M-MMSE phức tạp hơn MR về thuật toán và tính toán, dẫn đến việc phân bổ công suất tối ưu khó học hơn Nguyên nhân là do trong tiền mã hóa MR, công suất được phân bổ dựa trên tín hiệu tốt nhất, trong khi M-MMSE xem xét cả tín hiệu gây nhiễu Mạng nơ-ron nhận đầu vào là công suất của tất cả người dùng trong mạng, cho phép khai thác thông tin hiệu quả hơn khi sử dụng M-MMSE.
Kết luận: Phương pháp max-product trong Deep Learning cho thấy khả năng tính toán phức tạp hơn đáng kể so với các phương pháp truyền thống, đồng thời vẫn duy trì hiệu suất tối ưu với tiền mã hóa M-MMSE và gần tối ưu với tiền mã hóa MR.
KẾT LUẬN
Nghiên cứu này tập trung vào việc sử dụng mạng nơ-ron nhân tạo để phân bổ công suất trong đường xuống của mạng Massive MIMO với các kỹ thuật mã hóa MR và M-MMSE Phương pháp phân bổ công suất được áp dụng là max-prod, cho thấy rằng mạng nơ-ron được huấn luyện một cách chính xác có khả năng học cách phân bổ công suất cho từng người dùng trong mỗi cell Điều đặc biệt là phương pháp này chỉ dựa vào thông tin vị trí của người dùng, giúp giảm đáng kể độ phức tạp và thời gian xử lý trong quá trình tối ưu hóa.
Kết quả cho thấy Deep Learning hoạt động tốt hơn với M-MMSE hơn là với
Phương pháp M-MMSE cho phép mạng nơ-ron khai thác tối đa thông tin có sẵn, trong khi phương pháp MR lại khó khăn hơn trong việc huấn luyện Để đạt được hiệu quả huấn luyện, cần sử dụng các mạng nơ-ron với số lượng tham số cao.
HƯỚNG PHÁT TRIỂN
Đề tài nghiên cứu hệ thống Massive MIMO với 4 cell và 5 người dùng mỗi cell, nhằm phát triển mạng nơ-ron có khả năng mở rộng khi kích thước mạng tăng Trong thực tế, số lượng người dùng trên mỗi cell thường xuyên thay đổi Một giải pháp khả thi là triển khai nhiều mạng nơ-ron tại mỗi trạm gốc để phù hợp với các cấu hình người dùng khác nhau Tuy nhiên, việc mở rộng giải pháp này vẫn gặp nhiều khó khăn.
35 nhiên sự tích hợp của Deep Learning cho các công cụ phân bổ công suất theo thời gian thực trong Massive MIMO là khá khả thi