Áp dụng mô hình lý thuyết trò chơi cho mạng Femtoc- 123docz.net

Hình 2.7 minh họa một mô hình mạng Femtocell gồm K Femtocell Access Point (FAP) và M người dùng sử dụng Mobile System (MS). Số anten trên mỗi FAP là NT và trên MS là NR .

Hình 2.7. Mô hình mạng Femtocell.

Giả sử tất cả MS gửi Data lên đường Uplink cùng lúc và các FAP truyền Data trên Downlink tại cùng thời điểm, do đó tồn tại M trạm thu phát mọi lúc trong mô hình mạng. Khi đó, Tỉ lệ tín hiệu nhận được trên ồn của trạm thu có thể tính được :

yi = ρiHiixi + ηij

j=1,j≠1

Hijxj+ ni (1)

Với xi và xj là các vector truyền kích thước NT với i và j tương ứng, ρi là tỉ lệ tín hiệu nhận được trên tạp âm (SNR) và ηij là tỉ lệ nhiễu nhận được trên tạp âm (INR). Hii là ma trận kênh kích thước NR.NT trong trường hợp truyền i và nhận i, Hij

là ma trận kênh kích thước NR.NT trong trường hợp truyền j và nhận i.

Để đảm bảo giảm nhiễu của người dùng thứ cấp lên người dùng sơ cấp, mạng vô tuyến nhận thức phải thỏa mãn điều kiện giới hạn công suất :tr Qi ≤ Ptvới

Qi = E xixiH là ma trận phương sai của vector xi.

Theo [7] ma trận phương sai của nhiễu và tạp âm trong trường hợp nhận i:

Rni = ηjHjQj

j=1,j≠i

HjH + INR (2)

Ma trận phương sai của tín hiệu trong trường hợp nhận i:

Ryi = ρiHiiQiHiiH + Rni (3)

Tốc độ truyền tin của user thứ i có thể tính được :

Vi = log det ρiHiiQiHiiHRni−1+ INR 4

Yêu cầu đă ̣t ra là chứng minh s ự tồn tại của điểm cân bằng trong tốc độ truyền tin dựa trên quan điểm của lý thuyết trò chơi và phương pháp để tìm ra nó.

Như đã trình bày ở phần trên, một mô hình lý thuyết trò chơi được đặc trưng bởi ba thành phần cơ bản: Tập người chơi, tập chiến lược và tập các hàm trả giá. Mô hình này có thể được định nghĩa bởi một hàm toán học G =< 𝐿, Si , Ui > [7]

Trong đó L là tập người chơi, Si là tập các chiến thuật mà người chơi sử dụng và Ui tập hàm trả giá quyết định kết quả sau mỗi nước đi mà người chơi thực hiện.

Áp dụng mô hình Lý thuyết trò chơi vào và vấn đề điều khiển công suất cho mạng Femtocell nhận thức: L tương ứng với tập các user, Si là chiến thuật phát của các user, khi mà các user đều cố gắng làm tối đa hóa lợi ích của nó bằng công suất phát mà không cần cân nhắc đến các user trong toàn mạng. Nói cách khác, đây là mô hình của một trò chơi bất hợp tác [7], và tập Ui sẽ xác định tốc độ truyền tin toàn cục mà các user nhận được và được tính bằng công thức:

U Si = log det ρiHiiQiHiiHRn−1i + INR (5)

Công suất phát Pivà ma trận phương sai Qi đều phụ thuộc vào vector truyền, vì vậy chúng có mối quan hệ mật thiết với nhau. Qi tác động trực tiếp đến tốc độ truyền tin của các user trong cùng một thời điểm. Như vậy, các user sẽ điều chỉnh công suất của chúng theo các chiến thuật riêng nhằm cải thiện lợi ích của mình, điều này sẽ gây nhiễu cho các user khác [1] . Để đáp lại, các user khác cũng áp dụng những chiến thuật để thay đổi công suất phát của chúng nhằm đảm bảo tốc độ truyền tin, tiến trình này sẽ tiếp diễn cho đến khi tất cả các user đều đạt được lợi ích tối đa của chúng. Đó là thời điểm một cuộc chơi đạt trạng thái cân bằng, gọi là điểm cân bằng Nash- Điểm cân bằng tổng hợp cho tất cả các user. Khi đạt đến cân bằng Nash, tất cả user sẽ không đưa ra bất kỳ thay đổi về công suất phát nữa. Điều kiện này được mô tả bởi công thức:

U(S∗) ≥ U(Si, S−i)

Với Silà chiến lược của người chơi thứ i, S−i là chiến lược của tất cả các user khác nhằm ngăn chặn i. Nếu tồn tại một tập S∗ thỏa mãn công thức trên trong quá trinh chơi, trò chơi sẽ đạt được điểm cân bằng Nash.

Ta có thể chứng minh sự tồn tại của điểm cân bằng Nash bằng cách chứng minh hàm G =< 𝐿, Si , Ui > thỏa mãn hai điều kiện:

- Tập {Si} khác rỗng và là hàm lồi trong không gian Euclid. - Tập Ui liên tục trên {Si} và là hàm gần như lõm.

Như vâ ̣y, với viê ̣c áp du ̣ng lý thuyết trò chơi vào ma ̣ng Femtocell giúp ta chứng minh đươ ̣c sự tồn ta ̣i của điểm cân bằng của tốc đô ̣ truyền tin hay điểm cân bằng Nash, khi tốc độ truyền tin của tất cả người dùng đa ̣t cực đa ̣i . Vấn đề này được giải quyết bằng viê ̣c điều chỉnh công suất truyền để từng user có thể tối đa hóa lơi thế của mình trong cuộc chơi, qua đó tối đa hóa hiê ̣u năng cho toàn hê ̣ thống.

Trong mô hình trò chơi này , hàm trả giá được xác định bởi tốc độ thu tin của trạm gốc theo công thức[11]:

U S = log det ρiHiiQiHiiHR−1ni + INR (6)

i=1

Việc tìm điểm cân bằng cho mô hình trò chơi trên có thể thực hiê ̣n bởi các thuâ ̣t toán tìm kiếm. Phần sau của luâ ̣n văn sẽ trình bày mô ̣t số thuâ ̣t toán : Tối ưu hỗn đô ̣n, Gradient search có tính khả thi trong viê ̣c tìm kiếm điểm cân bằng này.

Chƣơng III: Các thuật toán tối ƣu áp dụng cho việc tìm kiếm điểm cân bằng.

Tối ưu hóa là một trong những lĩnh vực kinh điển của toán học có ảnh hưởng đến hầu hết các lĩnh vực khoa học – công nghệ và kinh tế – xã hội. Trong thực tế, việc tìm giải pháp tối ưu cho một vấn đề nào đó chiếm một vai trò hết sức quan trọng. Phương án tối ưu là phương án hợp lý nhất, tốt nhất, tiết kiệm chi phí, tài nguyên, nguồn lực mà lại cho hiệu quả cao.

Vấn đề tìm kiếm điểm cân bằng truyền tin cho hê ̣ thống ma ̣ng Femtocell nêu ra ở chương II có thể được giải quyết bằng nhiều phương ph áp tối ưu, tương tự như viê ̣c giải bài toán tối ưu toàn cục. Có rất nhiều phương pháp giải quyết được vấn đề tìm điểm tối ưu (cực trị, điểm cân bằng,..) như phương pháp Lagrange, phương pháp tìm kiếm trực tiếp, phương pháp tối ưu hỗn độn, các phương pháp tối ưu phi tuyến : phương pháp Gradient, phương pháp Newton...

Phương pháp tối ưu phi tuyến phù hợp hơn để giải quyết vấn đề được nêu ra . Phần dưới đây của luâ ̣n văn trình bày lần lượt các phương pháp tối ưu được x em là khả thi cho bài toán tìm điểm cân bằng truyền tin cho hệ thống mạng Femtocell .

3.1. Phƣơng pháp nhân tử Lagrange.

Đây là một phương pháp khá hiệu quả trong việc giải các bài toán cực trị có ràng buộc cũng như tìm điều kiện xảy ra dấu bằng của bất đẳng thức.

Hàm Lagrange được thiết lập để tìm cực trị có điều kiện của hàm𝑧 = 𝑓 𝑥; 𝑦

với điều kiện là các biến 𝑥, 𝑦 phải thỏa mãn ràng buộc 𝜑 𝑥; 𝑦 = 0.

𝐿 𝑥; 𝑦𝜆 = 𝑓 𝑥; 𝑦 + 𝜆𝜑(𝑥; 𝑦) trong đó 𝜆 là một nhân tử hằng chưa xác định,

gọi là nhân tử Lagrange.

Điểm dừng của 𝐿 là nghiệm của hệ phương trình:

𝐿′𝑥 𝑥; 𝑦; 𝜆 = 0

𝐿′𝑦 𝑥; 𝑦; 𝜆 = 0

𝐿𝜆′ 𝑥; 𝑦; 𝜆 = 0

Cực trị của hàm số được xác định như sau: -Nếu 𝑑2𝐿 𝑥0; 𝑦0; 𝜆0 < 0 𝑧𝑚𝑎𝑥 = 𝑓(𝑥0; 𝑦0)

-Nếu 𝑑2𝐿 𝑥0; 𝑦0; 𝜆0 > 0 𝑧𝑚𝑖𝑛 = 𝑓(𝑥0; 𝑦0)

Việc dùng phương pháp này khi ràng buộc là các bất phương trình thì việc giải bài toán thường dẫn đến điều kiện Kehn-Tucker ( Điều kiện cần và đủ nếu hàm mục tiêu là hàm lõm), trong trường hợp này, cục bộ địa phương là hàm lõm.

3.2. Phƣơng pháp tìm kiếm trực tiếp.

Đây là phương pháp không sử dụng đạo hàm, thời gian tìm kiếm không nhanh nhưng thuận lợi trong thực tiễn khi một số hàm mục tiêu không tính được đạo hàm và cho phép thời gian tính toán dài.

3.3. Phƣơng pháp tối ƣu hỗn độn (Chaotic Optimization).

Tối ưu hỗn độn là phương pháp sử dụng ánh xạ các biến hỗn độn lên không gian biến tối ưu và tìm điểm tối ưu toàn cục bằng cách sử dụng tính chất ergodic của hàm mục tiêu.[7]

Thuật toán có ưu điểm là sử dụng được các chuyển động hỗn độn nhưng lại vấp phải nhược điểm là số bước lặp để tìm ra điểm tối ưu tương đối lớn, nên trong trong những ứng dụng cần tốc độ hội tụ nhanh thì không thể đáp ứng.

3.4. Phƣơng pháp tối ƣu phi tuyến

Cho các hàm số f, gj : Rn → R, j = 1, 2, ..., m. Bài toán tối ưu tổng quát có dạng chính tắc như sau: Max (Min) f(x)

với các ràng buộc (i) gj(x) ≤ 0, j = 1, 2, …, k,

(ii) gj(x) = 0, j = k+1, k+2, …, m.

Nếu hàm mục tiêu f(x) hoặc ít nhất một trong các hàm ràng buộc gj(x), j = 1, 2, …, m là phi tuyến thì chúng ta có bài toán tối ưu phi tuyến, hay còn gọi là bài toán quy hoạch phi tuyến (BTQHPT). Các dạng khác của bài toán tối ưu có thể đưa về dạng chính tắc trên đây theo những quy tắc nhất định. Với ký hiệu D ⊂ Rn là miền ràng buộc (hay miền các phương án khả thi) cho bởi các ràng buộc (i) và / hoặc (ii) thì BTQHPT có thể viết gọn hơn như sau: f(x) → Max (Min), với x ∈ D. Trong trường hợp D ≡ Rn , ta có BTQHPT không ràng buộc. Nếu trái lại, D là tập con thực sự của Rn thì có BTQHPT có ràng buộc.

Các phương pháp giải tích giải BTQHPT chia thành: phương pháp không sử dụng đạo hàm và phương pháp sử dụng đạo hàm. Trong mục này chúng ta sẽ nghiên cứu một số phương pháp sử dụng đạo hàm như phương pháp Gradient, phương pháp Newton và phương pháp hướng liên hợp.

3.4.1. Phƣơng pháp Gradient

Gradient search là phương pháp toán học nhằm giải quyết các vấn đề của hàm số có dạng: x∈Rminvf(x)

Nói cách khác, đây là phương pháp tìm cực tiểu của hàm số dựa vào Gradient của hàm tại điểm đang xét.

Như đã biết, để tìm điểm tối ưu hay cực trị của hàm một biến, ta chỉ cần tìm nghiệm thỏa mãn: 𝑓′ 𝑥 = 0

36 Nhưng vấn đề đặt ra đối với các hàm nhiều biến không hề đơn giản, khi việc đạo hàm trở nên khó khăn hơn, Gradient descent là thuật toán có thể giải quyết vấn đề này. Phương pháp được trình bày như sau:

Xét một hàm n biến: 𝑓(𝑥1, 𝑥2, 𝑥3, 𝑥4. . 𝑥𝑛)

Đầu tiên chúng ta phải tính toán gradient vector, đại lượng được xác định bởi đạo hàm riêng của các biến thành phần.

∇f = (∂f

∂x1,∂f

∂x2, ∂f

∂x3, … ∂f

∂xn)

Cực trị của hàm n biến trên được xác định tại điểm thỏa mãn ∇𝑓 𝑥∗ =0.

Do đó, ý tưởng của thuật toán được mô tả như sau: Xuất phát từ một điểm

x0thỏa mãn hàm số, xây dựng các điểm 𝑥1, 𝑥2, 𝑥3, 𝑥4. . 𝑥𝑛 sao cho f x0 ≥ f x1 ≥

f x2 … f(xn) . Các bước của thuật toán được thực hiện theo tuần tự sau:

1. Cho x0 ∈ Rn,ε > 0, 𝑘 = 0 , tính ∇f(x0)

2. Xét điều kiện ∇f(x) < 𝜀 , đúng: dừng lặp, sai: tiếp tục bước 3.

3. xk = xk−1 − d∇f(xk−1); với0 < 𝑑 < 1 là bước nhảy

4. k: = k + 1, quay lại bước 1.

Hình 3.1. Minh họa thuật toán Gradient search

Đây là một phương pháp sử dụng đạo hàm, với tốc độ tính toán nhanh và phù hợp với việc giải quyết vấn đề tìm điểm cần bằng trong tốc độ truyền tin đã nêu ở chương II của luận văn. Thuật toán Gradient được dử dụng với mong muốn tìm được điểm tối ưu với số bước lặp ít hơn so với các thuật toán tối ưu toàn cục khác.

3.4.2. Phƣơng pháp Newton

Đối với phương pháp Gradient search , quy tắc dịch chuyển cho bởi xk = xk−1−

d∇f(xk−1). Trong phương pháp Newton, ta cũng có quy tắc dịch chuyển tương tự với

điểm 𝑥𝑘 với điều kiện ma trận này khả nghịch. Giả sử rằng dãy {𝑥𝑘} hội tụ tới x với ∇f( x )

= 0 và 𝐻(𝑥 ) xác định dương, trong đó f(x) là hàm khả vi cấp hai. Lúc đó, với các điểm 𝑥𝑘

khá sát x , 𝐻(𝑥𝑘) cũng xác định dương nên là ma trận khả nghịch.

Sau đây, chúng ta giải thích ý nghĩa của quy tắc dịch chuyển: 𝑥𝑘+1 = 𝑥𝑘 −

𝐻(𝑥𝑘)−1× ∇𝑓 𝑥𝑘 trong phương pháp Newton. Đối với hàm khả vi cấp hai chúng ta có thể viết:

𝑓 𝑥 = 𝑓 𝑥𝑘 + ∇𝑓(𝑥𝑘)𝑇 𝑥 − 𝑥𝑘 +1

2 𝑥 − 𝑥𝑘 𝑇𝐻 𝑥𝑘 𝑥 − 𝑥𝑘 + | 𝑥 − 𝑥𝑘 |2 ∝ (𝑥𝑘, 𝑥 − 𝑥𝑘)

Trong đó, lim𝑥→𝑥𝑘 ∝ (𝑥𝑘, 𝑥 − 𝑥𝑘) = 0 . Bởi vậy, có thể xấp xỉ f(x) bởi:

𝑞 𝑥 = 𝑓 𝑥𝑘 + ∇𝑓 𝑥𝑘 𝑇 𝑥 − 𝑥𝑘 +1

2 𝑥 − 𝑥𝑘 𝑇𝐻 𝑥𝑘 (𝑥 − 𝑥𝑘) ≈ 𝑓(𝑥).

Ngoài ra, dễ thấy điều kiện cần để q(x) đạt giá trị cực tiểu là: ∇𝑞 𝑥 = 0 ⟺ ∇𝑓 𝑥𝑘 +

𝐻 𝑥𝑘 (𝑥 − 𝑥𝑘). Giả sử ma trận 𝐻(𝑥𝑘) khả nghịch thì điểm tiếp theo nên xem xét chính là

điểm 𝑥𝑘+1= 𝑥𝑘 − 𝐻(𝑥𝑘)−1 × ∇𝑓(𝑥𝑘).

Có thể chứng minh được phương pháp Newton hội tụ (khá nhanh) với điều kiện điểm

xuất phát 𝑥1 nằm sát gần x với ∇f( x ) = 0 và ma trận H( x ) là khả nghịch. Mă ̣c dù vâ ̣y, đây

là điều kiện khó đáp ứng và đòi hỏi phương pháp tính khá phức ta ̣p.

Hình 3.2. Minh họa phương pháp Newton.

Như vâ ̣y , qua các phương pháp tối ưu được trình bày , phương pháp Gradient search tỏ ra phù hợp với yêu cầu tối ưu hàm mu ̣c tiêu mà luâ ̣n văn đã nêu ra ở chương II: Tìm kiếm điểm cân bằng truyền tin cho hệ thống mạng Femtocell . Mục tiêu hướ ng tới là tìm được điểm cân bằng của hàm thu tin với tốc đô ̣ tính toán nhanh , giảm thiểu số bước lă ̣p. Với những ưu điểm của thuâ ̣t toán , luâ ̣n văn lựa cho ̣n sử du ̣ng Gradient search để áp du ̣ng cho bài toán tối ưu ma ̣ ng Femtocell. Kết quả mô phỏng , triển khai thuâ ̣t toán sẽ được trình bày cu ̣ thể trong chương IV của luâ ̣n văn.

Chƣơng IV:Mô phỏng và đánh giá việc áp thuâ ̣t toán Gradient Search tìm điểm cân bằng tốc đô ̣ truyền tin cho ma ̣ng Femtocell.

Như đã trình bày ở chương II, ta có ốc độ truyền tin của user thứ i:

Vi = log det ρiHiiQiHiiHRni−1 + INR theo (4)

Khi đó, tốc độ truyền tin tổng hợp cho cả một tế bào (giả thiết mỗi trạm gốc phục vụ một tế bào) là:

𝑉 = 𝑀𝑖=1𝑉𝑖 (7)

Do đó bài toán điều khiển công suất trong hệ thông tin vô tuyến nhận thức được phát biểu: trạm gốc và các thiết bị truy cập sẽ điều khiển công suất đến điểm cân bằng nhằm tối ưu tốc độ truyền tin của cả hệ thống.

Bài toán có thể biểu diễn theo ý nghĩa toán học một cách chặt chẽ như sau:

min 𝑓 = min 1 − 𝑉 = min(1 − 𝑀𝑖=1𝑉𝑖 ) (8)

với ràng buộc 𝑡𝑟(𝑄𝑖) ≤ 𝑃𝑡 với 𝑖 = 1,2, . . , 𝑀.

4.1. Công cụ mô phỏng.

Công cụ mô phỏng mà luận văn này sử dụng là phần mềm MATLAB với hàm fmincon được đề xuất sử dụng vì hàm này được xây dựng dựa trên phương pháp Gradient search và có thể làm việc với hàm mục tiêu và hàm ràng buộc liên tục cũng như có đạo hàm bậc nhất liên tục.

fmincon làm một hàm được định nghĩa trong MATLAB có chức năng tìm kiếm cực tiểu của một hàm vô hướng từ các biến khởi tạo ban đầu. Nó còn được gọi là tối ưu hóa toàn cục phi tuyến hay lập trình phi tuyến.

Cấu trúc hàm:

[x,fval,exitflag,output] = fmincon(fun,x0,A,b,Aeq,beq,lb,ub)

Với x, fval, exitflag, output là các giá trị trả về của hàm: -x : điểm cực tiểu của hàm số.

-fval : giá trị của hàm số tại điểm cực trị.

-exitflag : giá trị mô tả điều kiện thoát cho hàm fmincon.

-output : thông tin tối ưu ( số lần lặp, bước nhảy, thông tin về thuật toán...). fun là giá trị ứng với hàm số cần tính toán tìm cực tiểu.

x0,A,b,Aeq,beq,lb,ublà các giá trị ràng buộc : -x0 : là giá trị khởi tạo ban đầu của biến.

-𝐴𝑥 ≤ 𝑏 là bất đẳng thức ràng buộc đối với tập biến x.

-𝑙𝑏 ≤ 𝑥 ≤ 𝑢𝑏 là giới hạn trên và dưới của tập biến x.

Áp dụng mô hình lý thuyết trò chơi cho mạng Femtocell

Nội dung của Lý thuyết trò chơi

Dựa vào kết quả của trò chơi: