Áp dụng mô hình lý thuyết trò chơi cho mạng Femtocell

Một phần của tài liệu Tìm điểm cân bằng truyền tin trong mạng femtocell sử dụng thuật toán gradient search (Trang 34)

Hình 2.7 minh họa một mô hình mạng Femtocell gồm K Femtocell Access Point (FAP) và M người dùng sử dụng Mobile System (MS). Số anten trên mỗi FAP là NT và trên MS là NR .

Hình 2.7. Mô hình mạng Femtocell.

Giả sử tất cả MS gửi Data lên đường Uplink cùng lúc và các FAP truyền Data trên Downlink tại cùng thời điểm, do đó tồn tại M trạm thu phát mọi lúc trong mô hình mạng. Khi đó, Tỉ lệ tín hiệu nhận được trên ồn của trạm thu có thể tính được :

32

yi = ρiHiixi + ηij

M

j=1,j≠1

Hijxj+ ni (1)

Với xi và xj là các vector truyền kích thước NT với i và j tương ứng, ρi là tỉ lệ tín hiệu nhận được trên tạp âm (SNR) và ηij là tỉ lệ nhiễu nhận được trên tạp âm (INR). Hii là ma trận kênh kích thước NR.NT trong trường hợp truyền i và nhận i, Hij

là ma trận kênh kích thước NR.NT trong trường hợp truyền j và nhận i.

Để đảm bảo giảm nhiễu của người dùng thứ cấp lên người dùng sơ cấp, mạng vô tuyến nhận thức phải thỏa mãn điều kiện giới hạn công suất :tr Qi ≤ Ptvới

Qi = E xixiH là ma trận phương sai của vector xi.

Theo [7] ma trận phương sai của nhiễu và tạp âm trong trường hợp nhận i:

Rni = ηjHjQj

M

j=1,j≠i

HjH + INR (2)

Ma trận phương sai của tín hiệu trong trường hợp nhận i:

Ryi = ρiHiiQiHiiH + Rni (3)

Tốc độ truyền tin của user thứ i có thể tính được :

Vi = log det ρiHiiQiHiiHRni−1+ INR 4

Yêu cầu đă ̣t ra là chứng minh s ự tồn tại của điểm cân bằng trong tốc độ truyền tin dựa trên quan điểm của lý thuyết trò chơi và phương pháp để tìm ra nó.

Như đã trình bày ở phần trên, một mô hình lý thuyết trò chơi được đặc trưng bởi ba thành phần cơ bản: Tập người chơi, tập chiến lược và tập các hàm trả giá. Mô hình này có thể được định nghĩa bởi một hàm toán học G =< 𝐿, Si , Ui > [7]

Trong đó L là tập người chơi, Si là tập các chiến thuật mà người chơi sử dụng và Ui tập hàm trả giá quyết định kết quả sau mỗi nước đi mà người chơi thực hiện.

Áp dụng mô hình Lý thuyết trò chơi vào và vấn đề điều khiển công suất cho mạng Femtocell nhận thức: L tương ứng với tập các user, Si là chiến thuật phát của các user, khi mà các user đều cố gắng làm tối đa hóa lợi ích của nó bằng công suất phát mà không cần cân nhắc đến các user trong toàn mạng. Nói cách khác, đây là mô hình của một trò chơi bất hợp tác [7], và tập Ui sẽ xác định tốc độ truyền tin toàn cục mà các user nhận được và được tính bằng công thức:

33

U Si = log det ρiHiiQiHiiHRn−1i + INR (5)

Công suất phát Pivà ma trận phương sai Qi đều phụ thuộc vào vector truyền, vì vậy chúng có mối quan hệ mật thiết với nhau. Qi tác động trực tiếp đến tốc độ truyền tin của các user trong cùng một thời điểm. Như vậy, các user sẽ điều chỉnh công suất của chúng theo các chiến thuật riêng nhằm cải thiện lợi ích của mình, điều này sẽ gây nhiễu cho các user khác [1] . Để đáp lại, các user khác cũng áp dụng những chiến thuật để thay đổi công suất phát của chúng nhằm đảm bảo tốc độ truyền tin, tiến trình này sẽ tiếp diễn cho đến khi tất cả các user đều đạt được lợi ích tối đa của chúng. Đó là thời điểm một cuộc chơi đạt trạng thái cân bằng, gọi là điểm cân bằng Nash- Điểm cân bằng tổng hợp cho tất cả các user. Khi đạt đến cân bằng Nash, tất cả user sẽ không đưa ra bất kỳ thay đổi về công suất phát nữa. Điều kiện này được mô tả bởi công thức:

U(S∗) ≥ U(Si, S−i)

Với Silà chiến lược của người chơi thứ i, S−i là chiến lược của tất cả các user khác nhằm ngăn chặn i. Nếu tồn tại một tập S∗ thỏa mãn công thức trên trong quá trinh chơi, trò chơi sẽ đạt được điểm cân bằng Nash.

Ta có thể chứng minh sự tồn tại của điểm cân bằng Nash bằng cách chứng minh hàm G =< 𝐿, Si , Ui > thỏa mãn hai điều kiện:

- Tập {Si} khác rỗng và là hàm lồi trong không gian Euclid. - Tập Ui liên tục trên {Si} và là hàm gần như lõm.

Như vâ ̣y, với viê ̣c áp du ̣ng lý thuyết trò chơi vào ma ̣ng Femtocell giúp ta chứng minh đươ ̣c sự tồn ta ̣i của điểm cân bằng của tốc đô ̣ truyền tin hay điểm cân bằng Nash, khi tốc độ truyền tin của tất cả người dùng đa ̣t cực đa ̣i . Vấn đề này được giải quyết bằng viê ̣c điều chỉnh công suất truyền để từng user có thể tối đa hóa lơi thế của mình trong cuộc chơi, qua đó tối đa hóa hiê ̣u năng cho toàn hê ̣ thống.

Trong mô hình trò chơi này , hàm trả giá được xác định bởi tốc độ thu tin của trạm gốc theo công thức[11]:

U S = log det ρiHiiQiHiiHR−1ni + INR (6)

M

i=1

Việc tìm điểm cân bằng cho mô hình trò chơi trên có thể thực hiê ̣n bởi các thuâ ̣t toán tìm kiếm. Phần sau của luâ ̣n văn sẽ trình bày mô ̣t số thuâ ̣t toán : Tối ưu hỗn đô ̣n, Gradient search có tính khả thi trong viê ̣c tìm kiếm điểm cân bằng này.

34

Chƣơng III: Các thuật toán tối ƣu áp dụng cho việc tìm kiếm điểm cân bằng.

Tối ưu hóa là một trong những lĩnh vực kinh điển của toán học có ảnh hưởng đến hầu hết các lĩnh vực khoa học – công nghệ và kinh tế – xã hội. Trong thực tế, việc tìm giải pháp tối ưu cho một vấn đề nào đó chiếm một vai trò hết sức quan trọng. Phương án tối ưu là phương án hợp lý nhất, tốt nhất, tiết kiệm chi phí, tài nguyên, nguồn lực mà lại cho hiệu quả cao.

Vấn đề tìm kiếm điểm cân bằng truyền tin cho hê ̣ thống ma ̣ng Femtocell nêu ra ở chương II có thể được giải quyết bằng nhiều phương ph áp tối ưu, tương tự như viê ̣c giải bài toán tối ưu toàn cục. Có rất nhiều phương pháp giải quyết được vấn đề tìm điểm tối ưu (cực trị, điểm cân bằng,..) như phương pháp Lagrange, phương pháp tìm kiếm trực tiếp, phương pháp tối ưu hỗn độn, các phương pháp tối ưu phi tuyến : phương pháp Gradient, phương pháp Newton...

Phương pháp tối ưu phi tuyến phù hợp hơn để giải quyết vấn đề được nêu ra . Phần dưới đây của luâ ̣n văn trình bày lần lượt các phương pháp tối ưu được x em là khả thi cho bài toán tìm điểm cân bằng truyền tin cho hệ thống mạng Femtocell .

3.1. Phƣơng pháp nhân tử Lagrange.

Đây là một phương pháp khá hiệu quả trong việc giải các bài toán cực trị có ràng buộc cũng như tìm điều kiện xảy ra dấu bằng của bất đẳng thức.

Hàm Lagrange được thiết lập để tìm cực trị có điều kiện của hàm𝑧 = 𝑓 𝑥; 𝑦

với điều kiện là các biến 𝑥, 𝑦 phải thỏa mãn ràng buộc 𝜑 𝑥; 𝑦 = 0.

𝐿 𝑥; 𝑦𝜆 = 𝑓 𝑥; 𝑦 + 𝜆𝜑(𝑥; 𝑦) trong đó 𝜆 là một nhân tử hằng chưa xác định,

gọi là nhân tử Lagrange.

Điểm dừng của 𝐿 là nghiệm của hệ phương trình:

𝐿′𝑥 𝑥; 𝑦; 𝜆 = 0

𝐿′𝑦 𝑥; 𝑦; 𝜆 = 0

𝐿𝜆′ 𝑥; 𝑦; 𝜆 = 0

Cực trị của hàm số được xác định như sau: -Nếu 𝑑2𝐿 𝑥0; 𝑦0; 𝜆0 < 0 𝑧𝑚𝑎𝑥 = 𝑓(𝑥0; 𝑦0)

-Nếu 𝑑2𝐿 𝑥0; 𝑦0; 𝜆0 > 0 𝑧𝑚𝑖𝑛 = 𝑓(𝑥0; 𝑦0)

Việc dùng phương pháp này khi ràng buộc là các bất phương trình thì việc giải bài toán thường dẫn đến điều kiện Kehn-Tucker ( Điều kiện cần và đủ nếu hàm mục tiêu là hàm lõm), trong trường hợp này, cục bộ địa phương là hàm lõm.

35

3.2. Phƣơng pháp tìm kiếm trực tiếp.

Đây là phương pháp không sử dụng đạo hàm, thời gian tìm kiếm không nhanh nhưng thuận lợi trong thực tiễn khi một số hàm mục tiêu không tính được đạo hàm và cho phép thời gian tính toán dài.

3.3. Phƣơng pháp tối ƣu hỗn độn (Chaotic Optimization).

Tối ưu hỗn độn là phương pháp sử dụng ánh xạ các biến hỗn độn lên không gian biến tối ưu và tìm điểm tối ưu toàn cục bằng cách sử dụng tính chất ergodic của hàm mục tiêu.[7]

Thuật toán có ưu điểm là sử dụng được các chuyển động hỗn độn nhưng lại vấp phải nhược điểm là số bước lặp để tìm ra điểm tối ưu tương đối lớn, nên trong trong những ứng dụng cần tốc độ hội tụ nhanh thì không thể đáp ứng.

3.4. Phƣơng pháp tối ƣu phi tuyến

Cho các hàm số f, gj : Rn → R, j = 1, 2, ..., m. Bài toán tối ưu tổng quát có dạng chính tắc như sau: Max (Min) f(x)

với các ràng buộc (i) gj(x) ≤ 0, j = 1, 2, …, k,

(ii) gj(x) = 0, j = k+1, k+2, …, m.

Nếu hàm mục tiêu f(x) hoặc ít nhất một trong các hàm ràng buộc gj(x), j = 1, 2, …, m là phi tuyến thì chúng ta có bài toán tối ưu phi tuyến, hay còn gọi là bài toán quy hoạch phi tuyến (BTQHPT). Các dạng khác của bài toán tối ưu có thể đưa về dạng chính tắc trên đây theo những quy tắc nhất định. Với ký hiệu D ⊂ Rn là miền ràng buộc (hay miền các phương án khả thi) cho bởi các ràng buộc (i) và / hoặc (ii) thì BTQHPT có thể viết gọn hơn như sau: f(x) → Max (Min), với x ∈ D. Trong trường hợp D ≡ Rn , ta có BTQHPT không ràng buộc. Nếu trái lại, D là tập con thực sự của Rn thì có BTQHPT có ràng buộc.

Các phương pháp giải tích giải BTQHPT chia thành: phương pháp không sử dụng đạo hàm và phương pháp sử dụng đạo hàm. Trong mục này chúng ta sẽ nghiên cứu một số phương pháp sử dụng đạo hàm như phương pháp Gradient, phương pháp Newton và phương pháp hướng liên hợp.

3.4.1. Phƣơng pháp Gradient

Gradient search là phương pháp toán học nhằm giải quyết các vấn đề của hàm số có dạng: x∈Rminvf(x)

Nói cách khác, đây là phương pháp tìm cực tiểu của hàm số dựa vào Gradient của hàm tại điểm đang xét.

Như đã biết, để tìm điểm tối ưu hay cực trị của hàm một biến, ta chỉ cần tìm nghiệm thỏa mãn: 𝑓′ 𝑥 = 0

36 Nhưng vấn đề đặt ra đối với các hàm nhiều biến không hề đơn giản, khi việc đạo hàm trở nên khó khăn hơn, Gradient descent là thuật toán có thể giải quyết vấn đề này. Phương pháp được trình bày như sau:

Xét một hàm n biến: 𝑓(𝑥1, 𝑥2, 𝑥3, 𝑥4. . 𝑥𝑛)

Đầu tiên chúng ta phải tính toán gradient vector, đại lượng được xác định bởi đạo hàm riêng của các biến thành phần.

∇f = (∂f

∂x1,∂f

∂x2, ∂f

∂x3, … ∂f

∂xn)

Cực trị của hàm n biến trên được xác định tại điểm thỏa mãn ∇𝑓 𝑥∗ =0.

Do đó, ý tưởng của thuật toán được mô tả như sau: Xuất phát từ một điểm

x0thỏa mãn hàm số, xây dựng các điểm 𝑥1, 𝑥2, 𝑥3, 𝑥4. . 𝑥𝑛 sao cho f x0 ≥ f x1 ≥

f x2 … f(xn) . Các bước của thuật toán được thực hiện theo tuần tự sau:

1. Cho x0 ∈ Rn,ε > 0, 𝑘 = 0 , tính ∇f(x0)

2. Xét điều kiện ∇f(x) < 𝜀 , đúng: dừng lặp, sai: tiếp tục bước 3.

3. xk = xk−1 − d∇f(xk−1); với0 < 𝑑 < 1 là bước nhảy

4. k: = k + 1, quay lại bước 1.

Hình 3.1. Minh họa thuật toán Gradient search

Đây là một phương pháp sử dụng đạo hàm, với tốc độ tính toán nhanh và phù hợp với việc giải quyết vấn đề tìm điểm cần bằng trong tốc độ truyền tin đã nêu ở chương II của luận văn. Thuật toán Gradient được dử dụng với mong muốn tìm được điểm tối ưu với số bước lặp ít hơn so với các thuật toán tối ưu toàn cục khác.

3.4.2. Phƣơng pháp Newton

Đối với phương pháp Gradient search , quy tắc dịch chuyển cho bởi xk = xk−1−

d∇f(xk−1). Trong phương pháp Newton, ta cũng có quy tắc dịch chuyển tương tự với

37

điểm 𝑥𝑘 với điều kiện ma trận này khả nghịch. Giả sử rằng dãy {𝑥𝑘} hội tụ tới x với ∇f( x )

= 0 và 𝐻(𝑥 ) xác định dương, trong đó f(x) là hàm khả vi cấp hai. Lúc đó, với các điểm 𝑥𝑘

khá sát x , 𝐻(𝑥𝑘) cũng xác định dương nên là ma trận khả nghịch.

Sau đây, chúng ta giải thích ý nghĩa của quy tắc dịch chuyển: 𝑥𝑘+1 = 𝑥𝑘 −

𝐻(𝑥𝑘)−1× ∇𝑓 𝑥𝑘 trong phương pháp Newton. Đối với hàm khả vi cấp hai chúng ta có thể viết:

𝑓 𝑥 = 𝑓 𝑥𝑘 + ∇𝑓(𝑥𝑘)𝑇 𝑥 − 𝑥𝑘 +1

2 𝑥 − 𝑥𝑘 𝑇𝐻 𝑥𝑘 𝑥 − 𝑥𝑘 + | 𝑥 − 𝑥𝑘 |2 ∝ (𝑥𝑘, 𝑥 − 𝑥𝑘)

Trong đó, lim𝑥→𝑥𝑘 ∝ (𝑥𝑘, 𝑥 − 𝑥𝑘) = 0 . Bởi vậy, có thể xấp xỉ f(x) bởi:

𝑞 𝑥 = 𝑓 𝑥𝑘 + ∇𝑓 𝑥𝑘 𝑇 𝑥 − 𝑥𝑘 +1

2 𝑥 − 𝑥𝑘 𝑇𝐻 𝑥𝑘 (𝑥 − 𝑥𝑘) ≈ 𝑓(𝑥).

Ngoài ra, dễ thấy điều kiện cần để q(x) đạt giá trị cực tiểu là: ∇𝑞 𝑥 = 0 ⟺ ∇𝑓 𝑥𝑘 +

𝐻 𝑥𝑘 (𝑥 − 𝑥𝑘). Giả sử ma trận 𝐻(𝑥𝑘) khả nghịch thì điểm tiếp theo nên xem xét chính là

điểm 𝑥𝑘+1= 𝑥𝑘 − 𝐻(𝑥𝑘)−1 × ∇𝑓(𝑥𝑘).

Có thể chứng minh được phương pháp Newton hội tụ (khá nhanh) với điều kiện điểm

xuất phát 𝑥1 nằm sát gần x với ∇f( x ) = 0 và ma trận H( x ) là khả nghịch. Mă ̣c dù vâ ̣y, đây

là điều kiện khó đáp ứng và đòi hỏi phương pháp tính khá phức ta ̣p.

Hình 3.2. Minh họa phương pháp Newton.

Như vâ ̣y , qua các phương pháp tối ưu được trình bày , phương pháp Gradient search tỏ ra phù hợp với yêu cầu tối ưu hàm mu ̣c tiêu mà luâ ̣n văn đã nêu ra ở chương II: Tìm kiếm điểm cân bằng truyền tin cho hệ thống mạng Femtocell . Mục tiêu hướ ng tới là tìm được điểm cân bằng của hàm thu tin với tốc đô ̣ tính toán nhanh , giảm thiểu số bước lă ̣p. Với những ưu điểm của thuâ ̣t toán , luâ ̣n văn lựa cho ̣n sử du ̣ng Gradient search để áp du ̣ng cho bài toán tối ưu ma ̣ ng Femtocell. Kết quả mô phỏng , triển khai thuâ ̣t toán sẽ được trình bày cu ̣ thể trong chương IV của luâ ̣n văn.

38

Chƣơng IV:Mô phỏng và đánh giá việc áp thuâ ̣t toán Gradient Search tìm điểm cân bằng tốc đô ̣ truyền tin cho ma ̣ng Femtocell.

Như đã trình bày ở chương II, ta có ốc độ truyền tin của user thứ i:

Vi = log det ρiHiiQiHiiHRni−1 + INR theo (4)

Khi đó, tốc độ truyền tin tổng hợp cho cả một tế bào (giả thiết mỗi trạm gốc phục vụ một tế bào) là:

𝑉 = 𝑀𝑖=1𝑉𝑖 (7)

Do đó bài toán điều khiển công suất trong hệ thông tin vô tuyến nhận thức được phát biểu: trạm gốc và các thiết bị truy cập sẽ điều khiển công suất đến điểm cân bằng nhằm tối ưu tốc độ truyền tin của cả hệ thống.

Bài toán có thể biểu diễn theo ý nghĩa toán học một cách chặt chẽ như sau:

min 𝑓 = min 1 − 𝑉 = min(1 − 𝑀𝑖=1𝑉𝑖 ) (8)

với ràng buộc 𝑡𝑟(𝑄𝑖) ≤ 𝑃𝑡 với 𝑖 = 1,2, . . , 𝑀.

4.1. Công cụ mô phỏng.

Công cụ mô phỏng mà luận văn này sử dụng là phần mềm MATLAB với hàm fmincon được đề xuất sử dụng vì hàm này được xây dựng dựa trên phương pháp Gradient search và có thể làm việc với hàm mục tiêu và hàm ràng buộc liên tục cũng như có đạo hàm bậc nhất liên tục.

fmincon làm một hàm được định nghĩa trong MATLAB có chức năng tìm kiếm cực tiểu của một hàm vô hướng từ các biến khởi tạo ban đầu. Nó còn được gọi là tối ưu hóa toàn cục phi tuyến hay lập trình phi tuyến.

Cấu trúc hàm:

[x,fval,exitflag,output] = fmincon(fun,x0,A,b,Aeq,beq,lb,ub)

Với x, fval, exitflag, output là các giá trị trả về của hàm: -x : điểm cực tiểu của hàm số.

-fval : giá trị của hàm số tại điểm cực trị.

-exitflag : giá trị mô tả điều kiện thoát cho hàm fmincon.

-output : thông tin tối ưu ( số lần lặp, bước nhảy, thông tin về thuật toán...). fun là giá trị ứng với hàm số cần tính toán tìm cực tiểu.

39

x0,A,b,Aeq,beq,lb,ublà các giá trị ràng buộc : -x0 : là giá trị khởi tạo ban đầu của biến.

-𝐴𝑥 ≤ 𝑏 là bất đẳng thức ràng buộc đối với tập biến x.

-𝑙𝑏 ≤ 𝑥 ≤ 𝑢𝑏 là giới hạn trên và dưới của tập biến x.

Một phần của tài liệu Tìm điểm cân bằng truyền tin trong mạng femtocell sử dụng thuật toán gradient search (Trang 34)