29 Trong trò chơi tổng bằng không, với mọi tổ hợp của các chiến lược chơi, tổng điểm của tất cả các người chơi trong ván chơi luôn bằng 0. Nói một cách không chính thức, đấu thủ này hưởng lợi trên thiệt hại của các đấu thủ khác. Một ví dụ là trò Poker, trong đó người này thắng số điểm bằng đúng số điểm mà người kia thua. Các loại cờ cổ điển như cờ vây, cờ vua và cờ tướng cũng là các trò chơi tổng bằng không. Nhiều trò chơi mà các nhà lý thuyết trò chơi nghiên cứu, trong đó có song đề tù nhân nổi tiếng, là các trò chơi tổng khác không, do có một số kết cục có tổng kết quả lớn hơn hoặc nhỏ hơn không. Nói một cách không chính thức, trong các trò chơi tổng khác không, một thu hoạch của đấu thủ này không nhất thiết tương ứng với một thiệt hại của một đấu thủ khác. Có thể biến đổi một trò chơi bất lỳ thành một trò chơi tổng bằng không bằng cách bổ sung một đấu thủ "bù nhìn" sao cho các thiệt hại của đấu thủ này bù lại tổng thu hoạch của các đấu thủ khác.
Hình 2.5. Biểu diễn một trò chơi có tổng bằng không.
2.6.3. Dựa vào thông tin của ngƣời chơi:
Trò chơi thông tin hoàn hảo và Trò chơi có thông tin không hoàn hảo.
Hình 2.6. Biểu diễn một trò chơi không hoàn hảo.
Một trò chơi thông tin không hoàn hảo (đường nét đứt biểu thị việc thiếu thông tin của người chơi 2). Các trò chơi thông tin hoàn hảo (games of perfect information) lập thành một tập con quan trọng của các trò chơi tuần tự. Một trò chơi được gọi là có thông tin hoàn hảo nếu mọi đấu thủ biết tất cả các nước đi mà tất cả các đấu thủ khác đã thực hiện. Do vậy chỉ có các trò chơi tuần tự mới có thể là các trò chơi thông tin hoàn hảo. Hầu hết các trò chơi được nghiên cứu trong lý thuyết trò chơi là các trò
30 chơi thông tin không hoàn hảo, tuy một số trò chơi hay như cờ vây, cờ vua lại là trò chơi thông tin hoàn hảo. Tính chất thông tin hoàn hảo thường bị nhầm lẫn với khái niệm thông tin đầy đủ. Tính chất thông tin đầy đủ đòi hỏi rằng mỗi người chơi biết về các chiến lược và thành quả thu được của các người chơi khác, nhưng không nhất thiết biết về các hành động của họ.
2.7. Ứng dụng của Lý thuyết trò chơi. 2.7.1. Kinh tế kinh doanh 2.7.1. Kinh tế kinh doanh
Các nhà kinh tế học đã sử dụng lý thuyết trò chơi để phân tích một diện rộng các hiện tượng kinh tế, trong đó có đấu giá, mặc cả, duopoly và oligopoly, các tổ chức mạng lưới xã hội và các hệ thống bầu cử. Nghiên cứu này thường tập trung vào một tập cụ thể các chiến lược được biết với tên các trạng thái cân bằng trong trò chơi. Nổi tiếng nhất là cân bằng Nash của nhà toán học John Nash, người đã được giải thưởng Nobel cho công trình nghiên cứu của ông về lý thuyết trò chơi.
2.7.2. Sinh học.
Không giống như trong kinh tế, phần lợi cho những trò chơi trong sinh học thường được diễn dịch như là tương ứng với sự thích nghi. Thêm vào đó, chú ý đã ít hơn về các cân bằng có liên quan đến khái niệm của sự hợp lý, nhưng là thiên về những thứ có thể duy trì được bởi các lực tiến hóa. Cân bằng được biết đến nhiều nhất trong sinh học được biết đến như là chiến lược tiến hóa bền vững (viết tắt ESS cho Evolutionary Stable Strategy), là được giới thiệu lần đầu bởi John Maynard Smith (mô tả trong cuốn sách năm 1982 của ông). Mặc đu động lực ban đầu của nó không liên quan đến bất cứ yêu cầu về tinh thần nào của cân bằng Nash, mỗi ESS là một cân bằng Nash.
Trong sinh học, lý thuyết trò chơi đã được sử dụng để hiểu được nhiều hiện tượng khác nhau. Nó được sử dụng lần đầu để giải thích sự tiến hóa (và bền vững) của tỷ lệ giới tính khoảng 1:1.Ronald Fisher (1930) đề nghị rằng tỉ lệ giới tính 1:1 là kết quả của những lực tiến hóa tác động lên những cá nhân là những người có thể được xem như là cố gắng làm tối đa số cháu chắt của mình.
Thêm vào đó, những nhà sinh vật đã sử dụng lý thuyết trò chơi tiến hóa và ESS để giải thích sự nổi lên của liên lạc giữa muông thú (Maynard Smith & Harper, 2003). Sự phân tích của các trò chơi tín hiệu vàcác trò chơi liên lạc khác đã cung cấp một số trực giác vào trong sự tiến hóa của việc liên lạc giữa muôn thú.
Cuối cùng, các nhà sinh vật đã sử dụng trò chơi diều hâu-bồ câu (cũng được biết đến như là con gà) để phân tích những hành vi đánh nhau và tranh giành lãnh thổ.
31
2.7.3. Khoa học máy tính và Logic.
Lý thuyết trò chơi đã đóng một vai trò ngày càng quan trọng trong logic và trong khoa học máy tính. Một số lý thuyết logic có cơ sở trong ngữ nghĩa trò chơi. Thêm vào đó, những khoa học gia máy tính đã sử dụng trò chơi để mô phỏng những tính toán tương tác với nhau.
2.7.4. Chính trị học.
Các nghiên cứu trong khoa học chính trị cũng có sử dụng lý thuyết trò chơi. Một thuyết trò chơi giải thích cho lý thuyết dân chủ hòa bình rằng tính công khai và tranh luận cởi mở trong các nền dân chủ sẽ gửi một thông điệp rõ ràng và khả tín về các mục tiêu đến những chế độ khác. Ngược lại, khó mà biết được những chủ đích của của các lãnh đạo phi dân chủ (độc tài), rằng sẽ có sự nhượng bộ chung hiệu quả nào, và các lời hứa hẹn có được tôn trọng hay không. Do đó, sẽ tồn tại sự việc không tin tưởng và không mong muốn nhằm tạo ra sự nhượng bộ chung nếu ít nhất một trong các thành phần của sự bàn cãi này là thành phần phi dân chủ.
2.8. Áp dụng mô hình lý thuyết trò chơi cho mạng Femtocell.
Hình 2.7 minh họa một mô hình mạng Femtocell gồm K Femtocell Access Point (FAP) và M người dùng sử dụng Mobile System (MS). Số anten trên mỗi FAP là NT và trên MS là NR .
Hình 2.7. Mô hình mạng Femtocell.
Giả sử tất cả MS gửi Data lên đường Uplink cùng lúc và các FAP truyền Data trên Downlink tại cùng thời điểm, do đó tồn tại M trạm thu phát mọi lúc trong mô hình mạng. Khi đó, Tỉ lệ tín hiệu nhận được trên ồn của trạm thu có thể tính được :
32
yi = ρiHiixi + ηij
M
j=1,j≠1
Hijxj+ ni (1)
Với xi và xj là các vector truyền kích thước NT với i và j tương ứng, ρi là tỉ lệ tín hiệu nhận được trên tạp âm (SNR) và ηij là tỉ lệ nhiễu nhận được trên tạp âm (INR). Hii là ma trận kênh kích thước NR.NT trong trường hợp truyền i và nhận i, Hij
là ma trận kênh kích thước NR.NT trong trường hợp truyền j và nhận i.
Để đảm bảo giảm nhiễu của người dùng thứ cấp lên người dùng sơ cấp, mạng vô tuyến nhận thức phải thỏa mãn điều kiện giới hạn công suất :tr Qi ≤ Ptvới
Qi = E xixiH là ma trận phương sai của vector xi.
Theo [7] ma trận phương sai của nhiễu và tạp âm trong trường hợp nhận i:
Rni = ηjHjQj
M
j=1,j≠i
HjH + INR (2)
Ma trận phương sai của tín hiệu trong trường hợp nhận i:
Ryi = ρiHiiQiHiiH + Rni (3)
Tốc độ truyền tin của user thứ i có thể tính được :
Vi = log det ρiHiiQiHiiHRni−1+ INR 4
Yêu cầu đă ̣t ra là chứng minh s ự tồn tại của điểm cân bằng trong tốc độ truyền tin dựa trên quan điểm của lý thuyết trò chơi và phương pháp để tìm ra nó.
Như đã trình bày ở phần trên, một mô hình lý thuyết trò chơi được đặc trưng bởi ba thành phần cơ bản: Tập người chơi, tập chiến lược và tập các hàm trả giá. Mô hình này có thể được định nghĩa bởi một hàm toán học G =< 𝐿, Si , Ui > [7]
Trong đó L là tập người chơi, Si là tập các chiến thuật mà người chơi sử dụng và Ui tập hàm trả giá quyết định kết quả sau mỗi nước đi mà người chơi thực hiện.
Áp dụng mô hình Lý thuyết trò chơi vào và vấn đề điều khiển công suất cho mạng Femtocell nhận thức: L tương ứng với tập các user, Si là chiến thuật phát của các user, khi mà các user đều cố gắng làm tối đa hóa lợi ích của nó bằng công suất phát mà không cần cân nhắc đến các user trong toàn mạng. Nói cách khác, đây là mô hình của một trò chơi bất hợp tác [7], và tập Ui sẽ xác định tốc độ truyền tin toàn cục mà các user nhận được và được tính bằng công thức:
33
U Si = log det ρiHiiQiHiiHRn−1i + INR (5)
Công suất phát Pivà ma trận phương sai Qi đều phụ thuộc vào vector truyền, vì vậy chúng có mối quan hệ mật thiết với nhau. Qi tác động trực tiếp đến tốc độ truyền tin của các user trong cùng một thời điểm. Như vậy, các user sẽ điều chỉnh công suất của chúng theo các chiến thuật riêng nhằm cải thiện lợi ích của mình, điều này sẽ gây nhiễu cho các user khác [1] . Để đáp lại, các user khác cũng áp dụng những chiến thuật để thay đổi công suất phát của chúng nhằm đảm bảo tốc độ truyền tin, tiến trình này sẽ tiếp diễn cho đến khi tất cả các user đều đạt được lợi ích tối đa của chúng. Đó là thời điểm một cuộc chơi đạt trạng thái cân bằng, gọi là điểm cân bằng Nash- Điểm cân bằng tổng hợp cho tất cả các user. Khi đạt đến cân bằng Nash, tất cả user sẽ không đưa ra bất kỳ thay đổi về công suất phát nữa. Điều kiện này được mô tả bởi công thức:
U(S∗) ≥ U(Si, S−i)
Với Silà chiến lược của người chơi thứ i, S−i là chiến lược của tất cả các user khác nhằm ngăn chặn i. Nếu tồn tại một tập S∗ thỏa mãn công thức trên trong quá trinh chơi, trò chơi sẽ đạt được điểm cân bằng Nash.
Ta có thể chứng minh sự tồn tại của điểm cân bằng Nash bằng cách chứng minh hàm G =< 𝐿, Si , Ui > thỏa mãn hai điều kiện:
- Tập {Si} khác rỗng và là hàm lồi trong không gian Euclid. - Tập Ui liên tục trên {Si} và là hàm gần như lõm.
Như vâ ̣y, với viê ̣c áp du ̣ng lý thuyết trò chơi vào ma ̣ng Femtocell giúp ta chứng minh đươ ̣c sự tồn ta ̣i của điểm cân bằng của tốc đô ̣ truyền tin hay điểm cân bằng Nash, khi tốc độ truyền tin của tất cả người dùng đa ̣t cực đa ̣i . Vấn đề này được giải quyết bằng viê ̣c điều chỉnh công suất truyền để từng user có thể tối đa hóa lơi thế của mình trong cuộc chơi, qua đó tối đa hóa hiê ̣u năng cho toàn hê ̣ thống.
Trong mô hình trò chơi này , hàm trả giá được xác định bởi tốc độ thu tin của trạm gốc theo công thức[11]:
U S = log det ρiHiiQiHiiHR−1ni + INR (6)
M
i=1
Việc tìm điểm cân bằng cho mô hình trò chơi trên có thể thực hiê ̣n bởi các thuâ ̣t toán tìm kiếm. Phần sau của luâ ̣n văn sẽ trình bày mô ̣t số thuâ ̣t toán : Tối ưu hỗn đô ̣n, Gradient search có tính khả thi trong viê ̣c tìm kiếm điểm cân bằng này.
34
Chƣơng III: Các thuật toán tối ƣu áp dụng cho việc tìm kiếm điểm cân bằng.
Tối ưu hóa là một trong những lĩnh vực kinh điển của toán học có ảnh hưởng đến hầu hết các lĩnh vực khoa học – công nghệ và kinh tế – xã hội. Trong thực tế, việc tìm giải pháp tối ưu cho một vấn đề nào đó chiếm một vai trò hết sức quan trọng. Phương án tối ưu là phương án hợp lý nhất, tốt nhất, tiết kiệm chi phí, tài nguyên, nguồn lực mà lại cho hiệu quả cao.
Vấn đề tìm kiếm điểm cân bằng truyền tin cho hê ̣ thống ma ̣ng Femtocell nêu ra ở chương II có thể được giải quyết bằng nhiều phương ph áp tối ưu, tương tự như viê ̣c giải bài toán tối ưu toàn cục. Có rất nhiều phương pháp giải quyết được vấn đề tìm điểm tối ưu (cực trị, điểm cân bằng,..) như phương pháp Lagrange, phương pháp tìm kiếm trực tiếp, phương pháp tối ưu hỗn độn, các phương pháp tối ưu phi tuyến : phương pháp Gradient, phương pháp Newton...
Phương pháp tối ưu phi tuyến phù hợp hơn để giải quyết vấn đề được nêu ra . Phần dưới đây của luâ ̣n văn trình bày lần lượt các phương pháp tối ưu được x em là khả thi cho bài toán tìm điểm cân bằng truyền tin cho hệ thống mạng Femtocell .
3.1. Phƣơng pháp nhân tử Lagrange.
Đây là một phương pháp khá hiệu quả trong việc giải các bài toán cực trị có ràng buộc cũng như tìm điều kiện xảy ra dấu bằng của bất đẳng thức.
Hàm Lagrange được thiết lập để tìm cực trị có điều kiện của hàm𝑧 = 𝑓 𝑥; 𝑦
với điều kiện là các biến 𝑥, 𝑦 phải thỏa mãn ràng buộc 𝜑 𝑥; 𝑦 = 0.
𝐿 𝑥; 𝑦𝜆 = 𝑓 𝑥; 𝑦 + 𝜆𝜑(𝑥; 𝑦) trong đó 𝜆 là một nhân tử hằng chưa xác định,
gọi là nhân tử Lagrange.
Điểm dừng của 𝐿 là nghiệm của hệ phương trình:
𝐿′𝑥 𝑥; 𝑦; 𝜆 = 0
𝐿′𝑦 𝑥; 𝑦; 𝜆 = 0
𝐿𝜆′ 𝑥; 𝑦; 𝜆 = 0
Cực trị của hàm số được xác định như sau: -Nếu 𝑑2𝐿 𝑥0; 𝑦0; 𝜆0 < 0 𝑧𝑚𝑎𝑥 = 𝑓(𝑥0; 𝑦0)
-Nếu 𝑑2𝐿 𝑥0; 𝑦0; 𝜆0 > 0 𝑧𝑚𝑖𝑛 = 𝑓(𝑥0; 𝑦0)
Việc dùng phương pháp này khi ràng buộc là các bất phương trình thì việc giải bài toán thường dẫn đến điều kiện Kehn-Tucker ( Điều kiện cần và đủ nếu hàm mục tiêu là hàm lõm), trong trường hợp này, cục bộ địa phương là hàm lõm.
35
3.2. Phƣơng pháp tìm kiếm trực tiếp.
Đây là phương pháp không sử dụng đạo hàm, thời gian tìm kiếm không nhanh nhưng thuận lợi trong thực tiễn khi một số hàm mục tiêu không tính được đạo hàm và cho phép thời gian tính toán dài.
3.3. Phƣơng pháp tối ƣu hỗn độn (Chaotic Optimization).
Tối ưu hỗn độn là phương pháp sử dụng ánh xạ các biến hỗn độn lên không gian biến tối ưu và tìm điểm tối ưu toàn cục bằng cách sử dụng tính chất ergodic của hàm mục tiêu.[7]
Thuật toán có ưu điểm là sử dụng được các chuyển động hỗn độn nhưng lại vấp phải nhược điểm là số bước lặp để tìm ra điểm tối ưu tương đối lớn, nên trong trong những ứng dụng cần tốc độ hội tụ nhanh thì không thể đáp ứng.
3.4. Phƣơng pháp tối ƣu phi tuyến
Cho các hàm số f, gj : Rn → R, j = 1, 2, ..., m. Bài toán tối ưu tổng quát có dạng chính tắc như sau: Max (Min) f(x)
với các ràng buộc (i) gj(x) ≤ 0, j = 1, 2, …, k,
(ii) gj(x) = 0, j = k+1, k+2, …, m.
Nếu hàm mục tiêu f(x) hoặc ít nhất một trong các hàm ràng buộc gj(x), j = 1, 2, …, m là phi tuyến thì chúng ta có bài toán tối ưu phi tuyến, hay còn gọi là bài toán quy hoạch phi tuyến (BTQHPT). Các dạng khác của bài toán tối ưu có thể đưa về dạng chính tắc trên đây theo những quy tắc nhất định. Với ký hiệu D ⊂ Rn là miền ràng buộc (hay miền các phương án khả thi) cho bởi các ràng buộc (i) và / hoặc (ii) thì BTQHPT có thể viết gọn hơn như sau: f(x) → Max (Min), với x ∈ D. Trong trường hợp D ≡ Rn , ta có BTQHPT không ràng buộc. Nếu trái lại, D là tập con thực sự của Rn thì có BTQHPT có ràng buộc.
Các phương pháp giải tích giải BTQHPT chia thành: phương pháp không sử dụng đạo hàm và phương pháp sử dụng đạo hàm. Trong mục này chúng ta sẽ nghiên cứu một số phương pháp sử dụng đạo hàm như phương pháp Gradient, phương pháp Newton và phương pháp hướng liên hợp.
3.4.1. Phƣơng pháp Gradient
Gradient search là phương pháp toán học nhằm giải quyết các vấn đề của hàm số có dạng: x∈Rminvf(x)
Nói cách khác, đây là phương pháp tìm cực tiểu của hàm số dựa vào Gradient