Dựa vào kết quả của trò chơi:

29 Trong trò chơi tổng bằng không, với mọi tổ hợp của các chiến lược chơi, tổng điểm của tất cả các người chơi trong ván chơi luôn bằng 0. Nói một cách không chính thức, đấu thủ này hưởng lợi trên thiệt hại của các đấu thủ khác. Một ví dụ là trò Poker, trong đó người này thắng số điểm bằng đúng số điểm mà người kia thua. Các loại cờ cổ điển như cờ vây, cờ vua và cờ tướng cũng là các trò chơi tổng bằng không. Nhiều trò chơi mà các nhà lý thuyết trò chơi nghiên cứu, trong đó có song đề tù nhân nổi tiếng, là các trò chơi tổng khác không, do có một số kết cục có tổng kết quả lớn hơn hoặc nhỏ hơn không. Nói một cách không chính thức, trong các trò chơi tổng khác không, một thu hoạch của đấu thủ này không nhất thiết tương ứng với một thiệt hại của một đấu thủ khác. Có thể biến đổi một trò chơi bất lỳ thành một trò chơi tổng bằng không bằng cách bổ sung một đấu thủ "bù nhìn" sao cho các thiệt hại của đấu thủ này bù lại tổng thu hoạch của các đấu thủ khác.

Hình 2.5. Biểu diễn một trò chơi có tổng bằng không.

2.6.3. Dựa vào thông tin của ngƣời chơi:

Trò chơi thông tin hoàn hảo và Trò chơi có thông tin không hoàn hảo.

Hình 2.6. Biểu diễn một trò chơi không hoàn hảo.

Một trò chơi thông tin không hoàn hảo (đường nét đứt biểu thị việc thiếu thông tin của người chơi 2). Các trò chơi thông tin hoàn hảo (games of perfect information) lập thành một tập con quan trọng của các trò chơi tuần tự. Một trò chơi được gọi là có thông tin hoàn hảo nếu mọi đấu thủ biết tất cả các nước đi mà tất cả các đấu thủ khác đã thực hiện. Do vậy chỉ có các trò chơi tuần tự mới có thể là các trò chơi thông tin hoàn hảo. Hầu hết các trò chơi được nghiên cứu trong lý thuyết trò chơi là các trò

30 chơi thông tin không hoàn hảo, tuy một số trò chơi hay như cờ vây, cờ vua lại là trò chơi thông tin hoàn hảo. Tính chất thông tin hoàn hảo thường bị nhầm lẫn với khái niệm thông tin đầy đủ. Tính chất thông tin đầy đủ đòi hỏi rằng mỗi người chơi biết về các chiến lược và thành quả thu được của các người chơi khác, nhưng không nhất thiết biết về các hành động của họ.

2.7. Ứng dụng của Lý thuyết trò chơi. 2.7.1. Kinh tế kinh doanh 2.7.1. Kinh tế kinh doanh

Các nhà kinh tế học đã sử dụng lý thuyết trò chơi để phân tích một diện rộng các hiện tượng kinh tế, trong đó có đấu giá, mặc cả, duopoly và oligopoly, các tổ chức mạng lưới xã hội và các hệ thống bầu cử. Nghiên cứu này thường tập trung vào một tập cụ thể các chiến lược được biết với tên các trạng thái cân bằng trong trò chơi. Nổi tiếng nhất là cân bằng Nash của nhà toán học John Nash, người đã được giải thưởng Nobel cho công trình nghiên cứu của ông về lý thuyết trò chơi.

2.7.2. Sinh học.

Không giống như trong kinh tế, phần lợi cho những trò chơi trong sinh học thường được diễn dịch như là tương ứng với sự thích nghi. Thêm vào đó, chú ý đã ít hơn về các cân bằng có liên quan đến khái niệm của sự hợp lý, nhưng là thiên về những thứ có thể duy trì được bởi các lực tiến hóa. Cân bằng được biết đến nhiều nhất trong sinh học được biết đến như là chiến lược tiến hóa bền vững (viết tắt ESS cho Evolutionary Stable Strategy), là được giới thiệu lần đầu bởi John Maynard Smith (mô tả trong cuốn sách năm 1982 của ông). Mặc đu động lực ban đầu của nó không liên quan đến bất cứ yêu cầu về tinh thần nào của cân bằng Nash, mỗi ESS là một cân bằng Nash.

Trong sinh học, lý thuyết trò chơi đã được sử dụng để hiểu được nhiều hiện tượng khác nhau. Nó được sử dụng lần đầu để giải thích sự tiến hóa (và bền vững) của tỷ lệ giới tính khoảng 1:1.Ronald Fisher (1930) đề nghị rằng tỉ lệ giới tính 1:1 là kết quả của những lực tiến hóa tác động lên những cá nhân là những người có thể được xem như là cố gắng làm tối đa số cháu chắt của mình.

Thêm vào đó, những nhà sinh vật đã sử dụng lý thuyết trò chơi tiến hóa và ESS để giải thích sự nổi lên của liên lạc giữa muông thú (Maynard Smith & Harper, 2003). Sự phân tích của các trò chơi tín hiệu vàcác trò chơi liên lạc khác đã cung cấp một số trực giác vào trong sự tiến hóa của việc liên lạc giữa muôn thú.

Cuối cùng, các nhà sinh vật đã sử dụng trò chơi diều hâu-bồ câu (cũng được biết đến như là con gà) để phân tích những hành vi đánh nhau và tranh giành lãnh thổ.

2.7.3. Khoa học máy tính và Logic.

Lý thuyết trò chơi đã đóng một vai trò ngày càng quan trọng trong logic và trong khoa học máy tính. Một số lý thuyết logic có cơ sở trong ngữ nghĩa trò chơi. Thêm vào đó, những khoa học gia máy tính đã sử dụng trò chơi để mô phỏng những tính toán tương tác với nhau.

2.7.4. Chính trị học.

Các nghiên cứu trong khoa học chính trị cũng có sử dụng lý thuyết trò chơi. Một thuyết trò chơi giải thích cho lý thuyết dân chủ hòa bình rằng tính công khai và tranh luận cởi mở trong các nền dân chủ sẽ gửi một thông điệp rõ ràng và khả tín về các mục tiêu đến những chế độ khác. Ngược lại, khó mà biết được những chủ đích của của các lãnh đạo phi dân chủ (độc tài), rằng sẽ có sự nhượng bộ chung hiệu quả nào, và các lời hứa hẹn có được tôn trọng hay không. Do đó, sẽ tồn tại sự việc không tin tưởng và không mong muốn nhằm tạo ra sự nhượng bộ chung nếu ít nhất một trong các thành phần của sự bàn cãi này là thành phần phi dân chủ.

2.8. Áp dụng mô hình lý thuyết trò chơi cho mạng Femtocell.

Hình 2.7 minh họa một mô hình mạng Femtocell gồm K Femtocell Access Point (FAP) và M người dùng sử dụng Mobile System (MS). Số anten trên mỗi FAP là NT và trên MS là NR .

Hình 2.7. Mô hình mạng Femtocell.

Giả sử tất cả MS gửi Data lên đường Uplink cùng lúc và các FAP truyền Data trên Downlink tại cùng thời điểm, do đó tồn tại M trạm thu phát mọi lúc trong mô hình mạng. Khi đó, Tỉ lệ tín hiệu nhận được trên ồn của trạm thu có thể tính được :

yi = ρiHiixi + ηij

j=1,j≠1

Hijxj+ ni (1)

Với xi và xj là các vector truyền kích thước NT với i và j tương ứng, ρi là tỉ lệ tín hiệu nhận được trên tạp âm (SNR) và ηij là tỉ lệ nhiễu nhận được trên tạp âm (INR). Hii là ma trận kênh kích thước NR.NT trong trường hợp truyền i và nhận i, Hij

là ma trận kênh kích thước NR.NT trong trường hợp truyền j và nhận i.

Để đảm bảo giảm nhiễu của người dùng thứ cấp lên người dùng sơ cấp, mạng vô tuyến nhận thức phải thỏa mãn điều kiện giới hạn công suất :tr Qi ≤ Ptvới

Qi = E xixiH là ma trận phương sai của vector xi.

Theo [7] ma trận phương sai của nhiễu và tạp âm trong trường hợp nhận i:

Rni = ηjHjQj

j=1,j≠i

HjH + INR (2)

Ma trận phương sai của tín hiệu trong trường hợp nhận i:

Ryi = ρiHiiQiHiiH + Rni (3)

Tốc độ truyền tin của user thứ i có thể tính được :

Vi = log det ρiHiiQiHiiHRni−1+ INR 4

Yêu cầu đă ̣t ra là chứng minh s ự tồn tại của điểm cân bằng trong tốc độ truyền tin dựa trên quan điểm của lý thuyết trò chơi và phương pháp để tìm ra nó.

Như đã trình bày ở phần trên, một mô hình lý thuyết trò chơi được đặc trưng bởi ba thành phần cơ bản: Tập người chơi, tập chiến lược và tập các hàm trả giá. Mô hình này có thể được định nghĩa bởi một hàm toán học G =< 𝐿, Si , Ui > [7]

Trong đó L là tập người chơi, Si là tập các chiến thuật mà người chơi sử dụng và Ui tập hàm trả giá quyết định kết quả sau mỗi nước đi mà người chơi thực hiện.

Áp dụng mô hình Lý thuyết trò chơi vào và vấn đề điều khiển công suất cho mạng Femtocell nhận thức: L tương ứng với tập các user, Si là chiến thuật phát của các user, khi mà các user đều cố gắng làm tối đa hóa lợi ích của nó bằng công suất phát mà không cần cân nhắc đến các user trong toàn mạng. Nói cách khác, đây là mô hình của một trò chơi bất hợp tác [7], và tập Ui sẽ xác định tốc độ truyền tin toàn cục mà các user nhận được và được tính bằng công thức:

U Si = log det ρiHiiQiHiiHRn−1i + INR (5)

Công suất phát Pivà ma trận phương sai Qi đều phụ thuộc vào vector truyền, vì vậy chúng có mối quan hệ mật thiết với nhau. Qi tác động trực tiếp đến tốc độ truyền tin của các user trong cùng một thời điểm. Như vậy, các user sẽ điều chỉnh công suất của chúng theo các chiến thuật riêng nhằm cải thiện lợi ích của mình, điều này sẽ gây nhiễu cho các user khác [1] . Để đáp lại, các user khác cũng áp dụng những chiến thuật để thay đổi công suất phát của chúng nhằm đảm bảo tốc độ truyền tin, tiến trình này sẽ tiếp diễn cho đến khi tất cả các user đều đạt được lợi ích tối đa của chúng. Đó là thời điểm một cuộc chơi đạt trạng thái cân bằng, gọi là điểm cân bằng Nash- Điểm cân bằng tổng hợp cho tất cả các user. Khi đạt đến cân bằng Nash, tất cả user sẽ không đưa ra bất kỳ thay đổi về công suất phát nữa. Điều kiện này được mô tả bởi công thức:

U(S∗) ≥ U(Si, S−i)

Với Silà chiến lược của người chơi thứ i, S−i là chiến lược của tất cả các user khác nhằm ngăn chặn i. Nếu tồn tại một tập S∗ thỏa mãn công thức trên trong quá trinh chơi, trò chơi sẽ đạt được điểm cân bằng Nash.

Ta có thể chứng minh sự tồn tại của điểm cân bằng Nash bằng cách chứng minh hàm G =< 𝐿, Si , Ui > thỏa mãn hai điều kiện:

- Tập {Si} khác rỗng và là hàm lồi trong không gian Euclid. - Tập Ui liên tục trên {Si} và là hàm gần như lõm.

Như vâ ̣y, với viê ̣c áp du ̣ng lý thuyết trò chơi vào ma ̣ng Femtocell giúp ta chứng minh đươ ̣c sự tồn ta ̣i của điểm cân bằng của tốc đô ̣ truyền tin hay điểm cân bằng Nash, khi tốc độ truyền tin của tất cả người dùng đa ̣t cực đa ̣i . Vấn đề này được giải quyết bằng viê ̣c điều chỉnh công suất truyền để từng user có thể tối đa hóa lơi thế của mình trong cuộc chơi, qua đó tối đa hóa hiê ̣u năng cho toàn hê ̣ thống.

Trong mô hình trò chơi này , hàm trả giá được xác định bởi tốc độ thu tin của trạm gốc theo công thức[11]:

U S = log det ρiHiiQiHiiHR−1ni + INR (6)

i=1

Việc tìm điểm cân bằng cho mô hình trò chơi trên có thể thực hiê ̣n bởi các thuâ ̣t toán tìm kiếm. Phần sau của luâ ̣n văn sẽ trình bày mô ̣t số thuâ ̣t toán : Tối ưu hỗn đô ̣n, Gradient search có tính khả thi trong viê ̣c tìm kiếm điểm cân bằng này.

Chƣơng III: Các thuật toán tối ƣu áp dụng cho việc tìm kiếm điểm cân bằng.

Tối ưu hóa là một trong những lĩnh vực kinh điển của toán học có ảnh hưởng đến hầu hết các lĩnh vực khoa học – công nghệ và kinh tế – xã hội. Trong thực tế, việc tìm giải pháp tối ưu cho một vấn đề nào đó chiếm một vai trò hết sức quan trọng. Phương án tối ưu là phương án hợp lý nhất, tốt nhất, tiết kiệm chi phí, tài nguyên, nguồn lực mà lại cho hiệu quả cao.

Vấn đề tìm kiếm điểm cân bằng truyền tin cho hê ̣ thống ma ̣ng Femtocell nêu ra ở chương II có thể được giải quyết bằng nhiều phương ph áp tối ưu, tương tự như viê ̣c giải bài toán tối ưu toàn cục. Có rất nhiều phương pháp giải quyết được vấn đề tìm điểm tối ưu (cực trị, điểm cân bằng,..) như phương pháp Lagrange, phương pháp tìm kiếm trực tiếp, phương pháp tối ưu hỗn độn, các phương pháp tối ưu phi tuyến : phương pháp Gradient, phương pháp Newton...

Phương pháp tối ưu phi tuyến phù hợp hơn để giải quyết vấn đề được nêu ra . Phần dưới đây của luâ ̣n văn trình bày lần lượt các phương pháp tối ưu được x em là khả thi cho bài toán tìm điểm cân bằng truyền tin cho hệ thống mạng Femtocell .

3.1. Phƣơng pháp nhân tử Lagrange.

Đây là một phương pháp khá hiệu quả trong việc giải các bài toán cực trị có ràng buộc cũng như tìm điều kiện xảy ra dấu bằng của bất đẳng thức.

Hàm Lagrange được thiết lập để tìm cực trị có điều kiện của hàm𝑧 = 𝑓 𝑥; 𝑦

với điều kiện là các biến 𝑥, 𝑦 phải thỏa mãn ràng buộc 𝜑 𝑥; 𝑦 = 0.

𝐿 𝑥; 𝑦𝜆 = 𝑓 𝑥; 𝑦 + 𝜆𝜑(𝑥; 𝑦) trong đó 𝜆 là một nhân tử hằng chưa xác định,

gọi là nhân tử Lagrange.

Điểm dừng của 𝐿 là nghiệm của hệ phương trình:

𝐿′𝑥 𝑥; 𝑦; 𝜆 = 0

𝐿′𝑦 𝑥; 𝑦; 𝜆 = 0

𝐿𝜆′ 𝑥; 𝑦; 𝜆 = 0

Cực trị của hàm số được xác định như sau: -Nếu 𝑑2𝐿 𝑥0; 𝑦0; 𝜆0 < 0 𝑧𝑚𝑎𝑥 = 𝑓(𝑥0; 𝑦0)

-Nếu 𝑑2𝐿 𝑥0; 𝑦0; 𝜆0 > 0 𝑧𝑚𝑖𝑛 = 𝑓(𝑥0; 𝑦0)

Việc dùng phương pháp này khi ràng buộc là các bất phương trình thì việc giải bài toán thường dẫn đến điều kiện Kehn-Tucker ( Điều kiện cần và đủ nếu hàm mục tiêu là hàm lõm), trong trường hợp này, cục bộ địa phương là hàm lõm.

3.2. Phƣơng pháp tìm kiếm trực tiếp.

Đây là phương pháp không sử dụng đạo hàm, thời gian tìm kiếm không nhanh nhưng thuận lợi trong thực tiễn khi một số hàm mục tiêu không tính được đạo hàm và cho phép thời gian tính toán dài.

3.3. Phƣơng pháp tối ƣu hỗn độn (Chaotic Optimization).

Tối ưu hỗn độn là phương pháp sử dụng ánh xạ các biến hỗn độn lên không gian biến tối ưu và tìm điểm tối ưu toàn cục bằng cách sử dụng tính chất ergodic của hàm mục tiêu.[7]

Thuật toán có ưu điểm là sử dụng được các chuyển động hỗn độn nhưng lại vấp phải nhược điểm là số bước lặp để tìm ra điểm tối ưu tương đối lớn, nên trong trong những ứng dụng cần tốc độ hội tụ nhanh thì không thể đáp ứng.

3.4. Phƣơng pháp tối ƣu phi tuyến

Cho các hàm số f, gj : Rn → R, j = 1, 2, ..., m. Bài toán tối ưu tổng quát có dạng chính tắc như sau: Max (Min) f(x)

với các ràng buộc (i) gj(x) ≤ 0, j = 1, 2, …, k,

(ii) gj(x) = 0, j = k+1, k+2, …, m.

Nếu hàm mục tiêu f(x) hoặc ít nhất một trong các hàm ràng buộc gj(x), j = 1, 2, …, m là phi tuyến thì chúng ta có bài toán tối ưu phi tuyến, hay còn gọi là bài toán quy hoạch phi tuyến (BTQHPT). Các dạng khác của bài toán tối ưu có thể đưa về dạng chính tắc trên đây theo những quy tắc nhất định. Với ký hiệu D ⊂ Rn là miền ràng buộc (hay miền các phương án khả thi) cho bởi các ràng buộc (i) và / hoặc (ii) thì BTQHPT có thể viết gọn hơn như sau: f(x) → Max (Min), với x ∈ D. Trong trường hợp D ≡ Rn , ta có BTQHPT không ràng buộc. Nếu trái lại, D là tập con thực sự của Rn thì có BTQHPT có ràng buộc.

Các phương pháp giải tích giải BTQHPT chia thành: phương pháp không sử dụng đạo hàm và phương pháp sử dụng đạo hàm. Trong mục này chúng ta sẽ nghiên cứu một số phương pháp sử dụng đạo hàm như phương pháp Gradient, phương pháp Newton và phương pháp hướng liên hợp.

3.4.1. Phƣơng pháp Gradient

Gradient search là phương pháp toán học nhằm giải quyết các vấn đề của hàm số có dạng: x∈Rminvf(x)

Nói cách khác, đây là phương pháp tìm cực tiểu của hàm số dựa vào Gradient

Nội dung của Lý thuyết trò chơi

Ứng dụng của Lý thuyết trò chơi