BÀI TOÁN HỌC XẤP XỈ HÀM Q VÀ HÀM NGƯỢC Q

Trong lĩnh vực viễn thông, các nhà nghiên cứu giả thuyết rằng hệ thống nhiễu có dạng biến Gaussian ngẫu nhiên. Việc tính toán xác suất lỗi trong hệ thống thông tin số thường gắn liền với việc tính toán dựa trên hàm lỗi Q(x), được định nghĩa như sau:

(4.1)

Sau đây là biểu diễn đồ thị của hàm Gaussian Q.

Hình vẽ 4.1. Đồ thị của hàm Q

Dạng hàm Q này có hai vấn đề. Trước tiên, xét về góc độ tính toán, nó đòi hỏi sự chặn trên của giới hạn vô cực khi sử dụng tích phân số hoặc kỹ thuật tính

80 toán. Vấn đề thứ hai gặp phải là tham số của hàm là giá trị dưới của hàm tích phân, do đó, nó sẽ gặp khó khăn về mặt giải tích khi tham số này phụ thuộc vào một biến số ngẫu nhiên đòi hỏi trung bình thống kê trên phân bố xác suất. Trong những trường hợp như vậy, chúng ta cần có dạng hàm Q(x) với tham số đầu vào không những không phải là giới hạn trên hay dưới của hàm tích phân, mà còn xuất hiện trong hàm tích phân như là tham số đầu vào của các hàm cơ bản. Dạng thức mong muốn vẫn là dạng mà giới hạn của tham số độc lập là hữu hạn, đồng thời, hàm tích phân vẫn duy trì cấu trúc tự nhiên của nó.

Các biểu diễn tường minh của hàm Q rất cần cho các bài toán liên quan đến hiệu năng của hệ thống viễn thông, đặc biệt là lỗi trung bình, bit và xác xuất khối lỗi và hàm mũ số nguyên với biến ngẫu nhiên thu được trong môi trường Fading [100] [101].

Tuy nhiên, hàm Q chỉ duy nhất được định nghĩa dưới dạng tích phân suy rộng, điều này sẽ gây nhiều khó khăn cho những phân tích sau này đối với với các hệ thống viễn thông [102] [103] [104] [105] [106]. Do đó, rất cần thiết phải tìm ra các biểu diễn tường minh (dạng giải tích) của hàm Q. Mục đích cơ bản của việc xấp xỉ hàm Q là nhằm đưa ra dạng đơn giản và tường minh của hàm Q, tiện lợi trong việc phân tích toán học của hiệu năng hệ thống viễn thông .

Tuy nhiên, đến thời điểm này, chưa có giải pháp chính xác tuyệt đối cho dạng tường minh của hàm Q, và do đó, các hàm xấp xỉ là lựa chọn duy nhất. Mặc dù có nhiều hàm xấp xỉ dạng tường minh của hàm Q đã được đề xuất bởi các chuyên gia (một số hàm xấp xỉ phổ biến sẽ được trình bày trong phần tiếp theo), nhưng do tính chất quan trọng và phổ biến của hàm Q trong lĩnh vực viễn thông, việc tìm kiếm các hàm xấp xỉ tốt hơn, có dạng giải tích và có nhiều đặc điểm quan trọng (chẳng hạn như sự đơn giản, tính khả tích,…) vẫn tiếp tục được thực hiện.

4.1.2Một số dạng xấp xỉ do chuyên gia đề xuất

Đến thời điểm này, có một số dạng xấp xỉ được đề xuất bởi các chuyên gia (các nhà toán học) trong lĩnh vực viễn thông về các xấp xỉ hàm Q dạng tường minh. Trong [102] đưa ra một tập các xấp xỉ của hàm lỗi bù, liên quan đến hàm Q . Xấp xỉ hàm Q trong [ [102], eqn. (9)] được định nghĩa như sau:

(4.2) Trong [103] sử dụng xấp xỉ PBCS với hàm xấp xỉ trong [ [102], eqn. (13)]

(4.3) Với a = 0.339, b = 5.510, sẽ được ký hiệu là xấp xỉ OPBCS.

Trong [104], một dạng xấp xỉ đơn giản và hữu ích khác được đưa ra. Tuy nhiên, những xấp xỉ này có sai số lớn với tham số đầu vào nhỏ, chính vì vậy nó ít phù hợp với kênh fading trên trung bình. Hàm xấp xỉ của Q trong [104] là:

(4.4) trong bài báo này được ký hiệu là xấp xỉ CDS.

Trong [105], các tác giả đã đề xuất dạng thức đơn giản khác của xấp xỉ hàm Q với sai số nhỏ trên toàn bộ dải giá trị đầu vào. Để thuận tiện, hàm xấp xỉ Q được đưa ra trong [105] như sau:

(4.5)

Trong đó, giá trị tối ưu của biến số A và B là A = 1.98 và B =1.135, và mối quan hệ là:

82 (4.6)

được áp dụng trong [ [105], eqn. (6)], trong đó erfc(.) là hàm lỗi bù. Độ chính xác có thể được điều chỉnh bằng cách thay đổi các giá trị khác nhau của A và B. Xấp xỉ này được ký hiệu là xấp xỉ GKAL.

Tuy nhiên, những hạn chế của xấp xỉ dạng tự do này là nó có thể rất chính xác nhưng khó áp dụng trong thực tế bởi sự phức tạp của dạng hàm xấp xỉ. Do đó, những dạng xấp xỉ, mặc dù có độ chính xác thấp hơn nhưng có dạng đơn giản thì vẫn hữu ích trong thực tế. Benitez và Casadevall trong [106] đã đề xuất dạng xấp xỉ (được gọi là xấp xỉ dạng hàm mũ) với dạng tương tự với hàm Gaussian, gọi là eP(x), trong đó P(x) là đa thức bậc 2, P(x) = ax2 +bx+c. Với dạng xấp xỉ này, trong khoảng [0;7], họ đã tìm được các giá trị tối ưu của tham số a, b và c tương ứng là -0.4698, -0.5026, và -0.8444. Dạng xấp xỉ này ít chính xác hơn so với OPBCS, nhưng khả năng dễ tính toán làm nó trở nên hữu ích trong bài toán phân tích hệ thống viễn thông.

4.1.3Hàm ngược Q

Bên cạnh hàm Q, hàm ngược Q cũng có ý nghĩa rất quan trọng, nó giúp cho việc tìm kiếm các giá trị của tỷ số tín hiệu trên nhiễu trong khoảng ngưỡng xác xuất lỗi nhất định hoặc trong hệ thống sóng thông minh (là một hệ thống vô tuyến sử dụng công nghệ cho phép hệ thống có được thông tin của môi trường hoạt động và địa lý của hệ thống, các chính sách được thiết lập và trạng thái bên trong của hệ thống; để điều chỉnh các thông số hoạt động và các giao thức của hệ thống một cách linh hoạt và chủ động theo thông tin có được của hệ thống để đạt được các mục tiêu được định nghĩa trước).

Tham số đầu vào của hàm ngược Q sẽ là xác suất lỗi, nằm trong khoảng giá trị 10-6 đến 10-1.

Do vậy, bài toán đặt ra là tìm dạng giải tích của hàm ngược Q dựa trên tập dữ liệu huấn luyện có được từ hàm Q (đảo vị trí giá trị đầu vào, đầu ra). Hiện

83 nay, chưa có công bố nào về dạng giải tích của hàm ngược Q.

Việc tính toán giá trị của hàm ngược chủ yếu được thực hiện qua việc sử dụng các hàm mà không biết được cụ thể dạng giải tích của hàm đó.

4.2 ỨNG DỤNG HỌC XẤP XỈ HÀM Q

4.2.1Xác định hàm thích nghi với bài toán học xấp xỉ hàm Q

Như đã trình bày ở chương một, một hệ thống GP bao gồm năm thành phần là biểu diễn chương trình, khởi tạo quần thể, hàm thích nghi, toán tử di truyền và các tham số. Trong đó, hàm thích nghi là thành phần rất quan trọng để đánh giá độ tốt của cá thể, làm cơ sở cho việc thực hiện quá trình tiến hóa. Có nhiều dạng hàm thích nghi khác nhau được sử dụng để phù hợp với từng bài toán khác nhau.

Dạng hàm thích nghi hay được sử dụng với GP và TAG3P1 là hàm dựa trên lỗi tuyệt đối trung bình (Mean Absolute Error - MAE):

∑ = − = n i yi fi n MAE 1 | | 1 (4.7)

Trong đó, n là số lượng dữ liệu mẫu (tập huấn luyện), fi là giá trị của hàm Q và yi là giá trị của hàm học được tại mẫu thứ i trong tập dữ liệu mẫu. Trong thí nghiệm này, tập dữ liệu mẫu gồm 500 giá trị, chia đều trong khoảng [0;7] và được tạo ra tương ứng dựa vào công thức hàm Q ở trên. Lý do của sự giới hạn này là bởi hàm Q sẽ tiệm cận giá trị 0 khi x lớn hơn 7, do đó ít có giá trị hữu dụng trong lĩnh vực viễn thông.

Tuy nhiên, mặc dù hàm thích nghi này chỉ ra được tính xấp xỉ với hàm Q dưới góc độ sai số tuyệt đối, nhưng nó không thể hiện được tính tốt của hàm xấp xỉ. Đặc biệt, với hình dạng của hàm Q (theo như đồ thị trong hình vẽ) thì Q sẽ tiệm cận càng gần giá trị 0 khi x càng lớn. Chính vì vậy, nếu sử dụng hàm thích nghi dựa trên lỗi tuyệt đối trung bình thì sẽ không thể hiện được bản chất của

1 Trên thực tế, GP và TAG3P thường sử dụng tổng lỗi tuyệt đối (Sum of Absolute Error - SAE) chứ không sử dụng lỗi tuyệt

84 hàm xấp xỉ tìm được (do lỗi tuyệt đối có thể là nhỏ nhưng lại lớn hơn nhiều so với giá tri của hàm). Do đó, trong thí nghiệm này, luận án cũng thử nghiệm thêm TAG3P với hàm thích nghi khác dựa trên hàm lỗi tương đối (RAE) như sau:

∑ = − = n i fi yi fi n RAE 1 | | 1 (4.8) Trong đó, n, fi, yi được định nghĩa tương tự như trên.

Để kiểm chứng kết quả thực sự khi so sánh việc áp dụng các hàm lỗi, luận án thiết lập hai tập thí nghiệm với TAG3P sử dụng hai hàm thích nghi ở trên, mỗi tập thí nghiệm gồm 50 lần chạy. Khi thiết lập thí nghiệm, luận án sử dụng tập hàm gồm các hàm sau: +,−, *,%, exp, log, sqrt. Ngoài các hàm cơ bản (+,−, *,%), việc lựa chọn thêm các hàm exp, log, sqrt là dựa trên cơ sở tham khảo các dạng xấp xỉ do chuyên gia đề xuất như mục ở trên. Tập kết được sử dụng gồm có tham số x, π và các hằng số ngẫu nhiên được sinh ra trong khoảng (0;1).

Với các kết quả thu được sau khi chạy 2 tập thí nghiệm, luận án lựa chọn một số hàm xấp xỉ tốt nhất tìm được và vẽ đồ thị lỗi tương đối của các hàm này.

Trên cơ sở kết quả thu được, luận án lựa chọn 03 xấp xỉ tốt nhất khi sử dụng hàm thích nghi MAE như sau:

π − + e x x e 3 . 0.5572 (TAG3P-MAE-1) (4.9) ) 1 ( 64482 . 0 1 + + e x x x e (TAG3P-MAE-2) (4.10) ) 03377 . 0 0288 . 0 )( (x ex x3 x6 x8 + + + +π π (TAG3P-MAE-3) (4.11) Sau đây là đồ thị lỗi của các xấp xỉ này so với xấp xỉ tốt nhất đưa ra bởi chuyên gia (OPBCS)

Hình vẽ 4.2. Lỗi tương đối của các xấp xỉ tìm được khi sử dụng hàm thích nghi MAE và xấp xỉ OPBCS

Đồng thời, trên cơ sở kết quả thu được, luận án lựa chọn 03 xấp xỉ tốt nhất khi sử dụng hàm thích nghi RAE như sau:

) 5609 . 0 5215 . 0 4785 . 0 0646 . 3 9.8696x ) 4073 . 4 ( ( − 2− − + − x x x x e (TAG3P-RAE-1) (4.12) 0624 . 0 3357 . 1 78859 . 0 4468 . 0 1 2 + − + + x x e x x e (TAG3P-RAE-2) (4.13) ) 3396 . 0 ( 483347 . 0 ) 83686 . 1 3183 . 1 ( 95956 . 0 + + e x x x (TAG3P-RAE-3) (4.14)

Sau đây là đồ thị lỗi của các xấp xỉ này so với xấp xỉ tốt nhất đưa ra bởi chuyên gia (OPBCS)

92 a = 0.0000018643 ; b = −0.000109; c = 0.002238;

d = −0.023735; f = −0.344644; g = −0.774128 và h = −0.698740

TAG3PSC_EXP = !"# $"% &"' (" )"* "+ (4.17) Trong đó, các giá trị hằng số như sau:

a=0.000010615; b= - 3.221547E-4; c= 0.004249 d= - 0.0329145; f=-0.3240148; g= -0.7942057 h= -0.69379799

Hình vẽ 4.5. So sánh lỗi tương đối của xấp xỉ Q

Từ hình vẽ trên có thể rút ra một số nhận xét như sau:

- Hình dạng đồ thị lỗi RAE của các xấp xỉ tìm được bởi MSSC, TAG3PL và TAG3PSC tương tự nhau.

93 - Xấp xỉ tìm bởi TAG3PL chỉ xấu hơn trong khoảng [0;0.2] và [0.7;1.5], còn lại thì đều tốt hơn OPBCS.

- Xấp xỉ tìm bởi TAG3PSC là tốt nhất, tốt hơn hẳn các xấp xỉ khác. Hơn thế nữa, xấp xỉ tốt nhất tìm được ở (4.17) lại có dạng hàm mũ nên rất đơn giản trong quá trình tính toán, phù hợp với đặc điểm sử dụng trong phân tích hệ thống viễn thông.

Kết quả này rất quan trọng vì kể từ khi xấp xỉ OPBCS được đưa ra năm 1979 đến nay chưa có một xấp xỉ nào tốt hơn được tìm ra. Ngoài ra, cùng có dạng hàm mũ nhưng so với xấp xỉ đề xuất bởi Benitez và Casadevall thì xấp xỉ này có độ chính xác cao hơn rất nhiều.

4.3 ỨNG DỤNG HỌC XẤP XỈ HÀM NGƯỢC Q

4.3.1Xác định hàm thích nghi với bài toán học xấp xỉ hàm ngược Q

Như đã trình bày ở trên, hàm thích nghi là thành phần rất quan trọng để đánh giá độ tốt của cá thể, làm cơ sở cho việc thực hiện quá trình tiến hóa.

94 Trong bài toán học hàm ngược Q, dựa trên đồ thị hàm ngược (vẽ từ tập dữ liệu huấn luyện) hàm thích nghi được sử dụng phù hợp để làm thí nghiệm là hàm lỗi tuyệt đối MAE.

Tham số đầu vào của hàm ngược Q sẽ là xác suất lỗi, nằm trong khoảng giá trị 10-6 đến 10-1.

Để có tập dữ liệu huấn huyện tốt, trong thí nghiệm này, tập dữ liệu mẫu gồm 500 giá trị, với tập các giá trị x chia đều trong khoảng [1.2816;4.7534] (là khoảng mà y nằm trong khoảng 10-6 đến 0.1). Sau đó tính giá trị y bằng hàm Q(x) rồi đảo ngược vị trí để thành tập huấn luyện để học hàm ngược.

Do vậy, bài toán đặt ra là tìm dạng giải tích của hàm ngược Q dựa trên tập dữ liệu huấn luyện có được từ hàm Q (đảo vị trí giá trị đầu vào, đầu ra).

4.3.2Thiết kế thí nghiệm và kết quả

Tương tự như học hàm Q, để so sánh kết quả học xấp xỉ hàm ngược Q, thí nghiệm được tiến hành giữa các toán tử lai ghép khác nhau đã đề cập ở trên gồm:

1. Toán tử lai ghép GP chuẩn (GP)

2. Toán tử lai ghép MSSC trên GP (MSSC) 3. Toán tử lai ghép trên hệ TAG3P (TAG3P).

4. Toán tử lai ghép trên hệ TAG3P có sử dụng tìm kiếm địa phương (TAG3PL)

5. Toán tử lai ghép dựa trên ngữ nghĩa trên hệ TAG3P (TAG3PSC). Dựa trên các hàm trong các xấp xỉ hàm Q, lựa chọn các hàm ngược tương ứng và phù hợp, các hàm sử dụng trong thí nghiệm sẽ là +,-,*,/ log và exp. Ngoài ra sử dụng hằng số là 1, Pi và R là hằng số trong khoảng (0;1). Do đó, văn phạm được sử dụng để học sẽ như sau:

Tham số Giá trị

Số thế hệ 100

Kích thước quần thể

3000 với GP, GP với MSSC. 3000 với TAG3P (không sử dụng

tìm kiếm địa phương) 100 với TAG3PL (có sử dụng

tìm kiếm địa phương) Kích thước tối đa 40 (với TAG3P) và 15 (với GP) Phương pháp chọn Lựa chọn cạnh tranh với kích cỡ là 9

Tập hàm sử dụng +, -, *,/, exp, log

Xác xuất các toán tử Lai ghép = 0.9, Đột biến = 0.1 Hàm thích nghi Lỗi tuyệt đối trung bình (MAE) Toán tử tìm kiếm địa phương

(áp dụng với TAG3PL)

Ngẫu nhiên lựa chọn toán tử chèn và toán tử xóa

Chiến lược tìm kiếm địa phương

(áp dụng với TAG3PL) Leo đồi

Bước tìm kiếm địa phương (áp dụng với TAG3PL)

30 với TAG3PL (có sử dụng tìm kiếm địa phương) Số cặp cây con lựa chọn để tính

ngữ nghĩa (N) đối với TAG3PSC N=40

Số lần chạy thí nghiệm 50

Hình vẽ 4.7. Văn phạm LTAG của TAP3P cho bài toán xấp xỉ hàm ngược Q

97 Sau khi chạy thí nghiệm trên, với 50 lần chạy thí nghiệm, kết quả thu được như sau: Thí nghiệm Giá trị MAE MAE<=10-3 10 -3<MAE và MAE<=10-2 10-2<MAE và MAE<=10-1 Giá trị MAE tốt nhất thu được GP 0 18 33 0.0814 MSSC 0 22 28 0.0096 TAG3P 0 21 29 0.0110 TAG3PL 0 33 17 0.0198 TAG3PSC 0 42 8 0.0070

Bảng 4.4. Kết quả thí nghiệm học hàm ngược Q

Do chưa có dạng tường minh nào của hàm ngược Q được công bố, nên dựa trên kết quả thu được, giá trị lỗi tuyệt đối trung bình của xấp xỉ tìm bởi TAG3PSC là tốt nhất và qua đánh giá các cấu trúc lời giải tốt nhất thu được thì đây là lời giải đơn giản nhất. Dạng tường minh của biểu thức xấp xỉ hàm ngược Q thu được như sau:

Qinver = ( -../-.

0.1202 3.$4995)∗678;)(.&454.44$5678 "-.0<=>)ln(0.981515+<.1-==) + 1.2617 – 2.1675x – -.=22=

?.0?1=∗ "-.-<=- (4.18)

Như vậy có thể thấy xấp xỉ hàm ngược Q thu được có cấu trúc tường minh và không quá phức tạp. Hiện tại chưa có công bố nào về hàm ngược Q ở dạng

BÀI TOÁN HỌC XẤP XỈ HÀM Q VÀ HÀM NGƯỢC Q

GP với biểu diễn tuyến tính

LẬP TRÌNH GEN ĐỊNH HƯỚNG BỞI VĂN PHẠM