Trong đó mỗi mô hình có một trọng số, trọng số này là BIC (Bayesian Information Criterion). Tiêu chuẩn Bayes cho phép giải quyết bài toán với số lượng tham số lớn, đưa ra hệ số phạt kh[r]
(1)PHƯƠNG PHÁP THỐNG KÊ MÔ PHỎNG GẦN ĐÚNG CHO
MƠ HÌNH NHIỀU YẾU TỐ ĐẦU RA
Trần Ngọc Sơn, Nguyễn Văn Đức, Trần Quang Hồng Anh*
Tóm tắt: Bài báo nghiên cứu hệ thống phức tạp có nhiều yếu tố đầu Những hệ thống phức tạp chịu tác động nhiều yếu tố, vấn đề đặt cần thiết phải đánh giá tầm quan trọng yếu tố phân tích ảnh hưởng yếu tố đến hệ thống, từ đó, xây dựng mơ hình tốn để phân tích dự báo phát triển hệ thống Tác giả đưa quy trình sử dụng phương pháp tốn thống kê để nghiên cứu hệ thống phức tạp Tác giả đề xuất phương pháp xây dựng mơ hình gần cho hệ thống nhiều yếu tố đầu tảng sử dụng dạng mở rộng thuật tốn bình phương tối thiếu Đồng thời, tác giả đệ trình phương pháp kiểm tra tính tương thích mơ hình để xem xét chất lượng độ tin cậy mơ hình vừa xây dựng
Từ khóa: Phân tích hồi quy, Mơ hình nhiều yếu tố đầu ra, Thuật tốn bình phương tối thiểu, Tiêu chuẩn Bayes
1 MỞ ĐẦU
Vấn đề mơ hệ thống đại địi hỏi cần phải dự báo phát triển hệ thống Một phương pháp quan trọng để thực phân tích dự báo sử dụng phương pháp tốn học Phương pháp tốn học có khả tính tốn toàn diện tác động nhiều yếu tố khác đến kết dự báo, tăng độ xác tăng tốc độ phân tích cho dự báo
Dựa vào số lượng yếu tố đầu ra, ta phân chia thành loại mơ hình chính: Mơ hình yếu tố đầu ra, Mơ hình nhiều yếu tố đầu Mơ hình yếu tố đầu nghiên cứu nhiều tài liệu, kể đến tác giả như: N Dreiper, H Smith, A.B Uspenskii, V.U Burmin, E.V Markova, J Johnson tác giả khác [1-5]
Mơ hình nhiều yếu tố đầu mơ hình đồng thời quan sát vài yếu tố đầu Có nhiều mơ hình sử dụng để mơ tả trạng thái đối tượng nghiên cứu Tuy nhiên, phương pháp thuật tốn mơ hình hóa nhiều yếu tố đầu chưa nghiên cứu cách toàn diện
(2)Trên sở tài liệu giới thiệu, tác giả xây dựng quy trình phương pháp thống kê cho mô gần hệ thống nhiều yếu tố đầu Quy trình phù hợp để dự báo, phân tích hệ thống phức tạp cho phép nghiên cứu tác động nhiều yếu tố tới hệ thống mơ hình hóa Các bước quy trình thể hình
Những bước quan trọng quy trình xây dựng (bước 5) kiểm định tính tương thích (bước 6) mơ hình mơ gần dựa liệu thống kê Dưới bước cụ thể quy trình
a Bước 1: Đặt vấn đề
Đây bước đầu phân tích hệ thống bao gồm nhiệm vụ như: Phân tích khó khăn gặp phải, liệt kê những nhiệm vụ, phân tích cấu trúc hệ thống đưa mục tiêu chung ban đầu phân tích hệ thống
b Bước 2: Tổng hợp biến đầu vào đầu hệ thống Đây bước liệt kê tất yếu tố tác động lên hệ thống c Bước 3: Đặt vấn đề cho mơ hình gần phức tạp
Trong bước hệ thống ban đầu phân tích chi tiết hơn, xem xét, đặt vấn đề phù hợp với mơ hình gần tảng kết thống kê thực nghiệm
d Bước 4: Phân tích tốn thống kê
Sử dụng phương pháp toán thống kê để mở khả phân tích hệ thống phức tạp Cụ thể q trình mơ sử dụng phương pháp toán thống kê để lựa chọn cấu trúc cho mơ hình, hay nói cách khác lựa chọn biến có giá trị để đưa vào phân tích
Để thực nhiệm vụ trường hợp mơ hình hồi quy đa biến kể đến vài phương pháp phương pháp hồi quy bước phương pháp Bayes
d.1 Phương pháp hồi quy bước
(3)Hình1 Quy trình phương pháp thống kê cho mơ gần
- Lựa chọn tiến: Ban đầu phương trình hồi quy khơng chứa biến Những biến tiếp nhận chúng thỏa mãn điều kiện xác định trước Thứ tự tiếp nhận biến mức độ quan trọng biến yếu tố đầu (sơ đồ phương pháp thể hình 2)
- Loại bỏ lùi: Ban đầu tất biến đưa vào phương trình hồi quy Sau theo thứ tự biến bị loại bỏ khỏi mơ hình theo tiêu chí thích hợp (sơ đồ phương pháp thể hình 3)
- Lựa chọn bước: Đây cách thức kết hợp phương pháp Trong giai đoạn lựa chọn tiến đồng thời loại bỏ biến
(4)Hình 2 Sơ đồ phương pháp lựa chọn tiến
(5)không đưa vào phương trình Để có cấu trúc mơ hình tối ưu, cần phải tính tốn trường hợp, phân tích tất khả kết hợp Tuy nhiên, phương pháp hồi quy bước có hiệu cao với mơ hình có số lượng thống kê lớn nhiều số lượng biến đầu vào
d.2 Phương pháp Bayes
Phương pháp có tên BMA (Bayesian Model Average) [9-11] thuật tốn lựa chọn mơ hình nhiều biến Trong mơ hình có trọng số, trọng số BIC (Bayesian Information Criterion) BIC tiêu chuẩn lựa chọn mơ hình từ tập hợp mơ hình tham số, mơ hình phụ thuộc vào số lượng tham số Để đánh giá mơ hình ta sử dụng phương pháp ước lượng hợp lý cực đại, giá trị tăng lên thêm tham số Tiêu chuẩn Bayes cho phép giải toán với số lượng tham số lớn, đưa hệ số phạt tăng số lượng tham số mơ hình Tiêu chuẩn gần giống với tiêu chuẩn thông tin Akaike, khác giá trị phạt nghiêm ngặt tăng số lượng tham số mơ hình
Giả sử ta có: X xi ni1 phận mẫu, thành phần đặc trưng cho biến xi (xi1, ,xik) Khi đó, tiêu chuẩn thơng tin Bayes tính theo cơng thức:
) ln( ) ln(
2 L k n
BIC ,
trong đó, L là giá trị cực đại hàm số hợp lý mẫu quan sát với số lượng tham số cho trước
Trong trường hợp mơ hình hồi quy tuyến tính tiêu chuẩn thể thơng qua SSE tổng bình phương số dư:
) ln(
ln k n
n SSE n
BIC
Từ mơ hình xem xét, ta chọn mơ hình có giá trị tiêu chuẩn Bayes nhỏ Tiêu chuẩn Bayes phụ thuộc vào số lượng tham số tổng bình phương số dư mơ hình Thay đổi biến phụ thuộc tăng số lượng biến làm thay đổi giá trị tiêu chuẩn Bayes
e Bước 5: Xây dựng mơ hình mơ gần
Dưới mơ hình nhiều yếu tố đầu quan trọng mơ hình mơ phỏng:
), , ( ) ,
( , i n
i x y
i
i (1)
trong đó:
i ki
T
i x x
(6)1
n số lần quan sát; l là số lượng biến đầu ra;
) , (
1 m
T
tham số chưa biết;
( , ), , ( , )
) , (
1
x x
x i T
hàm số cho trước;
i
sai số ngẫu nhiên, tuân theo tiêu chuẩn sau: [ ]0, [ ] ( ), [ ]0, , ( ) 0
i j
i
i E i iT d xi E i j d x
E
trong đó, E giá trị kỳ vọng
Nhiệm vụ vấn đề đặt phải xác định giá trị tham số cho mơ hình thể cơng thức (1) Để tìm giá trị tác giả sử dụng biến thể thuật tốn bình phương tối thiểu sau:
l j l k n i i k ki i j ji
jki y x y x
S
1 1
)) , ( ))( , ( ( ) (
min
, (2)
trong đó: i d1(xi) trọng số mơ hình Trong trường hợp tuyến tính theo tham số, ta có:
) ( )
,
(x FT x
, đó: ) ( ) ( ) ( ) ( ) ( 1 11 ) ( ), ( x f x f x f x f х F т т x f x f
Giá trị tham số tuyến tính tốt có dạng: Y
1 ˆ
, (3) đó: ) ( ) ( 1 i T i i n i x F x F n , i i i n i y x F n
Y ( )
1 1
, 1( )
i x d i
hoặc dạng chi tiết:
) (
jk
M
M , j,k1,, ( , , )
1 Y
Y
YТ ,
(7) n i i x T k f i x j f jki M jk ) ( ) ( , n i i x j f ki y l k jki Y j ) (
f Bước 6: Kiểm tra tính tương thích mơ hình
Sau tìm giá trị tham số mơ hình gần đúng, phương trình kiểm tra tính tương thích Để đạt điều sử dụng tiêu chuẩn tiêu chuẩn Student, tiêu chuẩn Khi bình phương, tiêu chuẩn Fisher…, giống mơ hình hồi quy đơn
Để kiểm định tính tương thích mơ hình nhiều yếu tố đầu tác giả đề xuất sử dụng tiêu chuẩn sau:
f.1 Sai số gần
Để xem xét độ xác mơ hình, ta sử dụng giá trị tương tự với sai số gần công thức (4) Sai số gần độ lệch trung bình giá trị thực tế giá trị tính tốn theo mơ hình [3]:
% 100 ) ( | ˆ | 1 n i i i i y sum y y sum n
A , (4)
trong đó:yilà giá trị thực tế;yˆilà giá trị theo mơ hình
Chỉ nên sử dụng mơ hình để phân tích dự báo có sai số nhỏ 15% Nếu sai số nhỏ 5% mơ hình có độ xác cao
f.2 Hệ số xác định
Để xem xét chất lượng mơ hình ta sử dụng đại lượng tương tự hệ số xác định công thức (5) Hệ số xác định đại lượng thể phần trăm biến động yếu tố đầu giải thích yếu tố đầu vào [3]:
0 0
2 ) ( i i T i i i T i E E tr E trE R
, (5)
trong đó: tr vết ma trận, Ei yˆi yi, Ei0 yi y, y giá trị trung bình Hệ số xác định gần với chất lượng mơ hình tốt
f.3 Tính ổn định tham số
Khi xem xét độ ổn định giá trị tham số mơ hình nhiều yếu tố đầu chia làm trường hợp: