Phƣơng pháp này tính phân bố của các giá trị chuỗi thời gian rơi vào các khoảng đã chia. Điều này thực hiện để biết các khoảng nào có nhiều giá trị rơi vào để có thể phân khoảng tiếp làm tăng độ chính xác khi dự báo. Cách phân khoảng này đƣợc mô tả trong công trình [2].
Các bƣớc của thuật toán tƣơng tự nhƣ khi chia làm 6 khoảng giá trị bằng nhau, tuy nhiên khi chia giá trị làm 6 khoảng , bảng sau sẽ cho thấy sự phân bố các giá trị của chuỗi thời gian rơi vào từng khoảng:
Bảng 3.10. Phân bố giá trị trong từng khoảng Khoảng Số lƣợng u1 = [1500,2000] 2 u2 = [2000,2500] 3 u3= [2500,3000] 1 u4= [3000,3500] 0 u5= [3500,4000] 6 u6=[4000,4500] 1 Bước 1. Xây dựng tập nền U:
Xem xét bảng trên thấy sự phân bố các giá trị tại các khoảng khác nhau là không đều nhau. Có 13 giá trị trong 6 khoảng nên số lƣợng trung bình rơi vào mỗi khoảng là hơn 2. Nhƣng có những khoảng rơi vào đến 6 giá trị. Vì vậy phải chia những khoảng có nhiều giá trị thành những khoảng con để có thể phân bố đều lại các giá trị này. Vì vậy những khoảng nào có 6 giá trị rơi vào ta chia tiếp làm 3 khoảng con. Kết quả sẽ hình thành 8 khoảng sau:
Bảng 3.11. Phân khoảng
U1 = [1500,2000] U5=[3500,3667] U2 = [2000,2500] U6=[3667,3833]
U3= [2500,3000] U7=[3833,4000]
U4= [3000,3500] U8=[4000,4500]
Bước 2: Xây dựng các tập mờ xác định trên các biến ngôn ngữ là các
khoảng đã chia
Trong bƣớc này ta xác định lại các tập mờ Ai tƣơng ứng với từng khoảng và có thể gán lại các giá trị ngôn ngữ cho từng tập mờ này. Các tập
mờ Ai i=1,2,...,8 đƣợc định nghĩa thông qua các hàm thuộc để đơn giản có dạng hình nón nhận 3 giá trị 0, 0.5 và 1 và đƣợc viết nhƣ sau:
A1 = 1/u1 + 0.5/u2 + 0/u3 +....+ 0/u7 + 0/u8 A2 = 0.5/u1 + 1/u2 + 0.5/u3 +...+ 0/u7 + 0/u8
A3 = 0/u1 + 0.5/u2 + 1/u3 + 0.5/u4 +...+ 0/u7 + 0/u8 ... A7 = 0/u1 + 0./u2 + ...+ 0.5/u6+ 1/u7 + 0.5/u8 A8 = 0/u1 + 0/u2 + ...+ 0/u6 + 0.5/u7 + 1/u8
Bƣớc 3.Xác định mối quan hệ mờ và nhóm quan hệ mờ
Bảng 3.12. Nhóm mối quan hệ mờ A1 A1,A2 A6 A8 A2 A2,A2,A3 A7 A5 A3 A5 A8 A7 A5 A5,A7,A6 Bảng 3.13. Các nhóm mối quan hệ mờ
Giá Trị Thời điểm Giá Trị mờ Nhóm quan hệ logic mờ mới
1756 t=1 A1 1745 t=2 A1 A1 2169 t=3 A2 A1, A2 2249 t=4 A2 A2 2290 t=5 A2 A2, A2 2527 t=6 A3 A2, A2,A3 3605 t=7 A5 A5 3661 t=8 A5 A5 3855 t=9 A7 A5, A7
3662 t=10 A5 A5
3707 t=11 A6 A5, A7,A6
4450 t=12 A8 A8
3892 t=13 A7 A7
Từ ba phƣơng pháp chia khoảng trên, ta có bảng tổng hợp kết quả dự báo của các phƣơng pháp nhƣ sau:
Bảng 3.14. Kết quả dự báo của các phương pháp khác nhau
Năm Số lƣợng trẻ Chia 6 khoảng Chia 12 khoảng Theo mật độ ( 8 khoảng ) 2001 1756 2002 1745 1750 1625 1750 2003 2169 2083 2125 2083 2004 2249 2250 2125 2250 2005 2290 2250 2292 2250 2006 2527 2500 2625 2500 2007 3605 3750 3625 3584 2008 3661 3750 3625 3584 2009 3855 3750 3791 3806 2010 3662 3750 3625 3584 .2011 3707 3750 3708 3778 2012 4450 3917 3975 4250 2013 3892 3750 3875 3917 MSE 30297 22866 5856
Kết quả sai số theo các phƣơng pháp đƣợc đƣa ra trong bảng sau:
Bảng 3.15. So sánh hiệu quả thuật toán
Số khoảng/MSE Chia 6 khoảng Chia 12 khoảng Chia theo mật độ ( 8 khoảng )
MSE 30297 22866 5856
Từ bảng trên ta cũng thấy đƣợc nếu chia nhỏ hơn (12 khoảng so với 6) thì kết quả có độ chính xác cao hơn nhƣ Huarng đã nhận xét [9]. Tuy nhiên điều này không phải lúc nào cũng đúng. Ta có thể nhận thấy với phƣơng pháp chia khoảng giá trị theo mật độ, với số khoảng nhỏ hơn (8 so với 12) nhƣng giá trị MSE lại nhỏ hơn rất nhiều lần so với 2 cách phân khoảng trƣớc. Điều đó chứng tỏ phƣơng pháp này đã đạt hiệu quả tốt nhất trong các phƣơng pháp đã đƣợc sử dụng nên có thể đƣa vào áp dụng trong tính toán.
Hình vẽ dƣới đây so sánh kết quả tính toán theo cả ba cách chia khoảng giá trị: chia thành 12 khoảng, 6 khoảng, và chia theo mật độ. Có thể nhận thấy đồ thị của phƣơng pháp chia theo mật độ phản ánh xu thế tốt hơn so với hai phƣơng pháp còn lại.
ĐỒ THỊ SO SÁNH KẾT QUẢ DỰ BÁO 0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 NĂM S Ố T R Ẻ E M Giá trị thực Chia 12 khoảng Chia 6 khoảng Chia theo mật độ
KẾT LUẬN
Luận văn này giới thiệu các khái niệm cơ bản về chuỗi thời gian và các mô hình xử lý chuỗi thời gian, đồng thời đƣa ra một cải biên mới để sử dụng đƣợc trong mô hình chuỗi thời gian mờ. Nhóm các quan hệ logic mờ là khái niệm cơ bản để cải tiến các thuật toán trong mô hình chuỗi thời gian mờ, chúng đƣợc sử dụng trong hầu hết các công trình sau này của các tác giả khác nhau. Với định nghĩa mới về nhóm quan hệ logic mờ phụ thuộc thời gian, chƣa cần sử dụng các phƣơng pháp nâng cao độ chính xác khác nhau nhƣ phân đoạn lại, sử dụng chuỗi thời gian mờ bậc cao hay mô hình hai nhân tố, kết quả đã tốt hơn rất nhiều so với thuật toán cơ bản của Chen. Chính vì vậy, em đã lựa chọn tìm hiểu về “Nhóm quan hệ mờ phụ thuộc thời gian và ứng
dụng trong mô hình chuỗi thời gian mờ”. Sử dụng nhóm quan hệ mờ mới này trong các phƣơng pháp cải tiến khác nhau hy vọng sẽ làm tăng hiệu quả của các thuật toán.
Trong luận văn này em trình bày một số mô hình đã đƣợc sử dụng trong chuỗi thời gian mờ. Đó là các mô hình cơ bản của Song - Chissom, mô hình của Chen cho nhóm quan hệ mờ, mô hình Heuristic của Huarng và mô hình có trọng của Yu.
Trọng tâm của luận văn là đề cập đến khái niệm mới: nhóm quan hệ mờ phụ thuộc thời gian. Khái niệm này đã làm tăng độ chính xác của thuật toán so với khái niệm cơ bản nhóm mối quan hệ mờ và thuật toán kinh điển của Chen. Qua đó ứng dụng nhóm quan hệ mờ phụ thuộc thời gian trong chuỗi thời gian mờ để dự báo số trẻ em sinh ra tại thành phố Việt trì. Kết quả tính toán cho thấy mức độ phù hợp của dự báo so với số liệu thực tế và tốt hơn so với các nhóm quan hệ mờ theo Chen và Yu. Hơn nữa nếu sử dụng thêm cách phân khoảng theo mật độ và sử dụng nhóm quan hệ mờ phụ thuộc thời gian
thì sai số MSE giảm khá nhiều nhƣ thí nghiệm 2 đã chứng tỏ. Chính vì vậy, mô hình chuỗi thời gian mờ với nhóm quan hệ mờ phụ thuộc thời gian có nhiều triển vọng ứng dụng trong nhiều lĩnh vực khác nhau, nhất là trong trong dự báo các chuỗi thời gian của kinh tế và xã hội.
Trong khi tính toán thử nghiệm em thấy mô hình thuật toán đƣợc ứng dụng tính toán trên phần mếm MS. Excel và lập trình Dev C++ rất thuận tiện và đơn giản. Chính vì vậy em đã sử dụng phần mềm MS. Excel và ngôn ngữ lập trình C để tính toán thử nghiệm và ứng dụng dự báo số trẻ em sinh ra tại
thành phố Việt trì.
Do thời gian có hạn cho nên trong đề tài này em mới chỉ ứng dụng cho việc dự báo số trẻ em sinh ra tại thành phố Việt trì. Tuy nhiên, kết quả đạt đƣợc là phù hợp nên phƣơng pháp này hoàn toàn có thể sẽ áp dụng đƣợc trong việc dự báo cho các lĩnh vực khác nhƣ: dự báo số trẻ em sinh ra trên cả nƣớc, dự báo thời tiết tỉnh Phú Thọ, dự báo số sinh viên nhập trƣờng của Trƣờng Đại học Công nghiệp Việt trì,...
PHỤ LỤC
Trong luận văn này em sử dụng phần mềm MS. Excel 2003 và Dev C++ để tính toán thử nghiệm và ứng dụng trong dự báo số trẻ em sinh ra tại thành phố Việt trì.
Dùng phần mềm MS. Excel: Dƣới đây là hình vẽ thể hiện kết quả tính toán với các phƣơng pháp Chen, Yu, và phƣơng pháp cải biên khi chia giá trị ra làm 12 khoảng :
Hình PL 1. So sánh kết quả dự báo của Chen, Yu, cải biên và sai số MSE
Dƣới đây là hình ảnh so sánh 3 phƣơng pháp chia khoảng khi chia chuỗi giá trị ra làm 6 khoảng, 12 khoảng và chia theo mật độ:
Hình PL 2. So sánh kết quả dự báo của 3 phương pháp chia khoảng và sai số MSE
Dùng phần mềm Dev C++: Kết quả chƣơng trình sau khi nhập vào số trẻ em sinh ra các năm. Dự báo bằng phƣơng pháp chia giá trị làm 12 khoảng:
TÀI LIỆU THAM KHẢO
Tiếng Việt
[1] Bùi Công Cƣờng (2001), N.D. Phƣớc, Hệ mờ, Mạng Nơron và ứng dụng
(Tuyển tập các bài giảng), NXB Khoa học và Kỹ thuật.
[2] Nguyễn Công Điều, “Một thuật toán mới cho mô hình chuỗi thời gian mờ heuristic trong dự báo chứng khoán”, Tạp chí Khoa học và Công nghệ, Viện KH&CN Việt Nam , 49 (4) 2011.11-25
[3] Nguyễn Công Điều, Phạm Thị Ngân, “Nhóm quan hệ mờ phụ thuộc thời gian và ứng dụng trong mô hình chuỗi thời gian mờ có trọng”, Tạp chí Khoa học và Công nghệ, Đại học Thái nguyên, 2012.
[4] Nguyễn Công Điều, “Nhóm quan hệ mờ phụ thuộc thời gian trong mô hình chuỗi thời gian mờ”. Tạp chí KHCN , Viện Hàn lâm KH và CN Việt Nam, 52(6), 2014, 659-672.
[5] Nguyễn Thị Kim Loan, “Mô hình chuỗi thời gian trong dự báo chuỗi thời gian”. Luận văn thạc sỹ Khoa học máy tính tháng 3 năm 2009.
Tiếng Anh
[6] H.K. Yu “Weighted fuzzy time series models for TAIEX forecasting ”,
Physica A, 349 (2005) 609–624.
[7] K.Huarng, “Heuristic models of fuzzy time series forecasting”, Fuzzy sets and Systems, V.123, pp 369-386, 2001.
[8] K.Huarng, “Effective lengths of interrvals to improve forecasting in fuzzy time series”, Fuzzy sets and Systems, V.123, pp 387-394, 2001.
[9] Q. Song, B.S. Chissom, “Forecasting Enrollments with Fuzzy Time Series – Part I,” Fuzzy set and systems, vol. 54, pp. 1-9, 1993.
[10] Q. Song, B.S. Chissom, “Forecasting Enrollments with Fuzzy Time Series – Part II,” Fuzzy set and systems, vol. 62, pp. 1-8, 1994.
[11] S.M. Chen, “Forecasting Enrollments based on Fuzzy Time Series,”
Fuzzy set and systems, vol. 81, pp. 311-319, 1996.
[12] S. M. Chen, “Forecasting Enrollments based on hight-order Fuzzy Time Series”, Int. Journal: Cybernetic and Systems, N.33, pp. 1-16, 2002.