1.2. Thơng tin và cấu trúc tốn học của miền ngôn ngữ tự nhiên 21!
1.2.3. Một số ứng dụng của ĐSGT 34 !
Trong ngôn ngữ của con người, thường xuyên tồn tại tính chất khơng rõ ràng, mơ hồ của tri thức. Kể từ khi được giới thiệu bởi Zadeh [140], lý thuyết tập mờ và sau này là lô-gic mờ đã được áp dụng rất thành công trong nhiều lĩnh vực. Lý thuyết tập mờ và lô-gic mờ được dùng làm cơng cụ mơ hình hố hữu hiệu cho cho tri thức không chắc chắn. Tuy nhiên, hướng tiếp cận mờ còn tồn tại một số điểm hạn chế cố hữu sau:
- Khi thiết kế hệ mờ, việc phân hoạch khơng gian bài tốn thành các khoảng mờ và biểu diễn chúng bằng các tập mờ thiếu cơ sở toán học mà phụ thuộc vào kiến thức, kinh nghiệm của người thiết kế. Tuy có nhiều nghiên cứu áp dụng các phương pháp tính tốn lai kết hợp với mạng nơron nhân tạo, tính tốn tiến hố, phân cụm dữ liệu, học máy… để tìm ra các cách phân hoạch mờ khác nhau nhưng lý thuyết tập mờ vốn không được xây dựng dựa trên hệ tiên đề, nên đôi khi khơng phản ánh được ngữ nghĩa vốn có mà con người dùng để phản ánh thế giới xung quanh mình.
- Cơ sở lơ-gic của các phép tốn trên tập mờ yếu. Điều đó thể hiện bằng việc lý thuyết tập mờ chấp nhận nhiều phép tính lơ-gic khác nhau miễn là các phép tính đó hợp lý và hiệu quả tốt với bài toán đang xét. Điều này mang tới lợi ích là làm cho mơ hình tính tốn mềm dẻo. Tuy nhiên, điều đó cũng gây ra sự không
nhất quán trong việc xem xét những yếu tố đang xét một cách thống nhất, hệ thống và đảm bảo sự ổn định.
- Lý thuyết tập mờ khơng có cách để xác định mối quan hệ giữa những từ ngôn ngữ tự nhiên với ngữ nghĩa vốn có của chúng. Việc so sánh giữa những giá trị ngơn ngữ vì vậy đơi khi mang tính ước lượng nhiều hơn là việc xem xét tính sánh được giữa những giá trị ngơn ngữ trên khơng gian bài tốn. Chính vì thế, trong cùng một khơng gian bài tốn có thể tồn tại nhiều thiết kế khác nhau.
ĐSGT là một cách tiếp cận khác nhằm mơ hình hóa tốn học miền ngơn ngữ. Nhờ đó mơ hình hóa được tính mờ bằng tập {(#) và cung cấp một nền tảng, cơng cụ tính tốn hiệu quả trên ngơn ngữ dựa trên các khái niệm được lượng hoá của các từ ngôn ngữ. Ba đại lượng được lượng hố trong ĐSGT là độ khoảng tính mờ, đo tính mờ và giá trị ngữ nghĩa định lượng của các từ ngôn ngữ. Trên cơ sở các đại lượng này, nhiều lĩnh vực ứng dụng của ĐSGT đã được nghiên cứu và đề xuất. Các lĩnh vực ứng dụng của ĐSGT như: điều khiển học [110–124], phân lớp và hồi quy [125–128], tóm tắt ngơn ngữ [129], [130], xử lý ảnh [131], hỗ trợ ra quyết định [132], [133], mạng máy tính [134], [135], cơng nghệ rơ-bốt [136–139] và nhiều lĩnh vực khác. Trong những nghiên cứu trên, việc áp dụng phương pháp tính tốn của ĐSGT trang bị một cơ sở lơ-gic vững chắc và phù hợp giúp tính tốn trên ngữ nghĩa định lượng của miền ngôn ngữ một cách hiệu quả.
KẾT LUẬN CHƯƠNG 1
Chương này trình bày một cách tóm tắt những khái niệm có liên quan về dự báo chuỗi thời gian, đặc biệt là việc nghiên cứu các mơ hình dự báo FTS-FM. Chương đã cung cấp một số khái niệm cơ bản, phương pháp dự báo và xu hướng nghiên cứu về FTS cũng đã được trình bày để làm cơ sở cho việc phát triển các mơ hình dự báo đối với dữ liệu chuỗi thời gian nói chung.
Chương cũng đã tóm tắt những khái niệm cơ bản của ĐSGT. Qua đó thấy được triết lý của ĐSGT và khả năng ứng dụng chúng trong xử lý ngôn ngữ tự nhiên cũng như dữ liệu không chắc chắn. Trên cơ sở đó, ở chương tiếp theo mơ
hình dự báo chuỗi thời gian dựa trên ngữ nghĩa của ngôn ngữ sử dụng phương pháp tính tốn của ĐSGT sẽ được đề xuất.
Việc nghiên cứu đề xuất mơ hình dự báo chuỗi thời gian dựa trên ngữ nghĩa của ngôn ngữ là rất cần thiết, bởi vì bên cạnh lý thuyết tập mờ, ĐSGT cũng có khả năng xử lý những dữ liệu khơng chắc chắn nhanh chóng và hiệu quả. Thêm vào đó, ĐSGT được phát triển theo phương pháp tiên đề, ở đó cấu trúc ngơn ngữ với quan hệ giữa những từ ngơn ngữ được mơ hình hóa giúp việc tính tốn trong khơng gian ngơn ngữ một cách thuận lợi và hiệu quả.
CHƯƠNG 2. CHUỖI THỜI GIAN NGƠN NGỮ VÀ MƠ HÌNH DỰ BÁO
Mơ hình dự báo chuỗi thời gian thực hiện tính tốn trên dữ liệu lịch sử mà dữ liệu đó đơi khi có tính mơ hồ và kết quả tính tốn dự báo có độ chắc chắn thấp. Mặt khác, con người thường xuyên thu thập, xử lý thông tin dưới dạng ngơn ngữ trong đó có việc dự báo tương lai dựa vào vốn ngơn ngữ đã có trong tri thức của mình. Dữ liệu mà con người phân tích thường dưới dạng các từ ngôn ngữ tự nhiên. Con người cảm nhận thế giới xung quanh bằng vốn ngôn ngữ và tri thức cá nhân của mình. Thêm vào đó, con người cũng thường xuyên phán đoán thế giới bằng các từ ngơn ngữ tự nhiên mà mình có. Tuy nhiên, các sự vật, hiện tượng trong thế giới thực thường được biểu diễn trong các mơ hình dưới dạng số học. Vậy có liên hệ nào giữa mơ hình số học đó với 7 ngơn ngữ mà con người đang sử dụng? Nói cách khác, con người tương tác với thế giới thực bằng các từ ngôn ngữ, vậy mối liên hệ giữa các từ ngơn ngữ đó với dạng số học của các sự vật và hiện tượng trong các mơ hình tính tốn thực chất như thế nào? Đây là một câu hỏi không dễ dàng trả lời.
Việc phát triển các mơ hình dự báo để xử lý dữ liệu không chắc chắn và mô phỏng khả năng suy luận của con người là rất cần thiết. Do đó, Song & Chissom [1–3] trong những nghiên cứu của mình đã đề xuất khái niệm FTS và mơ hình dự báo trên cơ sở phân hoạch khơng gian nền thành các khoảng để từ đó định nghĩa các tập mờ tương ứng để từng đó sử dụng các kỹ thuật tính tốn của lý thuyết tập mờ để tính kết quả dự báo. Đã có nhiều nghiên cứu mở rộng phương pháp dự báo FTS bằng nhiều mơ hình tính tốn dự báo và những cách tiếp cận khác nhau. Tuy vậy, những mơ hình theo cách tiếp cận của FTS vẫn tồn tại những hạn chế chính sau đây:
- Trong mơ hình tính tốn của phương pháp FTS các tác giả thường xuyên dùng những nhãn ngôn ngữ để đại diện cho các tập mờ. Tuy nhiên, những nhãn ngôn ngữ này tồn tại khá độc lập với những tập mờ mà chúng đại diện hay nói cách khác quan hệ giữa những nhãn và tập mờ tương ứng là khơng rõ ràng. Vì
quan hệ này không rõ ràng nên đôi khi tập mờ chưa thể hiện một cách phù hợp giá trị ngơn ngữ đại diện cho nó.
- Quan hệ về mặt thứ tự giữa các nhãn ngơn ngữ, kéo theo đó là giữa các tập mờ, được thiết lập một cách cảm tính theo kinh nghiệm thiết kế của tác giả.
- Chưa có nguyên tắc rõ ràng để xác định số lượng các khoảng và chiều dài của từng khoảng trong phân hoạch khơng gian nền. Tuy đã có nhiều nghiên cứu về phương pháp phân hoạch này nhưng bản chất của việc lựa chọn số khoảng và độ dài của chúng chưa được nghiên cứu một cách hệ thống và thuyết phục.
Từ những hạn chế trên nảy sinh yêu cầu về việc nghiên cứu đề xuất các mô hình dự báo cho dữ liệu chuỗi thời gian trong đó quan hệ giữa các từ ngơn ngữ được sử dụng một cách tự nhiên, trên cơ sở ngữ nghĩa khách quan của chúng.