1. Trang chủ
  2. » Luận Văn - Báo Cáo

Mô phỏng và phân tích rủi ro dự báo trên tập dữ liệu số chiều cao

12 1 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Kỷ yếu Hội nghị Quốc gia lần thứ X Nghiên cứu ứng dụng Công nghệ thông tin (FAIR), Đà Nẵng, ngày 17-18/08/2017 DOI: 10.15625/vap.2017.00056 MÔ PHỎNG VÀ PHÂN TÍCH RỦI RO DỰ BÁO TRÊN TẬP DỮ LIỆU SỐ CHIỀU CAO Đỗ Văn Thành1 Đỗ Đức Hiếu2 Khoa Công nghệ thông tin, Trường Đại học Nguyễn Tất Thành Khoa Công nghệ thông tin Truyền thông, Trường Đại học Khoa học Công nghệ Hà Nội, Viện Hàn lâm Khoa học Công nghệ Việt Nam, dvthanh@ntt.edu.vn, vincentdo2310@gmail.com TĨM TẮT: Sử dụng mơ hình định lượng để dự báo thừa nhận tương lai diễn gần giống khứ Nhưng thực tế vậy việc dự báo ln khó khăn có nhiều trường hợp kết dự báo khác xa chí trái ngược với thực tế mơ hình dự báo chẩn đốn kiểm định cẩn thận đánh giá phù hợp Hiện tượng gọi rủi ro dự báo Rủi ro dự báo thường đo xác suất xuất Mục đích báo đề xuất khung lý thuyết để mô phân tích rủi ro dự báo ngữ cảnh yếu tố ảnh hưởng đến vấn đề (hay biến đích) cần dự báo lớn Bài báo sử dụng kỹ thuật giảm chiều liệu để chuyển tập liệu số chiều cao (số biến gốc và/hoặc số quan sát lớn) thành tập liệu có số chiều thấp cho quan hệ biến đích biến gốc thay đổi tập liệu có số chiều thấp phản ánh đầy đủ thông tin tập liệu số chiều cao Đồng thời báo ứng dụng mơ hình hồi quy lơgit mơ hình hồi quy có thứ tự để xây dựng mơ hình tính xác suất dự báo theo xu theo mức độ khác biệt kết dự báo Bài báo ứng dụng phương pháp luận đề xuất lĩnh vực kinh tế - tài Từ khóa: giảm chiều liệu, liệu số chiều cao, mơ rủi ro dự báo, phân tích rủi ro, hồi quy lơgit hồi quy có thứ tự I GIỚI THIỆU Rủi ro từ sử dụng thường xuyên đời sống thực Theo [11], rủi ro định nghĩa “khả xảy kiện ngẫu nhiên, khơng thể đốn trước ảnh hưởng xấu đến kết dự kiến” Rủi ro gây lỗ hổng bên ngồi bên tránh thơng qua hành động phịng ngừa Phân tích rủi ro định nghĩa theo nhiều cách khác nhau, định nghĩa sử dụng rộng rãi cho phân tích rủi ro bao gồm: đánh giá rủi ro, tìm đặc trưng rủi ro, truyền thông rủi ro, quản lý rủi ro sách liên quan đến rủi ro Phân tích rủi ro định tính định lượng Phân tích rủi ro định tính sử dụng từ màu sắc để xác định đánh giá rủi ro đưa mô tả văn rủi ro, phân tích rủi ro định lượng tính tốn xác suất hậu xảy [4, 9] Rủi ro dự báo hiểu khả kết dự báo kiện khác xa, chí trái ngược với thực tế Trong [2, 4, 12] để đo lường định lượng, đánh giá mức độ không chắn dự báo (hay rủi ro dự báo) lớn hay nhỏ, người ta thường sử dụng metric khác nhau, metric sau phổ biến: (1) Kết hợp xác suất rủi ro với độ lớn/mức độ nghiêm trọng hậu quả; (2) Bộ ba (si, pi, ci), si kịch thứ i, pi xác suất kịch ci hệ kịch thứ i, i = 1,2, N; (3) Bộ ba (C ', Q, K), C' số hậu cụ thể, Q độ đo không chắn (thường xác suất) C’ K kiến thức hỗ trợ C' Q Nói cách khác dù sử dụng metric xác suất xảy kết dự báo sử dụng để đánh giá mức độ rủi ro dự báo Ký hiệu Y biến định lượng đo lường kiện kinh tế - xã hội (gọi biến đích), Xi (i =1, 2, …, n) biến đo lường yếu tố kinh tế - xã hội khác có ảnh hưởng đến thay đổi Y, gọi biến gốc Việc nhận biết giá trị và/hoặc xu hướng thay đổi tương lai biến đích Y dự báo thông qua biến Xi Dự báo sử dụng kỹ thuật dự báo định lượng (kỹ thuật thống kê kỹ thuật trí tuệ nhân tạo) [13] thực chất thừa nhận biến gốc quan hệ biến đích biến gốc tương lai thay đổi gần giống với quy luật chúng khứ Thừa nhận tượng thuộc lĩnh vực tự nhiên, phần lớn tượng thuộc lĩnh vực xã hội, lĩnh vực kinh tế - tài chính, có tham gia hoạt động người Hành vi người phụ thuộc nhiều vào yếu tố khó định lượng văn hóa, tâm lý dân tộc, đặc điểm tôn giáo, đặc điểm vùng miền,…, tâm trạng họ hoàn cảnh, thời điểm cụ thể Điều ngầm ý dự báo kinh tế - xã hội khó khăn Thực tế cho thấy sử dụng công cụ định lượng để dự báo kinh tế - xã hội chưa đủ để có kết dự báo xác cho dù cơng cụ định lượng có sở khoa học tốt đến đâu Vấn đề đánh giá mức độ rủi ro dự báo đặt từ năm 50 kỷ XX, vấn đề thời quan tâm thực dự báo giới thực Việc đánh giá rủi ro dự báo biến đích theo biến gốc thực theo cách sau: dựa vào biến đích chia tập liệu biến gốc thành số tập liệu gán nhãn cho tập (còn gọi xác định giá trị phân loại cho biến đích), xây dựng thuật tốn phân lớp tập liệu đầu vào theo nhãn xác định với liệu đầu vào (hay quan sát) biến gốc, thuật toán cho biết giá trị xác suất dự báo biến đích Y khơng thuộc thuộc vào lớp có nhãn xác định 468 MƠ PHỎNG VÀ PHÂN TÍCH RỦI RO DỰ BÁO TRÊN TẬP DỮ LIỆU SỐ CHIỀU CAO Hiện có nhiều kỹ thuật đánh giá rủi ro dự báo chia thành nhóm: kỹ thuật trí tuệ nhân tạo kỹ thuật thống kê Các kỹ thuật trí tuệ nhân tạo chủ yếu sử dụng để đánh giá rủi ro dự báo bao gồm: định xác suất, mạng nơron xác suất học mạng Bayes,… kỹ thuật đầu sử dụng phổ biến [15] Trong cấu trúc định, biểu diễn nhãn lớp, nhánh tượng trưng cho kết nối thuộc tính (hay biến gốc) dẫn đến nhãn lớp Trong định xác suất [3], kết nối thuộc tính gán giá trị xác suất có điều kiện theo quy tắc Bayes tính xác suất ứng với giá trị đầu vào cụ thể thuộc tính (hay biến gốc) Mạng nơtron xác suất (PNN) mạng nơron truyền thẳng, sử dụng rộng rãi vấn đề phân lớp nhận dạng mẫu Trong thuật toán PNN, hàm phân bố xác suất cha (PDF) lớp xấp xỉ cửa sổ Parzen hàm phi tham số [15] Xác suất lớp liệu đầu vào tính dựa vào sử dụng PDF lớp quy tắc Bayes Xác suất lớp cao sử dụng để phân bổ lớp cho liệu đầu vào [15] Trong đánh giá rủi ro dự báo, kỹ thuật trí tuệ nhân tạo thường cung cấp xác suất rủi ro dự báo với độ xác cao kỹ thuật có ưu, nhược điểm trình bầy chi tiết [13], theo nhược điểm đáng lưu ý kỹ thuật trí tuệ nhân tạo khơng đưa cơng thức tính xác suất rủi ro dự báo cách tường khơng đánh giá tác động yếu tố đầu vào đến xác suất dự báo hạn chế việc mơ phỏng, phân tích đề xuất giải pháp phòng ngừa rủi ro Các kỹ thuật thống kê sử dụng đánh giá rủi ro dự báo kể đến gồm: phân lớp Bayes, phân tích phân biệt (tuyến tính phi tuyến), hồi quy lơgit, …trong hai kỹ thuật xem hiệu sử dụng rộng rãi phân tích phân biệt hồi quy lơgit [6-7, 10, 14] Phân tích phân biệt nhằm phân quan sát mô tả giá trị biến liên tục (hay biến nhận giá trị số thực) thành lớp Thành viên lớp, xác định biến phân lớp dự báo biến liên tục cách ước tính khoảng cách Mahalanobis từ quan sát đến trung tâm (centroid) lớp Quan sát phân vào lớp gần xác suất tiên nghiệm thành viên lớp tính tính khoảng cách [10] Phân tích hồi quy lơgit nghiên cứu kết hợp biến đích (hay biến phụ thuộc) nhận giá trị phân loại tập biến gốc (hay biến giải thích) liên tục độc lập với Xác suất đo kết hợp sử dụng để đánh giá rủi ro dự báo Hồi quy lôgit bao gồm hồi quy lôgit đơn tên hồi quy lôgit đa tên Phương pháp hồi quy lôgit đơn tên (gọi tắt hồi quy lôgit) sử dụng biến phụ thuộc có hai giá trị phân loại Phương pháp hồi quy lơgit đa tên (gọi hồi quy có thứ tự), phát triển mở rộng phương pháp hồi quy lôgit, sử dụng biến phụ thuộc nhận nhiều giá trị phân loại Về chất hồi quy lôgit hồi quy thứ tự loại phân tích hồi quy sử dụng để dự đốn biến có thứ tự Nó coi vấn đề trung gian hồi quy lớp Cây định xác suất thuộc tính (biến gốc) liên tục (tức nhận giá trị số thực) gần với mô hình hồi quy lơgit So sánh phương pháp phân tích phân biệt họ hồi quy lơgit thấy phân tích phân biệt, lớp xác định trước cố định trong họ hồi quy lôgit, biến phân lớp ngẫu nhiên, nhiên hai kỹ thuật này, giá trị phân loại dự báo biến liên tục [8] Họ hồi quy lôgit đánh giá linh hoạt phù hợp cho việc mơ hình hóa hầu hết tình so với phân tích phân biệt hồi quy lơgit địi hỏi giả thiết tập liệu gốc Chẳng hạn trái với họ hồi quy lơgit, phân tích phân biệt hạn chế việc xử lý liệu ngoại lai; phân tích phân biệt địi hỏi biến gốc phải độc lập có phân phối chuẩn họ hồi qui lơgit địi hỏi tính độc lập; phân tích phân biệt địi hỏi kích cỡ lớp phải lớn số biến gốc họ hồi quy lôgit khơng có địi hỏi này, … Khi tập liệu đầu vào thỏa mãn đòi hỏi cần thiết để thực phân tích phân biệt xác suất dự báo kỹ thuật xấp xỉ [8] Các kỹ thuật phân tích phân biệt họ hồi quy lơgit địi hỏi biến gốc đầu vào phải độc lập với nhau, kỹ thuật phân lớp Bayes khơng địi hỏi điều kiện Nói cách khác biến gốc độc lập việc lựa chọn họ mơ hình hồi quy lơgit để xây dựng mơ hình mơ phân tích rủi ro dự báo lựa chọn xác hiệu nhất, trường hợp trái lại sử dụng phương pháp phân lớp Bayes Ngoài kỹ thuật phân tích phân biệt họ hồi quy lơgit mơ đánh giá rủi ro có ưu, nhược điểm kỹ thuật dự báo thống kê trình bầy chi tiết [13], hạn chế lớn kỹ thuật không thực tập liệu số chiều cao khơng tự động hóa tồn trình đánh giá rủi ro dự báo Những phân tích ưu, nhược điểm kỹ thuật đánh giá rủi ro dự báo gợi ý việc lựa chọn mơ hình hồi quy lơgit hồi quy có thứ tự để tính xác suất dự báo, mơ phân tích rủi ro dự báo tập liệu số chiều cao giới thực dường giải pháp phù hợp thời điểm khắc phục 02 hạn chế lớp mô hình hồi quy lơgit khơng thực tập liệu lớn biến gốc đòi hỏi phải biến độc lập Rất may, yêu cầu khắc phục ứng dụng phương pháp giảm chiều liệu tác giả báo đề xuất [13] Mục đích báo đề xuất khung lý thuyết để xây dựng mơ hình mơ phân tích rủi ro dự báo tập liệu số chiều cao biến gốc khơng có có tác động đến thay đổi biến đích; biến gốc khơng độc lập với nhau, chí cịn tương quan mạnh với nhau; tập liệu đầu vào có liệu ngoại lai (dữ liệu bất thường) Điểm mấu chốt khung lý thuyết trước hết phải thực kỹ thuật giảm chiều liệu để chuyển đổi tập liệu đầu vào có số chiều cao thành tập liệu số chiều thấp cho quan hệ biến đích Đỗ Văn Thành, Đỗ Đức Hiếu 469 biến gốc đầu vào bảo tồn nhiều có thể, đồng thời biến thay cho tập biến gốc đầu vào có tác động thực đến thay đổi biến đích chúng độc lập với Kỹ thuật giảm chiều liệu báo kết hợp kỹ thuật lựa chọn thuộc tính học thuộc tính theo cách tương tự [13] Điểm mấu chốt sử dụng kỹ thuật hồi quy lơgit hồi quy có thứ tự để xây dựng mơ hình dự báo phân lớp để thực mơ phân tích rủi ro dự báo Mơ hình dự báo cho biết xác suất việc dự báo sai xu hướng xác suất khác biệt kết dự báo biến đích theo tập biến gốc đầu vào ứng dụng mơ hình dự báo đề xuất [13] Việc phát xử lý liệu ngoại lai tập liệu thực q trình xây dựng mơ hình dự báo phân lớp Trong báo khung lý thuyết ứng dụng để xây dựng mơ hình dự báo, thực mơ phân tích rủi ro dự báo giá cổ phiếu dựa liệu thực kinh tế Phần lại báo cấu trúc sau, phần này, Phần II trình bầy cụ thể vấn đề đặt đề xuất phương pháp giải Phần III ứng dụng phương pháp đề xuất để mô phân tích rủi ro dự báo giá cổ phiếu tập liệu thực kinh tế cuối vài kết luận 2.1 Xác định vấn đề II XÁC ĐỊNH VẤN ĐỀ VÀ PHƢƠNG PHÁP GIẢI QUYẾT Ký hiệu Y biến đích, Xi (i =1, 2, …, n) biến gốc; Y Xi (i =1, 2, …, n) thuộc khơng gian Rm Nói cách khác Y, Xj biến véc tơ, YT = (yj), XiT = (xji), j =1, 2, …, m; (yj, x1j, x2j, …, xnj) gọi quan sát thứ j (hay trường hợp thứ j) biến Y, Xi, i =1, 2, …, n) Một số biến gốc Xi khơng có có tác động đến thay đổi Y; số biến gốc khác không độc lập với Giả sử số biến gốc n lớn Vấn đề đặt ra: xây dựng Mơ hình dự báo xác suất dự báo, mơ phân tích rủi ro dự báo biến đích Y theo tập biến gốc Xi (i =1, 2, …, n) 2.2 Khung lý thuyết dự báo Hình trình bầy cách tóm tắt khung lý thuyết q trình xây dựng Mơ hình dự báo xác suất dự báo, mơ phân tích rủi ro dự báo biến đích tập liệu số chiều biến cao biến gốc Quá trình gồm giai đoạn giảm chiều liệu tập liệu đầu vào xây dựng mô hình dự báo để tính xác suất dự báo, thực mơ phân tích rủi ro dự báo tập liệu 2.3 Pha 1: Giảm chiều liệu Phương pháp giảm chiều liệu báo hoàn toàn tương tự [13] nên không nhắc lại 2.4 Pha 2: Xây dựng Mơ hình dự báo xác suất, mơ phân tích rủi ro Rủi ro dự báo xẩy kết dự báo thuộc hướng trái ngược với liệu thực tế có khác biệt lớn kết dự báo với thực tế Ở trường hợp đầu hiểu giá trị dự báo biến đích khơng xu biến động khứ Ở trường hợp sau hiểu giá trị dự báo giá trị quan sát trước biến đích có khác biệt lớn phân thành k > mức độ khác biệt khác Khung lý thuyết xây dựng mơ hình mơ phân tích rủi ro dự báo cho trường hợp giống nhau, chúng khác chỗ thực gán nhãn (hay giá trị phân loại) k nhãn (k>2) cho giá trị biến gốc sử dụng mơ hình hồi quy lơgit mơ hình hồi quy có thứ tự để xây dựng Mơ hình dự báo xác suất, mơ phân tích rủi ro dự báo Cụ thể Khung lý thuyết minh họa Hình 2.4.1 Gán nhãn cho tập liệu đầu vào biến gốc Ký hiệu Z = {zi}, i =1, …, m biến nhãn lớp tập liệu đầu vào Ở trường hợp thứ ta chọn nhãn, chẳng hạn miền giá trị biến Z Khi Z ={zi} xác định theo biến đích Y = {yi}như sau: { với i >1 (1) Và vấn đề đặt ban đầu báo trở thành: xây dựng Mơ hình dự báo xác suất kết dự báo biến nhãn lớp Z nhận giá trị theo liệu xji biến gốc Xj, j =1, 2, …, n i quan sát thứ i Với trường hợp thứ 2, ta chọn nhãn 1, 2, …, K để gán cho biến nhãn lớp Z = {zi}, i = 1, …, m Khi miền giá trị Z 1, 2, …, K zi xác định dựa vào giá trị yi biến đích Y theo cách Chẳng hạn: (2) { 470 MƠ PHỎNG VÀ PHÂN TÍCH RỦI RO DỰ BÁO TRÊN TẬP DỮ LIỆU SỐ CHIỀU CAO 1< i ≤ m, ,  R Khi vấn đề đặt báo trở thành xây dựng Mơ hình dự báo xác suất kết dự báo biến nhãn lớp Z có giá trị h (h=1, 2, …, K) điều kiện biến gốc Xj nhận giá trị tương ứng xji, với j =1, 2, …, n i quan sát thứ i Pha 1:Giảm chiều liệu Giảm chiều liệu lần 1- Lựa chọn thuộc tính: Tìm tập thuộc tính Giảm chiều liệu lần - Học thuộc tính: Sinh tập thuộc tính Pha 2: Xây dựng mơ hình tính xác suất, mơ phân tích rủi ro dự báo Rủi ro kết dự báo xu Rủi ro khác biệt kết dự báo Gán nhãn cho tập liệu gốc Gán k nhãn cho tập liệu gốc Xây dựng mơ hình dự báo: Hồi quy logit (nominal) Xây dựng mơ hình dự báo: Hồi quy có thứ tự (multinominal) Đánh giá khả dự báo Đánh giá khả dự báo Dự báo tương lai, mô phân tích rủi ro dự báo Dự báo tương lai, mơ phân tích rủi ro dự báo Hình Khung lý thuyết mơ phân tích rủi ro dự báo tập liệu số chiều cao 2.4.3 Mơ hình hồi quy lơgit hồi quy có thứ tự a) Mơ hình hồi quy lơgit Giả sử biến gốc X1, X2,…, Xn biến độc lập Xác suất dự báo biến Z nhận giá trị nhãn ứng với liệu quan sát biến gốc Xi, ký hiệu Pr(Z=1| X1, X2, … Xn), xác định sau [5-6]: | (3) ∑ Các tham số  xác định cách ước lượng theo phương pháp cực đại hợp lý (maximum likelihood) [5] tập liệu đầu vào Ký hiệu p = | , thì: ln(odds) = ∑ (4) Phương trình (4) cho biết Xi tăng giảm đơn vị biến khác giữ nguyên odds tăng giảm %, ln(odds) =  tất biến độc lập Xi có giá trị 0, thực tế có trường hợp nên giải thích thường nhắc tới Tỷ số odds cho biết kiện Z =1 (hay biến đích tăng so với quan sát trước đó) xẩy lần so với kiến Z=0 (hay biến đích giảm so với quan sát trước đó) Rủi ro tỷ số odds: giả sử p0, p1 xác suất để Z =1 tương ứng quan sát k0 k1 Từ cơng thức (4) ta có: ln(odds(k0)) = Do ln(odds(k1)) - ln(odds(k0)) = ∑ ∑ ln(odds(k1)) = hay ∑ Đỗ Văn Thành, Đỗ Đức Hiếu 471 ∑ Giả sử (5) với j ≠ i, từ phương trình (5) nhận (6) Cơng thức (6) có nghĩa điều kiện yếu tố (biến) khác không đổi, biến tỷ số tăng/giảm lần xác suất để Z=1 quan sát k1 tăng/giảm đơn vị xác định công thức sau: (7) Công thức (6) (7) sử dụng để phân tích rủi ro dự báo b) Mơ hình hồi quy có thứ tự Giả sử biến gốc X1, X2,…, Xn biến độc lập; 1, 2, …, K nhãn lớp biến Z Xác suất dự báo biến Z nhận giá trị h ứng với liệu quan sát biến gốc Xi xác định phương trình (5) (6) [5-6]: | | ∑ ∑ ∑ ∑ ∑ (8) (9) tham số ước lượng phương pháp cực đại ước lượng hậu nghiệm (maximum a posteriori estimation), mở rộng phương pháp ước lượng cực đại hợp lý nêu [5]; h, q =1, K-1 c) Chẩn đốn làm phù hợp mơ hình dự báo Việc chẩn đốn làm phù hợp mơ hình hồi quy lơgit hồi quy có thứ tự thực tương tự mơ hình hồi quy nhiều biến [1, 10] Tuy nhiên thực số kiểm định thống kê khác kiểm định Andrews Hosmer-Lemeshow [1] lớp mơ hình lơgit để làm phù hợp mơ hình dự báo Trong trình ước lượng tham biến mơ hình dự báo cần ln kiểm tra phần dư để nhận biết có liệu ngoại lai tập liệu đầu vào hay không (bằng cách kiểm tra xem có quan sát có trị tuyệt đối phần dư vượt 1,5 lần giá trị tới hạn nó) Nếu có, cách thơng dụng hiệu sử dụng biến giả (dummy) để xử lý liệu bất thường số quan sát lớn Trường hợp số quan sát nhỏ sử dụng kỹ thuật làm trơn số liệu (như sử dụng phương pháp trung bình trượt có trọng số, phương pháp hồi quy, …) để xử lý liệu bất thường 2.4.4 Đánh giá khả dự báo Nhằm đánh giá khả dự báo mẫu mơ hình hồi quy lơ git mơ hình hồi quy có thứ tự, cần chia tập liệu đầu vào thành tập Tập thứ sử dụng để xây dựng mơ hình dự báo theo cơng thức (3) (5) (6) sau sử dụng mơ hình để tính xác suất dự báo thuộc lớp cho quan sát tập liệu thứ Các lớp “chính xác” nhận xác suất dự báo nhỏ giá trị “cắt” (cutoff) nằm (ngầm định 0.5) người dùng xác định nhãn lớp zi=0 xác suất dự báo lớn giá trị “cắt” nhãn lớp zi=1 2.4.5 Dự báo tương lai, mơ phân tích rủi ro dự báo a Dự báo tương lai Để đánh giá mức độ rủi ro tương lai kết dự báo biến đích cần: - Thực dự báo biến gốc X1, X2, …, Xn mô hình dự báo xây dựng theo phương trình (3) theo phương trình (8) (9) việc sử dụng mơ hình tự hồi quy AR(p) có xu xác định phương trình: ΔX(t) = α + ρX(-1) + γ1ΔX(-1) + …+ γp ΔX(-p) + δt + et, (10) đây: ΔX ký hiệu sai phân bậc X, t biến để đo số lượng quan sát - Thực ước lượng mơ hình dự báo tồn tập liệu ban đầu, sau sử dụng mơ hình để tính xác suất dự báo biến Z nhận giá trị theo nhãn ứng với giá trị biến gốc vừa dự báo, từ ta đánh giá khả rủi ro dự báo biến đích Y tương lai 472 MƠ PHỎNG VÀ PHÂN TÍCH RỦI RO DỰ BÁO TRÊN TẬP DỮ LIỆU SỐ CHIỀU CAO - Với giá trị khác biến gốc ta có kịch dự báo biến đích Các biến gốc dự báo mơ hình xây dựng theo phương trình (10) thừa nhận thay đổi biến gốc tương lai diễn gần giống khứ, kịch dự báo trường hợp gọi kịch sở b Mơ phân tích rủi ro dự báo Thực tế cho thấy nhiều trường hợp tương lai diễn khác xa q khứ, Khi dự báo biến đích kịch sở thường khác xa so với thực tế phương diện giá trị kết dự báo và/hoặc xu Mơ dự báo nhằm đánh giá tác động biến nhóm biến gốc đến kết dự báo biến đích so sánh với kịch sở, từ giúp nhận diện rủi ro dự báo xẩy tương lai để có biện pháp thích nghi phịng ngừa phù hợp Về chất mô dự báo cách dự báo giá trị biến gốc “nhạy cảm” cao thay đổi sách điều hành phủ, biến động tình hình kinh tế, trị, xã hội nước xây dựng theo giả định, biến gốc lại xem diễn gần giống khứ Trong ngữ cảnh tập liệu đầu vào chiều cao, việc tiến hành mô dự báo không nên thực thành phần (là biến thay cho tập biến gốc) mà phải thực tập biến gốc ban đầu III ỨNG DỤNG PHƢƠNG PHÁP 3.1 Bài toán cụ thể tập liệu đƣợc sử dụng để dự báo Giả sử biến đích Y biến giá cổ phiếu Cơng ty FPT tập biến gốc có tác động đến biến động giá cổ phiếu xác định theo cách tiếp cận [13] Cụ thể, biến số phản ánh điều kiện phát triển chung kinh tế gồm biến: Chỉ số phát triển Cơng nghiệp: IIP, dư nợ tín dụng: DUNO, lãi suất tiền gửi ngắn hạn: INT, tỷ giá hối đoái VNĐ USD: ER, kim ngạch xuất nhập Việt Nam theo tháng: EX IMP Các biến số liên quan đến biến động giá cổ phiếu FBT có 41 biến gồm: Giá 29 mã cổ phiếu cổ phiếu BULUECHIP (bài báo sử dụng mã cổ phiếu làm tên biến); Các số chứng khoán: VNINDEX, HNX, số chứng khoán 30 cổ phiếu BLUECHIP: VN30, số: UPCOM; Các số chứng khốn theo nhóm ngành, Cơng nghiệp: CNINDEX, Khống sản: KSINDEX, Ngân hàng: NHINDEX, Năng lượng: NLINDEX; Chỉ số gía tiêu dùng: CPI, số giá vàng: GOLDINDEX, số giá đô la Việt Nam: USINDEX; Các biến số phản ánh kinh tế- trị giới nước lớn, biến cố trị xuất đời kiện trị quan trọng gồm 04 biến, số chứng khoán NASDAD 100 NASDAD tổng hợp: NDX100 NDX_COM, số chứng khoán S&P500: SP500, giá giới dầu thô thị trường TEXAS- Mỹ: OIL; chưa có biến số phản ánh tâm lý nhà đầu tư vào công ty FPT, kỳ vọng lựa chọn mức giá để mua cổ phiếu nhà đầu tư nhà đầu tư có tổ chức, … Chi tiết biến nguồn sản sịnh liệu chúng tham khảo [13] Số liệu hầu hết biến số thu thập theo ngày kể từ ngày 2/01/2012 đến hết ngày 31/05/2017 giá trị trung bình theo ngày tháng biến số xem liệu tháng biến số Như tập liệu đầu vào để xây dựng mơ hình mơ phân tích rủi ro dự báo biến FPT liệu 65 quan cho 51 biến kinh tế - tài nêu 3.2 Giảm chiều liệu 3.2.1 Giảm chiều lần Phương pháp giảm chiều liệu tập liệu đầu vào báo hoàn toàn tương tự [13] Theo tập biến lựa chọn sử dụng thuật tốn ChonTapcon gồm biến có hệ số tương quan cao với biến đích FPT biến dư thừa [13] Tập biến Bảng dưới: Bảng Tập biến có ý nghĩa với biến FPT biến dư thừa 51 biến gốc Biến gốc Hệ số tƣơng quan Biến gốc Hệ số tƣơng quan Số TT Số TT CNINDEX 0.996 11 EX 0.778 SP500 VNINDEX 0.922 12 VNM 0.916 13 CII VSH 0.907 14 DUNO 0.890 HCM 0.869 GMD 10 Số TT Biến gốc Hệ số tƣơng quan 21 NHINDEX 0.584 0.763 22 HAG 0.752 23 UPCOM 0.498 CPI -0.742 24 FLC 0.494 15 OIL -0.738 25 GOLDINDEX 0.490 16 VN30 0.737 26 CTG 0.441 0.825 17 OGC -0.735 27 USDINDEX 0.414 MSN -0.807 18 KDC 0.699 28 IJC 0.319 EIB -0.784 19 CSM 0.675 PVT 0.781 20 BVH 0.598 -0.575 Đỗ Văn Thành, Đỗ Đức Hiếu 473 3.2.2 Giảm chiều lần 2: Thực phân tích PCA 28 biến gốc phản ánh với liệu 60 quan sát từ tháng 1/2012 đến tháng 12/2016 theo quy trình nêu [13], ta nhận Bảng Hình Theo ta cần chọn thành phần ứng với giá trị riêng lớn để làm đại diện cho tập biến gốc đầu vào thành phần giải thích đến 90.99% thay đổi tập liệu 51 biến gốc Ký hiệu thành phần tương ứng với giá riêng lớn giảm dần PC1, PC2, PC3, PC4, PC5 Hình Đồ thị giá tri riêng ma trận hệ số tương quan 28 biến gốc Bàng Các giá trị riêng tỷ lệ tích lũy 3.3 Xây dựng mơ hình dự báo, mơ phân tích rủi ro dự báo 3.3.1 Xây dựng mơ hình mơ phân tích rủi ro dự báo xu a Gán nhãn cho tập liệu gốc Việc gán nhãn cho tập liệu đầu vào thành phần dựa vào giá trị biến đích FPT cho 60 quan sát ứng với tháng từ tháng 1/2012 đến tháng 12/2016 thực theo công thức (1) Bây ta xây dựng mơ hình dự báo biến Z theo thành phần chọn PC1, PC2, PC3, PC4, PC5 biến gốc mà khơng sợ hồi quy sai thành phần trực giao nên chúng độc lập với b Xây dựng mơ hình dự báo Thực phương pháp hồi quy cực đại hợp lý biến Z theo thành phần theo cơng thức (3) tập liệu gồm 60 quan sát đầu tiên, đồng thời sử dụng kiểm định WALD [10] để kiểm tra xem biến thành phần nằm mơ hình dự báo cách có ý nghĩa thống kê, ta nhận được: (11) Pr (Z=1/PC1, PC2, PC3, PC4, PC5) = c Đánh giá khả dự báo Sử dụng mơ hình xác định theo cơng thức (11) tính xác suất dự báo để Z =1 cho quan sát từ tháng 1/2017 đến tháng 5/2017 với liệu thành phần PC1, PC2, PC3, PC4, PC5 Ta nhận Bảng 3: Bảng Xác suất dự báo để Z=1 tháng đầu năm 2017 Tháng 12/2016 36.4 Tần suất xuất Z =1 thực tế (%) 37/60 =0.617 Tháng 01/2017 38.28 38/61= 0.623 0.70139 38.59 39/62= 0.629 0.83404 Tháng 03/2017 39.55 40/63=0.635 0.88181 Tháng 04/2017 39.58 41/64=0.641 0.87105 41.29 42/65=0.646 0.88897 Quan sát Tháng 02/2017 Tháng 05/2017 FPT Pr(Z =1/PC1, PC2, PC3, PC4, PC5) 0.56208 474 MƠ PHỎNG VÀ PHÂN TÍCH RỦI RO DỰ BÁO TRÊN TẬP DỮ LIỆU SỐ CHIỀU CAO Bảng cho thấy xác suất để giá cổ phiếu FPT nằm xu hướng giá tháng sau cao tháng trước từ tháng 01/2017 đến tháng 05/2017 cao, tháng 1/2017, xác suất 70%, tháng thấp 83%, lại dều gần 90% Điều cho thấy lấy giá trị “cắt” 0.7 (hay 70%) quan sát ứng với tháng đầu năm 2017 phân vào lớp nhãn Z=1 (tức lớp có giá cổ phiếu FPT tháng sau cao tháng trước) Số liệu thực tế giá cố phiếu FPT cho thấy tháng này, giá cổ phiếu FPT nằm xu hướng tăng (hay Z=1) Cần lưu ý là; nói trên, ta khơng thể lấy tần suất quan sát có nhãn Z=1 (mặc dù cáo, 60%) để so sánh với xác suất để Z=1 quan sát xác suất cịn phụ thuộc vào giá trị cụ thể biến gốc PCi quan sát Chọn giá trị “cắt” 0.5, sử dụng mơ hình dự báo xây dựng tập liệu 60 quan sát để tính xác suất dự báo phục vụ cho việc phân lớp tất 65 quan sát từ tháng 1/2012 đến tháng 5/2017, ta nhận kết Bảng Bảng 4: Độ xác phân lớp theo giá trị “cắt” = 0.5 Z=0 Z=1 Tổng P(Z=1)0.5 10 35 45 Tổng 23 42 65 Chính xác 13 35 48 % Chính xác 56.52 83.33 73.85 % Không chinh xác 43.48 16.67 26.15 Từ bảng thấy rằng, với giá trị “cắt” khơng thiên vị phân lớp với nhãn cho độ xác cao với nhãn Khi giá trị cắt nhỏ 0.5 độ chinh xác phân lớp nhãn cao ngược lại độ xác phân lớp nhãn thấp Trái lại độ xác phân lớp nhãn giảm dần, nhãn tăng dần giá trị cắt gần đến d Dự báo, mơ phân tích rủi ro dự báo d1 Dự báo mức độ rủi ro kết dự báo theo xu Từ phương trình (11), để dự báo mức độ rủi ro (hay xác suất) kết dự báo giá cổ phiếu FPT theo xu thế, ta cần dự báo thành phần PC4, PC5 ước lượng theo phương trình (10) sau: d(PC4) = -0.194*PC4(-1) + 0.359*d(PC4(-1)) + 0.293*d(PC4(-4)) + 0.223*d(PC4(-11)) Std: (0.065) (0.131) (0.128) (12) (0.101) R : 0.28; DW: 1.93; SMPL: 54, sau điều chỉnh trễ d(PC5) = -0.33*PC5(-1) + 0.45*D(PC5(-1)) + 0.27*D(PC5(-3)) + 0.27*D(PC5(-5)) + 0.31*D(PC5(-10)) Std: (0.079) (0.125) (0.134) (0.117) (0.098) - 0.44*D2015M07 + 0.49*D2016M08 (0.181) (13) (0.180) R : 0.47; DW: 1.95; SMPL: 54, sau điều chỉnh trễ Với 51 biến gốc hoàn toàn tương tự báo này, báo [13] cung cấp kết dự báo giá cổ phiếu FPT sai số trung bình tháng 6, 7, năm 2017 thực dự báo khả xẩy rủi ro kết dự báo theo phương trình (12) (13) ta nhận Bảng dưới: Bảng Dự báo khả xẩy rủi ro kết dự báo theo xu Tháng 5/2017 Tháng 6/2017(f) Tháng 7/2017(f) Tháng 8/2017(f) Giải thích/Nguồn PC4 1.635 1.460 1.177 1.101 Biến gốc (f) PC5 0.499 0.614 1.090 0.721 Biến gốc (f) FPT 41.29 41.451 41.147 41.068 [13] Sai số trung bình +/- 1.582 +/- 1.565 +/- 1.561 Sai số trung bình (%) +/- 3.82 +/- 3.80 +/- 3.80 [13] 0.888 0.908 0.875 (f): Dự báo Pr (Z=1/ PC1,…,PC5) 0.889 Từ Bảng ta nhận được: giá cổ phiếu cơng ty FPT tháng 6, 7, là: [41.290, 41.451+1.582] [41.451, 41.147+1.565] [41.147, 41.068 + 1.561] với xác suất xẩy tương ứng 0.888, 0.908 Đỗ Văn Thành, Đỗ Đức Hiếu 475 0.875 khoảng [41.451-1.582, 41.451+1.582] [41.147-1.565, 41.147+1.565] [41.068 - 1.561, 41.068 + 1.561] theo Bài báo [13] Khả giá cổ phiếu FPT không nằm khoảng nêu ứng với tháng 6, 7, năm 2017 vào khoảng 10% Như việc tính xác suất rủi ro dự báo theo xu hỗ trợ làm thu hẹp khoảng dự báo giá cổ phiếu d2 Mô phân tích rủi ro dự báo Kết dự báo giá cổ phiếu FPT Bảng xẩy với xác suất khoảng 0.9 (hay 90%) tháng 6,7,8 năm 2017 khơng có biến động đặc biệt kinh tế, trị, xã hội nước ngồi nước, thay đổi sách điều hành kinh tế Chính phủ Ngược lại rủi ro dự báo xẩy Nhằm phát lường trước tác động rủi ro này, cần thực mơ dự báo Có vơ vàn kịch mô dự báo giá cổ phiếu FPT Trong báo thực mô minh họa điển hình Phân tích 28 biến gốc có tác động đến thay đổi FPT, ta thấy có biến liên quan trực tiếp đến sách điều hành Chính phủ dư nợ tín dụng: DUNO, giá giới dầu thơ: OIL số chứng khốn S$P500: SP500 biến mà thay đổi chúng nhiều trường hợp không theo quy luật khứ Trong kịch mô này, ta giả sử tháng 6, 7, năm 2017 dư nợ tín dụng giảm 1% tháng, giá dầu thô tăng 2%/ tháng số chứng khoán SP500 tăng 2%/tháng, biến khác diễn cách bình thường Thế điều xẩy xu tăng/giảm giá cổ phiếu FPT ? Thực dự báo 25 biến gốc khác trừ biến nêu phương pháp hồi quy nhiều biến mơ hình dự báo ước lượng theo phương trình (10) tháng 6, 7, năm 2017 tính thành phần tháng nêu, sau tính xác suất để biến đích FPT có xu hướng tăng theo phương trình (11), ta nhận kết Bảng Bảng 6: Xác suất để giá FPT có xu hướng tăng KBMP KB sở PC1 PC2 PC3 PC4 PC5 Pr (Z=1/ PC1,…,PC5) Pr (Z=1/ PC1,…,PC5) KBMP so với KBCS Tháng 6/2017 7.352 -0.625 0.26 1.319 0.483 0.888 0.88983 0.00183 Tháng 7/2017 7.754 -0.695 0.274 1.392 0.873 0.908 0.91113 0.00313 Tháng 8/ 2017 7.941 -0.484 -0.262 1.191 0.663 0.875 0.88132 0.00632 Ghi chú/Nguồn Kịch mô KBMP KBMP KBMP KBMP Kịch sở KBMP Bảng cho thấy Chính phủ hạn chế dư nợ tín dụng, giá giới dầu thô số giá chứng khốn S&P500 có xu hướng tăng xác suất để giá cổ phiếu FPT có xu hướng tăng giá Mức độ tăng giá cổ phiếu FPT phụ thuộc vào mức độ giảm tăng cụ thể tương ứng dư nợ tín dụng, giá dầu thơ số chứng khoán S&P500 3.3.2 Xây dựng mơ hình mơ phân tích rủi ro khác biệt kết dự báo a Gán nhãn cho tập liệu gốc Việc phân chia 60 quan sát tập liệu đầu vào thành lớp với nhãn từ đến dựa vào giá trị cổ phiếu FPT theo công thức (2) sau: { Z = { } biến nhãn lớp, i quan sát thứ i, i = 1, …, 60 476 MÔ PHỎNG VÀ PHÂN TÍCH RỦI RO DỰ BÁO TRÊN TẬP DỮ LIỆU SỐ CHIỀU CAO b Xây dựng mơ hình dự báo Mơ hình dự báo xác suất xẩy lớp ước lượng theo mơ hình hồi quy có thứ tự (8), (9) với biến PCi (i=1, 2, …,5) biến gốc thay cho 51 biến gốc ban đầu 60 quan sát sau: Pr (Z=1/PC1, ,PC5) = Pr (Z=2/PC1, ,PC5) = - Pr (Z=3/PC1…,PC5) = - Pr (Z=4/PC1, ,PC5) = - Pr (Z=5/PC1…,PC5) = - Pr (Z=6/PC1,…,PC5) = 1- (14) c Đánh giá khả dự báo mơ hình Việc đánh giá khả dự báo mơ hình hồi quy có thứ tự tương tự mơ hình hồi quy loogit, nên mục bỏ qua d Dự báo, mơ phân tích rủi ro Tương tự mơ hình hồi quy logit, mục giới thiệu kịch dự báo Kịch sở (KBCS) Kịch mô (KBMP) giả sử giả định tương tự trường hợp mơ phân tích rủi ro dự báo xu Khi xác suất dự báo để phân lớp cho tháng 6, 7, năm 2017 theo liệu đầu vào hai kịch cho Bảng Bảng 7: Hai kịch xác suất dự báo thuộc lớp theo liệu đầu vào tháng 6,7,8/2017 Dự báo giá cổ phiếu FPT Tháng 6/2017 Tháng 7/2017 Tháng 8/2017 Ghi Thấp 41.290 41.451 41.147 Do kết hợp kết dự báo [13] xác suất dự báo theo xu Cao 43.033 42.712 42.629 Kết dự báo [13] Pr (Z=1/PC1, ,PC5) 0.0507 0.0418 0.0598 KBCS Pr (Z=2/PC1, ,PC5) 0.0642 0.0541 0.0741 KBCS Pr (Z=3/PC1, ,PC5) 0.1157 0.1007 0.1291 KBCS Pr (Z=4/PC1, ,PC5) 0.1391 0.1272 0.1482 KBCS Pr (Z=5/PC1, ,PC5) 0.1697 0.1650 0.1712 KBCS Pr (Z=6/PC1, ,PC5) 0.4606 0.5112 0.4175 KBCS -0.0006 -0.0011 -0.0024 KBMP-KBCS Pr (Z=2/PC1, ,PC5) -0.0006 -0.0013 -0.0025 KBMP-KBCS Pr (Z=3/PC1, ,PC5) -0.0009 -0.0019 -0.0033 KBMP-KBCS Pr (Z=4/PC1, ,PC5) -0.0007 -0.0017 -0.0021 KBMP-KBCS Pr (Z=5/PC1, ,PC5) -0.0002 -0.0009 -0.0001 KBMP-KBCS Pr (Z=6/PC1, ,PC5) 0.0029 0.0068 0.0104 KBMP-KBCS KBMP so với KBCS Pr (Z=1/PC1, ,PC5) Đỗ Văn Thành, Đỗ Đức Hiếu 477 FPT thuộc vào lớp giá tháng sau tăng cao 5% so với tháng trước tăng, xác suất để giá cổ phiếu FPT tăng giảm theo mức độ khác giảm Kết dự báo giá cổ phiếu FPT [13], kết hợp với xác suất dự báo giá cổ phiếu FPT tăng/giảm theo xu mục 4.3.1 làm thu hẹp khoảng dự báo giá cổ phiếu FPT, việc tính xác suất dự báo thuộc lớp tập liệu đầu vào tháng 6,7,8 năm 2017 theo kịch sở kịch mơ trình bầy Bảng góp phần làm thu hẹp khoảng dự báo nữa, đồng thời cho biết chi tiết mức độ rủi ro kết dự báo IV KẾT LUẬN Bài báo đề xuất khung lý thuyết để dự báo, mô phân tích rủi ro dự báo ngữ cảnh tập liệu biến gốc đầu vào để phục vụ dự báo có số chiều cao, tập biến gốc đầu vào có biến khơng có ý nghĩa tác động đến thay đổi biến đích và/hoặc khơng cần thiết phải quan tâm dự báo biến đích (biến dư thừa) Việc giảm chiều liệu báo hoàn toàn tương tự [13] sử dụng đồng thời kỹ thuật lựa chọn thuộc tính bới thuật tốn đề xuất [13] kỹ thuật học thuộc tính PCA nhằm đảm bảo khơng giảm chiều, loại bỏ biến gốc ý nghĩa dư thừa, mà cịn bảo tồn nhiều quan hệ biến gốc biến đích Họ mơ hình hồi quy lơgit đề xuất báo xem giải pháp phù hợp, hiệu thời điểm việc xây dựng mơ hình dự báo, mơ phân tích rủi ro dự báo biến đích lĩnh vực kinh tế - xã hội Bài báo thực hành ứng dụng phương pháp đề xuất việc xây dựng mô hình dự báo xác suất kết dự báo giá cổ phiếu FPT thuộc lớp theo tập liệu đầu vào biến gốc Việc thực hành mô xác suất dự báo theo kịch khác tập liệu gốc đầu vào giúp nhà đầu tư thu hẹp khoảng dự báo giá cổ phiếu FPT đồng thời nhận biết mức độ rủi ro xẩy Những kết phân tích thực có ích việc định nhà đầu tư cổ phiếu Kết nghiên cứu báo báo [13] xem nghiên cứu hoàn chỉnh dự báo giá phân tích rủi ro dự báo giá, tốn xem khó lĩnh vực dự báo kinh tế - xã hội TÀI LIỆU THAM KHẢO [1] Allison, P D (2014) Measures of Fit for Logistic Regression, Statistical Horizons LLC and the University of Pennsylvania, working paper: 1485 [2] Aven, T et all (2015) Risk Analysis Foundations, Society of Risk Analysis [3] Barros, R C., Basgalupp, M P., Carvalho, A C P L F., Freitas, Alex A (2011) A Survey of Evolutionary Algorithms for Decision-Tree Induction IEEE Transactions on Systems, Man and Cybernetics, Part C: Applications and Reviews, vol 42, n 3, p 291-312, May 2012 [4] Berg, H P (2010) Risk management: procedures, methods and experiences, RT&A # 2(17), (Vol.1) 2010, June [5] Hosmer, D.W., Lemeshow, S (2000) Applied Logistic Regression, New York, USA: John Wiley and Sons [6] McFarland, H R and Richards D St P (2002) Exact Misclassification Probabilities for Plug-In Normal Quadratic Discriminant Functions, II The Heterogeneous Case, Journal of Multivariate Analysis, 2002, vol 82, issue 2, pages 299-330 [7] Piesse, J and Lin, L (2004) Financial risk assessment in takeovers: The effect on bidder firm shareholders’ wealth, Research Paper 028, The Management Centre, King's College, University of London [8] Pohar, M., Blas, M., Turk, S (2004) Comparison of Logistic Regression and Linear Discriminant Analysis: A Simulation Study, Metodološki zvezki, Vol 1, No 1, 2004, 143-161 [9] Rausand, M (2011) Risk Assessment: Theory, Methods, and Applications, Society of Risk Analysis [10] Simar W L (2007) Applied Multivariate Statistical Analysis, Springer Berlin Heidelberg, pp 289–303 [11] Stoica, C R and Constantin, B (2012) The assessment of risks that threaten a project, Economy transdisciplinarity cognition, Vol.15, Issue 2/2012 [12] Tixier, J., Dusserre, G., Salvi, O., Gaston D (2014) Review of 62 risk analysis methodologies of industrial plants, HAL Id: ineris-00961858, https://hal-ineris.ccsd.cnrs.fr/ineris-00961858 [13] Thành D V (2017), Dự báo giá cổ phiếu ngữ cảnh liệu số chiều cao, Bài gửi hội nghị FAIR X, Đà Năng 17-18/8/2017 [14] Yu, H F ; Huang, F L., Lin, C J (2011) Dual coordinate descent methods for logistic regression and maximum entropy models, Machine Learning, 85: 41–75 doi:10.1007/s10994-010-5221-8 [15] Zhang, Y (2009) Remote-sensing Image Classification Based on an Improved Probabilistic Neural Network, Sensors, (9): 7516–7539, doi:10.3390/s90907516 478 MƠ PHỎNG VÀ PHÂN TÍCH RỦI RO DỰ BÁO TRÊN TẬP DỮ LIỆU SỐ CHIỀU CAO SIMULATION AND ANALYSIS OF FORECAST RISKS ON HIGH DIMENSIONAL DATA SET Thanh Do Van1 and Hieu Do Duc2 1: Departement of Information Technology, Nguyen Tat Thanh University, dvthanh@ntt.edu.vn 2: Departement of Information and Communication Technology, University of Science and Technology of Hanoi, Vietnamese Academy of Science and Technology, vincentdo2310@gmail.com ABSTRACT: Using quantitative models for forecast means that the future is assumed to close to the present and the past But the reality is not so therefore the forecasts are always difficult and there are many cases the forecast results are far different, even are opposed to the fact even though the forecast model is carefully diagnosised and tested, and assessed as goodness - of - fit This phenomenon is called forecast risks The forecast risk is often measured by the probability of its occurrence The purpose of this paper is to propose a theoretical framework for simulation and analysis of forecast risks in the context that the factors affecting the problem (or the target variable) needed to be forecasted are very large The paper uses data dimension reduction techniques to transfer high-dimensional data sets (number of original variables and/or number of observations is huge) into low-dimensional data sets so that the relationships between the target variable and the original variables change as little as possible and basically the low-dimensional data sets reflect rather fully information in the high-dimensional data sets At the same time the paper uses also the logistic regression model or the ordered regression model to build models for caculating forecast probabilities under trends or under different levels of forecast results The paper applies the proposed methodology in the economic-financial field Keyword: dimentionality reduction, high-dimensional data, simulation of forecast risk, risk analysis, logistic and odered regression ... Đánh giá khả dự báo Dự báo tương lai, mô phân tích rủi ro dự báo Dự báo tương lai, mơ phân tích rủi ro dự báo Hình Khung lý thuyết mơ phân tích rủi ro dự báo tập liệu số chiều cao 2.4.3 Mơ hình hồi... độ rủi ro kết dự báo IV KẾT LUẬN Bài báo đề xuất khung lý thuyết để dự báo, mô phân tích rủi ro dự báo ngữ cảnh tập liệu biến gốc đầu vào để phục vụ dự báo có số chiều cao, tập biến gốc đầu vào... gốc vừa dự báo, từ ta đánh giá khả rủi ro dự báo biến đích Y tương lai 472 MƠ PHỎNG VÀ PHÂN TÍCH RỦI RO DỰ BÁO TRÊN TẬP DỮ LIỆU SỐ CHIỀU CAO - Với giá trị khác biến gốc ta có kịch dự báo biến

Ngày đăng: 06/08/2022, 08:52

Xem thêm:

TÀI LIỆU CÙNG NGƯỜI DÙNG

  • Đang cập nhật ...

TÀI LIỆU LIÊN QUAN

w