Mục đích của bài báo này là trình bầy việc sử dụng phát hiện các luật kết hợp âm dương mở rộng phân biệt để phân tích quan hệ kết hợp của chỉ số chứng khoán VNINDEX với một số biến kinh tế - tài chính và chỉ số chứng khoán quốc tế khác.
Kỷ yếu Hội nghị KHCN Quốc gia lần thứ XI Nghiên cứu ứng dụng Công nghệ thông tin (FAIR); Hà Nội, ngày 09-10/8/2018 DOI: 10.15625/vap.2018.00055 PHÂN TÍCH THỊ TRƯỜNG CHỨNG KHỐN VIỆT NAM BẰNG SỬ DỤNG LUẬT KẾT HỢP ÂM DƯƠNG MỞ RỘNG PHÂN BIỆT Đỗ Văn Thành1, Phạm Ngọc Lâm2 Khoa Công nghệ thông tin, Trƣờng Đại học Nguyễn Tất Thành Khoa Hệ thống thơng tin quản lý, Trƣờng Đại học Tài chính-kế tốn dvthanh@ntt.edu.vn, pnlamqn@yahoo.com TÓM TẮT: Luật kết hợp âm dương hiểu từ trước đến có nhiều hạn chế để biểu diễn quan hệ đối tượng giới thực Một dạng luật kết hợp tổng quát gọi luật kết hợp âm dương mở rộng vượt qua hạn chế Nhưng khơng may, khó xây dựng thuật toán hiệu để phát tương đối đầy đủ luật Trong luật kết hợp âm dương mở rộng, luật vế phải gồm mục liệu dương âm gọi luật kết hợp âm dương mở rộng phân biệt có ý nghĩa ứng dụng cao kinh tế tài việc sử dụng phát luật có nhiều hứa hẹn trở thành giải pháp hiệu dự báo lớp việc lựa chọn tập biến đắt giá để giảm chiều liệu Thuật toán phát luật luật kết hợp âm dương mở rộng phân biệt từ sở liệu tác vụ chứa mục liệu dương đề xuất Mục đích báo trình bầy việc sử dụng phát luật kết hợp âm dương mở rộng phân biệt để phân tích quan hệ kết hợp số chứng khoán VNINDEX với số biến kinh tế - tài số chứng khoán quốc tế khác Các luật kết hợp phát cho thấy hạn chế luật kết hợp âm dương, phù hợp chúng phân tích kết hợp thuộc lĩnh vực kinh tế - tài quan hệ nhân biểu diễn luật kết hợp âm dương mở rộng phân biệt có nhiều điểm tương đồng với quan hệ nhân Granger, quan hệ quan tâm sử dụng phân tích kinh tế lượng vĩ mơ Từ khóa: Thị trường chứng khốn, phân tích kết hợp, luật kết hợp âm dương, luật kết hợp phân biệt, quan hệ nhân I GIỚI THIỆU Thị trƣờng chứng khoán kênh thu hút vốn đầu tƣ quan trọng kinh tế Phân tích dự báo thị trƣờng chứng khốn ln đƣợc quan tâm nghiên cứu ứng dụng Hiện hình thành nhiều kỹ thuật phân tích dự báo thị trƣờng chứng khoán khác [14, 18] bao gồm mạng nơron nhân tạo, mơ hình Markov, hệ suy luận mờ (Neuro Fuzzy), giải thuật di truyền, phân tích chuỗi thời gian phân tích chuỗi thời gian mờ, phƣơng pháp hồi quy, lý thuyết tập thô, phát luật kết hợp,… nhƣ kết hợp số kỹ thuật phân tích dự báo thị trƣờng chứng khốn Phân tích kết hợp nhằm tìm mối quan hệ kết hợp biến luật kết hợp thƣờng đƣợc sử dụng [15] Trong trƣờng hợp thị trƣờng chứng khoán, ngƣời ta sử dụng luật kết hợp để biểu diễn mối quan hệ biến động giá chung thị trƣờng (hay số thị trƣờng chứng khoán) với giá cổ phiếu đƣợc niêm yết thị trƣờng yếu tố nƣớc, nƣớc khác có tác động đến biến động thị trƣờng [11] Có thể thấy luật kết hợp đƣợc sử dụng để phân tích kết hợp luật kết hợp dƣơng [2, 11-13, 15, 19, 21] luật kết hợp âm dƣơng [3-7, 9-10, 16-17, 20] Các luật kết hợp âm dƣơng tổng quát so với luật kết hợp dƣơng nhƣng có số hạn chế việc thể mối quan hệ đối tƣợng giới thực Chẳng hạn, thị trƣờng chứng khốn, thƣờng có tƣợng gia tăng lợi suất số cổ phiếu giảm lợi suất số cổ phiếu nguyên nhân làm giảm lợi suất số cổ phiếu khác làm tăng lợi suất số cổ phiếu khác Các luật kết hợp âm dƣơng nhƣ đƣợc hiểu biểu diễn đƣợc tƣợng nhƣ Chúng đề xuất loại luật kết hợp tổng quát luật kết hợp âm dƣơng nhƣ đƣợc hiểu từ trƣớc đến chúng đƣợc gọi luật kết hợp âm dƣơng mở rộng Việc xây dựng thuật toán khả thi hiệu để phát đƣợc luật kết hợp âm dƣơng mở rộng khó khăn phức tạp Thực tế đề xuất đƣợc thuật toán phát luật nhƣ q trình đƣợc lập trình thực nghiệm đánh giá Trong nghiên cứu trƣớc đó, chúng tơi tập trung phát triển thuật toán phát luật kết hợp âm dƣơng mở rộng vế phải luật gồm mục liệu dƣơng mục liệu với âm đƣợc gọi luật kết hợp âm dƣơng mở rộng phân biệt Các luật nhƣ có ý nghĩa ứng dụng thực tế xây dựng mô hình dự báo trong việc lựa chọn tập biến tối ƣu thực kỹ thuật giảm chiều liệu nhƣ việc xây dựng thuật toán phân lớp liệu đầu vào Thuật toán dự báo phân lớp sử dụng phát luật kết hợp âm dƣơng mở rộng phân biệt tập liệu lớn đƣợc chúng tơi thực nghiệm Thuật tốn tích hợp việc giảm chiều liệu, phát luật kết hợp âm dƣơng mở rộng phân biệt, loại bỏ luật kết hợp dƣ thừa sử dụng luật để dự báo lớp liệu đầu vào Kết thực nghiệm thuật toán số tập liệu liên tục (các biến nhận giá trị số) tập liệu phân Đỗ Văn Thành, Phạm Ngọc Lâm 423 loại (các biến nhận giá trị phân loại) cho thấy tỷ lệ đƣợc phân lớp liệu đầu vào độ xác phân lớp sử dụng phát luật kết hợp kết hợp âm dƣơng mở rộng phân biệt nói chung cao so với sử dụng phát luật kết hợp âm dƣơng nhƣ đƣợc hiểu đến sử dụng 13 thuật toán phân lớp tiếng thông dụng khác nhƣ: thuật toán định C4.8, Rừng ngẫu nhiên (Random forest) Cây ngẫu nhiên (Random tree); Bayes ngây thơ (NaiveBayes) mạng Bayes (BayesNet), Mạng Nơron nhận thức đa tầng (Multilayer perceptron neural network); hồi quy logistic máy Vector hỗ trợ với hàm hạt nhân tuyến tính (SMO); thuật toán Adaboost; thuật toán phân lớp đa lớp; thuật toán bảng định (Decision Table), ZeroR oneR Để khẳng định luật kết hợp âm dƣơng mở rộng phân biệt kỹ thuật dự báo lớp có giá trị chúng tơi cần tiếp tục thực nghiệm thuật tốn tập liệu lớn có cấu trúc khác nhau, bao gồm tập liệu cân khơng cân Mục đích báo trình bày kết ứng dụng thuật tốn phát luật kết hợp âm dƣơng mở rộng phân biệt để phân tích thị trƣờng chứng khốn Việt Nam, cụ thể ứng dụng thuật tốn để tìm quan hệ kết hợp biến kinh tế-tài nƣớc số số chứng khoán quốc tế có tác động đến biến động số VNINDEX Yếu tố hay luật [15] đƣợc xem xét để thấy rõ mối quan hệ kết hợp độ tin cậy kết luận đƣợc rút từ luật kết hợp âm dƣơng mở rộng phân biệt phát đƣợc Cấu trúc báo nhƣ sau: phần tiếp theo, trình bày khái niệm phƣơng pháp phát luật kết hợp âm dƣơng mở rộng hay không dƣ thừa; phần III giới thiệu tập liệu nghiên cứu việc phát luật kết hợp âm dƣơng mở rộng từ tập liệu này; phần IV phân tích luật kết hợp âm dƣơng mở rộng phát đƣợc; phần V trình bầy số thảo luận nghiên cứu báo phần VI cuối gồm số tài liệu tham khảo II PHƢƠNG PHÁP 2.1 Một số kiến thức chuẩn bị Phát luật kết hợp đƣợc Agrawal cộng đề xuất lần đầu năm 1993 trở thành lĩnh vực khai thác liệu quan trọng [1] Khái niệm chung luật kết hợp truyền thống nhƣ sau: cho G = {X1, X2,…, Xn} tập hợp tất mục liệu tập giao dịch D Một tập hợp mục liệu đƣợc gọi tập mục liệu (itemset) Số lƣợng mục liệu tập mục liệu chiều dài T đƣợc gọi giao dịch T ⊆ G đƣợc liên kết với mã định danh TID Một giao dịch T đƣợc cho chứa tập mục liệu A A ⊆ T Một luật kết hợp kéo theo dạng A => B, A ⊆ G, B ⊆ G A ∩ B = ∅ [1] Độ hỗ trợ A, ký hiệu Supp (A), tỷ lệ số lƣợng giao dịch D chứa A tổng số lƣợng giao dịch D Độ hỗ trợ luật A => B, ký hiệu Supp (A => B), Supp (A ∪ B) Độ tin cậy luật, ký hiệu Conf (A => B), đƣợc xác định Conf (A => B) = Supp (A ∪ B)/Supp (A) Độ hỗ trợ độ tin cậy hai tham số quan trọng thuật toán phát luật kết hợp Nói chung, tham số đƣợc xác định ngƣời sử dụng Các luật kết hợp truyền thống đƣợc gọi luật kết hợp dƣơng [3-7, 9-10, 16-17, 19] Vấn đề phát luật kết hợp dƣơng từ tập giao dịch D tìm luật kết hợp có độ hỗ trợ độ tin cậy lớn ngƣỡng tối thiểu định Các luật kết hợp tìm đƣợc đƣợc gọi luật kết hợp hiệu lực (valid) Một mục liệu với âm đƣợc định nghĩa ¬xi, có nghĩa mục liệu xi khơng xuất giao dịch T Độ hỗ trợ ¬xi Supp (¬xi) = - Supp (xi), xi mục liệu xuất giao dịch đƣợc gọi mục liệu dƣơng [3-7, 9-10, 16-17, 20] Luật kết hợp âm luật vế trái vế phải luật phải chứa mục liệu với âm Chí phí để tìm đƣợc luật nhƣ đắt số lƣợng mục liệu lớn Hiện ngƣời ta đề xuất đƣợc nhiều thuật tốn tìm luật kết hợp âm dƣơng từ sở liệu tác vụ gồm mục liệu dƣơng [4-5, 7, 9-10, 12, 20, 22] Đáng ý tất thuật toán này, luật kết hợp âm đƣợc xem xét dạng sau: ¬A => B, A => ¬B ¬A => ¬B, A, B tập mục liệu dƣơng A ∩ B = ∅ [4-5,7, 9-10, 12, 20], ¬A ký hiệu tập mục liệu A với âm Và nhƣ thuật toán phát luật kết hợp âm dƣơng tìm đƣợc luật dạng luật sau: A => B, ¬A => B, A => ¬B ¬A => ¬B, A ∩ B = ∅ Một số khái niệm dƣới cần thiết để hiểu rõ luật kết hợp âm dƣơng mở rộng luật kết hợp âm dƣơng mở rộng phân biệt đƣợc trình bầy báo Định nghĩa 1: Luật kết hợp âm dƣơng mở rộng luật kết hợp dạng r = ¬A ∪ B => ¬C ∪ D, trong hai tập ¬A B nhƣ hai tập ¬C D khác rỗng tập mục liệu dƣơng A, B, C D đôi khơng giao Nhận xét: thấy nếu¬A = ¢, ¬C = ¢, B ≠ ¢ D ≠ ¢ r luật kết hợp dƣơng, (¬A ≠ ¢, ¬C = ¢, B = ¢ D ≠ ¢) (¬A ≠ ¢, ¬C ≠ ¢, B = ¢ D = ¢) (¬A = ¢, ¬C ≠ ¢, B ≠ ¢ D = ¢) r luật kết hợp âm Nhƣng số tập hợp ¬A, ¬C, B D khác rỗng r khơng phải luật kết hợp dƣơng nhƣ luật kết hợp âm 424 PHÂN TÍCH THỊ TRƢỜNG CHỨNG KHỐN VIỆT NAM BẰNG SỬ DỤNG LUẬT KẾT HỢP ÂM DƢƠNG… Định nghĩa 2: Luật kết hợp âm dƣơng mở rộng ¬A ∪ B => ¬C ∪ D đƣợc gọi luật hiệu lực (i) Supp(¬A ∪ B => ¬C ∪ D) ≥ minSup; (ii) Conf (¬A ∪ B X' ⊆ X cho Supp (¬X' ∪ B => ¬C ∪ D) ≥ minSup ¬ ∪ ) ≥ minConf; (iii) Nếu X = ¬A khơng tồn Định nghĩa 3: Luật kết hợp âm dƣơng mở rộng phân biệt luật kết hợp âm dƣơng mở rộng mà vế phải luật có mục liệu dƣơng mục liệu với âm Định nghĩa 4: [12]: Giả sử r1, r2 luật kết hợp âm dƣơng mở rộng, r1 đƣợc cho có độ ƣu tiên cao r2 (ký hiệu ≽) nếu: 1) Độ tin cậy r1 lớn r2, 2) Độ tin cậy chúng nhƣ nhau, nhƣng độ hỗ trợ r1 lớn r2, 3) Cả hai độ tin cậy độ hỗ trợ r1 r2 nhƣ nhau, nhƣng r1 đƣợc sinh sớm r2 Quan hệ “≽” đƣợc sử dụng để xếp luật kết hợp mở rộng Nhƣ biết phần lớn trƣờng hợp tập liệu đầu vào, để phát đƣợc luật kết hợp âm nói chung độ hỗ trợ minSup cần phải đủ nhỏ số lƣợng luật kết hợp hiệu lực lớn chí độ tin cậy cực tiểu minConf cao Vì vấn đề loại bỏ luật kết hợp ý nghĩa sử dụng luật khác (đƣợc gọi luật dƣ thừa) trình phát luật kết hợp âm dƣơng mở rộng hiệu lực cần phải đƣợc đặt Các luật kết hợp dƣ thừa đƣợc định nghĩa nhƣ sau: Định nghĩa 5: Luật kết hợp âm dƣơng mở rộng hiệu lực r = A => B đƣợc gọi luật dƣ thừa tồn luật kết hợp âm dƣơng mở rộng hiệu lực khác C => B cho C A, A ∈ {X1, ¬X1}, C ∈ { X2, ¬X2}, Xi (i = 1, 2) ⊆ G 2.2 Thuật toán phát luật kết hợp âm dƣơng mở rộng phân biệt Để phát luật kết hợp âm dƣơng nhƣ luật kết hợp âm dƣơng mở rộng từ sở liệu tác vụ ngƣời ta thực cách bổ sung vào tác vụ sở liệu mục liệu với âm nhƣ mục liệu trƣớc chƣa đƣợc xuất tác vụ sau sử dụng thuật toán phát luật kết hợp truyền thống biết Nhƣng phƣơng pháp mặt thực đƣợc số mục liệu sở liệu tác vụ nhỏ, số lƣợng mục liệu lớn phƣơng pháp khơng thể thực độ phức tạp tính tốn cực lớn mặt khác không tận dụng thể đƣợc mối quan hệ tập mục liệu dƣơng tập mục liệu với âm Các cơng trình [4-5, 7, 9-10, 12, 20] cố gắng xây dựng thuật toán phát luật kết hợp âm dƣơng từ sở liệu tác vụ dƣơng (chỉ chứa mục liệu dƣơng) Những thuật tốn nhƣ nói chung phức tạp Và luật kết hợp âm dƣơng mở rộng theo định nghĩa 2, chƣa có nghiên cứu thuật toán phát luật nhƣ đƣợc công bố Việc giảm chiều liệu xây dựng mơ hình dự báo biến đích theo biến gốc đầu vào (là biến liên tục biến phân loại) nhƣ việc thực dự báo phân lớp sử dụng luật kết hợp âm dƣơng mở rộng cho thấy luật âm dƣơng mở rộng luật dạng ¬A ∪ B => {y} ¬A ∪ B => {¬y}, y A, B A ∩ B = ∅ hay đƣợc sử dụng nhất, y đƣợc gọi biến đích, nhận giá trị {0, 1} Khi biến nhận giá trị ta xem biến mục liệu dƣơng ngƣợc lại biến nhận giá trị 0, đƣợc xem mục liệu với âm Và tƣơng tự nhƣ mục liệu dƣơng mục liệu với âm vế trái luật thực chất liên quan đến biến gốc Thuật toán phát luật kết hợp âm dƣơng mở rộng phân biệt phức tạp nên đƣợc bỏ qua khơng trình bầy báo 2.3 Tính hay luật kết hợp âm dƣơng mở rộng Nhƣ biết minSup minConf hai tham số quan trọng để tìm luật kết hợp dƣơng hiệu lực (valid), minConf thể độ tin cậy sức mạnh luật Tuy nhiên ngƣời ta nhận thấy số trƣờng hợp bỏ sót luật kết hợp có giá trị cơng thức tính độ tin cậy luật khơng tính đến tập mục liệu bên phải luật Để vƣợt qua hạn chế này, ngƣời ta đề xuất độ đo ký hiệu Lift(A => B) đƣợc xác định nhƣ sau: Lift(A => B) = Conf(A => B)/Supp(B) Khi biến biến nhị phân (hay sở liệu tác vụ với mục liệu dƣơng mục liệu với âm) độ đo Lift(A => B) trở thành độ đo tính hay (interest factor) luật [15], cụ thể là: Lift(A => B) = { hệ số tƣơng quan tập mục liệu A, B đƣợc xác định nhƣ sau: Đỗ Văn Thành, Phạm Ngọc Lâm ( ) ( ∪ ) 425 (¬ ∪ ¬ ) ( )( √ ( )) (¬ ∪ ) ( )( ( ∪¬ ) ( )) Khi , A B đƣợc nói khơng tƣơng quan , A B đƣợc nói tƣơng quan âm, A, B tƣơng quan dƣơng với nhau, Độ đo Lift(A => B) đƣợc sử dụng để đánh giá tính hay luật kết hợp âm dƣơng mở rộng phân biệt III PHÁT HIỆN LUẬT KẾT HỢP ÂM DƢƠNG MỞ RỘNG PHÂN BIỆT 3.1 Tập liệu nghiên cứu Chỉ số chứng khoán phản ánh thực trạng phát triển chung thị trƣờng chứng khoán Sự biến động số chịu tác động nhiều yếu tố nhƣ nƣớc Các yếu tố nƣớc yếu tố phản ánh tình hình sản xuất, tăng trƣởng lạm phát kinh tế nhƣ phản ánh biến động hiệu số loại hình đầu tƣ quan trọng khác nhƣ vàng, la, Các yếu tố ngồi nƣớc có tác động mạnh đến thị trƣờng chứng khốn thƣờng giá giới số nguyên liệu đầu vào kinh tế biến động thị trƣờng tài giới, thị trƣờng chứng khốn số cƣờng quốc kinh tế Thực trạng biến động biến kinh tế - tài kỳ trƣớc ln có ảnh hƣởng khơng nhỏ đến biến động chúng tƣơng lai Điều hàm ý nghiên cứu, phân tích quan hệ số chứng khoán VNINDEX với biến kinh tế, tài khác cần thiết phải xem xét đến khứ biến chúng đƣợc gọi biến trễ Cụ thể, giả sử X = X(t) biến phụ thuộc vào thời gian t; biến Z=X(t-k), k≥1 đƣợc gọi biến trễ k-bƣớc biến X (và thƣờng đƣợc ký hiệu X(-k)) Trong báo biến trễ 1-bƣớc tất biến đƣợc đƣa vào để nghiên cứu phân tích Các biến đƣợc sử dụng để nghiên cứu quan hệ kết hợp chúng với số VNINDEX đƣợc mô tả tóm tắt Bảng dƣới, liệu biến kinh tế - tài nhƣ EXP, CPI, USD, GOLD đƣợc thu thập theo tháng từ tháng 1/2010-4/2016; Dữ liệu VNI, OIL, NAS, S&P, NIK đƣợc thu thập theo ngày từ 4/01/2010 đến 30/4/2016, sau đƣợc tính trung bình theo tháng để trở thành liệu theo tháng Các biến trễ 1- bƣớc biến đƣợc lựa chọn nhận đƣợc liệu từ tháng 2/2010 đến tháng 4/2016, tức chúng bao gồm 75 quan sát Bảng Tập biến nghiên cứu Tên Biến (viết gọn) Tên biến VNI Lợi suất số chứng khoán VNINDEX Lợi suất chung toàn thị trƣờng www.cophieu68.vn EXP Tốc độ tăng xuất theo tháng Việt Nam Tình hình phát triển sản xuất nƣớc www.gso.gov.vn CPI Tốc độ tăng số giá tiêu dùng so với tháng trƣớc Tình trạng lạm phát kinh tế www.gso.gov.vn GOLD Tốc độ tăng số giá vàng so với tháng trƣớc Tình trạng lạm phát sản phẩm đầu tƣ thay www.gso.gov.vn USD Tốc độ tăng số giá la so với tháng trƣớc Tình trạng lạm phát sản phẩm đầu tƣ thay www.gso.gov.vn OIL Tốc độ tăng giá giới dầu thô Giá giới nguyên liệu đầu vào kinh tế www.forecasts.org NAS Lợi suất số chứng khoán NASDAD Lợi suất chung thị trƣờng dịch vụ tài đa quốc gia www.forecasts.org S&P Lợi suất số chứng khoán S&P500 Lợi suất chung đầu tƣ vào 500 công ty hàng đầu www.forecasts.org NIK Lợi suất số chứng khoán NIKKEI225 Lợi suất chung thị trƣờng chứng khoán Nhật Bản www.forecasts.org 10-18 X(-1) Trễ bƣớc biến X, X biến đƣợc nêu Là biến X đƣợc trễ bƣớc STT Nội dung phản ánh Nguồn 3.2 Phát luật kết hợp âm dƣơng mở rộng phân biệt Để phát đƣợc luật kết hợp âm dƣơng mở rộng phân biệt, ta phải chuyển tập liệu dạng số thành tập liệu dạng giao dịch Khi quan sát trở thành giao dịch tên biến xuất giao dịch giá trị biến dƣơng giao dịch Bảng dƣới minh họa cho chuyển đổi PHÂN TÍCH THỊ TRƢỜNG CHỨNG KHỐN VIỆT NAM BẰNG SỬ DỤNG LUẬT KẾT HỢP ÂM DƢƠNG… 426 Bảng Chuyển đổi tập liệu số sang dạng giao dịch Tập liệu dạng số Obs VNI EXP CPI OIL GOLD USD NAS NIK S&P Feb-10 -0.01619 -0.26838 0.007809 -0.03104 -0.33589 -0.04965 0.076466 0.048782 0.057742 Mar-10 0.038896 0.50544 0.009216 0.061243 0.339139 0.057653 0.048039 0.043881 0.039295 Apr-10 0.014092 -0.02454 -0.00209 0.061015 -0.0217 -0.01516 -0.06321 -0.09298 -0.06035 May-10 -0.012 0.156564 -0.00169 -0.1022 0.012921 -0.01854 -0.03622 -0.03147 -0.03706 VNI(-1) EXP(-1) CPI(-1) OIL(-1) GOLD(-1) USD(-1) NAS(-1) NIK(-1) S&P(-1) Feb-10 0.038896 0.50544 0.009216 0.061243 0.339139 0.057653 0.048039 0.043881 0.039295 Mar-10 0.014092 -0.02454 -0.00209 0.061015 -0.0217 -0.01516 -0.06321 -0.09298 -0.06035 Apr-10 -0.012 0.156564 -0.00169 -0.1022 0.012921 -0.01854 -0.03622 -0.03147 -0.03706 May-10 TID -0.01472 0.000913 -0.00328 -0.01076 -0.02352 -0.00312 Tập liệu dạng giao dịch -0.01117 -0.03364 -0.00329 CPI, NAS, NIK, S&P, VNI(-1), EXP(-1), CPI(-1), OIL(-1), GOLD(-1), USD(-1), NAS(-1), NIK(-1), S&P(-1) VNI, EXP, CPI, OIL, GOLD, USD, NAS, NIK, S&P, VNI(-1), OIL(-1) VNI, OIL, EXP(-1), GOLD(-1) EXP, GOLD, EXP(-1) Áp dụng thuật toán phát luật kết hợp âm dƣơng mở rộng phân biệt tập liệu giao dịch gồm 75 giao dịch với minSupp = 0.11 minConf = 0.98, ta nhận đƣợc 40 luật kết hợp âm dƣơng mở rộng phân biệt không dƣ thừa biểu diễn quan hệ kết hợp số chứng khốn VNI với biến kinh tế - tài số số chứng khoán quốc tế đƣợc chọn Bảng Bảng Tập luật âm dƣơng mở rộng phân biệt không dƣ thừa (minSupp = 0.11, minConf =0.98) {EXP,¬VNI(-1),NIK(-1}=>{¬VNI}(0.176,1.0,1.85) {¬EXP, EXP(-1),¬NIK(-1)}=>{VNI}(0.149,1.0,2.18) {S&P,VNI(-1),¬NIK(-1)}=>{VNI}}(0.149,1.0,2.18) {¬VNI(-1), OIL(-1), NIK(-1)}=>{¬VNI}}(0.149,1.0,1.85) {GOLD, S&P,¬NIK(-1)}=>{VNI}(0.135,1.0,2.18) {NAS,S&P,VNI(-1),¬S&P(-1)}=>{VNI}(0.135,1.0,2.18) {EXP,¬CPI,¬VNI(-1),¬CPI(-1)}=>{¬VNI} (0.135,1.0,1.85) {EXP, ¬VNI(-1), EXP(-1),¬GOLD(-1)}=>{¬VNI} (0.135,1.0,1.85) {¬EXP,GOLD,¬NIK(-1)}=>{VNI}(0.122,1.0,2.18) 10 {NAS,VNI(-1),¬NAS(-1)}=>{VNI}(0.122,1.0,2.18) 11 {VNI(-1),¬CPI(-1),¬NIK(-1)}=>{VNI}(0.122,1.0,2.18) 12 {VNI(-1),¬CPI(-1),¬S&P(-1)}=>{VNI}(0.122,1.0,2.18) 13 {VNI(-1),¬GOLD(-1),¬NIK(-1)}=> {VNI} (0.122,1.0,2.18) 14 {VNI(-1),¬NAS(-1),¬NIK(1)}=>{VNI}(0.122,1.0,2.18) 15 {VNI(-1),¬NAS(-1),¬S&P(-1)}=>{VNI}(0.122,1.0,2.18) 16 {EXP,¬CPI,¬VNI(-1),¬GOLD(-1)}=>{¬VNI}(0.122,1.0,1.85) 17 {EXP, ¬OIL, ¬VNI(-1),¬GOLD(-1)} =>{¬VNI}(0.122,1.0,1.85) 18 {EXP,¬GOLD,EXP(-1),¬GOLD(-1)}=>{¬VNI}(0.122,1.0,1.85) 19 {EXP,USD,NAS,USD(-1)}=>{¬VNI}(0.122,1.0,1.85) 20 {EXP,¬VNI(-1),¬USD(-1)} =>{¬VNI}(0.122,1.0,1.85) 21 {CPI,¬VNI(-1), NIK(-1)}=>{¬VNI}(0.122,1.0,1.85) 22 {EXP,¬USD,¬VNI(-1),¬USD(-1)} =>{¬VNI}(0.122,1.0,1.85) 23 {CPI,EXP(-1),CPI(-1),NIK(-1)}=>{¬VNI}(0.122,1.0,1.85) 24 {CPI,EXP(-1),NAS(-1),NIK(-1)} =>{¬VNI}(0.122,1.0,1.85) 25 {EXP,USD,S&P,NIK(-1),S&P(-1)} =>{¬VNI} (0.122,1.0,1.85) 26 {CPI,GOLD,¬NIK(-1)} => {VNI}(0.108,1.0,2.18) 27 {OIL,VNI(-1),¬NAS(-1)}=>{VNI}(0.108,1.0,2.18) 28 {GOLD,NAS ¬NAS(-1)}=>{VNI}(0.108,1.0,2.18) 29 {GOLD,S&P,¬S&P(-1)}=>{VNI}(0.108,1.0,2.18) 30 {GOLD,VNI(-1),¬GOLD(-1)} => {VNI} (0.108,1.0,2.18) 31 {GOLD,VNI(-1),¬NAS(-1)}=>{VNI} (0.108,1.0,2.18) 32 {S&P,VNI(-1),¬NAS(-1)}=>{VNI} (0.108,1.0,2.18) 33 {CPI,USD,NIK(-1)}=>{¬VNI} (0.108,1.0,1.85) 34 {NIK,S&P,VNI(-1),¬S&P(-1)}=> {VNI}(0.108,1.0,2.18) 35 {EXP,¬OIL,¬VNI(-1),¬CPI(-1)}=> {¬VNI} (0.108,1.0,1.85) 36 {EXP,¬GOLD,NAS,EXP(-1)}=>{¬VNI} (0.108,1.0,1.85) 37 {EXP,USD,NAS,EXP(-1)}=> {¬VNI} (0.108,1.0,1.85) 38 {EXP,USD,NIK,USD(-1)}=>{¬VNI}(0.108,1.0,1.85) 39 {EXP,USD,S&P,USD(-1)}=>{¬VNI (0.108,1.0,1.85) 40 {EXP,NIK,EXP(-1),NAS(-1)}=>{¬VNI}(0.108,1.0,1.85) Các luật kết hợp bảng đƣợc viết dƣới dạng A => B( ), tham số tƣơng ứng độ hỗ trợ, độ tin cậy giá trị đo tính hay luật Các luật đƣợc xếp theo tiêu chí lần lƣợt là: độ tin cậy, độ hỗ trợ tính hay luật IV PHÂN TÍCH Ý NGHĨA CỦA LUẬT Bảng giải thích ý nghĩa luật Các luật khác đƣợc giải thích theo cách tƣơng tự Đỗ Văn Thành, Phạm Ngọc Lâm 427 Bảng Ý nghĩa luật kết hợp âm dƣơng mở rộng phân biệt Luật {EXP,¬VNI(-1),NIK(-1}=>{¬VNI}(0.176,1.0,1.85) {¬EXP, EXP(-1),¬NIK(-1)}=>{VNI}(0.149,1.0,2.18) {S&P,VNI(-1),¬NIK(-1)}=>{VNI}}(0.149,1.0,2.18) {¬VNI(-1), OIL(-1), NIK(-1)}=>{¬VNI}}(0.149,1.0,1.85) {GOLD, S&P,¬NIK(-1)}=>{VNI}(0.135,1.0,2.18) Ý nghĩa Nếu kim ngạch xuất tháng tăng tháng trƣớc lợi suất VNINDEX không dƣơng NIKKEI225 dƣơng lợi suất VNINDEX tháng không dƣơng, với độ hỗ trợ 17.6%, độ tin cậy 100% tính hay luật 1.85 hay tƣơng quan tập vế trái vế phải luật tƣơng quan dƣơng Nếu kim ngạch xuất tháng không tăng, nhƣng tháng trƣớc tăng lợi suất NIKKEI225 tháng trƣớc khơng dƣơng lợi suất VNINDEX tháng dƣơng, với độ hỗ trợ 14.9%, độ tin cậy 100% tính hay luật 2.18 Nếu lợi suất S&P500 tháng VNINDEX tháng trƣớc dƣơng lợi suất NIKKEI225 tháng trƣớc khơng dƣơng lợi suất VNINDEX tháng dƣơng, với độ hỗ trợ 14.9%, độ tin cậy 100% tính 2.18 Nếu tháng trước: lợi suất VNINDEX không dƣơng, NIKKEI225 dƣơng giá dầu thô không tăng tháng lợi suất VNINDEX không dƣơng, với độ hỗ trợ 14.9%, độ tin cậy 100% tính 1.85 Nếu tháng giá vàng tăng, lợi suất S&P500 dƣơng tháng trƣớc lợi suất NIKKEI225 không dƣơng tháng lợi suất VNINDEX dƣơng, với độ hỗ trợ 13.5%, độ tin cậy 100% tính 2.18 Bảng cho thấy luật kết hợp âm dƣơng nhƣ đƣợc hiểu từ trƣớc đến gồm luật, chiếm 22.5% tổng số luật âm dƣơng mở rộng phân biệt phát đƣợc Đó luật số 19, 23, 24, 25, 33, 37, 38, 39 40 Điều minh chứng hạn chế luật âm dƣơng việc biểu diễn quan hệ đối tƣợng giới thực Trong số 40 luật phát đƣợc, có luật số 4, 11, 12, 13, 14, 15 thể quan hệ nhân số biến kinh tế - tài số chứng khoán quốc tế với số VNINDEX Các biến bên trái luật biến trễ - bƣớc nên chúng đƣợc xem nguyên nhân VNINDEX Cụ thể hơn: dựa vào giá trị biến bên trái luật tháng tại, ta kết luận đƣợc lợi suất VNINDEX tháng Chẳng hạn luật số 4: {¬VNI(-1), OIL(-1), NIK(-1)}=>{¬VNI}}(0.149,1.0,1.85) cho biết lợi suất số chứng khoán VNINDEX tháng không tăng, giá dầu lợi suất số chứng khoán NIKKEI225 tháng tăng lợi suất số VNINDEX khơng tăng với độ hỗ trợ 14,9%, độ tin cậy 100%, tính hay luật 1.85, tức quan hệ kết hợp tƣơng quan dƣơng Ta thấy quan hệ nhân đƣợc biểu diễn luật kết hợp âm dƣơng mở rộng phân biệt gần gũi với cách biểu diễn quan hệ nhân Granger [8, 18] V KẾT LUẬN VÀ THẢO LUẬN Thơng qua việc phân tích quan hệ kết hợp số chứng khoán Việt Nam VNINDEX sử dụng phát luật kết hợp âm dƣơng mở rộng phân biệt, báo cho thấy: Các luật kết hợp âm dƣơng phân biệt nhƣ đƣợc hiểu từ trƣớc đến nhiều hạn chế để biểu diễn mối quan hệ giới thực Các luật âm dƣơng mở rộng phân biệt không biểu diễn đƣợc đa dạng quan hệ giới thực mà chúng phù hợp để biểu diễn quan hệ yếu tố lĩnh vực kinh tế - tài có tác động đến biến cần đƣợc nghiên cứu Vì hồn tồn sử dụng việc phát luật kết hợp nhƣ để phân tích kết hợp thị trƣờng chứng khốn nói chung Việt Nam nói riêng Bài báo cho thấy luật kết hợp âm dƣơng mở rộng phân biệt bao gồm luật thể quan hệ nhân biến gốc biến đích Nhƣ biết, việc phân tích quan hệ nhân Granger quan hệ đồng tích hợp đƣợc đề xuất nhà toán học giải Nobel kinh tế năm 2003 C Granger trở thành trung tâm phân tích kinh tế lƣợng vĩ mơ Việc nhận thấy có tƣơng đồng biểu diễn quan hệ nhân theo nghĩa Granger luật kết hợp âm dƣơng mở rộng phân biệt đặt câu hỏi: phải việc sử dụng phát luật kết hợp âm dƣơng mở rộng phân biệt để tìm quan hệ nhân khắc phục đƣợc số hạn chế quan hệ nhân Granger quan hệ nhân biến gốc biến đích tồn số quan sát (hoặc thể hiện) Trả lời câu hỏi trọng tâm nghiên cứu tƣơng lai gần 428 PHÂN TÍCH THỊ TRƢỜNG CHỨNG KHOÁN VIỆT NAM BẰNG SỬ DỤNG LUẬT KẾT HỢP ÂM DƢƠNG… VI TÀI LIỆU THAM KHẢO [1] Agrawal R., Imieliński T., & Swami A “Mining association rules between sets of items in large databases” ACM SIGMOD Record, 22(2):207–216, 1993 [2] Ali K., Manganaris M., & Srikant R “Partial Classification using association rules” Proceedings of the 3rd International Conference on Knowledge Discovery in Databases and Data Mining, Newport Beach, California, USA, pages 115–118, August 14–17, 1997 [3] Antonie M., & Zaïane O “An associative Classifier based on positive and negative rules” Proceedings of the 9th ACM SIGMOD Workshop on Research Issues in Data Mining and Knowledge Discovery Paris, France: ACM Press, pp 64–69, 2004 [4] Bouzouita I., & Elloumi S “Positive and negative generic classification rules-based Classifier” International Journal of Knowledge and Learning, Vol 7, Issue 3-4, pp 271-293 DOI 10.1504/IJKL.2011.044562, 2011 [5] Chris C., Peng Y., Xing Z., & Guoqing C “Mining positive and negative association rules from large databases” Proc of CIS, pages 1–6, 2006 [6] Cubero F J C., Sánchez N M D., Serrano J M., & Vila A “Association rule evaluation for Classification purposes” Actas del III Taller Nacional de Minería de Datos y Aprendizaje, TAMIDA2005, pp.135-144 ISBN: 849732-449-8, Los autores, Thomson, 2005 [7] Dong J., Niu J., Shi J., Zhang J., & Zhu D “Mining both Positive and Negative Association Rules from Frequent and Infrequent Itemsets” ADMA, LNAI 4632, Springer-Verlag Berlin Heidelberg, 2007 [8] Enders, W “Applied Econometric Time Series”, Wiley: USA, 2004 [9] Hao W., Xing X., & Guoqing X “Mining a complete set of both positive and negative association rules from large databases” Proc of PAKDD, pages 777–784, 2008 [10] Idheba M A O., Azuraliza A B., & Anis S A K “Mining Positive and Negative Association Rules from Interesting Frequent and Infrequent Itemsets” 9th International Conference on Fuzzy Systems and Knowledge Discovery (FSKD 2012), IEEE, 2012 [11] Li W., Han J., & Pei J “CMAR: Accurate and efficient classification based on multiple DGN-association rules” Proceedings of the 2001 IEEE International Conference on Data Mining (ICDM’01), San Jose, California, USA, pages 208–217, November 29 - December 02, 2001 [12] Liu B., Hsu W., & Ma Y “Integrating classification and association rule mining” In ACM Int Conf on Knowledge Discovery and Data Mining (SIGKDD’98), pages 80–86, New York City, NY, August 1998 [13] Mishra A., & Khare N “A Review on Gender Classification Using Association Rule Mining and Classification Based on Fingerprints” IEEE Xplore: DOI: 10.1109/CSNT.2015.244, 2015 [14] Preethi G and Santhi B “Stock Market Forecasting Techniques: A Survey” Journal of theoretical and Applied Information technology, Vol 46, No 1, pp 24-30, 2012 [15] Tan, Pang-Ning, Michael Steinbach, and Vipin Kumar “Association analysis: basic concepts and algorithms” Introduction to Data mining, pp 327-414, 2005 [16] Thabtah F., Cowling P., & Peng Y “MMAC: A new multi-DGN, multi-label associative Classification approach” Proceedings of the 4th IEEE International Conference on Data Mining (ICDM’04), Brighton, UK, pp 217–224, 2004 [17] Thabtah F., Cowling P., & Peng Y “MCAR: Multi-DGN Classification based on Association Rule approach” Proceeding of the 3rd IEEE International Conference on Computer Systems and Applications,Cairo, Egypt, pp 1– 7, 2005 [18] Thanh D V., & Hai N M “Phân tích dự báo thị trƣờng chứng khoán sử dụng số báo trƣớc” Kỷ yếu Hội nghị khoa học công nghệ quốc gia lần thứ IX (FAIR), Cần thơ, 559-566 DOI: 10.15625/vap.2016.00069, 45/8/2016 [19] Thuy C T., & Thanh D V “Một giải pháp phân tích thị trƣờng chứng khốn Việt Nam” Tin học Điều khiển học, Viện Khoa học Tự nhiên Công nghệ Quốc gia.Tập 24, số 2, 2008 [20] Xindong W., Chengqi Z., & Shichao Z “Efficient mining of both positive and negative association rules” ACM Trans on Inf Syst., 22(3):381–405, 2004 [21] Yin X., & Han J “CPAR: Classification based on predictive association rules” Proceedings of the Third SIAM International Conference on Data Mining, San Francisco, CA, USA, pages 208–217, May 1-3, 2003 [22] Zhang M L., & Zhou Z H “A Review on Multi-Label Learning Algorithms” IEEE Trans Knowl Data Eng 26(8), 1819-1837, 2014 Đỗ Văn Thành, Phạm Ngọc Lâm 429 ANALYSING VIETNAM STOCK MARKET BY USING DISCRIMINANT EXTENDED POSITIVE NEGATIVE ASSOCIATION RULES Thanh Do Van, Lam Pham Ngoc ABSTRACT: Positive and Negative association rules have so far been limited to expressing the ralationships of objects in the real world A more general form of association rules, called extended Positive and Negative association rules, can overcome these limitations Unfortunately, it is difficult to build efficient algorithms to detect all those rules In the extended Positive and Negative association rules, the rules that of the right containing only a positive or negative data items are called discriminant extended Positive and Negative association rules that have very high application meanings in the economic financial field These rules are promising to be effective solutions in class prediction as well as in the selection of subsets of valuable variables to reduce data dimension Algorithm for detecting discriminant extended Positive and Negative association rules from transactional databases containing only the positive data items was proposed The purpose of this paper is to use the discriminant extended Positive and Negative association rules for analyzing the association relations of the VNINDEX stock market index with some economic financial variables and other international stock market indexes The found association rules show the limitation of Positive and Negative association rules as understood so far, the suitability of these rules in the association analysis of the economic financial field, and many similarities of causality represented by discriminant extended Positive and Negative acsociation rules with the Granger's causality, which is one of the relations of most used in macro-econometric analyzes Keywords: Stock market, association analysis, Positive and Negative association rule, discriminant association Rule, causality ... hợp dƣơng nhƣ luật kết hợp âm 424 PHÂN TÍCH THỊ TRƢỜNG CHỨNG KHOÁN VIỆT NAM BẰNG SỬ DỤNG LUẬT KẾT HỢP ÂM DƢƠNG… Định nghĩa 2: Luật kết hợp âm dƣơng mở rộng ¬A ∪ B => ¬C ∪ D đƣợc gọi luật hiệu lực... LUẬN Thơng qua việc phân tích quan hệ kết hợp số chứng khoán Việt Nam VNINDEX sử dụng phát luật kết hợp âm dƣơng mở rộng phân biệt, báo cho thấy: Các luật kết hợp âm dƣơng phân biệt nhƣ đƣợc hiểu... nghĩa 3: Luật kết hợp âm dƣơng mở rộng phân biệt luật kết hợp âm dƣơng mở rộng mà vế phải luật có mục liệu dƣơng mục liệu với âm Định nghĩa 4: [12]: Giả sử r1, r2 luật kết hợp âm dƣơng mở rộng,