4.1.5.Tìm cập chứng khoán tương đồng của sàn HOSE

Một phần của tài liệu Tiểu luận môn khai phá dữ liệuTÍNH SỰ TƯƠNG ĐỒNG CỦA CHUỖI DỮ LIỆU THỜI GIAN (Trang 50 - 63)

CHƯƠNG 2

4.1.5.Tìm cập chứng khoán tương đồng của sàn HOSE

nP AbsDist = −

Với δ là ngưỡng cho trước và nPitnPjt là giá chuẩn của 2 mã chứng khoán i và j.

4.1.5. Tìm cập chứng khoán tương đồng của sàn HOSE

Tiểu luận này sử dụng 50 mã chứng khoán của sàn giao dịch chứng khoán HCM (HOSE), số liệu chọn từ tháng 5/2009 -> 12/2010. Bảng sau là danh sách 50 cổ phiếu quan sát :

STT TÊN STT TÊN

1 ACB Ngân hàng TMCP Á châu 26 PPC Pha Lai Thermal Power Joint Stock Company 2 ANV Công ty Cổ phần Nam Việt 27 PVC Công ty Cổ phần Dung dịch khoan và Hóa phẩm Dầu khí 3 BVS Công ty Cổ phần Chứng khoán Bảo Việt 28 PVT PetroVietNam Transportation Corporation 4 CDC CTCP Chương Dương 29 QNC Công ty Cổ phần Xi măng và Xây dựng Quảng Ninh 5 CII Công ty Cổ phần Đầu tư Hạ tầng Kỹ thuật Tp.HCM 30 RAL Rangdong Light Source and Vacuum Flask Joint Stock Company 6 DBC Công ty Cổ phần Dabaco Việt Nam 31 REE Refrigeration Electrical Engineering Corporation 7 DIC Công ty Cổ phần Đầu tư và Thương mại DIC 32 S99 Công ty Cổ phần Sông Đà 909 8 DPM Tổng Công ty Phân bón và Hóa chất Dầu khí - CTCP 33 SAM Sacom Development and Investment Corporation 9 DQC DIEN QUANG JOINT STOCK COMPANY 34 SD6 Công ty cổ phần Sông Đà 6

10 GMD Gemadept Corporation 35 SD7 Công ty cổ phần Sông Đà 7 11 HAP Hapaco Group Joint Stock Company 36 SD9 Công ty cổ phần Sông Đà 9 12 HBC Hoa Binh Construction & Real Estate Corporation 37 SDA Công ty Cổ phần SIMCO Sông Đà 13 HMC Ho Chi Minh City Metal Corporation 38 SGT Sai Gon Telecommunication & Technologies Corporation

14 HPC Công ty Cổ phần Chứng khoán Hải Phòng 39 SIC Công ty Cổ phần Đầu tư - Phát triển Sông Đà 15 HPG Hoa Phat Group Joint Stock Company 40 SJE Công ty Cổ phần Sông Đà 11

16 HT1 Ha Tien 1 Cement Joint Stock Company 41 SMC SMC Investment Trading Joint Stock Company 17 ITA Tan Tao Investment Industry Corporation 42 SSI Sai Gon Securities Incorporation 18 KLS Công ty Cổ phần Chứng khoán Kim Long 43 STB Sai Gon Thuong Tin Commercial Joint Stock Bank 19 LBM Lam Dong Mineral and Building Material Joint Stock Company 44 TAC Tuong An Vegetable Oil Joint Stock Company 20 LSS Lam Son Sugar Joint Stock Corporation 45 TBC Thac Ba Hydropower Joint Stock Company 21 NTP Công ty Cổ Phần Nhựa Thiếu Niên Tiền Phong 46 TNG Công ty Cổ phần Đầu tư và Thương mại TNG 22 PAN PAN Pacific Corporation 47 VIP Viet Nam Petroleum Transport Joint Stock Company 23 PET Petrovietnam General Services Corporation 48 VSH Vinh Son - Song Hinh Hydropower Joint Stock Company 24 PVI Tổng Công ty Cổ phần Bảo Hiểm Dầu Khí 49 VSP Công ty Cổ phần Vận tải Biển và Bất động sản Việt Hải

25 PVS Tổng Công ty Cổ phần Dịch vụ Kỹ thuật Dầu khí Việt Nam 50 VTO Viet Nam Tanker Joint Stock Copany

Hình sau mô tả cập chứng khoán PVT-VTO với DTW=0.069

Hình 11: Cập chứng khoán tương đồng PVT-VTO

Hình 12: Hai mã chứng khoán VSP-VTO không tương đồng

Bảng kết quả tìm được :

Mã CK1 Mã CK2 DTW CELL (1) OCELL (2) TỶ LỆ (2/1) PTIME PVT VTO 0.069 169,744 140,024 82 406 HT1 LBM 0.214 169,744 134,153 79 93 KLS STB 0.371 169,744 119,958 71 812 SGT VSH 0.406 169,744 115,703 68 890 HMC KLS 0.426 169,744 134,928 79 718 REE STB 0.429 169,744 122,552 72 218 SIC SJE 0.469 169,744 136,123 80 703 ACB VSP 0.481 169,744 133,793 79 125 HPC HT1 0.509 169,744 132,252 78 93 PET REE 0.514 169,744 129,554 76 109 ITA STB 0.575 169,744 126,618 75 750 ANV HAP 0.579 169,744 121,969 72 968 RAL S99 0.619 169,744 129,539 76 578 PVS SD6 0.635 169,744 138,824 82 109 SD6 SD9 0.649 169,744 136,522 80 250 LBM VSH 0.658 169,744 131,388 77 765 PVI SAM 0.690 169,744 131,241 77 203 QNC RAL 0.717 169,744 120,466 71 93 HAP TBC 0.722 163,564 118,645 73 828 STB TBC 0.722 163,564 114,460 70 921 PAN PET 0.741 163,976 127,177 78 328 SD9 SIC 0.794 169,744 129,440 76 937 DBC TAC 0.811 169,332 120,677 71 375 SAM SJE 0.825 169,744 132,355 78 953 VIP VSH 0.880 169,744 125,659 74 687 PVC PVI 0.901 169,744 142,476 84 171 S99 SD6 0.936 169,744 123,419 73 109 CDC PVC 0.939 166,860 122,424 73 171 HPG LSS 1.017 169,744 151,782 89 859 DPM HPG 1.031 169,744 119,142 70 671 SMC TNG 1.071 169,744 117,928 69 890 CII SD7 1.105 169,744 119,506 70 218 PPC VSH 1.107 169,744 117,423 69 140 TBC TNG 1.146 163,564 125,860 77 609 DIC PVS 1.208 169,744 145,935 86 375 DQC VSP 1.316 169,744 134,463 79 953 SJE SMC 1.323 169,744 132,482 78 671 VSH VTO 1.333 169,744 112,533 66 921 TNG VIP 1.408 169,744 144,442 85 640 LSS SD7 1.456 169,744 136,863 81 203 BVS VSP 1.525 169,744 127,314 75 203 SDA SMC 1.572 169,744 146,878 87 375 HBC HPG 2.238 169,744 135,506 80 781 GMD SD7 2.295 169,744 122,955 72 437 Trang 55/66

TAC TBC 2.440 163,167 125,263 77 921 SD7 SD9 3.317 169,744 122,715 72 640 SSI STB 3.672 169,744 123,550 73 656 VSP VTO 13.713 169,744 119,610 70 609 NTP SD7 29.826 168,920 127,266 75 843 Trang 56/66

- DTW : khoảng cách của 2 mã chứng khoán được tính theo giải thuật nêu trên - Cell : số lượng ô trong ma trận SM = n*m, với n, m là chiều dài dữ liệu của Mã

chứng khoán 1 và mã chứng khoán 2

- OCELL : số lượng các ô có tính toán, về hiệu quả thì số lượng ô này càng nhỏ thì càng tốt

- Tỷ lệ : so sánh giữa số lượng ô tính toán với số lượng ô của ma trận, tỷ lệ này càng thấp càng tốt. Quan sát bảng số liệu này ta thấy tỷ lệ truy bình khoảng 75% như vậy tiết kiệm 25% chi phí tính toán các ô

- PTIME : thời gian xử lý tham khảo trên máy Intel core 2 dual, 2.16GHz, 2GB RAM (kết quả này chỉ mang tính tương đối)

Ta thấy một số cập chứng khoán có độ đo khoảng cách <1 như : PVT-VTO, HT1-LBM, KLS-STB. Hình sau mô tả một vài cập mã chứng khoán tương đồng theo bảng kết quả trên

Hình 13: Cập chứng khoán PVT-VTO với DTW=0.06

Hình 1.4: Cập chứng khoán HT1-LBM với DTW=0.21

4.2. Thiết kế chương trình

Ngôn ngữ lập trình : VB.NET 2008 Microsoft .Net framework 2.0

.netCharting (dùng thể hiện đồ thị, bản dùng thử download từ www.dotnetcharting.com)

4.2.1. Cơ sở dữ liệu

Dữ liệu sử dụng trong chương trình được download từ Internet là dữ liệu EOD (End of day) của các mã chứng khoán tại sàn giao dịch HOSE. Trong phạm vi của tiểu luận này, 50 mã chứng khoán được chọn ngẫu nhiên để phân tích.

Để đơn giản tiểu luận sử dung database là MS Access với các bảng như sau : - MACK (MACK, TEN) : danh sách mã chứng khoán

 MACK : mã chứng khoán (adsbygoogle = window.adsbygoogle || []).push({});

 TEN : tên công ty có mã chứng khoán đó - DATA(MACK, NGAY, GIA) : dữ liệu chứng khoán

 MACK : mã chứng khoán  NGAY : ngày dữ liệu

 GIA : giá đóng cửa của mã đó

4.2.2. Các lớp

Code chính của chương trình nằm trong frmMain như sau :

- CalculateCost (SM, S, Q): hàm tính chi phí để tìm đường ánh xạ tối ưu. Sau khi có ma trận SM, hàm này sẽ xét từng ô (các ô không phải Block cell – B) để tính chi phí bằng cách xét các ô Lower bound và Mở các ô Upper Bound (nếu thỏa – dùng OpenBlockCells)

- CalculateIndexOfBin (Bin, S, Q): tính ra các index của S, Q thuộc bin đang xét

- CalculateLowerBound(SM, rIndex, cIndex, LowNeighbors) : tính các ô láng giềng dưới của ô c(rIndex, cIndex)

- CalculateSM(SM, S,Q, BIN) : tính khoảng cách EucDist của từng bin - CalculateLowerBound : tính các ô láng giềng trên của một ô cho trước - CalculateWarpingPath : tính đường so khớp tối ưu

- CalculateDTW : tính độ dài của đường so khớp

- CreateBin : tạo ra các bin với cận dưới, cận trên theo thông số độ rộng. Trong tiểu luận này độ rộng sử dụng là 0.5

- LB_Keogh : tính khoảng cách theo công thức Keogh & Ratanamahatana

- OpenBlockCells : khi giá trị của các ô Upper cell là 0 thì nó sẽ được unlock trong hàm này

- SequenceSearch : hiện thực giải thuật SequenceSearch

- SparseDTW : Hiện thực giải thuật SparseDTW

4.2.3. Giao diện & hướng dẫn sử dụng

Giao diện chính của chương trình như hình bên dưới.

- Trước khi sử dụng phải cấu hình đường dẫn chứa database bằng cách click vào nút … bên góc dưới. Mặc định database được đặt cùng thư mục chạy của chương trình. Do đó chỉ cấu hình nếu khác đường dẫn trên.

- Click nút « Tính » để bắt đầu tìm, sau khi click nút này thì thanh tiến trình tính toán (Progress bar) sẽ hiển thị để cho biến tình tính toán

- Xem đồ thị : để xem đồ thị nào chọn hàng dữ liệu muốn xem và click nút Xem,

cho phép xem 3 đồ thị sau :

• Đồ thị so sánh giữa 2 cập chứng khoán

• Đồ thị U,L, C : là đồ thị của biên trên, dưới của mã chứng khoán 1

• Đồ thị U,L, C : là đồ thị của biên trên, dưới của mã chứng khoán 2

4.2.4. Cài đặt

- Cài đặt Microsoft .NET Framework 2.0 - Copy các file chương trình vào cùng thư mục

- Chạy file PairTrading.exe để thực hiện chương trình

KẾT LUẬN

Một phần của tài liệu Tiểu luận môn khai phá dữ liệuTÍNH SỰ TƯƠNG ĐỒNG CỦA CHUỖI DỮ LIỆU THỜI GIAN (Trang 50 - 63)