Chương trình NeuroSolutions sau khi được đưa các dữ liệu đầu vào và đầu ra sẽ tự động chọn các lớp ẩn cho phù hợp với dữ liệu, cũng như tự động điều chỉnh các hệ số khác như Learning rate, Momemtum và epoch. Mặc định số epoch khi training của chương trình là 1000. Ngồi ra chương trình cịn cung cấp các tiện ích khác như cửa sổ theo dõi dữ liệu training qua biểu đồ kết quả dự báo. Một điểm nổi bật khác của chương trình này là nếu dữ liệu đầu vào có mối tương quan thấp với dữ liệu đầu ra vẫn được sử dụng nhưng sẽ được tự điều chỉnh với trọng số nhỏ.
3.3. CÁCH THỨC THU THẬP VÀ XỬ LÝ DỮ LIỆU THÔ3.3.1. Các nhân tố ảnh hưởng thị trường chứng khoán Việt Nam 3.3.1. Các nhân tố ảnh hưởng thị trường chứng khoán Việt Nam
Thị trường chứng khoán là một bộ phận của nền kinh tế vì vậy những thay đổi trong nền kinh tế đều có tác động trực tiếp hoặc gián tiếp đến thị trường chứng khoán. Theo nhận định của nhiều chun gia và nhà đầu tư chứng khốn thì thị trường chứng khốn hiện nay thì tác động “tâm lý bầy đàn” vẫn là tác động lớn nhất. Nhưng những tâm lý hình thành kỳ vọng của nhà đầu tư cũng có những yếu tố khác tác động đến, hiện nay ở Việt Nam chính là do các chính sách kinh tế của Chính Phủ. Chính những chính sách hay thay đổi của Chính phủ đã làm cho nhiều nhà đầu tư chứng khoán hiện nay giảm bớt đầu tư vào thị trường và thay đổi danh
mục của mình vào những kênh sinh lời khác như: bất động sản, thị trường vàng, kinh doanh ngoại tệ v.v….
Còn về các yếu tố tác động đến tâm lý của nhà đầu tư, ta có thể kể đến là: tỷ giá USD/VND, lãi suất tiền gửi, GDP, CPI, giá trị giao dịch mua/bán của các nhà đầu tư nước ngoài, khối lượng giao dịch trong ngày của VN-INDEX v.v… Đó là những yếu tố trong nước, cịn các yếu tố ngồi nước có thể từ sự cộng hưởng của các thị trường chứng khốn bên ngồi phải kể đến chỉ số S&P500( Mỹ), SSE (Trung Quốc). Những yếu tố này thể hiện trạng tình trạng của nền kinh tế nước ta, nhất là sau khi gia nhập WTO nền kinh tế Thế Giới lại càng ảnh hưởng đến chúng ta. Vì vậy, chúng tơi đưa ra các yếu tố sau ảnh hưởng đến VN-INDEX:
VNINDEX: Chỉ số VN-INDEX
KL_VNINDEX: Khối lượng giao dịch toàn thị trường của VN-INDEX NNKLMUA: Tổng khối lượng mua vào của nhà đầu tư nước ngoài (bao gồm giao dịch thỏa thuận)
NNKLBAN: Tổng khối lượng bán ra của nhà đầu tư nước ngoài (bao gồm giao dịch thỏa thuận)
NNGTMUA: Tổng giá trị tiền mua vào của nhà đầu tư nước ngoài (bao gồm giao dịch thỏa thuận)
NNGTBAN: Tổng giá trị tiền bán ra của nhà đầu tư nước ngoài (bao gồm giao dịch thỏa thuận)
CPI: Chỉ số hàng tiêu dùng của cả nước
LAMPHAT: Tỷ số phần trăm lạm phát so với kỳ gốc năm 2005 là 100 USD/VND: Tỷ giá USD/VND
JPY/VND: Tỷ giá JPY/VND EUR/VND: Tỷ giá EUR/VND
XKXANG: Khối lượng xuất khẩu dầu thơ NKXANG: Khói lượng nhập khẩu xăng
GDP_GTT: Tổng sản phẩm quốc nội tính theo giá thực tế SP500: Chỉ số các cơng ty vừa và nhỏ ở Mỹ S&P 500
SSE B: Chỉ số chứng khoán thị trường Thượng Hải, Trung Quốc LS3THANG: Lãi suất tiết kiệm có kỳ hạng 3 tháng
LS6THANG: Lãi suất tiết kiệm có kỳ hạng 6 tháng LS12THANG: Lãi suất tiết kiệm có kỳ hạng 12 tháng
Cũng nhờ vào tính chất đặc biệt của mơ hình Neural Network tự động nhận thấy các mối tương quan giữa các biến với nhau, vì vậy chúng ta khơng cần phải quan trọng về việc thống nhất đơn vị tính của từng biến. Các biến nhập trên đây có thể để ở bất kỳ đơn vị tính nào, trong q trình training mơ hình sẽ tự động san bằng các sai biệt về đơn vị tính và sau đó làm việc với dữ liệu sau điều chỉnh từ quá trình training.
3.3.2. Cách thức thu thập và điều chỉnh dữ liệu đầu vào
Việc thu thập dữ liệu đều dựa trên những trang web có uy tín. Tuy nhiên về mặt thời gian như đã trình bày ở phần trước cần phải nhất quán với nhau. Ở đây, chúng tôi tổ chức dữ liệu mẫu theo tuần để có những số liệu dự báo kịp thời cho nhà đầu tư. Do tính chất đặc thù của một số dữ liệu khơng có dữ liệu theo tháng, tơi lấy trung bình cho các tuần trong tháng. Các yếu tố được sử dụng theo phương pháp bình quân này là: CPI. XKXANG, NKXANG, GDP_SS_1994, GDP_TT,
LAMPHAT. Trong trường hợp đặc biệt của GDP thì dữ liệu được tổ chức theo quý nên lấy bình qn cho các tuần trong q đó.
Các dữ liệu trên đầy đều được lấy trong năm 2006, 2007 và ba tháng đầu năm 2008 để đảm bảo dữ liệu mẫu đủ lớn trong việc chạy mơ hình, tồn bộ ta có được 111 mẫu được trình bày chi tiết trong phụ lục.
Nguồn dữ liệu được dùng để xây dựng mơ hình Neural Network được lấy từ những nguồn khác nhau phù hợp với từng loại biến như sau:
VNINDEX: Dữ liệu dùng cho MetaStock từ trang web Phân tích cổ phiếu (www.phantichcophieu.com)
KL_VNINDEX: Dữ liệu dùng cho MetaStock từ trang web Phân tích cổ phiếu (www.phantichcophieu.com)
NNKLMUA: Phần mềm “Giao dịch nhà đầu tư nước ngoài” từ trang web Phân tích cổ phiếu (www.phantichcophieu.com)
NNKLBAN: Phần mềm “Giao dịch nhà đầu tư nước ngồi” từ trang web Phân tích cổ phiếu (www.phantichcophieu.com)
NNGTMUA: Phần mềm “Giao dịch nhà đầu tư nước ngồi” từ trang web Phân tích cổ phiếu (www.phantichcophieu.com)
NNGTBAN: Phần mềm “Giao dịch nhà đầu tư nước ngoài” từ trang web Phân tích cổ phiếu (www.phantichcophieu.com)
CPI: Tổng cục thống kê
LAMPHAT: Tổng cục thống kê
USD/VND: Trang web của ngân hàng TMCP Xuất nhập khẩu www.exim.com.vn
JPY/VND: Trang web của ngân hàng TMCP Xuất nhập khẩu www.exim.com.vn
EUR/VND: Trang web của ngân hàng TMCP Xuất nhập khẩu www.exim.com.vn
XKXANG: Tổng cục thống kê NKXANG: Tổng cục thống kê
GIA_VANG: Trang web của ngân hàng TMCP Xuất nhập khẩu www.exim.com.vn
GDP_SS_1994: Tổng cục thống kê GDP_GTT: Tổng cục thống kê
SP500: Trang web Yahoo!Finance www.finance.yahoo.com SSE B: Trang web Yahoo!Finance www.finance.yahoo.com LS3THANG: Ngân hàng Đầu tư phát triển quốc tế
3.3.3. Tổ chức file dữ liệu
Tất cả các dữ liệu đầu vào đều được nhập vào một file excel, nhưng do chương trình NeuroSulutions chỉ có thế đọc dữ liệu dưới dạng text ASCII nên chúng ta cần phải chuyển đổi dữ liệu từ excel sang dạng text. Các thao tác bước sau đây chúng tôi sử dụng Microsoft Office 2007.
Trước tiên, tạo một file access, sau đó thực hiện lệnh import file excel vào
Microsoft Access. Chọn các field trong access có tên chính là tên của các cột của file excel. Sau đó chọn định dạng cho từng cột, các cột đều có định dạng kiểu số, trừ ô NGAY là định dạng kiểu Date/Time, ta chọn khóa chính cho table này là cột STT.
Sau khi có table dữ liệu từ excel chuyển qua ta xuất dữ liệu sang file text. Trong quá trình xuất, chọn dấu phân cách các cột là dấu “,” và dòng đầu tiên là tiêu đề của các cột.
Sau khi xuất ra thành file text, ta có thể dùng file này vào chương trình NeuroSolutions để chạy mơ hình Neural Network.
3.3.4. Phân tích các biến đầu vào bẳng Data Manager
Mở Data Manager, chọn file dữ liệu đầu vào, sau đó chọn biến mong muốn là VN-INDEX. Sau đó ta thực hiện phân tích các dữ liệu đầu vào để đo lường mức độ tương quan của các biến đầu vào với biến đầu ra. Ta có được biểu đồ sau thể hiện mức độ tương quan theo biểu đồ hình 3.3.
Biểu đồ cho thấy sự tương quan của các biến đầu vào với biến đầu ra. Dù có nhiều biến có tương quan thấp nhưng ta vẫn giữ lại trong mơ hình để diễn tả phần nào tác động của các yếu tố này đến nền kinh tế.
Hình 3.3: Biểu đồ thể hiện độ tương quan giữa các biến đầu vào và biến đầu ra
3.4. Q TRÌNH XỬ LÝ MƠ HÌNH VÀ PHÂN TÍCH KẾT QUẢ3.4.1. Cách thực hiện chạy chương trình NeuroSolutions 3.4.1. Cách thực hiện chạy chương trình NeuroSolutions
Trước khi thực hiện chương trình, chúng tơi điểm qua lại các điều kiện ban đầu được chúng tơi sử dụng để thực hiện mơ hình Neural Network dự báo VN-INDEX
- Mơ hình thu thập số liệu từ ngày 3/1/2006 đến ngày 25/3/2008
- Phần mềm sử dụng là phiên bản Demo
- Các số liệu, thông tin đầu vào được thu thập từ các nguồn đáng tin cậy nhất có thể trong khả năng nhưng cũng khơng tránh khỏi những thiếu sót do nguyên nhân khách quan.
Bước 1: Chọn kiểu mơ hình là dự báo dựa trên những dữ liệu quá khứ và
ước lượng từ mơ hình.
Bước 2: Chọn đường dẫn đến dữ liệu đầu vào đã được chuyển sang file text Bước 3: Chọn các dữ liệu đầu vào có dữ liệu dưới dạng khác dạng số ( trong mơ
hình này khơng có dữ liệu thiết kế theo dạng khác dạng số trừ biến NGAY) Bước
4: Chọn file dùng làm biến output, ta chọn là dữ liệu giống dữ liệu ban đầu. Bước 5: Chọn biến số đầu ra, ta chọn VN-INDEX
Bước 6: Chọn xem biến đầu ra có phải được trình bày dưới dạng số hay khơng Bước 7: Chọn thời điểm cần mơ hình dự đốn tiếp.
Bước 8: Chọn biến để thử dữ liệu trong suốt thời gian training của mơ hình. Trong
trường hợp này, tơi chọn dùng 20% dữ liệu ban đầu để kiểm tra mơ hình Bước 9: Chọn out of sample, chương trình mặc định là 20%
Bước 10: Chọn cách so sánh giữa các mơ hình với nhau, tính năng này bỏ qua Bước 11: Chọn dạng thay đổi của phương sai. Ta chọn là Low, nghĩa là
phương sai sẽ theo mục tiêu là thấp nhất.
Trên đây là các bước để thiết kế một mơ hình Neural Network. Tuy nhiên do số lượng mẫu có hạn nên độ chính xác của mơ hình khơng cao. Để mơ hình cho ra kết quả tốt nhất cần phải training dữ liệu nhiều lần, ít nhất là 3 lần. Và mỗi lần training là mơ hình tự động thiết kế 1000 lần chạy với các biến đầu vào dựa trên các biến động trong quá khứ của VN-INDEX. Sau khi training nhiều lần, ta chạy Tesing để có được kết quả đầu ra mong muốn.
3.4.2. Kết quả nhận được từ phần mềm NeuroSolutions
Sau quá trình Training dữ liệu, dữ liệu đầu ra và dự liệu dự báo của VN-INDEX được thể hiện như hình 3.4. Hình 3.4 cho ta thấy dữ liệu dự báo cho kết quả gần với kết quả lấy từ 20% dữ liệu dùng để kiểm tra tính chính xác của mơ hình. Vì vậy, nhìn vào hình 3.4 ta có thể nói q trình huấn luyện nhận được rất thành cơng và có thể tiếp tục q trình testing để cho ra kết quả dự báo của VN-INDEX.