M hình mạng Neural trong giải quyết bài tốn dự báo chứng khốn

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu khai phá dữ liệu và ứng dụng phân tích xu thế thị trường chứng khoán (Trang 35 - 37)

3.1.2.1. hu th d i u.

Dữ li u được sử dụng trong bài tốn dự báo này là giá c phiếu MSFT của cơng ty Microsoft Corporation được thu thập từ 13/03/1986 đến 15/07/2015 niêm yết trên sàn NASDAQ từ trang http://finance.yahoo.com .

Dữ li u giá c phiếu tải về cĩ dạng:

Date Open High Low Close Volume

1-Jun-15 47.06 47.77 46.62 47.23 28,837,300 2-Jun-15 46.93 47.35 46.62 46.92 21,498,300 3-Jun-15 47.37 47.74 46.82 46.85 28,002,200 4-Jun-15 46.79 47.16 46.20 46.36 27,745,500 5-Jun-15 46.31 46.52 45.84 46.14 25,438,100 Bảng 3.1: Dữ li u c phiếu MSFT. Trong đĩ:

Date: là trường chỉ ngày giao dịch.

Open: là giá c phiếu tại thời điểm mở cửa trong ngày. High: là giá c phiếu cao nhất trong ngày.

Low: là giá cố phiếu thấp nhất trong ngày.

Close: là giá c phiếu được niêm yết tại thời điểm đĩng cửa trong ngày. Volume: là khối lượng giao dịch c phiếu trong ngày.

3.1.2.2. i d i u.

Trong khai phá dữ li u, quá trình tiền xử lý dữ li u là rất quan trọng. Quá trình tiền xử lý dữ li u giúp cho vi c chuẩn hĩa dữ li u trước khi đưa vào sử dụng. Vi c chuẩn hĩa dữ li u nh m loại bỏ tính khơng minh bạch của thị trường chứng khốn.

3.1.2.3. chức d i u.

Sau khi tiền xử lý dữ li u, tơi chia dữ li u thành ba tập: tập huấn luy n training set , tập kiểm chứng validation set) và tập kiểm tra (test set).

Tập huấn luy n là tập lớn nhất được mơ hình sử dụng để học các mẫu trong tập dữ li u. Tập huấn luy n chiếm khoảng 70% dữ li u.

Tập kiểm chứng được sử dụng để tối ưu bộ tham số trong mơ hình huấn luy n được sử dụng. Tập kiểm chứng chiếm khoảng 15% của tập dữ li u.

Tập kiểm tra cĩ kích cỡ chiếm khoảng 15% của tập dữ li u, nĩ được dùng để đánh giá khả năng khái quát hố của mơ hình huấn luy n.

3.1.2.3.1. ộ dữ liệu hứng hốn.

a. Trong phân tích định tính.

 Bộ dữ li u chứng khốn gồm 7385x5 bản ghi. Trong đĩ các cột tương ứng với số li u của giá đĩng cửa ngày i, i-1, i-2, i-3, i-4.

 Nhãn của hàng i được cho trong hàm 3.1 close(i) là giá đĩng cửa của ngày i, close i+s là giá đĩng cửa của ngày (i+s), với i 1.

close (i+s) > close (i) close (i+s) = close (i) -1 clo 1 sign(i) 0 se (i+s) < close (i )       (3.1) sign(i) = 1: sau s ngày, giá đĩng cửa của ngày i cĩ xu hướng tăng giá.

sign(i) = 0: sau s ngày giá đĩng cửa của ngày i cĩ xu hướng kh ng đ i. Tương tự sign(i) = -1, s ngày sau giá đĩng cửa ngày i cĩ xu hướng giảm giá.

 Tập huấn luy n cĩ 5169 mẫu, tập kiểm chứng cĩ 1108 mẫu, tập kiểm tra cĩ 1108 mẫu.

b. Trong phân tích định lượng.

 ẫn sử dụng bộ dữ li u trong mục 3.1.2.3.1.a nhưng nhãn của hàng i chính là giá đĩng cửa của ngày i+s) [23].

 Tập huấn luy n cĩ 5169 mẫu, tập kiểm chứng cĩ 1108 mẫu, tập kiểm tra cĩ 1108 mẫu.

3.1.2.3.2. ộ dữ liệu hứng hốn ết hợp với h báo kỹ thuật.

a. Trong phân tích định tính.

 Bộ dữ li u chứng khốn kết hợp với chỉ báo kỹ thuật gồm 7360x14 bản ghi. Trong đĩ các cột tương ứng với số li u của giá đĩng cửa ngày i, i-1, i-2, i-3, i-4, MACD, MACD – Histogram, Bollinger giữa, Bollinger dưới, Bollinger trên, RSI, roon up, roon down, và roon tương quan.

 Tập huấn luy n cĩ 5152 mẫu, tập kiểm chứng cĩ 1104 mẫu, tập kiểm tra cĩ 1104 mẫu.

b. Trong phân tích định lượng.

 ẫn sử dụng bộ dữ li u trong mục 3.1.2.3.2.a nhưng nhãn của hàng i chính là giá đĩng cửa của ngày i+s).

 Tập huấn luy n cĩ 5152 mẫu, tập kiểm chứng cĩ 1104 mẫu, tập kiểm tra cĩ 1104 mẫu.

3.1.2.4. u u hì h.

Luận văn t i sử dụng m hình mạng neural MLP với thuật tốn lan truyền ngược. Kiến trúc mạng gồm cĩ:

 Lớp đầu tiên là lớp vào.

 Lớp thứ hai là lớp ẩn. Theo lý thuyết thì cĩ thể cĩ nhiều lớp ẩn, ở đây t i chọn số lớp ẩn là 10.

 Lớp ra thể hi n kết quả: phân lớp (giá c phiếu tăng/giảm/kh ng đ i hoặc hồi quy (giá trị của giá c phiếu).

Hàm kích hoạt được sử dụng là hàm sigmoid (cơng thức 2.6). Các tham số :

 Khởi tạo trọng số liên kết và ngưỡng ngẫu nhiên.

 Tốc độ học: 0.01.

 Momentum Constant: 0.9.

 Số lần Epoch tối đa là: 1000.

3.1.2.5. Đ h gi hì h v h t ết uả

Mục đích chính của vi c đánh giá m hình là chỉ ra độ chính xác của mơ hình dự đốn. Nếu như kết quả của mơ hình là đáng tin cậy, chúng ta hồn tồn cĩ thể tin tưởng r ng giá trị dự đốn sẽ khơng l ch nhiều so với kết quả thực tế khi ta đưa dữ li u mới vào mơ hình.

3.2. M n xu t.

Kết hợp những kiến thức đã tìm hiểu, tơi đề xuất hai phương án cải tiến vi c dự báo xu thế thị trường chứng khốn. Hai phương án này cĩ nội dung như sau:

Đề xuất 1: Mơ hình mạng Neural cĩ b sung thêm các chỉ báo kỹ thuật.

ữ iệu M n mạn neural t quả dự ốn xu t t trƣờn c n ốn T n tốn một số c ỉ báo

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu khai phá dữ liệu và ứng dụng phân tích xu thế thị trường chứng khoán (Trang 35 - 37)

Tải bản đầy đủ (PDF)

(56 trang)