Mô hình máy véctơ hỗ trợ (Support Vector Machin e SVM)

Một phần của tài liệu Dự báo xu hướng chứng khoán tại Việt Nam bằng phương pháp học máy (Trang 34)

Trong nghiên cứu học máy, máy véc tơ hỗ trợ (SVM) là một phƣơng pháp dựa trên thuật toán đƣợc giới thiệu bởi Boser et al. (1992) và Vanik (1995). Phƣơng pháp học máy này lần đầu tiên đƣợc áp dụng vào các nhiệm vụ phân loại và sau đó đƣợc điều chỉnh phù hợp cho nhiệm vụ hồi quy (Vapnik et al, 1996). SVM đang đƣợc đánh giá là tốt hơn các mô hình khác nhƣ mô hình cây quyết định hay mô hình K láng giềng gần nhất (KNN) nhờ khắc phục đƣợc những nhƣợc điểm nhƣ cần dữ liệu huấn luyện lớn và khả năng tổng quát hóa thấp vì thƣờng xảy ra quá khớp bởi những giá trị tối ƣu cục bộ mà nó đạt đƣợc và tính hiệu quả của SVM đối với dữ liệu nhiều chiều và biến động phi tuyến của cổ phiếu [10].

Cho tập véctơ đầu vào và tập các giá trị nhãn lớp tƣơng ứng cho bộ phân lớp nhị phân. Hàm tuyến tính phân biệt hai lớp nhƣ sau:

(1)

Hình 2.5: Không gian tuyến tính

trong đó:

 là vector trọng số hay vector chuẩn của siêu phẳng phân cách, T là kí hiệu chuyển vị.

 là độ lệch

 là véc tơ đặc trƣng, làm hàm ánh xạ từ không gian đầu vào sang không gian đặc trƣng, (M > D).

Mục tiêu của SVM là tìm một siêu phẳng tối ƣu sao cho khoảng cách lề giữa hai lớp đạt giá trị cực đại. Bên cạnh đó, để đảm bảo tính tổng quát hóa cao và chống lại sự quá khớp (overfitting), một biến lỏng (slack variable) đƣợc đƣa vào để nới lỏng điều kiện phân lớp.

Hình 2.6: Biến lỏng được sử dụng trong SVM

Bài toán đƣa đến việc giải quyết tối ƣu có ràng buộc:

(2)

trong đó:

C > 0 là tham số chuẩn tắc (regularization parameter)

 là biến lỏng: cho mọi điểm dữ liệu.

 cho những điểm nằm trên lề hoặc phía trong của lề

 cho những điểm còn lại.

Do đó những điểm nằm trên đƣờng phân cách sẽ có

Còn những điểm phân lớp sai sẽ có

(2) có thể đƣợc giải bằng phƣơng pháp SMO [7] (Sequential Minimal Optimization). Phƣơng pháp này đƣa đến giải bài toán đối ngẫu quy hoạch toàn phƣơng - QP (Quadratic Programming):

(3)

Thỏa mãn: và với αi là các nhân tử

Lagrange.

Sau khi có đƣợc các giá trị từ bài toán (3), ta sẽ thu đƣơc các giá trị tối ƣu w* và b* của siêu phẳng. Chỉ có các mẫu có mới tham gia vào các véc tơ hỗ trợ (support vector). Cuối cùng, hàm quyết định phân lớp có dạng:

(4)

Gọi là hàm nhân của không gian đầu vào. Theo đó, tích vô hƣớng trong không gian đặc trƣng tƣơng đƣơng với hàm nhân K ở không gian đầu vào. Nhƣ vậy, thay vì tính trực tiếp giá trị tích vô huớng, ta thực hiện gián tiếp thông qua K.

Đối với dữ liệu chứng khoán biến đổi một cách phi tuyến [6], hàm phi tuyến Gauss (RBF-Radial Basis Function) có thể chọn làm hàm nhân:

2 , > 0 (5) Ngoài ra còn các hàm nhân khác thƣờng đƣợc sử dụng nhƣ :

 Hàm Linear Kernel (Tuyến tính) : K(xi, xj) = xiT.xj

 Hàm Polynomial Kernel (Đa thức bậc d): K(xi, xj) = ( xiT.xj + r)d, > 0

Với r và d là các tham số của hàm nhân.

Với mô hình thuật toán SVM hồi quy (SVR - Support Vector Regression). SVR là mở rộng của SVM, khác với hồi quy tuyến tính y(x)=w.x + w0 ở đây mô hình SVR dùng hàm lỗi -insensitive (Vapnik, 1995) đƣợc cho bởi:

Trong hàm này cho giá trị 0 nếu sai số tuyệt đối giữa dự đoán y(x) và mục tiêu t là < với >0. Do đó, giống nhƣ sử dụng SVM cho việc phân loại, mô hình dự báo dùng SVR chỉ phụ thuộc vào một tập hợp các dữ liệu huấn luyện. Ở đây hàm lỗi bỏ qua các điểm dữ liệu gần (trong ngƣỡng ) để dự đoán và chỉ các điểm nằm ngoài ống  đƣợc cho phép nhƣng bị chặn bằng các biến lỏng quyết định chiều rộng của ống [5].

Hình 2.7: ε – SVR với hạt nhân đa thức (phù hợp với một điểm dữ liệu)

Hình 2.8: SVR với hạt nhân tuyến tính giảm thiểu lỗi với biến lỏng Kết luận chương 2

Các kiến thức về khai phá dữ liệu có nhiều, trên đây chúng tôi chỉ giới thiệu để giúp ngƣời đọc hiểu đƣợc tổng quan về khai phá dữ liệu, một vài phƣơng pháp cơ bản để thực hiện đƣợc khai phá dữ liệu. Phƣơng pháp SVM đƣợc chúng tôi phân tích kỹ hơn cả với mục đích sử dụng cho xây dựng mô hình dự đoán chứng khoán tiếp theo.

Chƣơng 3. MÔ HÌNH DỰ BÁO CHỨNG KHOÁN

Trong chƣơng này, các lý thuyết nền tảng và kiến thức đƣợc trình bày ở trên sẽ đƣợc xem xét nghiên cứu để giải quyết bài toán. Trƣớc hết chúng tôi giới thiệu bài toán dự báo chứng khoán, mô hình dự đoán chung. Sau đó chuyển hƣớng đến mô hình sử dụng cho việc dự báo chứng khoán dựa trên những kiến thức trên và công cụ hỗ trợ việc triển khai thực nghiệm chƣơng trình.

Một phần của tài liệu Dự báo xu hướng chứng khoán tại Việt Nam bằng phương pháp học máy (Trang 34)