Một số vấn đề cần xem xét khi sử dụng mạng neural nhân tạo

Một phần của tài liệu Ứng dụng mạng neural dự báo chuỗi thời gian giá cổ phiếu trong thị trường chứng khoán việt nam (Trang 33 - 35)

Trong các chơng trớc, chúng tôi đã trình bày về bài toán dự báo chuỗi thời gian, đồng thời cũng trình bày khá tỉ mỉ về mạng neural nhân tạo. Thông qua sự trình bày đó, ta có thể thấy việc ứng dụng mạng neural để mô hình hóa và dự báo chuỗi thời gian đã khá rõ ràng. Tuy nhiên, cho đến nay các nhà khoa học vẫn phải đối mặt với một số khó khăn đang cần phải giải quyết[9]. Sau đây là một số vấn đề

cần phải xem xét khi sử dụng mạng neural để dự báo cũng nh các giải pháp đề nghị của chúng tôi.

3.1.1. Lựa chọn kiến trúc mạng ban đầu

Việc lựa chọn kiến trúc mạng ban đầu là một vấn đề còn phải xem xét, bởi vì cha có một giải pháp hữu hiệu nhất cho số các neuron và số các tầng ẩn. Số đầu vào và đầu ra của mạng đợc điều chỉnh tuỳ theo số đầu vào và đầu ra của từng bài toán cụ thể. Một số nhà nghiên cứu đa ra quan điểm "càng nhiều càng tốt"[9]. Tuy nhiên, nhiều nhà nghiên cứu cho rằng chỉ cần sử dụng một tầng ẩn bởi vì nếu sử dụng nhiều sẽ đẫn đến số tham số cần đợc ớc lợng tăng lên dẫn đến làm chậm quá trình kiểm tra mà không cải thiện đợc một cách căn bản hiệu quả của mạng. Các kết quả lý thuyết cho thấy rằng mạng neural một tầng ẩn với các hàm chuyển thích hợp có khả năng xấp xỉ bất cứ hàm đo đợc với độ chính xác chấp nhận đợc[8], và nếu sai số xảy ra thì là vì thuật toán học không tơng xứng hoặc là quá nhiều neuron hoặc là dữ liệu để huấn luyện không đủ. Điều đó khẳng định, mạng neural một tầng ẩn là thích hợp cho hầu hết các bài toán với số neuron là M nằm giữa khoảng I và 2I+1, trong đó I là số đầu vào, giá trị thích hợp nhất của M phải đợc xác định thông qua phơng pháp thử và sai. Đối với bài toán dự báo giá cổ phiếu, tầng đầu ra chỉ gồm 1 neuron, tầng đầu vào có số neuron bằng số đầu vào nên ta chỉ cần xét số neuron trong tầng ẩn.

3.1.2. Xác định tham số học α

Trong thuật toán học lan truyền ngợc, chúng tôi có đề cập đến tham số học

α. Việc xác định tham số α phù hợp có ảnh hởng đến tốc độ huấn luyện mạng và làm giảm sai số. Cha có một quy tắc cụ thể cho việc lựa chọn giá trị này, tuy nhiên một tập giá trị thích hợp ban đầu sẽ đợc lấy và sẽ điều chỉnh trong quá trình huấn luyện. Nếu ngay từ đầu chúng ta giảm sai số thì có thể làm chậm tốc độ huấn luyện.

3.1.3. Trọng số ban đầu, cực tiểu toàn cục và cực tiểu địa phơng

Nếu mạng dừng quá trình huần luyện trớc khi tìm ra giải pháp chấp nhận đợc vì cực tiểu địa phơng đã đợc tìm thấy thì cần phải thay đổi số neuron trong tầng ẩn hoặc thay đổi tham số học α, hoặc chúng ta phải bắt đầu lại với một tập trọng số

ban đầu khác. Khi mạng tìm ra đợc một giải pháp chấp nhận đợc thì vẫn cha thể đảm bảo rằng cực tiểu toàn cục nhỏ hơn cực tiểu địa phơng. Cần chú ý rằng thuật toán lan truyền ngợc có thể thất bại trong một số điều kiện ban đầu nhất định.

3.1.4. Sai số cho phép

Sai số cho phép cần đặt ra cho tất cả các mẫu. Việc ớc lợng chỉ dừng lại khi và chỉ khi sai số nhỏ hơn hoặc bằng sai số cho phép ban đầu đã đợc thiết lập. Thực ra, giá trị của sai số ban đầu là một bài toán phụ thuộc, tuy nhiên, vì cần phải xem xét thời gian tính toán nên thông thờng nếu mẫu đầu vào tốt thì khi độ chính xác đạt đến 98% thì quá trình huấn luyện có thể dừng lại. Cũng nh vậy số bớc lặp lớn nhất chỉ mang tính lý thuyết.

Một phần của tài liệu Ứng dụng mạng neural dự báo chuỗi thời gian giá cổ phiếu trong thị trường chứng khoán việt nam (Trang 33 - 35)