.26 Phân rã thành phần xu hướng khỏi các chuỗi thuộc bảng dòng tiền

Một phần của tài liệu Dự đoán dòng tiền dựa vào thu nhập của cơ sở kinh doanh (Trang 75 - 76)

66 trật ra khỏi xu hướng của chuỗi ban đầu quá nhiều.

4.3. Mạng nơ ron để huấn luyện dữ liệu

4.3.1.Tiền xử lí dữ liệu

Dữ liệu được mang vào nghiên cứu được lấy từ giá vàng, các báo cáo tài chính và các chỉ số chứng khoán thuộc cùng một công ty. Cụ thể, ta sẽ sử dụng báo cáo tài chính của công ty Google cho việc phân tích dữ liệu. Báo cáo tài chính được sử dụng gồm 3 loại: báo cáo tiền tệ, báo cáo dòng tiền, báo cáo bảng cân đối kế toán từ năm 2003 đến năm 2020. Sau khi nội sinh dữ liệu, lấy giao các điểm có giá trị thuộc cùng một ngày của tập dữ liệu trên, ta thu được lượng dữ liệu là 5800 điểm dữ liệu.

Sau khi xử lí, các trường dữ liệu được chọn đưa vào mô hình gồm 42 trường là các chuỗi dữ liệu đã được nội suy từ mục 4.2

Vì dữ liệu hiện có có những chuỗi có quy luật tăng trưởng không đồng đồng nhất. Để tăng hiệu quả huấn luyện và sử dụng tối đa giá trị dữ liệu, tôi sử dụng phương pháp K-Fold cross validation để huấn luyện mô hình.

Dữ liệu trước khi được đưa vào mô hình sẽ được scale in trong khoảng [-1,1] nhằm mục đích gia tăng tính nhanh hội tụ của mô hình.

4.3.2. Mô hình huấn luyện

Chúng ta sẽ lần lượt thử nghiệm độ đúng đắn của từng mô hình nơ ron để chọn ra mô hình phù hợp với bài toán được nêu. Hai mô hình được đem ra so sánh là mô hình mạng nơ ron đơn giản với lớp ẩn là Dense layer và mô hình LSTM với cùng số lượng units, batch_size như nhau, số lớp như nhau. Hai mô hình này đều sử dụng hàm loss là “Mean Square Error”, metric là “Mean Absolute Error”. Với lần thử nghiệm này, chúng ta sẽ thử với số epochs = 200.

Một phần của tài liệu Dự đoán dòng tiền dựa vào thu nhập của cơ sở kinh doanh (Trang 75 - 76)

Tải bản đầy đủ (PDF)

(93 trang)