Chuyển dữ liệu thời gian thực

Một phần của tài liệu nguyên cứu và xây dựng hệ thống quản lý và dự đoán xu thế giá chứng khoán dựa trên nền tảng mã nguồn mở (Trang 51 - 52)

Định nghĩa: Dữ liệu thời gian thực hay chuỗi tuần tự theo thời gian (time series) là

một chuỗi các giá trị của một đại lượng nào đó được ghi nhận là tuần tự theo thời gian. Ví dụ: Số lượng hàng hóa được bán ra trong 12 tháng năm 2008 của một công ty. Các giá trị của chuỗi tuần tự theo thời gian của đại lượng X được kí hiệu là X1, X2, …, Xt, …, Xn. với Xt là giá trị của X tại thời điểm t.

Dữ liệu chúng ta sử dụng là dữ liệu thời gian thực (time series) . Đặc điểm chính để phân biệt giữa dữ liệu có phải là thời gian thực hay không đó chính là sự tồn tại của cột thời gian được đính kèm trong đối tượng quan sát. Nói cách khác, dữ liệu thời gian thực là một chuỗi các giá trị quan sát của biến Y:

Mục đích chính của việc phân tích chuỗi thời gian thực là thu được một mô hình dựa trên các giá trị trong quá khứ của biến quan sát cho phép ta có thể

dự đoán được giá trị của biến Y trong tương lai, tức là có thể dự đoán được các giá trị .

Dữ liệu chứng khoán mà Jstock thu thập được là dữ liệu theo chuỗi thời gian và có nhiều thuộc tính cùng được ghi tại một thời điểm nào đó. Trong đó các thuộc tính chính bao gồm: Open, Last, High, Low, Volume

Open: Giá cổ phiếu tại thời điểm mở cửa trong ngày High: Giá cổ phiếu cao nhất tính đến thời điểm hiện tại Low: Giá cổ phiếu thấp nhất tính đến thời điểm hiện tại Last: Giá cổ phiếu được niêm yết tại thời điểm hiện tại

Volume: Khối lượng giao dịch cổ phiếu (bán, mua) trong ngày.

Mục đích của bước này là chuyển dữ liệu chứng khoán có dạng như trên thành dữ liệu dưới dạng bảng mà đã trình bày ở chương 4 để gói phần mềm weka có thể hiểu được

={ , , ,…, , , ,…, } vớ là giá tr ca biến Y ti thi đim t

, , ,…, , ,…,

Một phần của tài liệu nguyên cứu và xây dựng hệ thống quản lý và dự đoán xu thế giá chứng khoán dựa trên nền tảng mã nguồn mở (Trang 51 - 52)

Tải bản đầy đủ (DOCX)

(64 trang)
w