Quá trình tự hồiquy (AR)

Một phần của tài liệu Phát hiện tri thức từ cơ sở dữ liệu chuỗi thời gian (Trang 33)

đổi về cấu trỳc mụ hỡnh. Tuy nhiờn, khụng chắc chắn rằng cỏc mối quan hệ tồn tại trong chuỗi gốc sẽ thay đổi nhiều khi cú thờm dữ liệu mới, mụ hỡnh mới sẽ hiếm khi được nhận dạng. Nếu từ những gỡ thực tế xảy ra, dự bỏo bắt đầu thay đổi phự hợp thờm, mụ hỡnh cỳ thể được ước lượng lại. Tuy nhiờn việc thường xuyờn ước lượng lại mụ hỡnh là luụn hợp lý để mụ hỡnh luụn được cập nhật.

Kết luận

Chương này đú tập trung giới thiệu cỏc khỏi niệm cơ bản về dự bỏo, cỏc cụng cụ dự bỏo cỳ liờn quan, 3 thành phần cấu thành nờn mụ hỡnh ARIMA (hay cũn gọi là mụ hỡnh Box- Jenkins) là quỏ trỡnh tự hồi quy, quỏ trỡnh trung bỡnh trượt, quỏ trỡnh sai phừn (tớch hợp). Giới thiệu chi tiết về 4 bước phỏt triển mụ hỡnh ARIMA đú là: nhận dạng mụ hỡnh, ước lượng mụ hỡnh, thẩm định mụ hỡnh, dự bỏo mụ hỡnh.

CHƯƠNG 2

GIỚI THIỆU EVIEWS

PHẦN MỀM PHÂN TÍCH VÀ DỰ BÁO DỮ LIỆU 2.1 Giới thiệu chung

Cỳ rất nhiều phần mềm xử lý dữ liệu như là STATA, SPSS, EXCEL, MINITAB, và EViews . . . Cỏc phần mềm này đều cú điểm chung là giỳp chỳng ta xử lý dữ liệu một cỏch mau chúng. Tuy nhiờn mỗi phần mềm lại cú những đặc điểm riờng. STATA cú thể tốt cỏc dữ liệu từ cỏc cuộc điều tra lớn, SPSS cú ưu điểm xử lý dữ liệu mụ tả tốt dưới dạng bảng biểu, EXCEL thỡ cỳ ở khắp mọi mỏy tớnh PC thụng thường mà khụng cần phải cài đặt gỡ thờm. Ưu điểm chớnh của EViews cú thể là cho kết quả nhanh chúng về hàm kinh tế lượng cho cỏc dữ liệu chộo, dữ liệu chuỗi thời gian và dữ liệu bảng, ngoài ra phần mềm này lại được chạy trong mụi trường Window nờn rất ớt khi cần nhớ cỏc lệnh cụ thể.

EViews là sản phẩm đú được đăng ký bản quyền của Quantitative Micro Software EViews là cụng cụ sử dụng trong việc phõn tớch thống kờ chung, dự bỏo và đỏnh giỏ, ước lượng theo cỏc chuỗi thời gian, mụ phỏng mụ hỡnh cỳ sự biến thiờn lớn,cỏc phộp họa hỡnh trỡnh diễn hoặc quản trị cỏc dữ liệu đơn giản,…

EViews cung cấp cỏc cụng cụ dự bỏo hồi quy, phừn tớch dữ liệu tinh vi, phức tạp bằng cỏc mỏy tớnh dựa trờn nền Windows. Với EViews chỳng ta cỳ thể phỏt triển nhanh một quan hệ thống kờ từ dữ liệu của mỡnh và sau đú sử dụng quan hệ đú để dự bỏo cỏc giỏ trị tương lai của dữ liệu. Một số lĩnh vực sử dụng EViews rất hiệu quả như ước lượng và phõn tớch cỏc dữ liệu khoa học, phõn tớch tài chớnh, dự bỏo kinh tế vi mụ, mụ phỏng và dự bỏo nhu cầu tiờu thụ của thị trường cũng như phõn tớch giỏ cả thị trường.

EViews là phiờn bản được phỏt triển từ bộ cụng cụ phần mềm Time Series Processor sử dụng cho việc tớnh toỏn với cỏc chuỗi thời gian trờn cỏc mỏy tớnh lớn. EViews cung cấp cỏc phương thức trực quan và thuận tiện để nhập dữ liệu từ bàn phớm, từ cỏc tệp cú sẵn trờn đĩa, tạo mới cỏc chuỗi từ một chuỗi đú cỳ, hiển thị, in ra cỏc chuỗi và đưa ra cỏc phõn tớch thống kờ giữa cỏc quan hệ chặt chẽ của cỏc chuỗi.

EViews là một cụng cụ được xõy dựng và phỏt triển theo cỏc đặc tớnh của một phần mềm chạy trờn nền Windows với giao diện đồ họa và cỏc hệ thống menu, hộp hội thoại. Ngoài ra chỳng ta cũn cỳ thể sử dụng ngụn ngữ khối lệnh hoặc cỏc lệnh của EViews bằng cỏch nhập và sửa cỏc lệnh trong cửa sổ lệnh. Chỳng ta cỳ thể tạo và lưu trữ cỏc lệnh trong cỏc chương trỡnh để thực hiện sau đú.

Khi mở EViews lần đầu tiờn, cửa sổ chớnh cũn trống vỡ chưa xỏc định tập tin làm việc nào (workfile) để sử dụng .

Thanh trờn cựng trờn menu của Workfile chỉ toàn bộ đường dẫn đối với Workfile này; thanh trạng thỏi ở đỏy màn hỡnh cũng chỉ đường dẫn này.

Menu của workfile chứa cỏc nỳt dành cho

View Procs Objects Label +/- Show Fetch Store Delete Genr Sample

Cỏc phớm +/ - là cỏc phớm chuyển đổi thực hiện cỏc chức năng bật và tắt. Thụng tin về workfile này xuất hiện dưới thanh menu :

Range Filter Default Equation Sample

Trong cửa sổ của workfile, chỳng ta thấy tất cả cỏc đối tượng đang cú mặt trong workfile này : cỏc chuỗi (cỏc biến ), cỏc nhúm chuỗi, vector hệ số , vector phần dư, và bất cứ phương trỡnh, đồ thị hay bảng nào đú được đặt tờn.

2.2 Cỏc khỏi niệm cơ bản trong EViews 2.2.1 Dữ liệu và File

Cốt lừi của việc thiết kế bằng EViews là khỏi niệm của một đối tượng, cỏc đối tượng là tập hợp cỏc thao tỏc và thụng tin liờn quan được tớch hợp vào cựng một khối thống nhất và dễ dàng sử dụng. Thực tế tất cả cỏc cụng việc chỳng ta làm trong EViews sẽ liờn quan đến việc sử dụng và vận dụng đến rất nhiều đối tượng.

2.2.1.1 Workfile

Tất cả cỏc đối tượng của EViews phải được đặt trong một bộ chứa đối tượng, tất cả cỏc cụng việc chỳng ta làm trong EViews sẽ liờn quan đến cỏc đối tượng chứa trong một Workfile, vỡ vậy bước đầu tiờn trong việc sử dụng bất kỳ Project nào sẽ là tạo mới hoặc mở một Workfile cú sẵn.

EViews cú cỏc kiểu workfile định kỳ như: dữ liệu hàng năm, nửa năm (6 thỏng), hàng quý, hàng thỏng, hàng tuần và hàng ngày. Đối với cỏc workfile đú, EViews sẽ sử dụng tất cả cỏc thụng tin thời gian biểu cú sẵn trong việc tổ chức và quản lý dữ liệu.

Vớ dụ, với dữ liệu hàng tuần và hàng ngày, EViews phõn biệt được rằng cú một vài năm sẽ cú 366 ngày và nú sẽ điều chỉnh số lần quan sỏt trong một năm cho phự hợp.

Phạm vi của workfile là một cặp ngày thỏng hoặc số lần quan sỏt mụ tả lần quan sỏt đầu tiờn và cuối cựng sẽ được tổ chức trong workfile.

Tạo workfile: chọn File/ New/ Workfile 2.2.1.2 Nhập dữ liệu trong EViews + Nhập dữ liệu từ cỏc phần mềm khỏc

Dữ liệu cú thể được nhập vào từ cỏc tập tin Lotus, Excel, SPSS, MINITAB hoặc ASCII. Trong mỗi trường hợp đều dựng phương phỏp như nhau, đú là nhập dữ liệu bằng cỏch copy và dỏn (Copy và Paste)

Chỳng ta cú thể copy và dỏn từ nhiều nguồn, bao gồm cả thư điện tử.

Trước khi bắt đầu thao tỏc copy/paste , phải tạo ra cỏc biến trong workfile mục tiờu.

+ Nhập dữ liệu qua bàn phớm

Phương phỏp này đơn giản nhưng phiền phức; nếu việc nạp dữ liệu cần được thực hiện bằng tay thỡ người ta thớch làm bằng cỏch sử dụng một chương trỡnh bảng tớnh (như là Excel), sau đú nhập vào EViews. (adsbygoogle = window.adsbygoogle || []).push({});

2.2.1.3 Lựa chọn mẫu dữ liệu

Lựa chọn mẫu dữ liệu là chọn giai đoạn nghiờn cứu trong dữ liệu hiện cú trong workfile. Cú 2 cỏch:

+ Xỏc định khoảng mẫu mà chỳng ta muốn xem xột

+ Xỏc định cỏc quan sỏt thoả mún một điều kiện logic (if) nào đú.

Nếu sử dụng cả hai phương phỏp, thỡ mẫu kết quả là giao của cỏc mẫu được tạo ra bởi hai phương phỏp này.

2.2.2 Đối tượng (Object)

Thụng tin trong EViews được lưu trữ trong cỏc đối tượng, mỗi đối tượng gồm một tập hợp cỏc thụng tin cú liờn quan đến một phạm vi phõn tớch cụ thể. Một đối tượng phương trỡnh là tập hợp cỏc thụng tin liờn quan đến quan hệ giữa một tập cỏc biến.

Kết hợp với mỗi kiểu đối tượng là một tập cỏc hiển thị (view) và cỏc thủ tục được sử dụng với thụng tin chứa trong đối tượng. Sự kết hợp cỏc hiển thị và cỏc thủ tục với kiểu dữ liệu chứa trong đối tượng gọi tắt là thiết kế hướng đối tượng trong EViews

Thiết kế hướng đối tượng làm đơn giản húa cỏc cụng việc khi sử dụng EViews

2.2.2.1 Dữ liệu đối tượng (Object Data)

Mỗi đối tượng chứa rất nhiều kiểu thụng tin. Vớ dụ: chuỗi, ma trận, vector và cỏc đối tượng vụ hướng. Cỏc phương trỡnh và hệ thống chứa thụng tin hoàn chỉnh về phương trỡnh đặc tả và cỏc kết quả ước lượng cũng như cỏc tham chiếu đến dữ liệu cơ bản để xõy dựng cỏc phộp ước lượng, cỏc biểu đồ, cỏc bảng chứa số, văn bản và cỏc thụng tin định dạng.

2.2.2.2Hiển thị đối tượng (Object view)

Một đối tượng chuỗi cú thể hiển thị ra dưới dạng bảng tớnh, dũng dữ liệu, dũng hiển thị biểu đồ, biểu đồ thống kờ, biểu đồ tương quan. Cỏc hiển thị khỏc như đồ thị phõn loại, đồ thị mật độ nhõn. Cỏc hiển thị chuỗi cũng cho phộp tớnh toỏn cỏc kiểm định giả thiết và thống kờ đơn giản cho cỏc nhúm con khỏc trong nhau.

Một đối tượng phương trỡnh cỳ một hiển thị đại diện trỡnh bày đặc tả phương trỡnh, một hiển thị đầu ra chứa cỏc kết quả ước lượng, một hiển thị phần dư phự hợp thực tế chứa cỏc đồ thị của phần dư và cỏc giỏ trị hợp lý.

2.2.2.3 Cỏc kiểu đối tượng

Hầu hết cỏc đối tượng trong EViews là cỏc đối tượng chuỗi và phương trỡnh, tuy nhiờn cỳ một số kiểu khỏc nhau của cỏc đối tượng, mỗi đối tượng phục vụ một hàm duy nhất. Hầu hết cỏc đối tượng được mụ tả bằng một biểu tượng duy nhất.

Coefficient Vector Scalar

Equation Series Graph

Sspace (State Space)

Sym (Symmetric Matrix) Matrix

Table Model Text

Group System

Logl (Log Likelihood)

Var (Vector Autoregression) Sample

Vector/Row Vector

2.2.3. Khảo sỏt dữ liệu:

+ Bảng tớnh:

Chuỗi dữ liệu gốc được hiển thị dưới dạng bảng tớnh

+ Đồ thị

Chọn View/Multiple Graphs/Line từ thanh cụng cụ đối tượng nhúm để thể hiện đồ thị đường của từng chuỗi (adsbygoogle = window.adsbygoogle || []).push({});

Chọn VViieeww//MMuullttiipplleeGGrraapphhss//BBaarr từ thanh cụng cụ đối tượng nhúm để thể hiện đồ thị cột của nhúm

+ Thống kờ mụ tả và đồ thị

Để thu được đồ thị và thống kờ mụ tả của một chuỗi chỳng ta chọn

View/Descriptive Statistics/Histogram and Stats + Ma trận tương quan và hiệp phương sai

Chọn cỏc chuỗi muốn thể hiện dưới dạng ma trận tương quan và hiệp phương sai sau đú nhấp Quick/Group Statistics/Correlations ( hay Covariances nếu muốn thể hiện ma trận hiệp phương sai)

Hoặc chọn VViieeww//CCoorrrreellaattiioonnttừừtthhaannhhccụụnnggccụụđđốốiittưượợnnggnnhhúúmmđđểểtthhểểhhiiệệnnmmaattrrậậnn t

tưươơnnggqquuaannccủủaannhhúúm m

2.2.4 Làm việc với dữ liệu

2.2.4.1 Sử dụng biểu thức (Expession)

Một trong cỏc đặc tớnh nổi bật của EViews là khả năng sử dụng và xử lý cỏc biểu thức toỏn học. EViews bao gồm một thư viện tổng hợp cỏc hàm và toỏn tử đi kốm phộp thực hiện cỏc thao tỏc toỏn học phức tạp trờn dữ liệu chỉ bằng một số phớm bấm.

Một biểu thức của EViews là một tổ hợp cỏc số, cỏc tờn chuỗi, cỏc hàm, cỏc toỏn tử toỏn học và toỏn tử quan hệ. Trong thực tế, bạn sẽ sử dụng cỏc biểu thức mụ tả tất cả cỏc thao tỏc toỏn học theo cỏc đối tượng của EViews.

Cú thể sử dụng cỏc biểu thức đú để tớnh toỏn một chuỗi mới từ chuỗi đú cỳ để mụ tả một vớ dụ về cỏc lần quan sỏt, hoặc để mụ tả một phương trỡnh ước lượng hoặc dự bỏo được lưu trữ trong cỏc đối tượng, mỗi đối tượng gồm cú một tập hợp cỏc thụng tin cú liờn quan đến một phạm vi phõn tớch cụ thể.

Sử dụng cỏc toỏn tử trong EViews như quy tắc trong toỏn học.

2.2.4.2 Làm việc với chuỗi ( Series)

+ Tạo một chuỗi: cỳ 2 cỏch

- Chọn Object/New Objects…từ menu, chọn Series. Đặt một tờn cho chuỗi hoặc cú thể khụng cần đặt tờn cho chuỗi mới đú. Nhấn OK. EViews sẽ mở ra một bảng tớnh của chuỗi mới tạo đú. Tất cả cỏc theo dừi trong chuỗi sẽ được gỏn giỏ trị NA (not available). Chỳng ta cú chỉnh sửa hoặc sử dụng biểu thức để gỏn giỏ trị cho chuỗi. - Sinh ra chuỗi nhờ sử dụng biểu thức toỏn học. Nhấn Quick/Generate Series…và đưa vào biểu thức để định nghĩa chuỗi hoặc kớch chuột vào Genr trờn toolbar. Một trong cỏc mục đớch sử dụng chớnh của biểu thức trong EViews là sinh ra cỏc chuỗi mới từ cỏc dữ liệu đú cỳ hoặc để sửa đổi cỏc giỏ trị trong chuỗi đú cỳ. Cỏc biểu thức cho phộp thực hiện cỏc chuyển đổi phức tạp trờn dữ liệu của bạn. Sau khi chuyển đổi, cỏc kết quả được lưu vào một chuỗi mới hoặc một chuỗi đú cỳ.

2.2.4.3 Làm việc với chuỗi tự động (Auto-Series)

Khi làm việc với cỏc biểu thức, chỳng ta sử dụng một biểu thức thay thế một chuỗi. Cỏc cụng cụ về biểu thức của EViews cho phộp thay thế cỏc biểu thức ảo vào vị trớ bất kỳ bạn muốn dựng một chuỗi như là một đối tượng chuỗi, như một nhúm phần tử, trong cỏc đặc tả phương trỡnh và ước lượng.

Sử dụng chuỗi tự động rất hiệu quả khi muốn xem quỏ trỡnh thực hiện một hàm của chuỗi, nhưng khụng muốn giữ lại cỏc chuỗi đú biến đổi.

Vớ dụ: Series logcp = log(cp)

EViews cung cấp cỏc cụng cụ đặc biệt để làm việc với cỏc nhúm chuỗi được quản lý trong dạng (form) của đối tượng nhúm. Cú thể sử dụng nhúm để nhập dữ liệu từ cỏc bảng tớnh.

Với một nhúm, cú thể tớnh toỏn nhiều phộp toỏn thống kờ khỏc nhau, mụ tả quan hệ giữa nhiều chuỗi và hiển thị chỳng trong nhiều dạng khỏc nhau như cỏc bảng tớnh, bảng biểu và cỏc đồ thị.

2.2.5. Hàm chuỗi

EViews chứa một thư viện với số lượng lớn cỏc hàm xõy dựng sẵn thao tỏc trờn tất cả cỏc phần tử của chuỗi trong mẫu hiện thời. Một số hàm là "hàm phần tử" - là hàm sẽ trở thành giỏ trị cho mỗi phần tử của chuỗi trong khi đú cỏc hàm khỏc là "hàm kết luận" sẽ trở thành lượng vụ hướng, vộc tơ hay ma trận cú thể được sử dụng để xõy dựng chuỗi mới hoặc làm việc trong ngụn ngữ ma trận

Hầu hết tờn cỏc hàm được bắt đầu bằng ký hiệu @

Vớ dụ: @mean trả ra giỏ trị trung bỡnh của chuỗi trong mẫu hiện thời @abs lấy giỏ trị tuyệt đối của mỗi theo dừi trong mẫu hiện thời.

2.3 Xử lý chuỗi

2.3.1 Tạo biến mới, độ tiến (Leads), độ trễ (Lags) và sai phõn (Differences)

2.3.1.1 Tạo cỏc biến mới

Nếu muốn tạo ra biến mới là một hàm số của cỏc biến hiện thời, chỳng ta sử dụng chức năng Genr trờn EViews. Vớ dụ, để tạo ra Y như một logarit tự nhiờn của x chỳng ta sẽ nhấp vào Genr trờn menu của workfile, sau đú gừ Y = log(x). EViews cỳ một số lớn cỏc chức năng cú thể khỏm phỏ dưới địa chỉ Help/Function Reference. (adsbygoogle = window.adsbygoogle || []).push({});

2.3.1.2 Độ tiến (Leads), độ trễ (Lags)

Sử dụng tờn chuỗi, theo sau là độ trễ hoặc độ tiến được đặt trong cặp ngoặc. Độ trễ được đặc tả như một số õm và độ tiến thể hiện dưới dạng số dương.

Vớ dụ: income(-4) là độ trễ thứ tư của chuỗi income sales(2) là độ tiến thứ 2 của chuỗi sales.

Trong EViews, chỳng ta cú thể đặc tả một dúy cỏc hạng thức độ tiến hay độ trễ. Vớ dụ khi ước lượng phương trỡnh chỳng ta cỳ thể thể hiện biểu thức dưới dạng:

income(-1 to -4)

để thể hiện tất cả cỏc độ trễ của INCOME từ 1 đến 4. Tương tự, cỏc biểu thức

sales sales(-1) sales(-2) sales(-3) sales(-4) sales(0 to -4)

sales(to -4)

là cỏc phương phỏp tương đương để đặc tả mức của SALES và tất cả cỏc độ trễ từ 1 đến 4.

2.3.1.3 Sai phừn

EViews cú nhiều hàm xõy dựng sẵn để làm việc với dữ liệu sai phõn trong cỏc mức và trong logs. Hàm “d” và “dlog” sẽ tự động đỏnh giỏ sai phõn cho bạn.

Vớ dụ, cỳ thể thay: income - income(-1) bằng d(income) log(income) - log(income(-1)) bằng dlog(income)

Ta cú thể lấy sai phõn bậc cao hơn bằng việc đặc tả bậc sai phừn. Vớ dụ: d(income,4)

dlog(income,4)

thể hiện sai phừn bậc 4 của INCOME và log(INCOME).

Nếu muốn tiến hành sai phõn mựa vụ, ta đặc tả cả hạng thức sai phõn thụng thường

Một phần của tài liệu Phát hiện tri thức từ cơ sở dữ liệu chuỗi thời gian (Trang 33)