Hàm chuỗi

Một phần của tài liệu Phát hiện tri thức từ cơ sở dữ liệu chuỗi thời gian (Trang 42)

EViews chứa một thư viện với số lượng lớn cỏc hàm xõy dựng sẵn thao tỏc trờn tất cả cỏc phần tử của chuỗi trong mẫu hiện thời. Một số hàm là "hàm phần tử" - là hàm sẽ trở thành giỏ trị cho mỗi phần tử của chuỗi trong khi đú cỏc hàm khỏc là "hàm kết luận" sẽ trở thành lượng vụ hướng, vộc tơ hay ma trận cú thể được sử dụng để xõy dựng chuỗi mới hoặc làm việc trong ngụn ngữ ma trận

Hầu hết tờn cỏc hàm được bắt đầu bằng ký hiệu @

Vớ dụ: @mean trả ra giỏ trị trung bỡnh của chuỗi trong mẫu hiện thời @abs lấy giỏ trị tuyệt đối của mỗi theo dừi trong mẫu hiện thời.

2.3 Xử lý chuỗi

2.3.1 Tạo biến mới, độ tiến (Leads), độ trễ (Lags) và sai phõn (Differences)

2.3.1.1 Tạo cỏc biến mới

Nếu muốn tạo ra biến mới là một hàm số của cỏc biến hiện thời, chỳng ta sử dụng chức năng Genr trờn EViews. Vớ dụ, để tạo ra Y như một logarit tự nhiờn của x chỳng ta sẽ nhấp vào Genr trờn menu của workfile, sau đú gừ Y = log(x). EViews cỳ một số lớn cỏc chức năng cú thể khỏm phỏ dưới địa chỉ Help/Function Reference.

2.3.1.2 Độ tiến (Leads), độ trễ (Lags)

Sử dụng tờn chuỗi, theo sau là độ trễ hoặc độ tiến được đặt trong cặp ngoặc. Độ trễ được đặc tả như một số õm và độ tiến thể hiện dưới dạng số dương.

Vớ dụ: income(-4) là độ trễ thứ tư của chuỗi income sales(2) là độ tiến thứ 2 của chuỗi sales.

Trong EViews, chỳng ta cú thể đặc tả một dúy cỏc hạng thức độ tiến hay độ trễ. Vớ dụ khi ước lượng phương trỡnh chỳng ta cỳ thể thể hiện biểu thức dưới dạng:

income(-1 to -4)

để thể hiện tất cả cỏc độ trễ của INCOME từ 1 đến 4. Tương tự, cỏc biểu thức

sales sales(-1) sales(-2) sales(-3) sales(-4) sales(0 to -4)

sales(to -4)

là cỏc phương phỏp tương đương để đặc tả mức của SALES và tất cả cỏc độ trễ từ 1 đến 4.

2.3.1.3 Sai phừn

EViews cú nhiều hàm xõy dựng sẵn để làm việc với dữ liệu sai phõn trong cỏc mức và trong logs. Hàm “d” và “dlog” sẽ tự động đỏnh giỏ sai phõn cho bạn.

Vớ dụ, cỳ thể thay: income - income(-1) bằng d(income) log(income) - log(income(-1)) bằng dlog(income)

Ta cú thể lấy sai phõn bậc cao hơn bằng việc đặc tả bậc sai phừn. Vớ dụ: d(income,4)

dlog(income,4)

thể hiện sai phừn bậc 4 của INCOME và log(INCOME).

Nếu muốn tiến hành sai phõn mựa vụ, ta đặc tả cả hạng thức sai phõn thụng thường và hạng thức sai phõn mựa vụ:

d(income,1,4) dlog(income,1,4)

là sai phừn bậc 1 kết hợp với sai phõn mựa vụ ở độ trễ 4. Nếu chỉ muốn tớnh sai phõn mựa vụ thỡ hạng thức sai phừn thường sẽ được đặc tả là 0:

d(income,0,4) dlog(income,0,4)

2.3.2 Xõy dựng tương quan đồ trong EViews

Khi chọn View/Correlogram…, hộp thoại Correlogram Specification xuất hiện. Ta cú thể chọn thiết lập tương quan đồ của chuỗi gốc x, sai phõn bậc nhất

d(x)=x–x(–1),

hay sai phừn bậc 2 của chuỗi d(x)-d(x(-1)) = x-2x(-1)+x(-2) Ta cũng cú thể đặc tả bậc độ trễ lớn hơn để thể hiện tương quan đồ.

Tự tương quan ước lượng trong EViews được tớnh khỏc so với tự tương quan được ước lượng trong mụ tả lý thuyết ( đú trỡnh bày trong chương 1)

Tự tương quan ước lượng trong EViews được tớnh bởi cụng thức:

trong đú:

và trung bỡnh mẫu là trung bỡnh của yt và yt-k

2.3.2.2 Biờn của đồ thị tương quan

Đường nột đứt trong đồ thị của tự tương quan (tự tương quan riờng) là 2 biờn xấp xỉ sai số chuẩn được tớnh bằng . Nếu tự tương quan (tự tương quan riờng) nằm trong cỏc biờn đú cú nghĩa là khụng cỳ ý nghĩa khỏc 0 ở xấp xỉ 5% mức ý nghĩa.

2.3.2.3 Thống kờ Q (Q-Statistics)

Hai cột cuối thể hiện trong tương quan đồ là Ljung-Box Q-statistics và giỏ trị p của chỳng. Thống kờ Q ở độ trễ k là một kiểm định thống kờ giả thiết khụng, đú là khụng cú tự tương quan đến độ trễ k và được tớnh theo cụng thức:

trong đú rj là tự tương quan thứ j và T là số cỏc theo dừi. Nếu chuỗi khụng dựa vào kết quả ước lượng ARIMA thỡ trong giả thiết khụng Q được phõn phối gần giống phõn phối 2

với bậc tự do bằng với số lượng cỏc tự tương quan. Nếu chuỗi thể hiện

T k t k t k t y T k y 1 ) /( y k j j LB T j r T T Q 1 2 ) 2 ( T / 2 (2.3.1) (2.3.2) (2.3.3) T t t T k t t t k t k k T z z k T y y y y r 1 2 1 / ) ( ) /( ) )( (

cỏc phần dư từ ước lượng ARIMA thỡ số bậc tự do thớch hợp phải được điều chỉnh để thể hiện số tự tương quan nhỏ hơn số cỏc hạng thức AR và MA đú được ước lượng trước đõy.

Thống kờ Q thường được sử dụng để kiểm định tớnh chất nhiễu trắng một chuỗi. Khi thực hành cần chỳ ý đến việc chọn bậc độ trễ trong kiểm định. Nếu chọn một độ trễ quỏ nhỏ, kiểm định sẽ khụng phỏt hiện được sự tương quan chuỗi ở cỏc độ trễ bậc cao. Nếu chọn độ trễ quỏ lớn thỡ việc kiểm định sẽ cú hiệu quả thấp khi tương quan ý nghĩa ở một độ trễ cú thể bị "mờ" đi bởi sự tự tương quan khụng cú nghĩa ở những độ trễ khỏc.

2.3.3 Kiểm định nghiệm đơn vị (Unit Root Test )[7]

Phương phỏp thụng thường để kiểm tra tớnh dừng của một chuỗi là kiểm định nghiệm đơn vị.

Cú 2 cỏch kiểm định nghiệm đơn vị thụng dụng trong Eviews: kiểm định Dickey- Fuller (DF) và Dickey-Fuller gia số (Augmented Dickey-Fuller(ADF)), và Phillips- Perron (PP). EViews quy cả kiểm định Dickey-Fuller và Dickey-Fuller gia số về kiểm định ADF. Cỏc kiểm định này dựng khi hiển thị chuỗi. Dickey và Fuller (1979) đú chỉ ra rằng phừn phối trong giả thiết "khụng" là khụng chuẩn và tiến hành mụ phỏng cỏc giỏ trị tới hạn của kớch thước mẫu lựa chọn. Cỏc giỏ trị này đú được Dickey và Fuller lập thành bảng

Kiểm định nghiệm đơn vị trong EViews khi hiển thị một chuỗi cú sẵn: nhấn đỳp chuột vào tờn chuỗi để mở cửa sổ chuỗi và chọn View/Unit Root Test…chọn kiểu kiểm định, chọn kiểm định mức dữ liệu, sai phõn bậc nhất, hay bậc 2

Một chuỗi sai phừn dừng gọi là chuỗi được tớch hợp, được biểu thị là I(d) với d là bậc tớch hợp. Bậc tớch hợp là số nghiệm đơn vị chứa trong chuỗi hoặc số cỏc phộp sai phõn được thực hiện để tạo thành chuỗi dừng. Với mụ hỡnh "random walk", cỳ một nghiệm đơn vị, vỡ vậy đú là chuỗi I(1)

2.3.4 Kiểm định tớnh tương quan chuỗi (Testing for Serial Correlation)

Trước khi chỳng ta sử dụng một phương trỡnh ước lượng cho kết luận thống kờ (vớ dụ:kiểm định giả thuyết và dự bỏo), ta phải kiểm tra bằng chứng về tớnh tương quan

chuỗi của phần dư. EViews cung cấp nhiều phương phỏp kiểm định một đặc tả nếu cú sự xuất hiện tớnh tương quan chuỗi

2.3.4.1 Thống kờ Durbin-Watson (Durbin-Watson Statistic)

Thống kờ Durbin-Watson đo tớnh tương quan chuỗi của phần dư

EViews thể hiện thống kờ Durbin-Watson (DW) là một phần của kết quả hồi quy chuẩn. Thống kờ Durbin-Watson kiểm định tương quan chuỗi bậc nhất.

Thống kờ DW đo sự kết hợp tuyến tớnh giữa cỏc phần dư kế tiếp từ một mụ hỡnh hồi quy. Durbin-Watson là sự kiểm định của giả thiết =0 trong đặc tả:

Ut= ut-1+ t (2.3.4)

Thống kờ DW được tớnh theo cụng thức:

Với 2 giỏ trị dL(n,k) và dU(n,k) trong đú n là cỡ mẫu, k là số biến độc lập, khi đú cú 3 giới hạn chớnh trong kiểm định DW khi kiểm định tớnh tương quan chuỗi.[2][5] + Nếu 0 DW dL hoặc 4-dL DW 4 thỡ cỏc sai số ei cú tương quan chuỗi

+ Nếu dU DW 4-dU thỡ sai số ei khụng xuất hiện sự tương quan chuỗi + Nếu dL<DW<dU hoặc 4-dU<DW<4-dL ta khụng cỳ kết luận gỡ

(Tra bảng thống kờ DW ở cuối luận văn dể xỏc định 2 giỏ trị dL(n,k) và dU(n,k))

2.3.4.2 Hai kiểm định tương quan chuỗi khỏc: là kiểm nghiệm Q-statistic và Breusch-Godfrey LM khắc phục được cỏc giới hạn này và được dựng trong hầu hết cỏc ứng dụng, được trỡnh bày cụ thể trong mục 2.6.2 .

2.3.5 Đặc tả một phương trỡnh trong EViews

Khi tạo một đối tượng phương trỡnh, hộp thoại Equation Specification xuất hiện. Chỳng ta cần đặc tả 3 vấn đề trong hộp thoại: đặc tả phương trỡnh, phương phỏp ước lượng và mẫu được sử dụng trong ước lượng

2.3.5.1 Đặc tả phương trỡnh bằng danh sỏch

Để đặc tả một phương trỡnh tuyến tớnh, chỳng ta đưa ra một danh sỏch cỏc biến được sử dụng trong phương trỡnh. Đầu tiờn là tờn của biến phụ thuộc hoặc biểu thức, theo sau là một danh sỏch cỏc biến giải thớch

T i T i i i i DW 2 1 2 2 1 ~ / ) ~ ~ ( (2.3.5)

Vớ dụ: đặc tả một hàm tuyến tớnh y được hồi quy dựa vào một hằng số và x. Ta thể hiện trong hộp thoại Equation Specification

y c x

c trong phương trỡnh được EViews thể hiện là một hằng số trong phộp hồi quy. Cú thể thể hiện chuỗi tự động trong danh sỏch cỏc biến. Chỳng được đặt trong ngoặc. Vớ dụ:

log(y) c log(y(-1)) ((x+x(-1)) / 2) 2.3.5.2 Đặc tả phương trỡnh bằng cụng thức

Chỳng ta sẽ sử dụng cụng thức để đặc tả phương trỡnh khi phương phỏp lập danh sỏch khụng cú tớnh tổng quỏt cho đặc tả. Khụng phải lỳc phương phỏp ước lượng cũng cho phộp chỳng ta đặc tả phương trỡnh bằng cụng thức.

Một phương trỡnh cụng thức trong EViews là một biểu thức toỏn học bao gồm cỏc biến hồi quy, và cỏc hệ số. Để đặc tả một phương trỡnh sử dụng cụng thức thỡ đơn giản là nhập biểu thức vào hộp thoại nơi đặt danh sỏch cỏc biến. EViews sẽ cộng thờm một nhiễu bổ sung ẩn vào phương trỡnh này và ước lượng cỏc tham số của mụ hỡnh sử dụng phương phỏp bỡnh phương tối thiểu.[5]

Khi đặc tả một phương trỡnh bằng danh sỏch, Eviews sẽ chuyển sang dạng phương trỡnh cụng thức tương đương . Vớ dụ, với danh sỏch:

log(y) c log(y(-1)) log(x)

được EViews dịch là

log(y) = c(1) + c(2)*log(y(-1)) + c(3)*log(x)

Dấu bằng cú thể nằm bất kỳ chỗ nào trong phương trỡnh Vớ dụ: log(x1) + c(1)*x2 = c(2)

Phần dư của phương trỡnh này được thể hiện bởi

resid=log(x1)+c(1)*x2-c(2).

EViews sẽ làm tối thiểu hỳa tổng bỡnh phương cỏc phần dư này

Chỳng ta cỳ thể đặc tả một phương trỡnh như một biểu thức đơn giản mà khụng cú biến phụ thuộc và ký hiệu bằng. Nếu khụng cỳ dấu bằng, EViews giả thiết rằng toàn bộ biểu thức là một hạng thức nhiễu. Vớ dụ, phương trỡnh

c(1)*x + c(2)*y + 4*z

EViews sẽ tỡm cỏc giỏ trị hệ số để tối thiểu húa biểu thức đưa ra, trong trường hợp này là (C(1)*X+C(2)*Y+4*Z).

Khi khụng cú biến phụ thuộc, EViews sẽ ước lượng một biểu thức dạng này, một số phộp thống kờ hồi quy (như R-squared) sẽ khụng được thực hiện và phương trỡnh này khụng được sử dụng để dự bỏo. Sự ràng buộc này cũn được ỏp dụng cho bất kỳ phương trỡnh nào cỳ chứa cỏc hệ số bờn trỏi dấu bằng. Vớ dụ, nếu đặc tả

x + c(1)*y = c(2)*z

EViews tỡm ra cỏc giỏ trị của C(1) và C(2) sao cho tối thiểu hỳa tổng bỡnh phương của (X+C(1)*Y–C(2)*Z). Cỏc hệ số ước lượng sẽ được xỏc định từ

x = -c(1)*y + c(2)*z

nhưng một số phộp thống kờ hồi quy khụng được thể hiện.

Hai động cơ thụng thường nhất để chỳng ta đặc tả phương tỡnh bằng cụng thức là ước lượng chặt và cỏc mụ hỡnh khụng tuyến tớnh

2.4 Ước lượng một phương trỡnh 2. 4.1 Cỏc phương phỏp ước lượng

Khi đú cỳ một phương trỡnh được đặc tả, chỳng ta cần phải chọn một phương phỏp ước lượng. Thụng thường một phương trỡnh hồi quy đơn thường sử dụng phương phỏp LS-Least Squares[11][20]

Cỏc phương trỡnh được ước lượng bằng phương phỏp bỡnh phương tối thiểu thường và bỡnh phương tối thiểu hai giai đoạn, GMM, ARCH cú thể được đặc tả bằng một cụng thức.

2.4.2 Mẫu ước lượng (Estimation Sample)

Khi ước lượng chỳng ta phải đặc tả mẫu. EViews sẽ điền mẫu workfile hiện hành vào hộp thoại.Cú thể thay đổi mẫu phục vụ cho mục đớch ước lượng bằng cỏch nhập vào chuỗi mẫu đú hoặc đối tượng trong hộp soạn thảo. Việc thay đổi mẫu ước lượng khụng ảnh hưởng đến mẫu workfile hiện hành.

EViews xử lý dữ liệu thất lạc ở phần đầu hoặc phần cuối của vựng mẫu bằng việc điều chỉnh cỏc điểm cuối mẫu và sử lý bằng thủ tục ước lượng.

2.4.3 Ước lượng mụ hỡnh ARIMA

Cú 2 cỏch ước lượng mụ hỡnh tớch hợp trong EViews. Đầu tiờn chỳng ta cú thể sinh ra một chuỗi mới chứa dữ liệu sai phõn sau đú ước lượng mụ hỡnh ARMA sử dụng dữ liệu mới.

Vớ dụ : Để ước lượng mụ hỡnh ARIMA(1,1,1) Box-Jenkins cho chuỗi M1 chỳng ta cỳ thể nhập:

series dm1 = d(m1) ls dm1 c ar(1) ma(1)

Hoặc thể hiện trực tiếp toỏn tử sai phõn d trong đặc tả ước lượng như sau

ls d(m1) c ar(1) ma(1)

*) Hạng thức ARMA

Thành phần AR và MA trong mụ hỡnh của chỳng ta được thể hiện bằng từ khúa ar

ma trong phương trỡnh đặc tả (như vớ dụ đú thấy ở trờn).

Vớ dụ: để ước lượng một tiến trỡnh ARMA(2,1), biểu thức của chỳng ta sẽ gồm cú cú hạng thức AR(1), AR(2), và MA(1) đi cựng với cỏc biến hồi quy khỏc:

c x ar(1) ar(2) ma(1)

Cú thể đặc tả mụ hỡnh trung bỡnh trượt thuần tỳy chỉ sử dụng hạng thức MA

c x ma(1) ma(2)

thể hiện mụ hỡnh MA(2) cho phần dư

Chỳ ý: Mụ hỡnh Box-Jenkins truyền thống hoặc mụ hỡnh ARMA khụng cỳ bất kỳ

biến nào ở phớa phải của phương trỡnh trừ hằng số. Trong trường hợp này dang sỏch biến hồi quy chỉ chứa hằng số C và cộng thờm cỏc hạng thức AR và MA. Vớ dụ: c ar(1) ar(2) ma(1) ma(2)

là mụ hỡnh Box-Jenkins ARMA (2,2) chuẩn.

2.4.4 Làm việc với phương trỡnh:

*) Hiển thị một phương trỡnh: Cỳ 3 lựa chọn

+ Representations. Thể hiện phương trỡnh theo 3 dạng:

- Dạng phương trỡnh đại số với hệ số tượng trưng - Dạng phương trỡnh với giỏ trị hệ số được ước lượng + Estimation Output: Kết quả ước lượng

+ Actual, Fitted, Residual: Thể hiện giỏ trị thực, giỏ trị làm phự hợp, phần dư của chuỗi dưới dạng đồ thị, bảng giỏ trị.

*) Cỏc thủ tục của một phương trỡnh

Đặc tả/Ước lượng (Specify/Estimate) Dự bỏo ( Forecast)

Tạo mụ hỡnh

Cập nhật cỏc hệ số từ phương trỡnh(được ước lượng ) Tạo nhỳm cỏc biến hồi quy

Tạo chuỗi phần dư

*) Phần dư từ một phương trỡnh

Phần dư của một phương trỡnh được lưu trong đối tượng chuỗi cú tờn RESID. RESID cú thể được sử dụng trực tiếp như một chuỗi thụng thường trừ khi ước lượng.

RESID sẽ bị viết đố lờn khi chỳng ta ước lượng một phương trỡnh và nỳ sẽ chứa phần dư của phương trỡnh ước lượng mới nhất. Muốn lưu phần dư của một phương trỡnh cụ thể chỳng ta phải lưu chỳng trong một chuỗi khỏc để trỏnh tỡnh trạng viết đố khi cú lệnh ước lượng tiếp theo.

2.5 Phương trỡnh kết quả (Equation Output)

Khi chọn OK trong hộp thoại Equation Specification, EViews thể hiện phương trỡnh là kết quả ước lượng :

Sử dụng ma trận ký hiệu, phộp hồi quy chuẩn cú thể được viết như sau:

y=X + (2.5.1) trong đú y là vộc tơ T chiều chứa cỏc theo dừi trờn cỏc biến phụ thuộc, X là ma trận T*k biến độc lập, là vộc tơ k của cỏc hệ số, và là vộc tơ T của cỏc nhiễu. T là số cỏc theo dừi và k là số cỏc biến hồi quy phớa bờn phải

Vớ dụ trờn: y là CA, X chứa 2 biến C và AR(1), trong đú T=68 và k=2.

2.5.1 Kết quả hệ số [11][14]

+ Hệ số hồi quy ( Regression Coefficients)

Cột được gỏn nhún “Coefficient” mụ tả cỏc hệ số ước lượng. Cỏc hệ số hồi quy bỡnh phương tối thiểu b được tớnh bằng cụng thức OLS chuẩn

b=(X'X)-1X'y (2.5.2) trong đú X'=(1,X2,…Xn).

Với mụ hỡnh tuyến tớnh đơn được xột ở đõy, hệ số đo sự đúng gúp biờn của biến độc lập cho biến phụ thuộc nắm giữ tất cả cỏc biến cố định khỏc. Hiện tại, hệ số C là hằng số hoặc phần chắn trong phộp hồi quy, nú dựa vào bậc phỏng đoỏn khi tất cả cỏc biến độc lập khỏc bằng 0. Cỏc hệ số khỏc được coi là độ lệch quan hệ giữa giữa biến độc lập và biến phụ thuộc tương ứng, giả sử tất cả cỏc biến khỏc là khụng thay đổi

Cột “Std. Error” thể hiện sai số chuẩn được ước lượng của hệ số ước lượng. Cỏc sai số chuẩn đo độ tin cậy thống kờ của hệ số ước lượng. Sai số chuẩn càng lớn, nhiễu

Một phần của tài liệu Phát hiện tri thức từ cơ sở dữ liệu chuỗi thời gian (Trang 42)