1. Trang chủ
  2. » Cao đẳng - Đại học

PHÂN TÍCH THỐNG kê và dự báo

82 489 1

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 82
Dung lượng 655,01 KB

Nội dung

Cho dù với trình độ khoa học - kỹ thuật ngày nay,các mô hình cũngnhư các thuật toán chưa hẳn đã đưa ra những dự báo chính xác hơn là các dự đoán của các chuyên gia, thí dụ Trạng Trình Ng

Trang 1

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI

- -VANLAYA PHOMOUDOM

PHÂN TÍCH THỐNG KÊ VÀ DỰ BÁO

LUẬN VĂN THẠC SĨ KHOA HỌC TOÁN HỌC

HÀ NỘI – 2014

Trang 2

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI

- -VANLAYA PHOMOUDOM

PHÂN TÍCH THỐNG KÊ VÀ DỰ BÁO

Chuyên ngành: Lý thuyết xác suất và thống kê toán học

Mã số: 60.46.01.06

LUẬN VĂN THẠC SĨ KHOA HỌC TOÁN HỌC

Người hướng dẫn khoa học: NCVCC TS Nguyễn Hồng Hải

HÀ NỘI – 2014

Trang 3

I Lời mở đầu

Trong thống kê toán học, phân tích thống kê và dự báo đối với chuỗi thời gian đóng một vai trò quan trọng và có ý nghĩa to lớn trong thực tiễn: trong thực tiễn khoa học cũng như trong thực tiễn xã hội, cuộc sống…

Vì vậy, tác giả lựa chọn đề tài là: “Phân tích thống kê và dự báo”

Luận văn ngoài phần mở đầu thì gồm hai chương chính

Tác giả xin bày tỏ long biết ơn chân thành tới thày hướng dẫn NCVCC TS Nguyễn Hồng Hải, người đã tận tình hướng dẫn chỉ bảo trong suốt thời gian thực hiện đề tài này Tác giả cũng xin bày tỏ sự biết ơn tới các thày cô trong

tổ toán, các thày cô trong nhóm xác suất và bạn bè đồng nghiệp đã tạo điều kiện cho tác giả trong suốt thời gian học tập và làm việc

Hà Nội, tháng 6 năm 2014

Tác giảVanlaya Phomoudom

Chương1:

Các khái niệm cơ bản về dự báo

Trang 4

1.1. Mở đầu

Việc dự báo một đại lượng biến thiên nói chung và dự báo nhu cầu nóiriêng đóng một vai tro rất quan trọng trong kinh tế và kỹ thuật Chúng giúp cho những người ra quyết định, các nhà doanh nghiệp tiên đoán một cách khoa học xu hướng phát triển trong tương lai của các đại lượng, của thị

trường… và từ đó người ta có thể hoạch định các chính sách Phương hướng đầu tư một cách đúng đắn

Ta lấy thí dụ ở ngành Bưu chính - Viễn thông Đó là một ngành công nghiệp dịch vụ có quy mô lớn sử dụng các thiết bị đắt tiền, đòi hỏi việc đầu

tư về cơ sở hạ tầng rất lớn và liên tục Vì vậy, để đảm bảo cho việc sử dụng

có hiệu quả các thiết bị và cơ sở vật chất sẽ được đầu tư, cần phải tiến hành việc dự báo nhu cầu với mực độ càng chính xác càng tốt

Bài toán dự báo cũng đặc biệt quan trọng trong lĩnh vực Khí tượng -Thủy văn Việc dự báo trước được thời tiết như nhiệt độ, nắng mưa Lũ lụt…

sẽ giúp ích nhiều cho nên kinh tế quốc dân cũng như phòng tránh được thiệt hai to lớn do thiên nhiên gây ra

Trong lĩnh vực tài chính, nếu ai biết trước được xu hướng tăng giảm của một loại tiền tệ hay giá cổ phiếu thì chắc chắn mang lại nhiều lợi ích cho người đó

Những lĩnh vực có nhu cầu dự báo rất rộng lớn Có những dự báo mang tính chất định tính như màu sắc, bản chất con người và có những dự báo mang tính chất định lượng như lượng mưa, sức gió, mực nước về ở sông

hồ, chỉ số tăng GDP, tốc độ phát triển dân số Song với sự phát triển của kỹ

thuật số tất cả các tính chất định tính đầu có thể lượng hóa Thí dụ màu sắc

có thể đồng nhất với chỉ thị màu của nó… Vì vậy, từ nay về sau, từ dự báo nhằm chỉ các dự báo mang tính chất định lượng

Dự báo và “đoán mò” là hai điều khác hẳn nhau Trong khi “đoán mò”mang tính chất của công việc làm của thầy bói thí dụ báo phải căn cứ trên những thông tin có được, thiết lập các mô hình các thuật toán để chỉ ra giá trị

Trang 5

cần dự đoán Nói cách khác đi, dự báo chính là các “dự đoán” mang tính chất khoa học Cho dù với trình độ khoa học - kỹ thuật ngày nay,các mô hình cũngnhư các thuật toán chưa hẳn đã đưa ra những dự báo chính xác hơn là các dự đoán của các chuyên gia, thí dụ Trạng Trình Nguyễn Bỉnh Khiêm hay một vàichuyên gia giỏi có thể đoán sự việc trước một thời gian rất dài, thì chúng ta không nên xếp mình vào tầng lớp những danh nhân đó mà nên tiệp cận với các phương pháp khoa học để dự báo một cách có cơ sở hơn.

1.2. Các bước cần thực hiện trong quá trình dự báo

Thông thường thủ tục dự báo bao gồm các bước sau:

Bước 1: Xác định các mục tiêu dự báo

Bước đầu tiên của công tác dự báo là làm rõ các mục tiêu của nó Ba mục tiêu chính cần phải xác định là:

Đối tương dụ báo: Nhu cầu về thuê bao điện thoại, nhu cầu về nhà ở,

nhu cầu nghề nghiệp Lương nước về trong hồ chứa, thời tiết, tỷ giá cổ phiếu

Khu vực dự báo: Theo địa dư (một tỉnh, khu vực, toàn quốc ) hay khu

vực xã hội (ngành công nghiệp, khu vực dịch vụ…) Khu vực dự báo

có thể là thu hạp trong vùng nông thôn hay một lĩnh vực cụ thể nào đó như tỷ giá đồng đô-la Mỹ và đồng Việt Nam

Khoảng thời gian cần dự báo: 1 năm, 5 năm, 10 năm…

Bước 2: Phân tích các yếu tố ảnh hưởng đến đại lượng cần dự báo.

Dự báo một địa lượng biến đổi theo thời gian có thể thực hiện trên tiền

đề là quan hệ giữa đại lượng này và các yếu tố quyết định các giá trị của đại lượng này trong quá khứ về cơ bản không thay đổi cho đến thời điểm cần dự báo trong tương lai Do đó các điều kiện bên trong (như hệ thống giá và cơ câu giá, cơ chế vận hành điều tiết lũ ) cũng các điều kiện bên ngoài (như các

Trang 6

kế hoạch phát triển vùng Bảo đảm tính bền vững của môi trường ) phải được xét đến.

Bước 3: Thu thập và phân loại dữ liệu.

Trong việc nghiên cứu các yếu tố ảnh hưởng trực tiếp đến đối tương dựbáo, cần phải thu thập những dữ liệu về các yếu tố đó Sau đó sắp xếp và phânloại chúng để xử lý

Chẳng hạn, dữ liệu cần cho việc dự báo nhu cầu điện thoại có thể bao gồm:

• Dân số, số hộ gia đình

• Số văn phòng các công ty, cơ quan, đoàn thể

• Tốc độ tăng thu nhập

• Tốc độ tăng trưởng kinh tế

• Các kế hoạch phát triển đô thị

• Nhu cầu điện thoại của các nam qua

Các dữ liệu trên cần được sắp xếp theo thời gian, vùng địa dư hay ngành nghề

Bước 4: Phân tích xu hướng tiến triển của đại lượng cần dự báo:

Xu hướng tiến triển được phân tích trên các bình diện sau:

• Các số liệu của thời gian trước đó

• Cơ cấu phát triển của hệ

• Nguồn tác động đến quá trình phát triển

• Xem xét các đặc trưng của khu vực

• So sách với các vùng khác

Bước 5: Xác định kỹ thuật dự báo sẽ sử dụng và tính toán các giá trị dự báo

Các phương pháp dự báo có thể tạm phân thành 3 loại sau:

• Ngoại suy chuỗi thời gian

Trang 7

• Phân tích hồi quy

• Các phương pháp khác (so sánh, chuyên gia )

Phương pháp dự báo thường được chọn tương ứng với đặc điểm của đối tượng cần dự báo và các yếu tố liên quan, ứng với các dữ liệu có thể thu thập được Để đạt được các giá trị dự báo với độ tin cậy cao, điều quan trọng

là phải chọn được phương pháp dự báo thích hợp, khả thi nhất và chọn ra được phương pháp tính toán tin cậy và tối ưu

Bước 6: Kiểm tra tính phù hợp của mô hình

Bước 7: Xác định các giá trị dự báo: kết hợp kết qủa thu được ở bước 5 và

các phân tích thực hiện ở các bước 2 và 4, xác định các giá trị dự báo thích hợp nhất

1.3. Phân loại các kiểu dự báo

Thông thường, dự báo được phân loại theo mục tiêu dự báo, chu kỳ dự báo và quy mô vùng dự báo đích

1.3.1. Phân loại dự báo theo mục tiêu

Mục tiêu của dự báo có thể được phân thành 3 loại

• Loại thứ nhất là nhằm nghiên cứu chính sách quản lý hoặc chiến lược khác

• Loại thứ hai là nhằm phác họa chi tiết để tính toán số lượng thiết bị đặt

Trang 8

cực hơn là các vấn đề, gian đoạn cụ thể Thí dụ dự báo một nhu cầu thường nằm ở tầm vĩ mô cho cả quốc gia, cả vùng được sử dụng.

Để lập một kế hoạch thiết bị cụ thể cho việc lắp đặt mới hoặc bổ sung thiết bị cũ, dự báo nhu cầu một cách chi tiết cho từng vùng phải được thực trên cơ sở một khảo sát tổng thể trong vùng đó

1.3.2. Phân loại theo các thời kỳ dự báo

Thời kỳ dự báo nhu cầu được phân thành dự báo ngắn hạn, trung hạn

và dài hạn tùy theo độ dài của thời kỳ dự báo

1. Dự báo ngắn hạn

Dự báo này là dự báo cho khoảng thời gian 1 hoặc 2 thời kỳ tiếp theo (thí dụ tháng hoặc quý) Dự báo ngắn hạn thường được sử dụng cho kế hoạch cung cấp thiết bị từng kỳ Dự báo này đòi hỏi thông tin chính xác có xét tới các điều kiện kinh tế, các khả năng về ngân sách Các đơn yêu cầu còn chưa được thực hiện

3. Dự báo dài hạn

Dự báo dài hạn cho khoảng thời gian 5 thời kỳ trở lên Nó được sử dụng cho kế hoạch đầu tư thiết bị quy mô lớn hoặc những chiến lược có tầm

Trang 9

Nhu cầu

Trung/dài hạn Ngắn hạn

Năm dự báo

…Ngoại suy giữa các dự báo

vĩ mô Trong trường hợp này Việc dự báo bằng cách mở rộng các dữ liệu thực tế có được đến thời điểm hiện tai sẽ không thích hợp Mà phải xem xét đến sự tăng lên của mức sống và sự thay đổi của đời sống xã hội Dự báo này được thực hiện về cơ bản có được bằng cách dự đoán gián tiếp, sử dụng các mối quan hệ giả định của các yếu tố khác đối với đối tượng cần dự báo

Chẳng hạn, tổng thu nhập quốc nội thường được coi là một yếu tố của ảnh hưởng quan trọng nhất đến sự tăng trưởng của nhu cầu điện thoại Trong dự báo dài hạn người ta thường sử dụng các phương pháp hồi quy

4. Điều chỉnh dự báo theo thời kỳ

Đối với các thời kỳ dự báo khác nhau, người ta sử dụng các loại phương pháp dự đoán khác nhau Không thể áp dụng cùng một phương pháp cho tất cả các dự báo ngắn hạn trung hạn và dài hạn

Vì vậy, cần phải tiến hành các công việc sau:

• Khi hai phương pháp khác nhau được sử dụng, thì các giá trị dự báo của phần gối đầu lên nhau phải được điều chỉnh

• Khoảng trống giữa các đường tăng trưởng (của 2 thời kỳ lien tục không bị gốilên nhau) phải được điều chỉnh

Hình 1.1 cho thấy một phương pháp điều chỉnh chủ quan mà ở đó 1 đường cong trơn được vẽ ra giữa 2 đường cong vẽ bằng các phương pháp khác nhau Ngược lai là một ví dụ của phương pháp điều chỉnh khách quan,

Trang 10

phương pháp mỏ rộng điểm cuối của một đường cong ngắn hạn làm một giá trị ban đầu có thể sử dụng được cho tốc độ tăng trưởng của các mô hìnhtrung hạn và dài hạn.

1.3.3. Phân loại theo quy mô vùng dự báo

Đây là phân sự phân loại tương đối theo quy mo vùng dự báo Chẳng hạn, việc dự báo cho một đơn vị lớn như nhu cầu điện thoại toàn quốc được gọi là dự báo cấp vĩ mô, trong khi việc dự báo cho một đơn vị

dự báo cấp vi mô

Trang 11

1. Dự báo cấp vĩ mô

Trong dự báo cấp vĩ mô, nói chung có thể dùng nhiều phép thống kê

xã hội Vì vậy, có thể tiến hành nghiên cứu chi tiết về chúng Chúng thường được sử dụng để dự thảo một ngân sách toàn bộ hay hoạch định một kế hoạchmang tính chất chiến lược

2. Dự báo cấp vi mô

Dự báo cấp vi mô là dự báo của vùng hay dự báo cho khu vực nhỏ

Nó có thể hiểu là dự báo một đại lượng cho một ngành cụ thể Thí dụ, đối với việc thiết kế công việc lắp đặt thiết bị mới hoặc thiết bị bổ sung như đấu cáp, thiết kế kỹ thuật và xây dựng kế hoạch bố trí tổng đài việc dự báo cấp vi mô

là cần thiết

3. Điều chỉnh dự báo giữa vi mô và vĩ mô

Nhìn chung, có sự khác nhau ở chừng mực nào đó giữa tổng các giá trị dự báo tầm vi mô và các giá trị dự báo tầm vĩ mô Đối với vùng địa lý nhỏ,

ta khó có thể thu được các dữ liệu thống kê ổn định (các dữ liệu quá khwsmaf

ta có thể sử dụng làm cơ sở cho dự báo khác) và điều này có khả năng gây ra những xét đoán sai lệch Do đó, dự báo trực tiếp của một vùng địa lý lớn cho chúng ta một xu hướng chính xác hơn là tổng của các kết của dự báo cấp vi mô

Khi đối chiếu giữa dự báo vi mô và dự báo vĩ mô, ta thường phải điều chỉnh dự báo vi mô theo dự báo vĩ mô Những nhân tố bị bỏ qua bởi dự báo vĩ mô đôi khi có thể được dự báo vi mô chỉ rõ Ý nghĩa của việc điều chỉnh dự báo là nâng cao độ chính xác của dự báo Xóa bỏ sai lệch trong việc đánh giá gây ra bởi dự báo cấp vi mô

Có hai phương pháp dự báo cơ bản là:

1) Phương pháp phân tích hội quy

2) Phương pháp chuỗi thời gian

Các phương này sẽ được xét chi tiết trong các chương sau:

1.4. Các khái niệm về dự báo

1.4.1. Các yếu tố ảnh hưởng đến nhu cầu

Trang 12

Nhân tố bên ngoài

Người đang lao động

Nhân tố bên trong

Cước phí Tiền thiết bị Phí thuê bao Phí truyền thong Phụ phí sử dụng

Chiến lược tiếp thị Chiến lược sản xuất Chiến lược quảng cáo Nhu cầu

Nhu cầu của xã hội về một loại sản phẩm một loại dịch vụ náo đó thường bị chi phối bởi nhiều yếu tố Các nhân tố nay có thể chia thành hai nhóm: các yếu tố bên ngoài và các yếu tố bên trong Thành phần của các nhóm này hoàn toàn tùy thuộc vào bài toán cụ thể ta đang xét

Chẳng hạn, đối với bài toán dự báo nhu cầu điện thoại, có thể xếp các yếu tố như các hoạt động chính trị, đoàn thể và tư nhân, sự tăng trưởng GDP: các yếu tố xã hội như dân số, số hộ gia định, và dân số làm việc… vào nhóm các yếu tố bên ngoài Các yếu tố bên trong có thể bao gồm: chi phí đâu

tư thiết bị, chi phí thuê bao, phụ phí sử dụng và các yếu tố marketing như hệ thống sản xuất, quảng cáo và chiến lược marketing

Dự báo nhu cầu là nhằm nắm vững và phân tích các nhân tố này để xác định nhu cầu tương lai về số lượng Ta minh họa những điều vừa nói ở trên trong bài toán dự báo nhu cầu điện thoại:

1.4.2. Các giai đoạn tăng trưởng của nhu cầu

Nói chung, sự tăng trưởng của nhu cầu bao giờ cũng trải qua 3 giai đoạn:

• Giai đoạn khởi đầu: Trong giai đoạn này, nhu cầu tăng dần nhưng chậm chạp

• Giai đoạn tăng trưởng nhanh

• Giai đoạn bão hòa: Giai đoạn có tốc độ tăng trưởng chậm lại và giảm dần

1.4.3. Các cộng việc cần làm để dự báo nhu cầu

Trang 13

Dự báo nhu cầu

Quản lý giá trị nhu cầu

Thu thập sắp xếp dữ liệu

Dữ liệu

Dữ liệu

Dự báo nhu cầu nhằm đưa ra các giá trị dự đoán về nhu cầu náo đó

để làm điều này, người ta phải tiến hành các bước: thu thập và chỉnh lý các dữliệu; phân tích và đanh giá độ chính xác của các giá trị dự báo: cuối cùng là đưa ra giá trị dự báo nhu cầu Ba phần việc này liên quan chặt chẽ với nhau

Ta minh họa các phần việc của dự báo nhu cầu theo sơ đồ:

Chẳng hạn để dự báo nhu cầu điện thoại, cần tiến hành các công việc

a) Thu thập và chỉnh lý các số liệu về nhu cầu điện thoại (số liệu bên trong); các số liệu thống kê về dân số, số hộ gia đình, các chỉ số kinh tế v.v… (dữ liệu bên ngoài) theo trình tự thời gian và địa

phương

b) Thiết lập mô hinh toán học cho bài toán Sau đó căn cứ trên các số liệu thu tập được ta tiến hành tính toán đê ước lượng mô hình Các bước tính toán này thường có kích thước lớn nên ta phải cần đến sự trợ giúp của máy tính

c) Tiến hành tính các giá trị dự báo theo phương pháp đã lựa chọn Sử dụng các tính toán này phục vụ cho mục đích của chúng ta

Trang 15

có vai trò đặc biệt quan trọng Chúng ta cũng tóm lược qua một vài nét về các

kỹ thuật cơ bản ước lượng và loại bỏ đừng xu thế cũng như tính chất theo mùa từ một chuỗi thời gian quan sát được Một vài thí dụ minh họa đưa ra được tính toán bằng phần tích mềm EVIEWS

2.1.1. Khái niệm và các thí dụ về chuỗi thời gian

Mục tiêu của việc phân tích kinh tế thể nghiệm là chỉ ra cơ chế kinh tế

và đưa ra các quyết sách Vì vậy ta đòi hỏi có một số lượng lớn các quan sát cho các đại lượng thích hợp để nghiên cứu các mối lien hệ giữa các đại lượng này Các quan sát này có thể được tiến hành đều đặn qua từng thời kỳ chẳng hạn theo từng tháng, theo từng quý hoặc hàng năm hoặc chỉ trong những thời điểm đặc biệt như các thời kỳ xảy ra khủng hoảng kinh tế Dãy các quan sát này ta gọi là chuỗi thời gian Như vậy, chuỗi thời gian là tập hợp các quan sát

mà mỗi quan sát dược ghi nhận tại thời điểm t với tT Chuỗi thời gian được gọi rời rạc nếu như T là tập hợp rời rạc (thí dụ các quan sát được thực hiện

cách nhau một khoảng thời gian đều đặn như là doanh thu cước phí điện thoạihàng tháng của một trạm bưu điện từ tháng 12 năm 1995 đến tháng 12 năm

2001 Trái lại nếu T là một khoảng thì chuỗi được gọi là liên tục Biểu đồ ghi

nhịp tim của một bệnh nhân trong 2 giờ là một minh họa cho chuỗi thời gian

liên tục với T= [0,2]

2.1.2. Mục đích của việc phân tích chuỗi thời gian

Trang 16

Tất cả các kỹ thuật dự báo chuỗi thời gian dựa trên giả định là có một mẫu hình cơ bản tiềm ẩn trong các số liệu đang nghiên cứu cùng với các yếu

tố ngẫu nhiên ảnh hưởng lên hệ thống đang xét Công việc chính của phân tích chuỗi thời gian là ngiên cứu các kỹ thuật để tách mẫu hình cơ bản này và

sử dụng nó như là cơ sở để dự báo cho tương lai

Vấn đề là ở chỗ phần lớn các chuỗi thời gian trong cuộc sống thực tại làrất phức tạp nên các kỹ thuật đơn giản như là làm trơn số liệu …ở các phần trước sẽ không thể dùng được trong các trường hợp này (kỹ thuật làm trơn số liệu chỉ phù hợp cho các chuỗi mà độ thăng giáng không lớn lắm) Vì vậy, chương này dành cho việc giới thiệu phương pháp Box-Jenkins để dự báo các chuỗi thời gian có độ phức tạp cao hơn Kỹ thuật này rất phù hợp cho công việc dự báo chuỗi thời gian mặc dù nó tương đối phức tạp về phương diện toán học và yêu cầu phải có nhiều số liệu Trên thức tế, nó đòi hỏi ít nhất 50

số liệu và thong thường tốt nhất là nên có khoảng 100 số liệu mới có thể nhận dạng chính xác mô hình

Kỹ thuật dự báo Box-Jenkins được đề xuất hỏi George Box và lym Jenkinsnăm 1970 song thường được gọi là phương pháp dự báo các quá trình tự hồi quy trung bình trượt ARMA(ARMA = Autogregres-sive

Gwin-/Moving/Average)

Đề làm được điều đó, trước hết ta giả thiết có một hình xác suất để biểu diễn dãy số liệu Sau khi chọ ra mọt mô hình gần dãy số liệu, chúng ta tiến hành ước lượng các tham số của mô hình, kiểm tra lại xem mô hình được

sử dụng có thích hợp không

2.1.2.1. Dự báo

Dự báo là ước lượng các giá trị tương lai yt+h , h ≥ 1 của một biến ngẫu nhiên dựa trên các quan sát các giá trị quá khứ của nó y1, y2,…,yt Dự báo của yt+h thường được ký hiệu là

Trang 17

Chất lượng của dự báo phụ thuộc vào nhiểu yếu tố Trước hết nó phụ thuộc váo xu hướng phát triển của chuỗi thời gian Nếu chuỗi thời gian là làm “đều đặn” theo thời gian thì càng dễ dự báo.Thí dụ nếu tiến trình phát triển kinh tế không có những biến động đặc biệt thì dễ dàng dự báo tổng sản phẩm quốc nội (GDP) cho những năm sau Cho đến này, các phương pháp dự báo chuỗi thời gian chưa cho phép dự báo được các giá trị đột biến.

Chất lượng dự báo chuỗi thời gian còn phụ thuộc xa gần của thời gian

Dự báo các giá trị càng gần hiện tại càng chính xác Như vậy, việc ước lượngGĐP cho năm sau sẽ chính xác hơn là ược lượng GĐP cho 10 năm sau

Ngoài ra, phương pháp ước lượng cũng đóng vai trò hết sức quan trọng Nếu chúng ta sử dụng phương pháp dự báo tốt thì giá trị dự báo càng chính xác

2.1.2.2. Tách các xu thế

Trong các chu kỳ tăng trưởng, nhiều chuỗi thời gian có sự tiến triển trung hạn tương tự nhau Sự tiến triển trung hạn này được gọi là các xu thế Như vậy, nếu tồn tại một xu thế trong chuỗi thời gian thì ta nên tách nó ra để

dễ dàng cho việc xử lý các số liệu còn lại

2.1.2.3. Hiệu chỉnh theo mùa

Có lẽ chẳng cần nghiên cứu nhiều cũng biết hàng năm cứ đến mùa thu thì áo len bán chạy hơn mùa hè Cũng như vậy đối với các hiện tượng khí tượng như mây mưa, bão lụt và các vấn đề kinh tế khác Thí dụ về lượng hànhkhách của ngành đường sắt Pháp cho ta thấy cứ đến tháng tám thì số hành khách đi tàu thấp nhất trong năm đó Ta gọi tình trạng đó là hiện tượng theo

Trang 18

mùa Chuỗi số nhận được sau khi loại bỏ xu thế theo mùa trong chuỗi thời gian gọi là “chuỗi được hiệu chỉnh theo mùa”.

Có nhiều phương pháp khác nhau để hiệu chỉnh một chuỗi thời gian theo mùa Tuy nhiên bất cứ một phương pháp nào cũng đòi hỏi có các tính chất sau: nếu ta ký hiệu zSA là chuỗi hiệu chỉnh theo mùa của chuỗi (zt) thì

i) xSA + ySA = (x + y)SA , x,y

ii)

iii) xSAySA = (xy)SA , x,y

2.1.2.4. Phát hiện các thời điểm đột biến

Có thể do khủng hoảng kinh tế - chính trị hay chiến tranh mà chiều hướng phát triển kinh tế có thể thay đổi mạnh mẽ ở những thời điểm nào đó về

xu thế cũng như mức độ Rõ ràng rằng việc phát hiện ra những điểm đột biến này càng sớm càng tốt là một việc quan trọng trong dự báo chuỗi thời gian

2.1.3. Một vai mô hình chuỗi thời gian đơn giản

Phần quan trọng của việc phân tích chuỗi thời gian là chọn mô hình xác suất phù hợp (hay là phân lớp mô hình) cho dãy số liệu Để còn có một khả năng nào đó cho việc không thể dự đoán được giá trị tương lai, ta giá thiết mỗi quan sát xt, là một thể hiện của biến ngẫu nhiên Xt

Bây giờ ta hãy xét việc mô hình hóa chuỗi thời gian đối với các số liệu quan sát {xt} từ các biến ngẫu nhiên{xt}, đó là việc nhận dạng các phân phối đồng thời {xt }, tức là tập hợp các phân phối xác suất

Trang 19

Của biến ngẫu nhiên (X 1 , X 2 ,…, X n) Tuy nhiên tập các phân bố này ít được sử dụng bởi vì nó chứa quá nhiều tham số Vì vậy, trong nhiều trường hợp ta chỉ cần xác định một vài tham số như là kỳ vọng EXt và hệ số tương quan

Trong trường hợp các phân phối đồng thời của (X 1 , X 2 ,…, X n) là chuẩn thì việc biết hai tham số này sẽ đủ xác định phân phối đó

Sau đây ta xét 3 trường hợp đơn giản nhất của mô hình chuỗi thời gain

1) Mô hình ướt trung bình zero

a) Mô hình tiếng ồn độc lập cùng phân phối ( ồn trắng )

Trong mô hình này các quan sát {xt} là các mẫu ngẫu nhiên đơn giản tức là nó là các quan sát từ các biển ngẫu nhiên {xt} độc lợp cùng phân phối với trung bình zero Đây là mô hình chuỗi thời gian đơn giản nhất vì nó

không chứa bất cứ một xu thế hoặc tính chất theo mùa nào Theo định nghĩa

mô hình là ồn trắng (viết tắt nếu

Và Xt = 0, DXt =

b) Mô hình nhị thức

Nếu{xt} lấy hai giá trị với

Và là dãy độc lập thì mô hình ồn trắng gọi là mô hình nhị thức

Chúng ta có thể nhận được các chuỗi thời gian nhị thức bằng cách tung một đồng tiền cân đối, đồng nhật Nếu ở lần tung thứ t đồng tiền

Trang 20

Xuất hiện mật sấp thì ta gán cho giá trị + 1 còn xuất hiện mặt ngừa thì gán giá trị - 1 Chuỗi thời gian nhị thức thường gặp trong các tiếng ồn điện báo, các bài toán liên quan may rủi trong song bạc hay kết quả các trận đấu…

Từ định nghĩa của mô hình ta có

Đẳng thức này cho thấy việc biết được các giá trị của quá khứ (X1, X2,…, Xn) không giúp ích gì cho dự báo giá trị tương lai Mặc dù vậy chuỗi thời gian độc lập cùng phân phối vẫn đóng vai trò quan trọng trong việc xây dựng những mô hình phức tạp hơn như ví dụ sau đây

{St} được gọi là di động ngẫu nhiên đối xứng Nó hay gặp trong các

mô hình kinh tế - tài chính như là tính toán cổ phiếu hay rủi ro ở các ngẫu nhiên hàng

2) Mô hình có xu thế và mô hình có tính chất theo mùa

Các mô hình được đưa ra trong mục 1) thuần túy ngẫu nhiên Tức là số liệu quan sát tại một thời điểm hoàn toàn không kế thừa bất cứ thông tin nào

từ các số liệu quan sát tại thời điểm khác Tuy nhiên trong niều bài toán phân tích chuỗi thời gian ta nhận thấy có một xu thế rõ ràng trong số liệu Rõ ràng trong các trường hợp này, mô hình trung bình zero không còn thích hợp Đường biểu diễn các số liệu này trên mặt phẳng gợi cho ta mô hình dạng

Xt = mt +Yt với t=1,2…

Trang 21

Với mt là hàm có dạng đã biết Nó được mình họa như là thành phần có xu thếcủa chuỗi thời gian còn Yt có trung bình zero Kỹ thuật để ước lượng mt sẽ được đề cập về sau.

Có nhiều chuỗi thời gian bị ảnh hưởng của nhiều yếu tố có tính chất theo mùa như là thời tiết, chu kỳ sinh đẻ hay chu kỳ tăng (giảm) kinh tế Các chuỗi thời gian này có thể mô hình hóa nhờ một thành phần tuần hoàn với chu

kỳ cố định Để biểu thị được ảnh hưởng theo mùa này, ta giả thiết mô hình có thể có nhiều nhưng không có xu thế và viết

Xt = st +Yt với t=1,2…

Với st là hàm tuần hoàn với chu kỳ d ( tức là ) Thường ta lựa chọn

Vớilà các tham số chưa biết, là các tần số cố định, mỗi số là một bội nguyên của

3) Phương pháp chung để mô hình hóa chuỗi thời gian

Qua phân tích ở trên cách tiếp cận chung để phân tích chuỗi thời gian là

• Vẽ các số liệu của chuỗi lên mặt phẳng tọa độ và xết các đặc trưng chính của chúng, chú ý đến

Trang 22

b) Sai phân số liệu: Xết một chuỗi thời gian mới {Yt} từ chuỗi ban đầu nhờ toán tử sai phân (hoạc lạp lại một vài lần sai phân như vậy) Mục tiêu là nhậnđược một chuỗi dừng (xem phần 2.3.3 về nhận dạng chuỗi thời gian).

2.2. Quá trình dừng và phân tích hệ số tự tương quan

2.2.1. Khái niệm về quá trình dừng

Quá trình dừng là quá trình ngẫu nhiên có một vài đặc trưng khôngbiến đổi theo thời gian Dây là một khái niệm cốt lõi trong việc phân tích chuỗi thời gian Nếu đặc trưng đó là phân phối đồng thời của các {Xt} thì

Không phụ thuộc vào t, tức là

Ta nhận xét rằng quá trình dừng theo nghĩa chặt với suy ra nó phải đúng theo nghĩa rộng Điều ngược lại chỉ đúng trong một vài tương hợp đặc

biệt Trong suốt giáo trình này khi nói quá trình dừng là ta ngụ ý dừng theo

nghĩa rộng nếu không chú thích thêm.

Định nghĩa 2.2.4.

Trang 23

Nếu {Xt} t = 0, là quá trinh dừng với thì hàm (theo h):

Gọi là hàm tự hiệp phương sai(autocovaiancer)còn

(2.2.1)

Gọi là hàm tự tương quan.

Giải thích: Khi nghiên cứu hai véc - tơ trên mặt phẳng, ngoài thống số

độ dài của từng véc - tơ, còn có một đại lượng rất quan trọng là số đo cosin của góc giữa hai véc - tơ đó Về phương diện nào đó thì hệ số tương quan của hai đại lương ngẫu nhiên X và Y được cho bởi cũng mang một ý nghĩa tương

tự như vậy Nó là một chỉ số đơn giản chỉ sự phụ thuộc lẫn nhau của hai đại lượng ngẫu nhiên Khi chỉ có một dãy quan sát, ta đưa vào khái niệm mới là các hàm tự tương quan để đo sự phụ thuộc lẫn nhau giữa các quan sát Giá rị của hệ số tự tương quan tại h đo mối quan hệ giữa hai giá trị của chuỗi thời gian cách nhau một khoảng h Khoảng cách xa nhau của hai số liệu này gọi là

độ trễ của thời gian

Các tính chất của các hệ số hiệp phương sai, tương quan có thể xem trong các tài liệu về lý thuyết xác suất và thống kê toán học (thí dụ [2]) ở đây

ta chỉ nhấn mạnh đến tính chất tuyến tính của các hệ số tương quan Nếu và a,b,c là các số thức bất kỳ thì

Ví dụ 2.2.1 Dãy tiếng ồn độc lập cùng phân phối

Nếu là độc lập cùng phân phối với thì

Trang 24

cho theo nghĩa bình phương tối thiểu Theo ý thuyết quá trình ngẫu nhiên, người ta đã chứng minh rằng ước lượng đó là

Với sai số của ước lượng

Trong đó tương ứng là giá trị trung bình và phương sai của Biểu thức này cho thấy (ít nhất là trong trường hợp chuỗi thời gian Gauss), ước lượng càng chính xác nếu Càng gần giá trị 1

Từ định nghĩa 2.2.4 ta thấy HSTTQ là hàm chẵn tức là với mọi h vì vậy trong các lập luận về sau, ta chỉ quan tâm đến các giá trị của h) với h > 0

Cách đơn giản nhất để xây dựng chuỗi thời gian dừng theo nghĩa chặt

là “lọc” nó từ quá trình ngẫu nhiên độc lập cùng phân phối Giả sử là dãy độclập cùng phân phối còn là hàm (đo được) q biến số, khi đó

Sẽ là chuỗi thời gian dừng theo nghĩa chặt Trong trường hợp này dễ thấy và sẽ độc lập với mọi |h| > q nên với mọi |h| > q

Các quá trình có tính chất này ta sẽ gọi là q – tương quan Ta xét trườnghợp riêng nhưng quan trọng sau

Định nghĩa 2.2.5:

(Quá trình trung bình trượt MA(q)) {Xt} là quá trình trung bình trượtcấp q(viết tắt MA(q)) nếu

Xt = Zt + θ1Zt - 1 +…+ θqZt - q (2.2.2)Trong đó {Zt} là dãy lập có cùng phân phối với trung bình 0 và

phương sai σ2, còn θ1, θ2, , θqlà các hằng số, θq≠0

Trang 25

Tầm quan trọng của quá trình trung bình MA (q)) ở chỗ mỗi quá trình

q - tương quan sẽ là một quá trình MA(q)) như mệnh đề sau

Các quá trình ngẫu nhiên tuyến tính cho chúng ta bối cảnh chung

để nghiên cứu chuỗi thời gian Thật vậy, theo khai triển Wold, mỗi quá trình ngẫu nhiên dừng có mô mem cấp 2 hữu hạn thì hoặc là tuyến tính, hoặc có thểbiến đổi thành quá trình tuyến tính bằng cách khử thành phần tất định trong chuỗi thời gian

Định nghĩa 2.2.6:

Chuỗi thời gian {Xt} là tuyến tính nếu nó có biểu diễn dạng

(2.2.3)Vớc mọi t, trong đó {Zt} Là chuỗi độc lập, cùng phân phối với trung bình zero và phương sai (viết tắt là còn Là dãy các hằng số với

Để tiện việc trình bày, ta dẫn vào khái niệm toán tử dịch chuyển B định

nghĩa bởi Với ký hiệu này (2.2.3) có thể viết lại dưới dạng

Với

Chú ý : Điều kiện đảm bảo cho chuỗi (2.2.3) hội tụ với xác suất 1 (xem(5)) Ta cũng có thể thay điểu kiện này bằng điểu kiện yếu hơn Vẫn đảm bảocho chuỗi (2.2.3) hội tụ nhưng theo nghĩa bình phương trung bình

Trang 26

Từ (2.2.3) dễ dàng tính được

(2.2.5)

(2.2.6)

Ví dụ 2.2.3 Quá trình trung bình trượt (dĩ nhiên) là quá trình tuyến tính.

Ví dụ 2.2.4 Quá trình tự hồi quy cấp một AR(1) có dạng

(2.2.7)Với Nếu thì từ ta có

(2.2.8)

Từ (2.2.6) và (2.2.7) ta nhận được

(2.2.9)Với mọi h>0

Nếu || >1, chuỗi (2.2.8) không hội tụ Tuy nhiên ta có thể viết lại chuỗi thờigian (2.2.7) ở dạng

(2.2.10)

Từ đó

Suy ra

(2.2.11)

Trang 27

Là quá trình dừng tuyến tính.

Ví dụ 2.2.5 Lý luận trên có thể mở rộng cho quá trình tự hồi quy trung bình

trượt cấp 1 (viết tắt là quá trình ARMA(1,1) có dạng sau

(2.2.12)Với và

Để đơn giản ta lý hiệu

2.2.3. Hệ số tương quan và tự tương quan mẫu

Cũng như trong tất cả bài toán thống kê, các HSTTQ chưa được biết nên ta tìm các ước lượng chúng qua các thể hiện của chuỗi thời gian

2.2.3.1. Hệ thống quan mẫu

Trang 28

Nếu ta quan sát được n giá trị của chuỗi là và n giá trị của chuỗi {Yt} là thì

hệ số hiệp phương sai sẽ được ước lượng bởi

Còn hệ số tương quan của và được tính bởi công thức:

(2.2.17) Trong đó

Là trung bình số học của các số đo ,tương ứng và

2.2.3.2. Hệ số tự tương quan mẫu

Một cách tương tự, giả tự, giả sử có các quan sát của chuỗi thời gian Khi đó ước lượng cuuar hệ số tự hiệp phương sai là hệ số tự hiệpnphuongw sai mẫu cho bởi

Và hệ số tự tương quan mẫu là

,(với độ trễ của thời gian là ) Trong đó

• n= số quan sát của đại lượng X

• = thể hiện của tại thời điểm t

• giá trị trung bình của các thể hiện của chuỗi thời gian

Nhìn vào công thức ta thấy và đo mối tương quan giữa đoạn số liệu với đoạn số liệu cách nhau một độ trễ của thời gian là

Trang 29

Dễ dàng chứng minh rằng giá trị hệ số tự tương quan mẫu p h nằm giữa

- 1 và +1 Hơn nữa, dễ dàng nhận thấy với mọi độ trễ của thời gian Do vậy,

từ nay về sau ta chỉ xét với những > 0

Chú ý: Trong công thức tính đáng lẽ ta phải chia cho n-|h|-1để đảm

bảo tính không chệch của ước lượng Tuy nhiên trong các bài toán phân tích

chuỗi thời gian n thường khá lớn nên việc thay n-|h|-1 bởi n sẽ không ảnh

hưởng lớn lắm đến giá trị của

2.2.3.3. Tính chất của HSTTQ mẫu

Từ các giá trị tính được, ta thành lập ma trận

được gọi là ma trận tự hiệp phương sai Ma trận

Gọi là ma trận tương quan Người ta đã chứng minh được rằng là các

ma trận xác định không âm Hơn nữa, chúng sẽ xác định dương nếu

Nếu không có giả thiết nào phụ thêm thì rõ ràng khó có thể đưa ra

những kết luận thống kê cho ngay cả khi k khá nhỏ so với n Những tính

chất này sẽ được nghiên cứu cụ thể cho một vài mô hình Tuy nhiên, theo

quan điểm của Box và Jenkin (1976) để có các ước lượng tin cậy thì n

3-25

9425

-25-6

-6-10-30

Trang 30

3636419164

-621-342

-36-122-3-128

Bảng 2.1Bây giờ ta sử dụng công thức tính hệ số tự tương quan với thời gian

Trễ với h = 1.

Do vậy,

Để bạn đọc làm quen hơn nữa với hệ số tự tương quan Chúng ta hãy

tính hệ số tự tương quan mẫu tính trễ sau hai hơn vị thời gian (h=2) trên cùng một dãy số liệu đã cho ở trên (độ trễ của thời gian bằng h = 2): Sử dụng công

thức tính chota nhận được

Do vậy,

Ví dụ2 2.7 Nếu là độc lập, cùng phân phối thi với mọi Vì vậy, nếu

là một thể hiện (có vô hạn giá trị) của chuỗi thời gian độc lợp cùng phân phốithì ước lượng phải dần tới 0 khi với mọi Tuy nhiên chúng ta chỉ quan sát được n số liệu nên nói chung các hệ số tự tương quan mẫu này sẽ chỉ xấp xỉ bằng 0 mà thôi

Nhưng thế nào được xem xấp xỉ bằng 0? Để trả lời câu hỏi đó, ta dựa vào phương pháp thông thường trong lý thuyết thống kê đã được trình bày

Trang 31

trong chương 2 Người ta chứng minh rằng khi mẫu khá lớn thì các hệ số tự tương quan có phân phối xấp xỉ chuẩn với trung bình bằng 0 và có độ lệch tiêu chuẩn là (tức là ) Do vậy, khi cho trước độ tin cậy ( hay ta còn gọi mức ýnghĩa ), chúng ta hãy thiết lập khoảng tin cậy

Trong đó được tính từ bảng phân phối chuẩn tắc ứng với mức ý nghĩa a

Định nghĩa 2.2.7 Với độ tin cậy (hay mức ý nghĩa là ), nếu các giá trị

thuộc khoảng tin cậy này, tức là

Thì được xem là xấp xỉ 0

Nếu không thỏa mãn bất đẳng thức này, ta nói khác 0 thực sự

Bảng sau đây cho các giá trị của chuỗi thời gian gồm 36 quan sát được xây dựng bằng cách chọn ngẫu nhiên các số từ 0 đến 100 Ta giả sử sự kiện “chọnngẫu nhiên” này chưa được biết và bằng tính toán ta phải chỉ ra được điều đó Trong thí dụ này, n = 36, nếu cho = 5% thì

Thời kỳ Giá trị Thời kỳ Giá trị Thời kỳ Giá trị1

13 14 15 16 17 18 19 20 21 22 23 24

86 33 90 74 7 54 98 59 86 90 65 20

25 26 27 28 29 30 31 32 33 34 35 36

17 45 9 72 33 17 3 29 30 68 87 44Bảng 2.2

=1.96 Do vậy được xem là xấp xỉ 0 nếu

Trang 32

Dựa vào những điều đã nói ở trên, chúng ta có các quy tắc sau đây để xác định xem một chuỗi có ngẫu nhiên hay không,

Quy tắc 2.3.1 Nếu các hệ số tự tương quan của một chuỗi đều thỏa mãn bất đẳng đức (*) thì ta xem rằng dãy số liệu đã cho được phân bổ một cách ngẫu nhiên Ngược lại, dù chỉ một giá trị không thỏa mãn bất đẳng đức (*) thì trong chuỗi đang xét nhất thiết phải có tồn tại một mối liên kết nào đó

Hình vx trên biểu thị trực tiếp 10 giá trị của dãy số liệu cho ở bằng 1 (được thực hiện từ chương trình Eviews, tuy nhiên bạn đọc có thể sử dụng công thức tính hệ số tương quan để tính trực tiếp) Ở trong hình, cột cuối cùng là các giá trị của còn cột đầu là đồ thị của nó; Các đường chấm biểu thị giới hạn của khoảng tin cậy với độ tin cậy 95% (hay là mức ý nghĩa 0.05) tất

cả các giá trị của hệ số tự tương quan đều nằm trong hai vạch giới hạn này nên ta khẳng định các số liệu là ngẫu nhiên

Chú ý: Nếu việc phân tích các hệ số tư tương quan chỉ ra rằng dãy số

liệu đang xét là ngẫu nhiên, thì giữa các giá trị của số liệu không tồn tại một mối liên kết nào cả Do vậy có mô hình hóa nó để tìm xu thế tiềm ẩn trong nó cũng vô ích và ta dừng việc phân tích chuỗi thời gian

Trang 33

Ví dụ 2.2.8 (Hệ số tương quan của quá trình M A(1)) Xét quá trình MA

(1) cho bởi với Khi đó, theo công thức (2.2.6) ta nhận được

Từ đó ta có nhận xét rằng các hệ số tự tương quan mẫu của chuỗi thời gian MA(1) phải thỏa mãn điều kiện: với mọi Như vậy ta có thể áp dụng quy tắc 2.3.1 trên để kiểm tra xem một thể hiện có phải là của một quá trình

MA(1) hay không.

Ví dụ 2.2.9 ( Hệ số tương quan của quá trình tự hồi quy AR(1) Xét quá

trình AR(1) cho bởi với và Khi đó, theo công thức (2.2.6) ta nhận được

Từ đó ta nhận xét rằng giá trị tuyệt đối của các hệ số tự tương quan

mẫu của chuỗi thời gian AR(1) phải giảm theo hàm lũy thừa Nếu khi ta vẽ cả

giá trị của các HSTTQ này mà không nhìn thấy nó có tính chất đó thì ta kết

luận đó không phải là số liệu từ chuỗi AR(1).

Trang 34

2.2.4. Hệ số tự tương quan riêng

2.2.4.1. Hệ số tự tương quan riêng

Hệ số tự tương quan riêng là khái niệm ít được sử dụng hơn so với hệ

số tự tương quan trọng việc phân tích chuỗi thời gian Trên thực tế, hệ số tự tương quan riêng chỉ giúp cho ta việc nhận dạng mô hình tự hồi quy trung bình trượt ARMA để sự báo (kỹ thuật phân tích mô hình ARMA sẽ được trìnhbày ở chương sau) Nhưng do hệ số tựu tương quan riêng đóng vai trò quyết định trong việc mô hình hóa ARMA nên ta sẽ để cập đến nó ở đây

Hệ số tự tương quan riêng không những khó hình dung về phương diện

lý thuyết mà sự tính toán nó cũng gặp rắc rối hơn nhiều

Ta có thể quan niệm một cách thô thiển là hệ số tự tương quan riêngcủa chuỗi số liệu nhằm để đo mức độ kết hợp giữa chuỗi thời gian và chuỗi với thời gian trễ khi ảnh hưởng của các quan sát xen vào ở giữa đã

bị loại trừ (thí dụ k = 4 thì ta loại ra khỏi việc tính toán)

Để đưa ra định nghĩa cho HS tự tương quan riêng ta xét bài toán sau Với mỗi n cố định, ta tìm một tổ hợp tuyến tính của các giá trị

Để “ dự báo” biến ngẫu nhiên Y sao cho sai số bình phương trung bình

Bây giờ giả sử (Xt) là chuỗi thời gian dừng

Định nghĩa2.2.8

Trang 35

Hệ số tư tương quan riêng của chuỗi thời gian dừng , được ký hiệu là , chính là hệ số quan của hai biên ngẫu nhiên và

Nói cách khác, đo sự phụ thuộc của và sau khi loại bỏ các ảnh hưởng (tuyết tính) của các giá trị trung gian

2.2.4.2. Cách tính hệ số tự tương quan riêng

• Khi k=1: Hệ số tự tương quan riêng đo mức độ phụ thuộc của và sau khi đã loại trừ các giá trị xen giữa Vì giữa chúng không có giá trị nào nên ta có

• Với k bất kỳ, có thể chứng minh rằng là nghiệm của phương trình

Ví dụ 2.2.10 Thí dụ giả sử ta đã tính toán được các hệ số tự tương

quan mẫu ứng với các thời gian trễ k = 1,2,……, 12 như sau:

Trang 36

Giá trị này khác với ở bảng trên Như vậy nếu loại trừ một quan sát chen giữa

và (tức loại giá trị ) thì tương quan được tính ra là -0.18

• Với k = 3 ta

Để tính được, chúng ta còn cần biết thêm

Vậy có

Chú ý: Bạn đọc đừng ngại sự phức tạp của công thức chính tự tương quan

riêng Trong hầu hết các chương trình máy tính , người ta đã tập sẵn các thủ tục để tính các giá trị này và ta chỉ còn học cách sử dụng nó như thế nào

Ví dụ 2.2.11 Tính hệ số tự tương quan riêng của quá trình AR(1)

Theo (2.2.8), nên là nghiệm của phương trình

Dễ thấy phương trình này chỉ có nghiệm còn 0 vói mọi k>1 Từ đó ta

đi đến quy tắc thực hành sau : (Xt) là thể hiện của quá trình AR(1) chỉ khi nó

chỉ có duy nhất một hệ số tự tương quan riêng (1) khác không thực sự.

Bài tập : Sử dụng hãy số liệu đơn giản 1, 2, 3, 4, 5, 6, 7, 8, 9 và 10 để

a) Tính hệ số tự tương quan với thời gian trễ là 1, 2, 3 và 4

Trang 37

b) Giải thích tại sao các hệ số tự tương quan nằm trên một đường thẳng.

c) Tính chuỗi sai phân cấp 1 và tính hệ số tự tương quan của chuỗi đã sai phân với k=1 và k = 2

d) Tính giới hạn tín cậy mức 95% của hệ số tự tương quan của chuỗi sai phân

e) Tiến hành kiểm tra bằng phương pháp –bình phương của chuỗi sai phân

2.3. Phương pháp dự báo chuỗi thời gian ARMA

Trong các bài toán kinh tế, kỹ thuật cũng như cuộc sống hàng ngày Việc biết trước được các giá trị của tương lai sẽ vô cùng quan trọng Nó sẽ giúp cho chúng ta hoạch định được kế hoạch, tránh những rủi ro không cần thiết cũng như lựa chọn những phương án tối ưu

Trong phần này, chúng ta giới thiệu một số kỹ thuật phân tích và tính toán sự báo cho chuỗi thời gian dừng chú trọng là quá trình ARMA

2.3.1. Khái niệm dự báo chuỗi thời gian dừng

Giả sử ta có chuỗi thời gian dừng với giá trị trung bình và hàm tự tương quan đã được biết Ta muốn dự báo giá trị theo các giá trị của Mục tiêu của chúng ta là tìm một hàm số g () để g () là sự báo cho có sai số bình phương trung bình nhỏ nhất Ta ký liệu sự báo tốt nhất này là Người ta đã biết rằng trong trường hợp có phân phối chuẩn thì ta có thể chọn là một tổ hợp tuyến tính theo các biến

Mặt khác, phần lớn các chuỗi thời gian trong thực tế đều có phân phối chuẩn hoặc xấp xỉ chuẩn, Chúng ta có thể biến đổi chúng để trờ thành chuỗi thời gian có phân phối gần chuẩn Vì vậy, lẽ tự nhiên ta giả thiết

Vấn đề bây giờ là tìm các hệ số Theo phương pháp bình phương tốt thiểu, các hệ số này được xác định từ phương trình

Phương trình này cho ta nghiệm duy nhất

Trang 38

(xem 2.7.5)

Một cách tương tự, giả sử rằng và là biến ngẫu nhiên (không nhất thiết

là chuỗi thời gian dừng) có mô men cấp 2 hữu hạn với và hệ số tương quan

đã được biết Chúng ta muốn tìm một tổ hợp tuyến tính của 1, để ước lượng

Y

sao cho sai số bình phương trung bình là nhỏ nhất Đặt

(2.3.25)

Ví dụ 2.3.1 Ước lượng giá trị bị thất lạc của chuỗi thời gian

Trang 39

với và Giả sử ta quan sát được và , chúng ta muốn tìm một tổ hợp tuyến tính của 1, và dể ước lượng sao cho sai số bình phương trung bình là nhỏ nhất Từ (2.3.24) ta thu được phương trình

Ngôn ngữ nào mà mình quen thuộc Giả sử là chuỗi thời gian dừng Chúng

ta luôn giả thiết có trùng bình zero và hàm tự tương quan

( )

γ × Nếu chuỗi thời gian không có trung bình zero thì bước đầu tiên ta phải hiệu chỉnh chúng bằng cách thay thế chuỗi ban đầu bằng chuỗi mới với , trong đó

Phương trình (2.3.21) và (2.3.24) cho ta biết cách tính dự báo tốt nhất của

theo Nó liên quan tới việc giải hệ phương trình đại số tuyến tính Nếu n khá

lớn thì việc tính toán sẽ gặp nhiều khó khăn Trong trường hợp này ta có thể

Trang 40

sử dụng thuật toán Durbin- Liwinson hoặc thuật toán đổi mới để giải quyết bài toán.

Trước hết ta nghiên cứu thuật toán Durbin- Liwinson

2.3.1.1. Thuận toán Durbin - Liwinson

Thuật toán Durbin - Liwinson sử dụng kết quả tính toán để tính Từ (2.3.21) ta có

(2.3.26) với thỏa mãn

Ngày đăng: 02/04/2017, 08:28

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1]. Đào Hữu Hồ. Xác suất thống kê. NXB Đại học Quốc gai Hà Nội. Xuất bản lần thứ 6, 2001 Khác
[2]. Đào Hữu Hồ. Nghiễn Văn Hữu. Hoàng Hữu Như, Thống kê toán hoc, NXBĐại học và Trung học Chuyên nghiệp Hà Nội, 1984 Khác
[3]. Bartlett. M.S, Further Aspests of Theory of Multiple Regression, Pro -ceedings of the Cambridge Philosophycal Society, 34, 1938, 33-40 Khác
[4]. Cramer H., Mathematical Methods in Statistics, Princeton, 1948 Khác
[5]. Johnson R.A, Wichern D.W., Applied Multivariante Statistical Analy-sis, Fourth Edition, Prentice Hall, 1998 Khác
[6]. Anderson T.W., An Introduction to Multivariate Statistical Methods (2n.ed.) New York, John Wiley,1984 Khác

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w