1. Trang chủ
  2. » Luận Văn - Báo Cáo

Phân tích thống kê và dự báo

71 957 5

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 71
Dung lượng 727,34 KB

Nội dung

Dự báo một đại lượng biến đổi theo thời gian có thể thực hiện trên tiền đề là quan hệ giữa đại lượng này và các yếu tố quyết định các giá trị của đại lượng này trong quá khứ về cơ bản kh

Trang 1

Lời mở đầu

Trong thống kê toán học, phân tích thống kê và dự báo đối với chuỗi thời gian đóng một vai trò quan trọng và có ý nghĩa to lớn trong thực tiễn: trong thực tiễn khoa học cũng như trong thực tiễn xã hội, cuộc sống…

Vì vậy, chúng tôi lựa chọn đề tài là: “Phân tích thống kê và dự báo”.

Luận văn ngoài phần mở đầu thì gồm hai chương chính

Chương 1: Các khái niệm cơ bản về dự báo

Chương 2: Phân tích chuỗi thời gian và dự báo

Bản luận văn được thực hiện từ tháng 08 năm 2013 và đã hoàn thành vào tháng 06 năm 2014, đánh một dấu mốc quan trọng trong sự nghiệp của tôi Nhân dịp này, tôi xin gửi lời cảm ơn chân thành nhất đến những người thân yêu của tôi,gia đình, bạn bè và đồng nghiệp đã luôn ở bên cạnh động viên, ủng hộ và chia sẻ cùng tôi công việc cũng như những khó khăn trong cuộc sống để tôi vượt qua dấumốc quan trọng này Bản luận văn cũng là lời cảm ơn sâu sắc nhất của tôi dành cho các thầy cô giáo và các bạn học Việt Nam đã giảng dạy và giúp đỡ tôi trong quá trình học tập tại trường Đại học Sư phạm Hà Nội, đặc biệt là NCVCC TS Nguyễn Hồng Hải , người đã dìu dắt và tận tình hướng dẫn tôi hoàn thành luận văn này Do kiến thức còn hạn chế và gặp nhiều khó khăn trong ngôn ngữ nên chắc chắn luận văn thạc sĩ của tôi còn rất nhiều thiếu sót Tôi rất mong nhận được nhiều ý kiến đóng góp của các thầy giáo, cô giáo, của các bạn để luận văn được hoàn thiện hơn

Tôi xin trân trọng cảm ơn!

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI

Trang 2

- -VANLAYA PHOMOUDOM

PHÂN TÍCH THỐNG KÊ VÀ DỰ BÁO

LUẬN VĂN THẠC SĨ KHOA HỌC TOÁN HỌC

HÀ NỘI – 2014

Trang 3

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI

- -VANLAYA PHOMOUDOM

PHÂN TÍCH THỐNG KÊ VÀ DỰ BÁO

Chuyên ngành: Lý thuyết xác suất và thống kê toán học

Mã số: 60.46.01.06

LUẬN VĂN THẠC SĨ KHOA HỌC TOÁN HỌC

Người hướng dẫn khoa học: NCVCC TS Nguyễn Hồng Hải

Trang 4

HÀ NỘI – 2014

Trang 5

MỤC LỤC Lời mở đầu

Trong thống kê toán học, phân tích thống kê và dự báo đối với chuỗi thời gian đóng một vai trò quan trọng và có ý nghĩa to lớn trong thực tiễn: trong thực tiễn khoa học cũng như trong thực tiễn xã hội, cuộc sống…

Vì vậy, chúng tôi lựa chọn đề tài là: “Phân tích thống kê và dự báo”.

Luận văn ngoài phần mở đầu thì gồm hai chương chính

Chương 1: Các khái niệm cơ bản về dự báo

Chương 2: Phân tích chuỗi thời gian và dự báo

Bản luận văn được thực hiện từ tháng 08 năm 2013 và đã hoàn thành vào tháng 06 năm 2014, đánh một dấu mốc quan trọng trong sự nghiệp của tôi Nhân dịp này, tôi xin gửi lời cảm ơn chân thành nhất đếnnhững người thân yêu của tôi, gia đình, bạn bè và đồng nghiệp đã luôn ởbên cạnh động viên, ủng hộ và chia sẻ cùng tôi công việc cũng như những khó khăn trong cuộc sống để tôi vượt qua dấu mốc quan trọng này Bản luận văn cũng là lời cảm ơn sâu sắc nhất của tôi dành cho các thầy cô giáo và các bạn học Việt Nam đã giảng dạy và giúp đỡ tôi trong quá trình học tập tại trường Đại học Sư phạm Hà Nội, đặc biệt là

NCVCC TS Nguyễn Hồng Hải, người đã dìu dắt và tận tình hướng dẫn tôi hoàn thành luận văn này Do kiến thức còn hạn chế và gặp nhiều khó khăn trong ngôn ngữ nên chắc chắn luận văn thạc sĩ của tôi còn rất nhiềuthiếu sót Tôi rất mong nhận được nhiều ý kiến đóng góp của các thầy giáo, cô giáo, của các bạn để luận văn được hoàn thiện hơn

Tôi xin trân trọng cảm ơn!

Trang 6

Chương 1

CÁC KHÁI NIỆM CƠ BẢN VỀ DỰ BÁO

Các khái niệm cơ bản về dự báo

Việc dự báo một đại lượng biến thiên nói chung và dự báo nhu cầu nói riêng đóng một vai trò rất quan trọng trong kinh tế và kỹ thuật Chúng giúp cho những người ra quyết định, các nhà doanh nghiệp tiên đoán một cách khoa học xu hướng phát triển trong tương lai của các đại lượng, của thị trường… và từ đó người ta có thểhoạch định các chính sách, phương hướng đầu tư một cách đúng đắn

Ta lấy thí dụ ở ngành Bưu chính-Viễn thongthông, đó là một ngành công nghiệp dịch vụ có quy mô lớn sử dụng các thiết bị đắt tiền, đòi hỏi việc đầu tư về cơ

sở hạ tầng rất lớn và liên tục Vì vậy, để đảm bảo cho việc sử dụng có hiệu quả các thiết bị và cơ sở vật chất sẽ được đầu tư, cần phải tiến hành việc dự báo nhu cầu với mức độ càng chính xác càng tốt

Bài toán dự báo cũng đặc biệt quan trọng trong lĩnh vực Khí tượng -Thủy văn Việc dự báo trước được thời tiết như nhiệt độ, nắng mưa, lũ lụt… sẽ giúp ích nhiều cho nền kinh tế quốc dân cũng như phòng tránh được thiệt hại to lớn do thiên nhiên gây ra

Trong lĩnh vực tài chính, nếu ai biết trước được xu hướng tăng giảm của một loại tiền tệ hay giá cổ phiếu thì chắc chắn mang lại nhiều lợi ích cho người đó

Những lĩnh vực có nhu cầu dự báo rất rộng lớn Có những dự báo mang tính chất định tính như màu sắc, bản chất con người và có những dự báo mang tính chất định lượng như lượng mưa, sức gió, mực nước về ở sông hồ, chỉ số tăng GDP, tốc độ phát triển dân số Song với sự phát triển của kỹ thuật số, tất cả các tính chất định tính đều có thể lượng hóa Thí dụ màu sắc có thể đồng nhất với chỉ thị màu của nó… Vì vậy, từ nay về sau từ dự báo nhằm chỉ các dự báo mang tính chất định lượng

Dự báo và “đoán mò” là hai điều khác hẳn nhau Trong khi “đoán mò” mang tính chất của công việc làm của thầy bói thì dự báo phải căn cứ trên những thông tin

có được, thiết lập các mô hình các thuật toán để chỉ ra giá trị cần dự đoán Nói cách

Trang 7

khác đi, dự báo chính là các “dự đoán” mang tính chất khoa học Cho dù với trình độ khoa học - kỹ thuật ngày nay các mô hình cũng như các thuật toán chưa hẳn đã đưa ranhững dự báo chính xác hơn là các dự đoán của các chuyên gia, thí dụ Trạng Trình Nguyễn Bỉnh Khiêm hay một vài chuyên gia giỏi có thể đoán sự việc trước một thời gian rất dài Chúng ta không nên xếp mình vào tầng lớp những danh nhân đó mà nên tiệp cận với các phương pháp khoa học để dự báo một cách có cơ sở hơn.

2 Các bước cần thực hiện trong quá trình dự báo

Thông thường thủ tục dự báo bao gồm các bước sau:

Bước 1: Xác định các mục tiêu dự báo

Bước đầu tiên của công tác dự báo là làm rõ các mục tiêu của nó Ba mục tiêu chính cần phải xác định là:

Đối tương dự báo

• : Nhu cầu về thuê bao điện thoại, nhu cầu về nhà ở, nhu cầu nghề nghiệp, lượng nước

về trong hồ chứa, thời tiết, tỷ giá cổ phiếu

Khu vực dự báo : Theo địa dư (một tỉnh, khu vực, toàn quốc ) hay khu vực xã hội

(ngành công nghiệp, khu vực dịch vụ…) Khu vực dự báo có thể là thu hẹp trong vùng nông thôn hay một lĩnh vực cụ thể nào đó như tỷ giá đồng đô-la Mỹ và đồng Việt Nam

Khoảng thời gian cần dự báo

: 1 năm, 5 năm, 10 năm…

Bước 2: Phân tích các yếu tố ảnh hưởng đến đại lượng cần dự báo.

Dự báo một đại lượng biến đổi theo thời gian có thể thực hiện trên tiền đề là quan hệ giữa đại lượng này và các yếu tố quyết định các giá trị của đại lượng này trong quá khứ về cơ bản không thay đổi cho đến thời điểm cần dự báo trong tương lai Do đó các điều kiện bên trong (như hệ thống giá và cơ cấu giá, cơ chế vận hành điều tiết lũ ) cùng các điều kiện bên ngoài (như các kế hoạch phát triển vùng Bảo đảm tính bền vững của môi trường ) phải được xét đến

Bước 3: Thu thập và phân loại dữ liệu.

Trong việc nghiên cứu các yếu tố ảnh hưởng trực tiếp đến đối tượng dự báo cần phải thu thập những dữ liệu về các yếu tố đó Sau đó sắp xếp và phân loại chúng

để xử lý

Trang 8

Chẳng hạn, dữ liệu cần cho việc dự báo nhu cầu điện thoại có thể bao gồm:

• Dân số, số hộ gia đình

• Số văn phòng các công ty, cơ quan, đoàn thể

• Tốc độ tăng thu nhập

• Tốc độ tăng trưởng kinh tế

• Các kế hoạch phát triển đô thị

• Nhu cầu điện thoại của các năm qua

Các dữ liệu trên cần được sắp xếp theo thời gian, vùng địa dư hay ngành nghề

Bước 4: Phân tích xu hướng tiến triển của đại lượng cần dự báo:

Xu hướng tiến triển được phân tích trên các bình diện sau:

Các số liệu của thời gian trước đó

Cơ cấu phát triển của hệ

Nguồn tác động đến quá trình phát triển

Xem xét các đặc trưng của khu vực

So sánh với các vùng khác

Bước 5: Xác định kỹ thuật dự báo sẽ sử dụng và tính toán các giá trị dự báo

Các phương pháp dự báo có thể tạm phân thành 3 loại sau:

Ngoại suy chuỗi thời gian

Phân tích hồi quy

Các phương pháp khác (so sánh, chuyên gia )

Phương pháp dự báo thường được chọn tương ứng với đặc điểm của đối tượng cần dự báo và các yếu tố liên quan, ứng với các dữ liệu có thể thu thập được Để đạt được các giá trị dự báo với độ tin cậy cao, điều quan trọng là phải chọn được phương pháp dự báo thích hợp, khả thi nhất và chọn ra được phương pháp tính toán tin cậy vàtối ưu

Bước 6: Kiểm tra tính phù hợp của mô hình Bước 7: Xác định các giá trị dự báo

: kết hợp kết quả thu được ở bước 5 và các phân tích thực hiện ở các bước 2 và

4, xác định các giá trị dự báo thích hợp nhất

3 Phân loại các kiểu dự báo

Trang 9

Thông thường, dự báo được phân loại theo mục tiêu dự báo, chu kỳ dự báo và quy mô vùng dự báo đích.

1 Phân loại dự báo theo mục tiêu

Mục tiêu của dự báo có thể được phân thành 3 loại

• Loại thứ nhất là nhằm nghiên cứu chính sách quản lý hoặc chiến lược khác

• Loại thứ hai là nhằm phác họa chi tiết để tính toán số lượng thiết bị, đặt hệ thống, bố trí và thiết kế thí nghiệm

• Loại thứ ba gồm dự đoán sự phát triển của hệ để khai thác hệ hay đề phòng rủi ro

Trong nghiên cứu chính sách quản lý hoặc chiến lược khác, các giá trị tương lai được ước tính một cách đại thể để thiết lập một chính sách hoàn chỉnh và một mụctiêu.Vì vậy, thông thường các dự báo mang màu sắc toàn cực hơn là các vấn đề, giai đoạn cụ thể Thí dụ dự báo một nhu cầu thường nằm ở tầm vĩ mô cho cả quốc gia, cả vùng được sử dụng

Để lập một kế hoạch thiết bị cụ thể cho việc lắp đặt mới hoặc bổ sung thiết bị

cũ, dự báo nhu cầu một cách chi tiết cho từng vùng phải được thực trên cơ sở một khảo sát tổng thể trong vùng đó

2 Phân loại theo các thời kỳ dự báo

Thời kỳ dự báo nhu cầu được phân thành dự báo ngắn hạn, trung hạn và dài hạn tùy theo độ dài của thời kỳ dự báo

Đối với các dự báo ngắn và trung hạn, phương pháp chuỗi thời gian thường hay được sử dụng.Nó dùng xu hướng được phát hiện ra từ các dữ liệu có được cho đến thời điểm hiện tại làm cơ sở cho việc đoán định các giá trị trong tương lai (phép ngoại suy).Nhìn từ góc độ toàn quốc dự báo này có khả năng bị ảnh hưởng bởi các điều kiện kinh doanh và các điều kiện kinh tế.Dưới góc độ từng vùng thì nó chịu ảnh

Trang 10

Nhu cầu

Trung/dài hạn Ngắn hạn

Năm dự báo

…Ngoại suy giữa các dự báo

hưởng lớn của các kế hoạch phát triển khu vực hoặc đô thị có liên quan chặt chẽ với vùng này

ta thường sử dụng các phương pháp hồi quy

5 Điều chỉnh dự báo theo thời kỳ

Đối với các thời kỳ dự báo khác nhau, người ta sử dụng các loại phương pháp

dự đoán khác nhau Không thể áp dụng cùng một phương pháp cho tất cả các dự báo ngắn hạn, trung hạn và dài hạn

Vì vậy, cần phải tiến hành các công việc sau:

• Khi hai phương pháp khác nhau được sử dụng, thì các giá trị dự báo của phần gối đầulên nhau phải được điều chỉnh

• Khoảng trống giữa các đường tăng trưởng (của 2 thời kỳ liên tục không bị gối lên nhau) phải được điều chỉnh

Trang 11

Hình 1.1 cho thấy một phương pháp điều chỉnh chủ quan mà ở đó 1 đường cong trơn được vẽ ra giữa 2 đường cong vẽ bằng các phương pháp khác nhau.Ngược lai là một ví dụ của phương pháp điều chỉnh khách quan, phương pháp mở rộng điểm cuối của một đường cong ngắn hạn làm một giá trị ban đầu có thể sử dụng được cho tốc độ tăng trưởng của các mô hình trung hạn và dài hạn.

3 Phân loại theo quy mô vùng dự báo

Đây là phân loại tương đối theo quy mô vùng dự báo Chẳng hạn, việc dự báo cho một đơn vị lớn như nhu cầu điện thoại toàn quốc được gọi là dự báo cấp vĩ mô, trong khi việc dự báo cho một đơn vị dự báo cấp vi mô

1 Dự báo cấp vĩ mô

Trong dự báo cấp vĩ mô, nói chung có thể dùng nhiều phép thống kê xã hội Vìvậy, có thể tiến hành nghiên cứu chi tiết về chúng Chúng thường được sử dụng để dựthảo một ngân sách toàn bộ hay hoạch định một kế hoạch mang tính chất chiến lược

2 Dự báo cấp vi mô

Dự báo cấp vi mô là dự báo của vùng hay dự báo cho khu vực nhỏ Nó có thể hiểu là dự báo một đại lượng cho một ngành cụ thể Thí dụ, đối với việc thiết kế côngviệc lắp đặt thiết bị mới hoặc thiết bị bổ sung như đấu cáp, thiết kế kỹ thuật và xây dựng kế hoạch bố trí tổng đài việc dự báo cấp vi mô là cần thiết

3 Điều chỉnh dự báo giữa vi mô và vĩ mô

Nhìn chung, có sự khác nhau ở chừng mực nào đó giữa tổng các giá trị dự báo tầm vi mô và các giá trị dự báo tầm vĩ mô Đối với vùng địa lý nhỏ, ta khó có thể thu được các dữ liệu thống kê ổn định (các dữ liệu quá khó mà ta có thể sử dụng làm cơ

sở cho dự báo khác) và điều này có khả năng gây ra những xét đoán sai lệch Do đó,

dự báo trực tiếp của một vùng địa lý lớn cho chúng ta một xu hướng chính xác hơn làtổng của các kết của dự báo cấp vi mô

Khi đối chiếu giữa dự báo vi mô và dự báo vĩ mô, ta thường phải điều chỉnh dựbáo vi mô theo dự báo vĩ mô Những nhân tố bị bỏ qua bởi dự báo vĩ mô đôi khi có thể được dự báo vi mô chỉ rõ Ý nghĩa của việc điều chỉnh dự báo là nâng cao độ chính xác của dự báo Xóa bỏ sai lệch trong việc đánh giá gây ra bởi dự báo cấp vi mô

Có hai phương pháp dự báo cơ bản là:

1 Phương pháp phân tích hồi quy

Phương pháp chuỗi thời gian

Trang 12

Các phương này sẽ được xét chi tiết trong các chương sau.

4 Các khái niệm về dự báo

1 Các yếu tố ảnh hưởng đến nhu cầu

Nhu cầu của xã hội về một loại sản phẩm, một loại dịch vụ nào đó thường bị chi phối bởi nhiều yếu tố Các nhân tố này có thể chia thành hai nhóm: các yếu tố bênngoài và các yếu tố bên trong Thành phần của các nhóm này hoàn toàn tùy thuộc vàobài toán cụ thể ta đang xét

Chẳng hạn, đối với bài toán dự báo nhu cầu điện thoại, có thể xếp các yếu tố như các hoạt động chính trị, đoàn thể và tư nhân, sự tăng trưởng GDP: các yếu tố xã hội như dân số, số hộ gia định, và dân số làm việc… vào nhóm các yếu tố bên ngoài Các yếu tố bên trong có thể bao gồm: chi phí đâu tư thiết bị, chi phí thuê bao, phụ phí

sử dụng và các yếu tố marketing như hệ thống sản xuất, quảng cáo và chiến lược marketing

Dự báo nhu cầu là nhằm nắm vững và phân tích các nhân tố này để xác định nhu cầu tương lai về số lượng Ta minh họa những điều vừa nói ở trên trong bài toán

dự báo nhu cầu điện thoại:

Trang 13

Nhân tố bên ngoài

Nhân tố kinh tế

Độ tăng trưởng kinh tế

Tiêu thụ cá nhân

Nhân tố xã hội Dân số

Hộ gia đình Người đang lao động

Nhân tố bên trong

Cước phí Tiền thiết bị Phí thuê bao Phí truyền thông Phụ phí sử dụng

Chiến lược tiếp thị Chiến lược sản xuất Chiến lược quảng cáo

Nhu cầu

Hình 1.2: Sơ đồ phân tích các nhân tố

2 Các giai đoạn tăng trưởng của nhu cầu

Nói chung, sự tăng trưởng của nhu cầu bao giờ cũng trải qua 3 giai đoạn:

• Giai đoạn khởi đầu: Trong giai đoạn này, nhu cầu tăng dần nhưng chậm chạp

• Giai đoạn tăng trưởng nhanh

• Giai đoạn bão hòa: Giai đoạn có tốc độ tăng trưởng chậm lại và giảm dần

3 Các công việc cần làm để dự báo nhu cầu

Dự báo nhu cầu nhằm đưa ra các giá trị dự đoán về nhu cầu nào đó để làm điềunày người ta phải tiến hành các bước: thu thập và chỉnh lý các dữ liệu; phân tích và đánh giá độ chính xác của các giá trị dự báo; cuối cùng là đưa ra giá trị dự báo nhu cầu Ba phần việc này liên quan chặt chẽ với nhau Ta minh họa các phần việc của dựbáo nhu cầu theo sơ đồ:

Trang 14

Dự báo nhu cầu

Quản lý giá trị nhu cầu

Trang 15

Chẳng hạn để dự báo nhu cầu điện thoại, cần tiến hành các công việc

a Thu thập và chỉnh lý các số liệu về nhu cầu điện thoại (số liệu bên trong); các số liệu thống kê về dân số, số hộ gia đình, các chỉ số kinh tế v.v… (dữ liệu bên ngoài) theo trình tự thời gian và địa phương

b Thiết lập mô hình toán học cho bài toán Sau đó căn cứ trên các số liệu thu thập được

ta tiến hành tính toán để ước lượng mô hình Các bước tính toán này thường có kích thước lớn nên ta phải cần đến sự trợ giúp của máy tính

Tiến hành tính các giá trị dự báo theo phương pháp đã lựa chọn Sử dụng các tính toán này phục vụ cho mục đích của chúng ta

Chương 2

PHÂN TÍCH CHUỖI THỜI GIAN VÀ DỰ BÁO

:Phân tích chuỗi thời gian và dự báo

Chương này đưa ra một vài ý tưởng cơ bản của bài toán phân tích chuỗi thời gian.Trong bài toán đó, các khái niệm về tính dừng, về hệ số tương quan có vai trò đặc biệt quan trọng Chúng ta cũng tóm lược qua một vài nét về các kỹ thuật cơ bản ước lượng và loại bỏ từng xu thế cũng như tính chất theo mùa từ một chuỗi thời gianquan sát được Một vài thí dụ minh họa đưa ra được tính toán bằng phần mềm

EVIEWS

Trang 16

1 Khái niệm và các thí dụ về chuỗi thời gian

Mục tiêu của việc phân tích kinh tế thể nghiệm là chỉ ra cơ chế kinh tế và đưa

ra các quyết sách Vì vậy ta đòi hỏi có một số lượng lớn các quan sát cho các đại lượng thích hợp để nghiên cứu các mối liêen hệ giữa các đại lượng này Các quan sátnày có thể được tiến hành đều đặn qua từng thời kỳ chẳng hạn theo từng tháng, theo từng quý hoặc hàng năm hoặc chỉ trong những thời điểm đặc biệt như các thời kỳ xảy

ra khủng hoảng kinh tế Dãy các quan sát này ta gọi là chuỗi thời gian Như vậy, chuỗi thời gian là tập hợp các quan sát mà mỗi quan sát được ghi nhận tại thời điểm t

với tT Chuỗi thời gian được gọi rời rạc nếu như T là tập hợp rời rạc (thí dụ các quan

sát được thực hiện cách nhau một khoảng thời gian đều đặn như là doanh thu cước phí điện thoại hàng tháng của một trạm bưu điện từ tháng 12 năm 1995 đến tháng 12

năm 2001 Trái lại nếu T là một khoảng thì chuỗi được gọi là liên tục Biểu đồ ghi

nhịp tim của một bệnh nhân trong 2 giờ là một minh họa cho chuỗi thời gian liên tục

với T= [0, 2].

2 Mục đích của việc phân tích chuỗi thời gian

Tất cả các kỹ thuật dự báo chuỗi thời gian dựa trên giả định là có một mẫu hình

cơ bản tiềm ẩn trong các số liệu đang nghiên cứu cùng với các yếu tố ngẫu nhiên ảnh hưởng lên hệ thống đang xét Công việc chính của phân tích chuỗi thời gian là ngiên cứu các kỹ thuật để tách mẫu hình cơ bản này và sử dụng nó như là cơ sở để dự báo cho tương lai

Vấn đề là ở chỗ phần lớn các chuỗi thời gian trong cuộc sống thực tại là rất phức tạp nên các kỹ thuật đơn giản như là làm trơn số liệu …ở các phần trước sẽ không thể dùng được trong các trường hợp này (kỹ thuật làm trơn số liệu chỉ phù hợpcho các chuỗi mà độ thăng giáng không lớn lắm) Vì vậy, chương này dành cho việc giới thiệu phương pháp Box-Jenkins để dự báo các chuỗi thời gian có độ phức tạp cao hơn.Kỹ thuật này rất phù hợp cho công việc dự báo chuỗi thời gian mặc dù nó tương đối phức tạp về phương diện toán học và yêu cầu phải có nhiều số liệu.Trên thức tế, nó đòi hỏi ít nhất 50 số liệu và thông thường tốt nhất là nên có khoảng 100 sốliệu mới có thể nhận dạng chính xác mô hình

Trang 17

Kỹ thuật dự báo Box-Jenkins được đề xuất bởi George Box và Gwin-lym Jenkins năm 1970 song thường được gọi là phương pháp dự báo các quá trình tự hồi quy trung bình trượt ARMA(ARMA = Autogregres-sive /Moving/Average).

Đề làm được điều đó, trước hết ta giả thiết có một hình xác suất để biểu diễn dãy số liệu.Sau khi chọn ra một mô hình gần dãy số liệu, chúng ta tiến hành ước lượng các tham số của mô hình, kiểm tra lại xem mô hình được sử dụng có thích hợp không

Dự báo là ước lượng các giá trị tương lai yt+h , h ≥ 1 của một biến ngẫu nhiên dựa trên các quan sát các giá trị quá khứ của nó y1, y2,…,yt Dự báo của yt+h thường được ký hiệu là

Chất lượng của dự báo phụ thuộc vào nhiều yếu tố.Trước hết nó phụ thuộc vào

xu hướng phát triển của chuỗi thời gian Nếu chuỗi thời gian là làm “đều đặn” theo thời gian thì càng dễ dự báo Thí dụ nếu tiến trình phát triển kinh tế không có những biến động đặc biệt thì dễ dàng dự báo tổng sản phẩm quốc nội (GDP) cho những nămsau.Cho đến nay, các phương pháp dự báo chuỗi thời gian chưa cho phép dự báo được các giá trị đột biến

Chất lượng dự báo chuỗi thời gian còn phụ thuộc xa gần của thời gian Dự báo các giá trị càng gần hiện tại càng chính xác Như vậy, việc ước lượng GDP cho năm sau sẽ chính xác hơn là ược lượng GDP cho 10 năm sau

Ngoài ra, phương pháp ước lượng cũng đóng vai trò hết sức quan trọng Nếu chúng ta sử dụng phương pháp dự báo tốt thì giá trị dự báo càng chính xác

Trang 18

2 Tách các xu thế

Trong các chu kỳ tăng trưởng, nhiều chuỗi thời gian có sự tiến triển trung hạn tương tự nhau Sự tiến triển trung hạn này được gọi là các xu thế Như vậy, nếu tồn tại một xu thế trong chuỗi thời gian thì ta nên tách nó ra để dễ dàng cho việc xử lý các số liệu còn lại

Có lẽ chẳng cần nghiên cứu nhiều cũng biết hàng năm cứ đến mùa thu thì áo len bán chạy hơn mùa hè Cũng như vậy đối với các hiện tượng khí tượng như mây mưa, bão lụt và các vấn đề kinh tế khác Thí dụ về lượng hành khách của ngành đường sắt Pháp cho ta thấy cứ đến tháng tám thì số hành khách đi tàu thấp nhất trong năm đó Ta gọi tình trạng đó là hiện tượng theo mùa Chuỗi số nhận được sau khi loại

bỏ xu thế theo mùa trong chuỗi thời gian gọi là “chuỗi được hiệu chỉnh theo mùa”

Có nhiều phương pháp khác nhau để hiệu chỉnh một chuỗi thời gian theo mùa Tuy nhiên bất cứ một phương pháp nào cũng đòi hỏi có các tính chất sau: nếu ta ký hiệu zSA là chuỗi hiệu chỉnh theo mùa của chuỗi (zt) thì

i xSA + ySA = (x + y)SA , x,y

ii

iii xSAySA = (xy)SA , x,y

4 Phát hiện các thời điểm đột biến

Có thể do khủng hoảng kinh tế - chính trị hay chiến tranh mà chiều hướng phát triển kinh tế có thể thay đổi mạnh mẽ ở những thời điểm nào đó về xu thế cũng như mức

độ Rõ ràng rằng việc phát hiện ra những điểm đột biến này càng sớm càng tốt là một việcquan trọng trong dự báo chuỗi thời gian

3 Một vài mô hình chuỗi thời gian đơn giản

Phần quan trọng của việc phân tích chuỗi thời gian là chọn mô hình xác suất phù hợp (hay là phân lớp mô hình) cho dãy số liệu Để còn có một khả năng nào đó cho việc không thể dự đoán được giá trị tương lai, ta giả thiết mỗi quan sát xt là một thể hiện của biến ngẫu nhiên Xt

Trang 19

Bây giờ ta hãy xét việc mô hình hóa chuỗi thời gian đối với các số liệu quan sát {xt} từ các biến ngẫu nhiên{xt}, đó là việc nhận dạng các phân phối đồng thời {xt }, tức là tập hợp các phân phối xác suất

của biến ngẫu nhiên (X 1 , X 2 ,…, X n) Tuy nhiên tập các phân bố này ít được sử dụng bởi vì nó chứa quá nhiều tham số Vì vậy, trong nhiều trường hợp ta chỉ cần xác định một vài tham số như là kỳ vọng EXt và hệ số tương quan

Trong trường hợp các phân phối đồng thời của (X 1 , X 2 ,…, X n) là chuẩn thì việc biết hai tham số này sẽ đủ xác định phân phối đó

Sau đây ta xét 3 trường hợp đơn giản nhất của mô hình chuỗi thời gian

1 Mô hình với ướt trung bình zero

a Mô hình tiếng ồn độc lập cùng phân phối (ồn trắng)

Trong mô hình này các quan sát {xt} là các mẫu ngẫu nhiên đơn giản tức là nó

là các quan sát từ các biển ngẫu nhiên {xt} độc lậợp cùng phân phối với trung bình zero Đây là mô hình chuỗi thời gian đơn giản nhất vì nó không chứa bất cứ một xu thế hoặc tính chất theo mùa nào Theo định nghĩa mô hình là ồn trắng (viết tắt nếu

Và Xt = 0, DXt=

b Mô hình nhị thức

Nếu{xt} lấyhai giá trị với

và là dãy độc lập thì mô hình ồn trắng gọi là mô hình nhị thức

Chúng ta có thể nhận được các chuỗi thời gian nhị thức bằng cách tung một đồng tiền cân đối, đồng nhật Nếu ở lần tung thứ t đồng tiền xuất hiện mặt sấp thì ta gán cho giá trị +1 còn xuất hiện mặt ngửa thì gán giá trị -1 Chuỗi thời gian nhị thức thường gặp trong các tiếng ồn điện báo, các bài toán liên quan may rủi trong song bạchay kết quả các trận đấu…

Từ định nghĩa của mô hình ta có

Trang 20

Đẳng thức này cho thấy việc biết được các giá trị của quá khứ (X1, X2…, Xn) không giúp ích gì cho dự báo giá trị tương lai Mặc dù vậy chuỗi thời gian độc lập cùng phân phối vẫn đóng vai trò quan trọng trong việc xây dựng những mô hình phức tạp hơn.

{St} được gọi là di động ngẫu nhiên đối xứng Nó hay gặp trong các mô hình kinh tế-tài chính như là tính toán cổ phiếu hay rủi ro ở các ngẫu nhiên hàng

2) Mô hình có xu thế và mô hình có tính chất theo mùa

Các mô hình được đưa ra trong mục 1) thuần túy ngẫu nhiên Tức là số liệu quan sát tại một thời điểm hoàn toàn không kế thừa bất cứ thông tin nào từ các số liệu quan sát tại thời điểm khác Tuy nhiên trong niều bài toán phân tích chuỗi thời gian ta nhận thấy có một xu thế rõ ràng trong số liệu Rõ ràng trong các trường hợp này, mô hình trung bình zero không còn thích hợp Đường biểu diễn các số liệu này trên mặt phẳng gợi cho ta mô hình dạng

Xt = mt +Yt với t=1,2…

Với mt là hàm có dạng đã biết Nó được mình họa như là thành phần có xu thế của chuỗi thời gian còn Yt có trung bình zero Kỹ thuật để ước lượng mt sẽ được đề cập về sau

Có nhiều chuỗi thời gian bị ảnh hưởng của nhiều yếu tố có tính chất theo mùa như là thời tiết, chu kỳ sinh đẻ hay chu kỳ tăng (giảm) kinh tế Các chuỗi thời gian này có thể mô hình hóa nhờ một thành phần tuần hoàn với chu kỳ cố định Để biểu thị được ảnh hưởng theo mùa này, ta giả thiết mô hình có thể có nhiều nhưng không

có xu thế và viết

Xt = st +Yt với t=1,2…

Với st là hàm tuần hoàn với chu kỳ d (tức là ) Thường ta lựa chọn

Trang 21

Vớilà các tham số chưa biết, là các tần số cố định, mỗi số là một bội nguyên của

3) Phương pháp chung để mô hình hóa chuỗi thời gian

Qua phân tích ở trên cách tiếp cận chung để phân tích chuỗi thời gian là

• Vẽ các số liệu của chuỗi lên mặt phẳng tọa độ và xết các đặc trưng chính của chúng.,

• Khử các xu thế và thành phần theo mùa Có hai phương pháp chính:

a) Ước lượng các xu thế hay các biểu diễn theo mùa nhờ phương pháp bình phương tối thiểu sau đó trừ các giá trị của hàm vừa ước lượng vào các số liệu

b) Sai phân số liệu: Xét một chuỗi thời gian mới {Yt} từ chuỗi ban đầu nhờ toán tử sai phân (hoặc lặp lại một vài lần sai phân như vậy) Mục tiêu là nhận được một chuỗi dừng (xem phần 2.3.3 về nhận dạng chuỗi thời gian)

2 Quá trình dừng và phân tích hệ số tự tương quan

1 Khái niệm về quá trình dừng

Quá trình dừng là quá trình ngẫu nhiên có một vài đặc trưng không biến đổi theo thời gian Đây là một khái niệm cốt lõi trong việc phân tích chuỗi thời gian Nếu đặc trưng đó là phân phối đồng thời của các {Xt} thì ta có

Định nghĩa 2.2.1:

Quá trình ngẫu nhiên {Xt} được gọi là dừng theo nghĩa chặt nếu như với mọi

t1< t2<…<tk và h > 0 ta có () có cùng phân phối với ()

Việc đòi hỏi phân phối đồng thời của {Xt} bất biến của phép dịch chuyển thời gian là quá mạnh nên đôi khi ta chỉ đòi hỏi một vài đặc trưng yếu hơn liên quan tới các mô men cấp 1 và cấp 2 không phụ thuộc theo thời gian như định nghĩa sau đây

Trang 22

ii Với mỗi h=0, cố định hàm số

]không phụ thuộc vào t, tức là

Ta nhận xét rằng quá trình dừng theo nghĩa chặt với suy ra nó phải đúng theo nghĩa rộng Điều ngược lại chỉ đúng trong một vài trường hợp đặc biệt

Định nghĩa 2.2.4.

Nếu {Xt}, t = 0, là quá trình dừng với thì hàm (theo h):

gọi là hàm tự hiệp phương sai (autocovaiancer) còn

(2.2.1)

gọi là hàm tự tương quan.

Giải thích: Khi nghiên cứu hai véc - tơ trên mặt phẳng, ngoài thông số độ dài của từng véc - tơ, còn có một đại lượng rất quan trọng là số đo cosin của góc giữa hai véc

- tơ đó Về phương diện nào đó thì hệ số tương quan của hai đại lương ngẫu nhiên X

và Y được cho bởi cũng mang một ý nghĩa tương tự như vậy Nó là một chỉ số đơn giản chỉ sự phụ thuộc lẫn nhau của hai đại lượng ngẫu nhiên Khi chỉ có một dãy quan sát, ta đưa vào khái niệm mới là các hàm tự tương quan để đo sự phụ thuộc lẫn nhau giữa các quan sát Giá rị của hệ số tự tương quan tại h đo mối quan hệ giữa hai giá trị của chuỗi thời gian cách nhau một khoảng h Khoảng cách xa nhau của hai số liệu này gọi là độ trễ của thời gian

Các tính chất của các hệ số hiệp phương sai, tương quan có thể xem trong các tài liệu về lý thuyết xác suất và thống kê toán học (thí dụ [2]).Ở đây ta chỉ nhấn mạnhđến tính chất tuyến tính của các hệ số tương quan Nếu

và a,b,c là các số thức bất kỳ thì

Ví dụ: 2.2.1 Dãy tiếng ồn độc lập cùng phân phối

Nếu là độc lập cùng phân phối với thì

Ví dụ 2.2.2 Di động ngẫu nhiên

Vì hệ số tự tương quan phụ thuộc theo t nên di động ngẫu nhiên không có tính chất dừng

.Vai trò của hệ số tự tương quan (HSTTQ) có thể được minh họa nhứ thí dụ sauđây Giả sử là chuỗi thời gian dừng Gauss (tức là các phân phối đồng thời của

Trang 23

(X1,X2, … , Xk) là chuẩn với mọi k) Giả sử ta đã quan sát được giá trị của , ta muốn tìm một hàm số của để ước lượng tốt nhất cho theo nghĩa bình phương tối thiểu Theo ý thuyết quá trình ngẫu nhiên, người ta đã chứng minh rằng ước lượng đó là

Với sai số của ước lượng

Trong đó tương ứng là giá trị trung bình và phương sai của Biểu thức này cho thấy (ít nhất là trong trường hợp chuỗi thời gian Gauss), ước lượng càng chính xác nếu càng gần giá trị 1

Từ định nghĩa 2.2.4 ta thấy HSTTQ là hàm chẵn tức là với mọi h vì vậy trong các lập luận về sau, ta chỉ quan tâm đến các giá trị của với h > 0

Cách đơn giản nhất để xây dựng chuỗi thời gian dừng theo nghĩa chặt là “lọc”

nó từ quá trình ngẫu nhiên độc lập cùng phân phối Giả sử là dãy độc lập cùng phân phối còn là hàm (đo được) q biến số, khi đó

sẽ là chuỗi thời gian dừng theo nghĩa chặt Trong trường hợp này dễ thấy và

sẽ độc lập với mọi |h| > q nên với mọi |h| > q

Các quá trình có tính chất này ta sẽ gọi là q – tương quan Ta xét trường hợp riêng nhưng quan trọng sau:

Định nghĩa 2.2.5: (Quá trình trung bình trượt MA(q))

{Xt} là quá trình trung bình trượt cấp q (viết tắt MA(q)) nếu

Xt = Zt + θ1Zt - 1 +…+ θqZt - q (2.2.2)Trong đó {Zt} là dãy lập có cùng phân phối với trung bình 0 và phương sai σ2 , còn θ1, θ2, , θqlà các hằng số, θq≠0

Tầm quan trọng của quá trình trung bình MA (q)) ở chỗ mỗi quá trình q - tương quan sẽ là một quá trình MA(q)) như mệnh đề sau

Trang 24

Các quá trình ngẫu nhiên tuyến tính cho chúng ta bối cảnh chung để nghiên cứu chuỗi thời gian Thật vậy, theo khai triển Wold, mỗi quá trình ngẫu nhiên dừng

có mô menm cấp 2 hữu hạn thì hoặc là tuyến tính, hoặc có thể biến đổi thành quá trình tuyến tính bằng cách khử thành phần tất định trong chuỗi thời gian

Định nghĩa 2.2.6:

Chuỗi thời gian {Xt} là tuyến tính nếu nó có biểu diễn dạng

(2.2.3)

với mọi t, trong đó {Zt} là chuỗi độc lập, cùng phân phối với trung bình zero

và phương sai (viết tắt là còn là dãy các hằng số với

Để tiện việc trình bày, ta dẫn vào khái niệm toán tử dịch chuyển B định

nghĩa bởi Với ký hiệu này (2.2.3) có thể viết lại dưới dạng

(2.2.4)

với

Chú ý : Điều kiện đảm bảo cho chuỗi (2.2.3) hội tụ với xác suất 1 (xem (5)) Ta cũng có thể thay điểu kiện này bằng điểu kiện yếu hơn Vẫn đảm bảo cho chuỗi (2.2.3) hội tụ nhưng theo nghĩa bình phương trung bình

Từ (2.2.3) dễ dàng tính được

(2.2.5)

(2.2.6)

Ví dụ 2.2.3 Quá trình trung bình trượt (dĩ nhiên) là quá trình tuyến tính.

Ví dụ : 2.2.4 Quá trình tự hồi quy cấp một AR(1) có dạng

Trang 25

là quá trình dừng tuyến tính

Ví dụ 2.2.5 Lý luận trên có thể mở rộng cho quá trình tự hồi quy trung

bình trượt cấp 1 (viết tắt là quá trình ARMA(1,1) có dạng sau

(2.2.12)với và

Để đơn giản ta ký hiệu

(2.2.16)

là quá trình tuyến tính dừng

3 Hệ số tương quan và tự tương quan mẫu

Cũng như trong tất cả bài toán thống kê, các HSTTQ chưa được biết nên ta tìmcác ước lượng chúng qua các thể hiện của chuỗi thời gian

Nếu ta quan sát được n giá trị của chuỗi là và n giá trị của chuỗi {Yt} là thì hệ

số hiệp phương sai sẽ được ước lượng bởi

Trang 26

Còn hệ số tương quan của và được tính bởi công thức:

(2.2.17) Trong đó

là trung bình số học của các số đo ,tương ứng và

Một cách tương tự, giả tự, giả sử có các quan sát của chuỗi thời gian Khi đó ước lượng của hệ số tự hiệp phương sai là hệ số tự hiệp phương sai mẫu cho bởi

và hệ số tự tương quan mẫu là ,

(với độ trễ của thời gian là ) Trong đó

• n= số quan sát của đại lượng X

• = thể hiện của tại thời điểm t

• giá trị trung bình của các thể hiện của chuỗi thời gian

Nhìn vào công thức ta thấy và đo mối tương quan giữa đoạn số liệu với đoạn

số liệu cách nhau một độ trễ của thời gian là

Dễ dàng chứng minh rằng giá trị hệ số tự tương quan mẫu p hnằm giữa - 1

và +1 Hơn nữa, dễ dàng nhận thấy với mọi độ trễ của thời gian Do vậy, từ nay về sau ta chỉ xét với những > 0

Chú ý: Trong công thức tính đáng lẽ ta phải chia cho n-|h|-1 để đảm bảo

tính không chệch của ước lượng Tuy nhiên trong các bài toán phân tích chuỗi thời

gian n thường khá lớn nên việc thay n-|h|-1 bởi n sẽ không ảnh hưởng lớn lắm đến

Trang 27

gọi là ma trận tương quan Người ta đã chứng minh được rằng là các ma trận xác định không âm Hơn nữa, chúng sẽ xác định dương nếu

Nếu không có giả thiết nào phụ thêm thì rõ ràng khó có thể đưa ra những

kết luận thống kê cho ngay cả khi k khá nhỏ so với n Những tính chất này sẽ được

nghiên cứu cụ thể cho một vài mô hình Tuy nhiên, theo quan điểm của Box và

Jenkin (1976) để có các ước lượng tin cậy thì n >49 và k < n/4.

Ví dụ 2.2.6 Để minh họa điều đã nói ở trên, ta đưa ra thí dụ sau về cách

3-25-6-621-342

94253636419164

-25-6-621-342

-6-10-30-36-122-3-128

Để bạn đọc làm quen hơn nữa với hệ số tự tương quan Chúng ta hãy tính

hệ số tự tương quan mẫu tính trễ sau hai hơn vị thời gian (h=2) trên cùng một dãy số liệu đã cho ở trên (độ trễ của thời gian bằng h=2): Sử dụng công thức tính cho ta

Trang 28

phải dần tới 0 khi với mọi Tuy nhiên chúng ta chỉ quan sát được n số liệu nên nói chung các hệ số tự tương quan mẫu này sẽ chỉ xấp xỉ bằng 0 mà thôi.

Nhưng thế nào được xem xấp xỉ bằng 0?Để trả lời câu hỏi đó, ta dựa vào phương pháp thông thường trong lý thuyết thống kê đã được trình bày trong chương

2 Người ta chứng minh rằng khi mẫu khá lớn thì các hệ số tự tương quan có phân phối xấp xỉ chuẩn với trung bình bằng 0 và có độ lệch tiêu chuẩn là (tức là ) Do vậy,khi cho trước độ tin cậy (hay ta còn gọi mức ý nghĩa ), chúng ta hãy thiết lập khoảng tin cậy

trong đó được tính từ bảng phân phối chuẩn tắc ứng với mức ý nghĩa α

Định nghĩa 2.2.7 Với độ tin cậy (hay mức ý nghĩa là ), nếu các giá trị thuộc

khoảng tin cậy này, tức là

thì được xem là xấp xỉ 0

Nếu không thỏa mãn bất đẳng thức này, ta nói khác 0 thực sự

Bảng sau đây cho các giá trị của chuỗi thời gian gồm 36 quan sát được xây dựng bằng cách chọn ngẫu nhiên các số từ 0 đến 100 Ta giả sử sự kiện “chọn ngẫu nhiên” này chưa được biết và bằng tính toán ta phải chỉ ra được điều đó Trong thí dụ này, n = 36, nếu cho = 5% thì

131415161718192021222324

86339074754985986906520

252627282930313233343536

1745972331732930688744Bảng 2.2

=1.96 Do vậy được xem là xấp xỉ 0 nếu

Trang 29

Dựa vào những điều đã nói ở trên, chúng ta có các quy tắc sau đây để xác định xem một chuỗi có ngẫu nhiên hay không

Quy tắc 2.3.1: Nếu các hệ số tự tương quan của một chuỗi đều thỏa mãn bất

đẳng đức (*) thì ta xem rằng dãy số liệu đã cho được phân bổ một cách ngẫu nhiên

Ngược lại, dù chỉ một giá trị không thỏa mãn bất đẳng đức (*) thì trong chuỗi đang xét nhất thiết phải có tồn tại một mối liên kết nào đó

Hình vẽ trên biểu thị trực tiếp 10 giá trị của dãy số liệu cho ở bằng 1 (được thực hiện từ chương trình Eviews, tuy nhiên bạn đọc có thể sử dụng công thức tính

hệ số tương quan để tính trực tiếp) Ở trong hình, cột cuối cùng là các giá trị của còn cột đầu là đồ thị của nó; các đường chấm biểu thị giới hạn của khoảng tin cậy với độ tin cậy 95% (hay là mức ý nghĩa 0.05).Tất cả các giá trị của hệ số tự tương quan đều nằm trong hai vạch giới hạn này nên ta khẳng định các số liệu là ngẫu nhiên

Chú ý: Nếu việc phân tích các hệ số tư tương quan chỉ ra rằng dãy số liệu đang

xét là ngẫu nhiên, thì giữa các giá trị của số liệu không tồn tại một mối liên kết nào

cả Do vậy có mô hình hóa nó để tìm xu thế tiềm ẩn trong nó cũng vô ích và ta dừng việc phân tích chuỗi thời gian

Ví dụ 2.2.8 (Hệ số tương quan của quá trình M A(1))

Xét quá trình MA (1) cho bởi với Khi đó, theo công thức (2.2.6) ta nhận được

Trang 30

Từ đó ta có nhận xét rằng các hệ số tự tương quan mẫu của chuỗi thời gian MA(1) phải thỏa mãn điều kiện: với mọi Như vậy ta có thể áp dụng quy tắc 2.3.1

trên để kiểm tra xem một thể hiện có phải là của một quá trình MA(1) hay không.

Ví dụ 2.2.9.( Hệ số tương quan của quá trình tự hồi quy AR(1))

Xét quá trình AR(1) cho bởi với và Khi đó, theo công thức (2.2.6) ta nhận được

Từ đó ta nhận xét rằng giá trị tuyệt đối của các hệ số tự tương quan mẫu của

chuỗi thời gian AR(1) phải giảm theo hàm lũy thừa Nếu khi ta vẽ cả giá trị của các

HSTTQ này mà không nhìn thấy nó có tính chất đó thì ta kết luận đó không phải là số

liệu từ chuỗi AR(1).

Hệ số tự tương quan riêng là khái niệm ít được sử dụng hơn so với hệ số tự tương quan trong việc phân tích chuỗi thời gian Trên thực tế, hệ số tự tương quan riêng chỉ giúp cho ta việc nhận dạng mô hình tự hồi quy trung bình trượt ARMA để

sự báo (kỹ thuật phân tích mô hình ARMA sẽ được trình bày ở chương sau) Nhưng

do hệ số tự tương quan riêng đóng vai trò quyết định trong việc mô hình hóa ARMA nên ta sẽ đề cập đến nó ở đây

Hệ số tự tương quan riêng không những khó hình dung về phương diện lý thuyết mà sự tính toán nó cũng gặp rắc rối hơn nhiều

Ta có thể quan niệm một cách thô thiển là hệ số tự tương quan riêng của chuỗi số liệu nhằm để đo mức độ kết hợp giữa chuỗi thời gian và chuỗi với thời gian trễ khi ảnh hưởng của các quan sát xen vào ở giữa đã bị loại trừ (thí dụ k = 4 thì ta loại ra khỏi việc tính toán)

Để đưa ra định nghĩa cho HS tự tương quan riêng ta xét bài toán sau Với mỗi

n cố định, ta tìm một tổ hợp tuyến tính của các giá trị

Để “ dự báo” biến ngẫu nhiên Y sao cho sai số bình phương trung bình

Trang 31

.Bây giờ giả sử (Xt) là chuỗi thời gian dừng.

Định nghĩa2.2.8.

Hệ số tư tương quan riêng của chuỗi thời gian dừng , được ký hiệu là , chính là

hệ số quan của hai biên ngẫu nhiên và

Nói cách khác, đo sự phụ thuộc của và sau khi loại bỏ các ảnh hưởng (tuyết tính) của các giá trị trung gian

2 Cách tính hệ số tự tương quan riêng

• Khi k=1: Hệ số tự tương quan riêng đo mức độ phụ thuộc của và sau khi đã loại trừcác giá trị xen giữa Vì giữa chúng không có giá trị nào nên ta có

• Với k bất kỳ, có thể chứng minh rằng là nghiệm của phương trình

(2.2.18)với Nếu là thể hiện của chuỗi thời gian thì hệ số tự tương quan riêng mẫu được tính theo công thức

(2.2.19)trong đó

Ta có thể dựa vào thuật toán Durbin – Lewinson trình bày ở mục 9.3 để tính các hệ số tự tương quan riêng

Ví dụ 2.2.10 Thí dụ giả sử ta đã tính toán được các hệ số tự tương quan mẫu

ứng với các thời gian trễ k = 1,2,……, 12 như sau:

Giá trị này khác với ở bảng trên Như vậy nếu loại trừ một quan sát chen giữa

và (tức loại giá trị ) thì tương quan được tính ra là -0.18

Trang 32

• Với k = 3 ta có

Để tính được, chúng ta còn cần biết thêm

Vậy có

Chú ý: Bạn đọc đừng ngại sự phức tạp của công thức chính tự tương quan riêng

Trong hầu hết các chương trình máy tính, người ta đã tập sẵn các thủ tục để tính các giá trịnày và ta chỉ còn học cách sử dụng nó như thế nào

Ví dụ : 2.2.11 Tính hệ số tự tương quan riêng của quá trình AR(1)

.Theo (2.2.8), nên là nghiệm của phương trình

Dễ thấy phương trình này chỉ có nghiệm còn 0 vói mọi k>1 Từ đó ta đi đến quy tắc thực hành sau : (Xt) là thể hiện của quá trình AR(1) chỉ khi nó chỉ có duy nhất một hệ số tự tương quan riêng (1) khác không thực sự.

Bài tập: Sử dụng hãy số liệu đơn giản 1, 2, 3, 4, 5, 6, 7, 8, 9 và 10 để

a Tính hệ số tự tương quan với thời gian trễ là 1, 2, 3 và 4

b Giải thích tại sao các hệ số tự tương quan nằm trên một đường thẳng

c Tính chuỗi sai phân cấp 1 và tính hệ số tự tương quan của chuỗi đã sai phân với k=1

và k = 2

d Tính giới hạn tín cậy mức 95% của hệ số tự tương quan của chuỗi sai phân

e Tiến hành kiểm tra bằng phương pháp –bình phương của chuỗi sai phân

Trong các bài toán kinh tế, kỹ thuật cũng như cuộc sống hàng ngày.Việc biết trước được các giá trị của tương lai sẽ vô cùng quan trọng Nó sẽ giúp cho chúng ta hoạch định được kế hoạch, tránh những rủi ro không cần thiết cũng như lựa chọn những phương án tối ưu

Trong phần này, chúng ta giới thiệu một số kỹ thuật phân tích và tính toán sự báo cho chuỗi thời gian dừng, chú trọng là quá trình ARMA

Trang 33

Giả sử ta có chuỗi thời gian dừng với giá trị trung bình và hàm tự tương quan

đã được biết Ta muốn dự báo giá trị theo các giá trị của Mục tiêu của chúng ta là tìm một hàm số g () để g () là sự báo cho có sai số bình phương trung bình nhỏ nhất

Ta ký hiệu sự báo tốt nhất này là Người ta đã biết rằng trong trường hợp có phân phối chuẩn thì ta có thể chọn là một tổ hợp tuyến tính theo các biến

Mặt khác, phần lớn các chuỗi thời gian trong thực tế đều có phân phối chuẩn hoặc xấp xỉ chuẩn, chúng ta có thể biến đổi chúng để trờ thành chuỗi thời gian có phân phối gần chuẩn.Vì vậy, lẽ tự nhiên ta giả thiết

Vấn đề bây giờ là tìm các hệ số theo phương pháp bình phương tốt thiểu, các

hệ số này được xác định từ phương trình

Trang 34

với là nghiệm của phương trình

( )

γ ×Nếu chuỗi thời gian không có trung bình zero thì bước đầu tiên ta phải hiệu chỉnh chúng bằng cách thay thế chuỗi ban đầu bằng chuỗi mới với , trong đó

Phương trình (2.3.21) và (2.3.24) cho ta biết cách tính dự báo tốt nhất của

theo Nó liên quan tới việc giải hệ phương trình đại số tuyến tính Nếu n khá lớn thì

việc tính toán sẽ gặp nhiều khó khăn Trong trường hợp này ta có thể sử dụng thuật toán Durbin- Liwinson hoặc thuật toán đổi mới để giải quyết bài toán

Trước hết ta nghiên cứu thuật toán Durbin- Liwinson

Trang 35

1 Thuận toán Durbin - Liwinson

Thuật toán Durbin - Liwinson sử dụng kết quả tính toán để tính Từ (2.3.21)

ta có

(2.3.26)với

thỏamãn

Do vậy

Thuật toán Durbin- Liwinson

Các hệ số có thể được tính đệ quy từ phương trình

(2.3.27)(2.3.28)Và

(2.3.29)Trong đó

Chứng minh Từ định nghĩa suy ra thỏa mãn phương trình

nên định lý được chứng minh khi Giả sử định lý đúng với Ta chia khối ma trận thành dạng

với Ký hiệu và sử dụng (2.3.28) ta nhận được

Ta chỉ còn phải chỉ ra sai số bình phương trung bình

thỏa mãn và (2.3.29) Đẳng thức ) suy từ định nghĩa

Ta đã thấy rằng là ước lượng tuyến tính tốt nhất cho nên nhờ (2.3.22) và (2.3.28) có thể viết

Ngày đăng: 11/07/2016, 22:40

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1] Đào Hữu Hồ, Xác suất thống kê, NXB Đại học Quốc gia Hà Nội, xuất bản lần thứ 6, 2001 Khác
[2] Đào Hữu Hồ, Nghiễn Văn Hữu, Hoàng Hữu Như, Thống kê toán hoc, NXB Đại học và Trung học Chuyên nghiệp Hà Nội,1984 Khác
[3] Bartlett. M.S, Further Aspests of Theory of Multiple Regression, Pro -ceedings of the Cambridge Philosophycal Society, 34, 1938, 33-40 Khác
[4] Cramer H, Mathematical Methods in Statistics, Princeton, 1948 Khác
[5] Johnson R.A, Wichern D.W, Applied Multivariante Statistical Analy-sis, Fourth Edition, Prentice Hall, 1998 Khác
[6] Anderson T.W, An Introduction to Multivariate Statistical Methods (2n. ed.) New York, John Wiley, 1984 Khác
[7] Anderson T.W, An Introduction to Multivariate Statistical Methods (2n. ed.) New York, John Wiley, 1984 Khác

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w