Khi mở một chuỗi dữ liệu, nếu chọn View ta thấy xuất hiện một thực đơn dạng drop-down như hình bên cạnh. Thực đơn nay chia thành bốn block riêng. Block thứ nhất mô tả dữ liệu dưới dạng bảng tính hay đồ thị. Block thứ hai và thứ
ba cung cấp các công cụ thống kê cơ bản về chuỗi, trong đó block thứ ba chủ yếu sử dụng cho các chuỗi thời gian. Block thứ tư cho biết các thuộc tính, và tên nhãn của chuỗi.
Lưu ý rằng các phân phối xác suất của một biến ngẫu nhiên sẽ
được trình bày một cách chi tiết ở bài giảng 3.
Thống kê mô tả
Thống kê mô tả gồm có bốn nội dung: Đồ thị tần suất và thống kê (Histogram and Stats), Bảng thống kê (Stats Table), Thống kê theo nhóm (Stats by Classification …), và Đồ thị hình hộp theo nhóm (Boxplots by Classification …).
• Thống kê JB (Jarque-Bera)
Đây là một thống kê thường được sử dụng để kiểm định xem một biến có phân phối chuẩn hay không. Trong hồi qui tuyến tính cổ điển, thống kê này rất quan trọng cho việc kiểm định phần dư của mô hình hồi theo phương pháp OLS có phân phối chuẩn hay không.
Giả thiết H0: Chuỗi (biến) có phân phối chuẩn Công thức: ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎣ ⎡ − + − = 4 ) 3 K ( S 6 k N JB 2 2 (2.1)
Trong đó, S là độ nghiêng của phân phối, K là độ nhọn của phân phối, N là số quan sát, và k là số hệ số lượng được sử dụng để tạo ra chuỗi dữ liệu (N-k là bậc tự do)46. Khi một chuỗi có phân phối chuẩn thì S = 0 và K = 3, nên JB = 0. Chúng ta sẽ biết ở bài giảng 3 rằng thống kê JB có phân phối Chi bình phương với số bậc tự do là 2 (χ2(2))47. Xác suất được báo cáo kèm theo giá trị thống kê JB là xác suất mà thống kê JB lớn hơn giá trị quan sát dưới giả
thiết không (H0), ở đây là số 0. Giá trị xác suất càng nhỏ
thì khả năng bác bỏ giả thiết H0 càng cao.
• Thống kê theo nhóm
Thống kê theo nhóm cho phép ta tính các thống kê mô tả
của một chuỗi theo các phân nhóm khác nhau trong mẫu phân tích. Nếu ta chọn View/Descriptive Statistics/Stats by Classification …, thì một hộp thoại sau đây sẽ xuất hiện: Các lựa chọn ở Stattistics bên trái cho phép ta chọn các tiêu chí thống kê muốn tính toán. Trong ô Series/Group for classify ta nhập tên chuỗi hay nhóm để xác định các phân nhóm. Nếu ta chọn nhiều chuỗi thì mỗi chuỗi cách nhau một khoảng trắng. Ở mục Output Layout, nếu ta chọn các Margins thì bảng kết quả có trình bày thống kê của tất các các quan sát trong cùng một nhóm cũng như của toàn bộ mẫu phân tích.
Ví dụ, sử dụng file Chapter2.4.wf1 để thống kê mô tả
biến LWAGE (log tự nhiên48 của lương tuần) theo hai biến CONSTRUC (= 1 nếu làm việc trong ngành xây dựng và = 0 nếu làm trong các ngành khác) và MARRIED (= 1 nếu đã có