Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 24 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
24
Dung lượng
825,5 KB
Nội dung
2.2 Kỳ vọng biến lượng Giá trị kỳ vọng µ • Đối với biến rời rạc i =n µ = E { X } = ∑ xi pi i =1 +∞ • Đối với biến liên tục µ = E { X } = ∫ xf ( x ) dx −∞ f(x) hàm mật độ xác xuất Biến lượng σ2 i =n • Đối với biến rời rạc Var { X } = ∑ ( xi − µ ) pi • Đối với biến liên tục σ = Var { X } i =1 Var { X } = ∫ +∞ ( xi − µ ) −∞ f ( x ) dx Một không gian mẫu mô tả đại lượng kỳ vọng µ độ lệch chuẩn σ • • • • Tính chất giá trị kỳ vọng Với biến không ngẫu nhiên E{c}= c Biến không ngẫu nhiên đặt dấu kỳ vọng E{cX} = cE{X} Tính cộng E{X1+X2+….+Xn} = E{X1} + E{X2} + … + E{Xn} Tính nhân E{X1.X2… Xn} = E{X1}.E{X2}… E{Xn} Tính chất biến lượng • Với biến không ngẫu nhiên Var{c} = • Biến không ngẫu nhiên dặt ký hiệu Var Var{cX} = c2Var{X} • Tính cộng Var{X1+X2+…+Xn} = Var{X1} + Var{X2}+ …+ Var{Xn} • Var{X} = E{X2} - µ2 Đối với mẫu khảo sát nằm không gian mẫu • Ước lượng giá trị trung bình hay giá trị trung bình mẩu, x biểu thị độ phép đo x = xi/n • Ước lượng biến lượng hay biến lượng mẫu, s2 biểu thị độ xác phép đo s2 = (xi - x)2/(n-1) Biến lượng mẫu gọi bình phương trung bình sai số (error mean square) • Các hàm Excel: AVERAGE(number1,[number2], ); VAR(number1,[number2], ) 2.3 Hệ số tin cậy mức ý nghĩa • Hệ số tin cậy xác xuất để khoảng tin cậy chứa giá trị thực thông số không gian mẫu Hệ số tin cậy gọi mức tin cậy • Mức ý nghĩa, dùng kiểm định giả thuyết, xác xuất mà ta loại bỏ giả thuyết hay phần trăm rủi ro ta loại bỏ giả thuyết giả thuyết Giá trị liên quan đến sai số loại I • Đối với sai số loại II, người ta thường đánh giá giá trị β Tuy nhiên ý nghĩa β không đơn giản xác xuất nhận kết sai Các loại sai số: Kết luận so sánh kết rút từ không gian mẫu kết rút theo khảo sát có trường hợp H0 H0 sai Loại H0 Sai số loại I OK Giữ H0 OK Sai số loại II H0 Đúng Loại I Loại Sai II • Theo phân tích thống kê tiêu chí đánh giá nhỏ 5% loại bỏ giả thuyết; đồng nghĩa với kết luận biến thuộc phân bố không gian khác 2.4 Kiểm nghiệm giả thiết • Một giả thuyết thống kê phát biểu phân bố không gian mẫu biến ngẫu nhiên • Kiểm nghiệm giả thuyết trình lấy định giả thuyết có tương thích với liệu hay không cách so sánh giả thuyết (thường ký hiệu H0) với liệu hay đại lượng thống kê suy từ liệu (giá trị trung bình, biến lượng hay hệ số hồi qui) • Khi tiến hành kiểm nghiệm giả thuyết giả thuyết kiểm nghiệm, H0 đối sánh với giả thuyết ngược lại H1 • Phương pháp bắt đầu cho giả thuyết • Mục tiêu xác định có đủ chứng cớ để kết luận giả thuyết ngược, H1 lại đúng, giả thuyết ban đầu, H0 có lẽ sai • Có khả định – Có đủ chứng cớ khẳng định giả thuyết ngược H1 đúng: Loại bỏ giả thuyết ban đầu H0 – Không đủ chứng cớ khẳng định giả thuyết ngược H đúng: không bỏ giả thuyết ban đầu H0 • • • • • • Các bước kiểm nghiệm giả thuyết Phát biểu giả thuyết Xác định đại lượng thống kê đánh giá Xác định kích thước mẫu khảo sát Đặt tiêu chí loại bỏ giả thuyết Tính đại lượng thống kê Đưa kết luận giả thuyết ban đầu • Phát biểu giả thuyết ban đầu lẫn giả thuyết ngược • Tiêu chí loại bỏ giả thuyết: thường dùng mức ý nghĩa, dựa xác xuất gây sai số loại I Nhà nghiên cứu xác định giá trị • Có nhiều kiểm nghiệm thống kê sử dụng Việc chọn lựa phương pháp kiểm nghiệm dựa loại liệu có được, giả thuyết kiểm nghiệm, đại lượng thống kê quan tâm (giá trị trung bình, biến lượng, mối quan hệ …), cách thu thập liệu, giả thuyết không gian mẫu, có biết đại lượng thống kê không gian mẫu hay không • Đối với kiểm nghiệm giả thuyết dựa tiêu chí đánh giá Giá trị thống kê mẫu – Thông số không gian giả định Tiêu chí đánh giá = Sai số chuẩn phân bố thống kê Hay Tiêu chí đánh giá = Khác biệt quan sát Khác biệt kỳ vọng ngẩu nhiên • Loại bỏ giả thuyết tiêu chí đánh giá rơi vào vùng phân bố mẫu xác định Những lưu ý phân tích thống kê • Sự khác biệt từ phân tích thống kê không cần thiết mang ý nghĩa khác biệt thực tế • Với mẫu lớn khác biệt nhỏ không quan trọng thực tế đáng kể phân tích thống kê • Với mẫu nhỏ khác biệt đáng kể thực tế không nhận thấy phân tích thống kê • Luôn bắt đầu với nhận xét từ thực tế củng cố phân tích thống kê Những quan điểm sai kiểm nghiệm giả thuyết • Không loại bỏ giả thuyết nghĩa chấp nhận giả thuyết (SAI! Không loại bỏ có nghĩa không đủ chứng cớ để loại bỏ) • Giá trị p xác xuất để nói giả thuyết sai (SAI! Giá trị p xác xuất liệu có liệu cực giả sử giả thuyết đúng) • Giá trị p nhỏ có hiệu ứng cao (SAI! Giá trị p không nói lên độ lớn hiệu ứng) • Các liệu cho biết giả thuyết sai hay (SAI! Các liệu nhằm củng cố hay bác bỏ giả thuyết) • Ý nghĩa thống kê ám chí mức độ quan trọng (HOÀN TOÀN SAI! Ý nghĩa thống kê cho biết mức độ quan trọng quan hệ) 2.5 Loại bỏ liệu sai • Trong trình thu thập liệu, có liệu bất cẩn thu thập chất, nằm xa giá trị kỳ vọng Các giá trị xem giá trị sai(outlier) Do phải kiểm tra để xác định nên loại bỏ liệu hay không • Có nhiều phương pháp đánh giá để loại bỏ liệu sai – Loại bỏ liệu nằm khoảng µ ± 2σ – Loại bỏ liệu nằm khoảng phân vị (quantile) Q2 Q3 – Dùng kiểm nghiệm Dixon – Dùng kiểm nghiệm Grubbs Kiểm nghiệm Dixon • Còn gọi kiểm nghiệm Q • Dựa tỉ số khoảng xác định liệu • Tùy thuộc số liệu dự đoán liệu sai sử dụng tỉ lệ khác • Nhóm tỉ lệ thứ nhất, r10, dùng kiểm nghiệm dự đoán liệu lớn nhỏ liệu sai • Nhóm tỉ lệ thứ hai, r11, dùng kiểm nghiệm dự đoán liệu lớn thứ hai nhỏ thứ hai liệu sai • Nếu tỉ lệ tính lớn giá trị tương ứng bảng liệu bị loại bỏ • Kiểm nghiệm liệu lớn xn − xn −1 r10 = xn − x1 x2 − x1 • Kiểm nghiệm liệu nhỏ r10 = xn − x1 • Kiểm nghiệm liệu lớn bỏ qua liệu nhỏ xn − xn −1 r11 = xn − x2 • Kiểm nghiệm liệu lớn bỏ qua liệu nhỏ x2 − x1 r11 = xn −1 − x1 Giá trị kiểm nghiệm Dixon (α=0.05) Số liệu R10 R11 0.941 0.765 0.955 0.642 0.807 0.560 0.689 0.507 0.610 0.468 0.554 0.437 0.512 10 0.412 0.477 Kiểm nghiệm Grubbs • Kiểm nghiệm Grubbs hiệu loại bỏ liệu phân bố bình thường • Tính giá trị ESD (Extreme Studentized Deviate) xi − x ESD = s • So sánh giá trị tính giá trị bảng Nếu giá trị tính lớn giá trị bảng loại bỏ liệu Lập lại phép kiểm nghiệm với số liệu lai Giá trị dùng cho kiểm nghiệm Grubbs Số liệu N α = 0.05 α = 0.01 10 2.29 2.48 11 2.35 2.56 12 2.41 2.64 13 2.46 2.70 14 2.51 2.76 15 2.55 2.81 16 2.59 2.85 17 2.62 2.89 18 2.65 2.93 19 2.68 2.97 20 2.71 3.00 25 2.82 3.14 30 2.91 3.24 35 2.98 3.32 40 3.04 3.38 ... x = xi/n • Ước lượng biến lượng hay biến lượng mẫu, s2 biểu thị độ xác phép đo s2 = (xi - x)2/(n-1) Biến lượng mẫu gọi bình phương trung bình sai số (error mean square) • Các hàm Excel: AVERAGE(number1,[number2],... Var{cX} = c2Var{X} • Tính cộng Var{X1+X2+…+Xn} = Var{X1} + Var{X2}+ …+ Var{Xn} • Var{X} = E{X2} - µ2 Đối với mẫu khảo sát nằm không gian mẫu • Ước lượng giá trị trung bình hay giá trị trung bình