1. Trang chủ
  2. » Luận Văn - Báo Cáo

Chapter 3.Pdf

57 4 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

TỔNG QUAN VỀ THỐNG KÊ TRONG KINH TẾ Chương 3 Thống kê suy diễn TS Thạch Thanh Tiền Đại học Tôn Đức Thắng Thạch Thanh Tiền (Đại học Tôn Đức Thắng) Tổng Quan Về Thống Kê Trong Kinh Tế Chương 3 Thống kê[.]

TỔNG QUAN VỀ THỐNG KÊ TRONG KINH TẾ Chương 3: Thống kê suy diễn TS Thạch Thanh Tiền Đại học Tôn Đức Thắng Thạch Thanh Tiền (Đại học Tôn Đức Thắng) Tổng Quan Về Thống Kê Trong Kinh Tế Chương 3: Thống kê suy diễn / 58 Nội dung Giới thiệu kiểm định giả thuyết Giả thuyết thống kê Xây dựng giả thuyết không đối thuyết Sai lầm loại I loại II Các bước tốn kiểm định Kiểm định trung bình mẫu Kiểm định giả thuyết cho trung bình: Biết σ Kiểm định giả thuyết cho trung bình: Khơng biết σ Kiểm định trung bình hai mẫu Kiểm định trung bình hai mẫu độc lập Kiểm định trung bình hai mẫu phụ thuộc Phân tích phương sai (ANOVA) Giới thiệu ANOVA Phân tích phương sai yếu tố Phân tích hậu định Kiểm định tính phù hợp Kiểm định tính độc lập Thạch Thanh Tiền (Đại học Tôn Đức Thắng) Tổng Quan Về Thống Kê Trong Kinh Tế Chương 3: Thống kê suy diễn / 58 Giới thiệu kiểm định giả thuyết Giả thuyết thống kê (Statistical hypothesis) Giả thuyết thống kê phát biểu tham số tổng thể Kiểm định giả thuyết sử dụng để xác định xem có nên bác bỏ tuyên bố giá trị tham số tổng thể hay không Trong kiểm định giả thuyết bắt đầu cách đưa giả định tham số tổng thể Giả định gọi giả thuyết không (null hypothesis) ký hiệu H0 Sau định nghĩa giả thuyết đối ngược với H0 gọi đối thuyết (alternative hypothesis) ký hiệu Ha Kiểm định giả thuyết sử dụng liệu mẫu để kiểm định hai phát biểu đối lập H0 Ha Thạch Thanh Tiền (Đại học Tôn Đức Thắng) Tổng Quan Về Thống Kê Trong Kinh Tế Chương 3: Thống kê suy diễn / 58 Giới thiệu kiểm định giả thuyết Đối thuyết giả thuyết nghiên cứu Many applications of hypothesis testing involve an attempt to gather evidence in support of a research hypothesis In these situations, it is often best to begin with the alternative hypothesis and make it the conclusion that the researcher hopes to support Mẫu cũ (Future neo): µ = 57.8 km/L Mẫu mới: Future neo FI 125i Giả thuyết nghiên cứu: µ > 70 km/L H0 : µ ≤ 70 km/L Ha : µ > 70 km/L Thạch Thanh Tiền (Đại học Tôn Đức Thắng) Tổng Quan Về Thống Kê Trong Kinh Tế Chương 3: Thống kê suy diễn / 58 Giới thiệu kiểm định giả thuyết Giả thuyết không giả định thách thức We begin with a belief or an assumption that a statement about the value of a population parameter is true The null hypothesis H0 expresses the belief or assumption about the value of the population parameter The alternative hypothesis Ha is that the belief or assumption is incorrect Khía cạnh người tiêu dùng H0 : µ ≥ 500 ML Ha : µ < 500 ML Thạch Thanh Tiền (Đại học Tôn Đức Thắng) Tổng Quan Về Thống Kê Trong Kinh Tế Khía cạnh nhà sản xuất H0 : µ = 500 ML Ha : µ 6= 500 ML Chương 3: Thống kê suy diễn / 58 Xây dựng giả thuyết không đối thuyết Tóm tắt dạng giả thuyết khơng đối thuyết The three possible forms of hypotheses H0 and Ha are shown here Note that the equality always appears in the null hypothesis H0 One-tailed test (kiểm định phía) Lower tailed test Upper tailed test (kiểm định bên trái) (kiểm định bên phải) H0 : µ ≥ µ0 H0 : µ ≤ µ0 Ha : µ < µ0 Ha : µ > µ0 Thạch Thanh Tiền (Đại học Tôn Đức Thắng) Tổng Quan Về Thống Kê Trong Kinh Tế Two-tailed test (kiểm định phía) H0 : µ = µ0 Ha : µ 6= µ0 Chương 3: Thống kê suy diễn / 58 Sai lầm loại I loại II Mức ý nghĩa Mức ý nghĩa xác suất mắc sai lầm loại I Mức ý nghĩa thường ký hiệu α thường chọn 0.05 0.01 Thạch Thanh Tiền (Đại học Tôn Đức Thắng) Tổng Quan Về Thống Kê Trong Kinh Tế Chương 3: Thống kê suy diễn / 58 Các bước toán kiểm định Bước 1: Phát biểu giả thuyết không đối thuyết Bước 2: Chọn mức ý nghĩa (α) Bước 3: Thu thập liệu mẫu tính tốn giá trị thống kê kiểm định Phương pháp giá trị tới hạn Bước 4: Sử dụng mức ý nghĩa để xác định giá trị tới hạn miền bác bỏ Bước 5: Bác bỏ H0 giá trị thống kê kiểm định rơi vào miền bác bỏ Bước 6: Kết luận cho toán Phương pháp p-value Bước 4: Sử dụng giá trị thống kê kiểm định để tính p-value Bước 5: Bác bỏ H0 p-value ≤ α Bước 6: Kết luận cho toán Thạch Thanh Tiền (Đại học Tôn Đức Thắng) Tổng Quan Về Thống Kê Trong Kinh Tế Chương 3: Thống kê suy diễn / 58 Kiểm định giả thuyết cho trung bình: Biết σ Hypotheses Test Statistics Rejection Rule Two-Tailed Test Upper-Tailed Test Lower-Tailed Test (KĐ hai phía) H0 : µ = µ0 Ha : µ 6= µ0 (KĐ bên phải) H0 : µ = µ0 Ha : µ > µ0 (KĐ bên trái) H0 : µ = µ0 Ha : µ < µ0 z= x−µ √0 σ/ n Reject H0 if z ≤ −z α2 or if z ≥ z α2 Thạch Thanh Tiền (Đại học Tôn Đức Thắng) z= x−µ √0 σ/ n Reject H0 if z ≥ zα Tổng Quan Về Thống Kê Trong Kinh Tế z= x−µ √0 σ/ n Reject H0 if z ≤ −zα Chương 3: Thống kê suy diễn / 58 Kiểm định giả thuyết cho trung bình: Biết σ Example (Heights of 1-Year-Olds) The average 1-year-old (both genders) is 0.74 meters tall A random sample of 30 1-year-olds in a large day care franchise resulted in the following heights At α = 0.05, can it be concluded that the average height differs from 0.74 meters? Assume σ = 0.07 0.64 0.76 0.74 0.81 0.72 0.81 0.89 0.76 0.69 Thạch Thanh Tiền (Đại học Tôn Đức Thắng) 0.64 0.81 0.71 0.76 0.71 0.84 0.67 0.80 0.71 0.66 0.74 0.69 Tổng Quan Về Thống Kê Trong Kinh Tế 0.65 0.75 0.81 0.75 0.76 0.74 0.81 0.86 0.75 Chương 3: Thống kê suy diễn 10 / 58 Phân tích phương sai (ANOVA) H0 : µi = µj Ha : µi 6= µj s LSD = 2.179  28.33 1 + 5  = 7.34 Vì |x1 − x2 | = |62 − 66| = < 7.34 nên không bác bỏ H0 : µ1 = µ2 , tức khơng có khác biệt trung bình số sản phẩm tạo phương pháp A B Vì |x1 − x3 | = |62 − 52| = 10 > 7.34, nên bác bỏ H0 : µ1 = µ3 , tức có khác biệt trung bình số sản phẩm tạo phương pháp A C Vì |x2 − x3 | = |66 − 52| = 14 > 7.34, nên bác bỏ H0 : µ2 = µ3 , tức có khác biệt trung bình số sản phẩm tạo phương pháp B C Thạch Thanh Tiền (Đại học Tôn Đức Thắng) Tổng Quan Về Thống Kê Trong Kinh Tế Chương 3: Thống kê suy diễn 43 / 58 Phân tích phương sai (ANOVA) Ví dụ Dữ liệu sau giá bữa ăn (tính la) thu thập từ 24 nhà hàng thuộc loại nhà hàng Italian 12 13 15 17 18 20 17 24 Seafood 16 18 17 26 23 15 19 18 Steakhouse 24 19 23 25 21 22 27 31 Với mức ý nghĩa α = 0.05, kiểm định xem có khác biệt có ý nghĩa hay khơng giá trung bình bữa ăn loại nhà hàng Thạch Thanh Tiền (Đại học Tôn Đức Thắng) Tổng Quan Về Thống Kê Trong Kinh Tế Chương 3: Thống kê suy diễn 44 / 58 Kiểm định tính phù hợp Example (Tai nạn giao thông theo ngày tuần) Cục Quản lý An tồn Giao thơng Đường cao tốc Quốc gia báo cáo tỷ lệ tai nạn giao thông xảy ngày tuần Một mẫu gồm 420 vụ tai nạn cho bảng sau: Sunday 66 Monday 50 Tuesday 53 Wednesday 47 Thursday 55 Friday 69 Saturday 80 Với α = 0, 05 tỷ lệ tai nạn giao thông ngày tuần có giống khơng? Thạch Thanh Tiền (Đại học Tơn Đức Thắng) Tổng Quan Về Thống Kê Trong Kinh Tế Chương 3: Thống kê suy diễn 45 / 58 Kiểm định tính phù hợp Phát biểu giả thuyết: H0 : Tỷ lệ tai nạn giao thông ngày tuần giống Ha : Tỷ lệ tai nạn giao thông ngày tuần không giống Nếu H0 đúng, tức là, p1 = 17 , p2 = 17 , p3 = 17 , p4 = 17 , p5 = 17 , p6 = 17 , p7 = Tần số quan sát (fi ) Tần số kỳ vọng (ei ) Thạch Thanh Tiền (Đại học Tôn Đức Thắng) Sun 66  420 71 = 60 Mon 50 60 Tue 53 60 Tổng Quan Về Thống Kê Trong Kinh Tế Wed 47 60 Thu 55 60 Fri 69 60 Sat 80 60 Chương 3: Thống kê suy diễn 46 / 58 Kiểm định tính phù hợp (Goodness of fit test) Phát biểu giả thuyết: H0 : p1 = 17 , p2 = 17 , p3 = 71 , p4 = 17 , p5 = 17 , p6 = 17 , p7 = 71 Ha : Các tỷ lệ không giống nêu giả thuyết không Chọn mẫu ngẫu nhiên đếm tần số quan sát fi cho nhóm Giả định H0 xác định tần số kỳ vọng ei cho nhóm ei = pi × n (13) Nếu tần số kỳ vọng ei cho nhóm, tính giá trị thống kê kiểm định k X (fi − ei )2 χ2 = (14) ei i=1 Bác bỏ H0 χ2 ≥ χ2α χ2α phân vị mức α phân phối chi-bình phương với k − bậc tự Thạch Thanh Tiền (Đại học Tôn Đức Thắng) Tổng Quan Về Thống Kê Trong Kinh Tế Chương 3: Thống kê suy diễn 47 / 58 Kiểm định tính phù hợp Category Sun Mon Tue Wed Thu Fri Sat fi 66 50 53 47 55 69 80 ei 60 60 60 60 60 60 60 fi − ei -10 -7 -13 -5 20 (fi − ei )2 36 100 49 169 25 81 400 (fi − ei )2 /ei 0.600 1.667 0.817 2.817 0.417 1.350 6.667 χ2 = 14.335 Với α = 0.05 bậc tự 6, giá trị tới hạn cho thống kê kiểm định χ20.05 = 12.592 Vì χ2 = 14.335 > 12.592 nên bác bỏ H0 Vậy tỷ lệ tai nạn giao thông ngày tuần không giống Thạch Thanh Tiền (Đại học Tôn Đức Thắng) Tổng Quan Về Thống Kê Trong Kinh Tế Chương 3: Thống kê suy diễn 48 / 58 Kiểm định tính phù hợp Exercise (Truck colors) In a recent year, the most popular colors for light trucks were white, 31%; black, 19%; silver 11%; red 11%; gray 10%; blue 8%; and other 10% A survey of randomly selected light truck owners in a particular area revealed the following At α = 0.05, the proportions differ from those stated? White 45 Black 32 Thạch Thanh Tiền (Đại học Tôn Đức Thắng) Silver 30 Red 30 Gray 22 Tổng Quan Về Thống Kê Trong Kinh Tế Blue 15 Other Chương 3: Thống kê suy diễn 49 / 58 Kiểm định tính phù hợp Exercise (Statistics Class Times) A professor wishes to see if students show a time preference for statistics classes A sample of four statistics classes shows the enrollment At α = 0.01, the students show a time preference for the classes? Time Students 8:00 AM 24 Thạch Thanh Tiền (Đại học Tôn Đức Thắng) 10:00 AM 35 12:00 PM 31 Tổng Quan Về Thống Kê Trong Kinh Tế 2:00 PM 26 Chương 3: Thống kê suy diễn 50 / 58 Kiểm định tính độc lập A research question is whether preference for the three types of beer is independent of the gender of the beer drinker Thạch Thanh Tiền (Đại học Tôn Đức Thắng) Tổng Quan Về Thống Kê Trong Kinh Tế Chương 3: Thống kê suy diễn 51 / 58 Kiểm định tính độc lập The hypotheses for this test of independence are as follows: H0 : Beer preference is independent of gender Ha : Beer preference is not independent of gender Thạch Thanh Tiền (Đại học Tôn Đức Thắng) Tổng Quan Về Thống Kê Trong Kinh Tế Chương 3: Thống kê suy diễn 52 / 58 Chi-square test for independence of two categorical variables State the null and alternative hypotheses H0 : The two categorical variables are independent Ha : The two categorical variables are not independent Select a random sample from the population and collect data for both variables for every element in the sample Record the observed frequencies fij in a table with r rows and c column Assume the null hypothesis is true and compute the expected frequency eij eij = (Row i total)(Column j total) Sample size (15) If the expected frequency eij is or more for each cell, compute the test statistic X X (fij − eij )2 χ2 = (16) eij i j Rejection rule: Reject H0 if χ2 ≥ χ2α where α is the level of significant for the test and there are (r − 1)(c − 1) degrees of freedom Thạch Thanh Tiền (Đại học Tôn Đức Thắng) Tổng Quan Về Thống Kê Trong Kinh Tế Chương 3: Thống kê suy diễn 53 / 58 Thạch Thanh Tiền (Đại học Tôn Đức Thắng) Tổng Quan Về Thống Kê Trong Kinh Tế Chương 3: Thống kê suy diễn 54 / 58 With α = 0.05 and (3 − 1)(2 − 1) = degree of freedom, the critical value for the test statistic is χ20.05 = 5.991 Since χ2 = 6.45 > 5.991, we reject H0 Thạch Thanh Tiền (Đại học Tôn Đức Thắng) Tổng Quan Về Thống Kê Trong Kinh Tế Chương 3: Thống kê suy diễn 55 / 58 Kiểm định tính độc lập Exercise (Amount of Sleep by Age Group) Conduct a test of independence to determine whether hours of sleep are independent of age Using α = 0.05 level of significance Thạch Thanh Tiền (Đại học Tôn Đức Thắng) Tổng Quan Về Thống Kê Trong Kinh Tế Chương 3: Thống kê suy diễn 56 / 58 Kiểm định tính độc lập Exercise (Types of Pizzas Purchased) A pizza shop owner wishes to determine if the type of pizza a person selects is related to the age of the individual The data obtained from a sample are shown At α = 0.1, is the age of the purchaser related to the type of pizza ordered? Age 10-19 20-29 30-39 40-49 Plain 12 18 24 52 Thạch Thanh Tiền (Đại học Tôn Đức Thắng) Type of Pizza Pepperoni Mushroom 21 39 76 52 50 40 30 12 Tổng Quan Về Thống Kê Trong Kinh Tế Double cheese 71 87 47 28 Chương 3: Thống kê suy diễn 57 / 58

Ngày đăng: 11/11/2023, 01:52

Xem thêm:

TÀI LIỆU CÙNG NGƯỜI DÙNG

  • Đang cập nhật ...

TÀI LIỆU LIÊN QUAN