- Phân tích phương sai I yếu tổ là phân tích về việc có hay không sự phụ thuộc của | yếu tổ I biến định tính này vào L yếu tổ 1 biến định lượng khác.. - Phân tích phương sai 2 yếu tổ là
Trang 1BÀI TẬP TRONG SÁCH THÓNG KÊ ỨNG DUNG (14 điểm) 5.1 (2d)
a) (0,5đ) Trong phân tích phương sai một yếu tố, ở giả định 3 là các mẫu ngẫu
nhiên, độc lập với nhau Nếu giả sử các tông thể cần lẫy mẫu là đồng chất thì hình
thức chọn mẫu ngẫu nhiên nào là phù hợp ?
- Chọn mẫu ngẫu nhiên đơn giản
- Vì phương pháp này thường vận dụng khi các đơn vị của tổng thé chung nam
ở vị trí địa lý gần nhau, các đơn vị đồng đều nhau về đặc điểm Vì vậy, trong trường
hợp này tổng thê cần lấy mẫu là đồng chất, chọn mẫu ngẫu nhiên đơn giản là phù hợp
nhất
b) (0,5đ)Sự khác biệt giữa phân tích phương sai một yếu tố và hai yếu tổ là gì ?
- Phân tích phương sai I yếu tổ là phân tích về việc có hay không sự phụ thuộc của |
yếu tổ (I biến định tính) này vào L yếu tổ (1 biến định lượng) khác
- Phân tích phương sai 2 yếu tổ là phân tích về việc có hay không sự phụ thuộc của 2
yếu tổ (2 biến định tính) này vào L yếu tổ (1 biến định lượng) khác
5.2 (3đ)
Giám đốc một chuỗi nhà hàng muốn kiểm tra xem các nhà hàng trong chuỗi
nhà hàng của mình trên củng một địa bàn có sự khác biệt về doanh số bán hàng trung
bình hàng tuần không Hiển nhiên không thê đo lường được điều này trên tổng thê nên
giám đốc đã khảo sát ngẫu nhiên doanh số bán hàng (triệu đồng/tháng) của các nhà
hàng này trong một số tuân ngầu nhiên và thu được bảng số liệu sau:
Trang 2a) Bạn hãy cho biết ta cân sử dụng phân tích phương sai một hay hai yêu tô?
- Sử dụng phân tích phương sai một yếu tô (vì chỉ có 1 biến định tính (chuỗi
nhà hàng) ảnh hưởng đến 1 biến định lượng (doanh số bán hàng))
b) Hãy xác định biến nguyên nhân và biến kết quả
- Biến nguyên nhân (biến định tính) là chuỗi nhà hàng
- Biến kết quả (biến định lượng) là doanh số bán hàng
c) Hãy xây dựng cặp giả thuyết đề kiếm định xem doanh số trung bình có sự
khác biệt giữa các nhà hàng không Nếu các giả định cần thiết của phân tích
phương sai được théa mãn thì bạn hãy điền các giá trị còn khiếm khuyết vào bảng
sau:
- #1: là doanh số trung bình hàng tuần của nhà hàng l
- M2: là doanh số trung bình hàng tuần của nhà hàng 2
- #3: là doanh số trung bình hàng tuần của nhà hàng 3
Cặp giả thuyết:
H0: tI=u2=u3=u4 (Cả 3 cửa hàng không có sự khác biệt về doanh thu bán hàng)
HI:I tí z tị (Có ít nhất 1 cửa hàng có sự khác biệt về doanh thu bán hàng)
Nhập dữ liệu vào stata
Trang 3File Edit View Data Tools
+» oneway doanhthu Nhahang
Analysis of variance Source ss df MS F Prob > F
Trang 4— Fg>Fri„„ — Bác bỏ giả thuyết Ho Trong nghiên cứu này, sẽ tồn tại ít nhất
1 cửa hàng có sự khác biệt về doanh thu bán hàng
Với mức ý nghĩa 5% thì đoanh số trung bình giữa các nhà hàng này có sự khác
biệt không ? Nếu có bạn hãy cho biết sự khác biệt này xảy ra trên đoanh số trung bình
Trang 5e | X,—X;| = 818,33 >T—> Bác bỏ Ho Với mức ý nghĩa 5% có sự khác biệt về
doanh số giữa nhà hàng 2 và 3
5.3 (3đ)
Đề đánh giá về tuôi thọ pin của 3 hãng có hay không sự khác biệt về thời gian
sử dụng, người ta đã tiến hành điều tra ngẫu nhiên tuôi thọ (đơn vị: giờ) của một số
cục pin của 3 hãng và thu được bảng số liệu sau:
a) Xác định biến nguyên nhân và biến kết quả
- Biến nguyên nhân là hãng pin
- Biến kết quả là tuổi thọ pin
b) Phân tích phương sai một yếu tổ hay hai yếu tô sẽ được sử dụng ?
Phân tích phương sai 1 yếu tố sẽ được sử dụng vì chỉ có I biến nguyên nhân
ảnh hưởng đến I biến kết quả (1 biến định tính và 1 biến định lượng)
c) Hay xay đựng giả thuyết để kiêm chứng về sự khác biệt tuổi thọ pin của 3
hãng, từ đó kiêm định giả thuyết này với mức ý nghĩa 5% dựa trên bảng kết quả sau:
Trang 6- 1: 1a tuổi thọ trung binh cua hang pin 1
- #2: 1a tuổi thọ trung binh cua hang pin 2
- #3: 1a tuổi tho trung binh cua hang pin 3
Cap gia thuyét:
H0: uI=u2=u3 (Cả 3 hãng pin không có sự khác biệt về tudi tho pin)
HI:5I tí = tị (Có ít nhất 1 hãng pin có sự khác biệt về tudi tho pin)
Ta có: k=3;n= I§
Gia tri tra bang Fisher la F(0,05;2;12) = 3,885
0,845988 < 3,885
=> Chấp nhận H0
=> Với mức ý nghĩa 5%, không có sự khác biệt về tuôi thọ pin giữa các hãng pin,
hãng khác nhau nhưng thoi gian su dung là như nhau
5.4 (2đ)
Người ta nhận định rằng mẫu bao bì của một sản phâm ảnh hưởng rất nhiều
đến doanh số bán của sản phẩm đó Đề kiêm chứng điều này người ta đã tiến hành bỏ
cùng 1 loại sản phẩm vào 3 mẫu bao bì khác nhau và quan sát doanh số bán của 3 loại
bao bì nảy tại một số cửa hàng (đơn vị: triệu déng/tuan) thi thu được bảng số liệu sau:
Mẫu bao bì
Trang 7
a) Xác định biến nguyên nhân và biến kết quả
Biến nguyên nhân (biến định tính) là mẫu bao bì
Biến kết quả (biến định lượng) là doanh số bán
b) Với mức ý nghĩa 5%, sử dụng phân tích ANOVA để kiểm định sự khác biệt về
doanh sô của 3 mẫu bao bì này ?
Trang 81: là doanh số bán trung bình hàng tuần của mẫu l
u2: là doanh số bán trung bình hàng tuần của mẫu 2
u3: là doanh số bán trung bình hàng tuần của mẫu 3
Cặp giả thuyết:
Hạ:u,=t;=u:; ( Không có sự khác biệt về đoanh số bán giữa các mẫu bao bì)
H,: 3!u,ZH,o(Có ít nhất một mẫu bao bì có doanh số bán khác với các mẫu còn lại)
Trang 9Câu 5.TI (1đ)
Trưởng phòng kỹ thuật của một nhà máy sản xuất vỏ xe thực hiện một nghiên
cứu đề đánh giá sự khác biệt về chât lượng sản phâm g 1ữa 3 ca sản xuât: sáng, chiêu
và tôi Chọn ngầu nhiên một sô sản phâm đề kiêm tra, kết quả ghi nhận như sau:
Thời gian sản „ „ Độ bên trung bình
SSG _ 35,1772 _
MSG = TT =" = 17,5886
_ 17,5886 06 Ð 29,314 => Chon A
Trang 10Câu 5.T2 (1đ)
Với các giả thuyết như cau V.T1, có thê kết luận rang có sự khác biệt về độ bên giữa các sản phâm sản xuât ra ở ca sáng, chiêu vả tôi với mức ý nghĩa 0.01 hay không? Trong các phát biểu sau, phát biểu nào ĐỨNG
A Độ bên ca chiêu lớn hơn ca sảng và ca tôi
B Giữa các ca là như nhau
€ Độ bên ca sáng và chiêu lớn hơn ca tôi
D Độ bên ca sáng và chiêu lớn hơn ca tôi và chứng cứ không đủ mạnh đê có thê kết luận có sự khác biệt giữa độ bền trung bình của ca sáng và chiều
Gia tri tra bang Turkey
Gia tri tra bang Fisher F(0,01;2;34) = 5,289
Trang 11=> có sự khác biệt về độ bền giữa các sản pham sản xuất ở ca chiều và tối
Bài toán sau sử dụng cho câu 5.T3 & 5.T4
Trưởng phòng kỹ thuật của một nhà máy sản xuất vỏ xe thực hiện một nghiên cứu đề đánh giá sự khác biệt về chât lượng sản phẩm giữa 3 ca sản xuất: sáng, chiêu và tối Chọn ngẫu nhiên một số sản phẩm dé kiểm tra, kết quả trong Excel
Trang 12A Độ bên vỏ xe được sản xuất trong ca sáng và chiêu có sự khác biệt
B Độ bên vỏ xe được sản xuât giữa các ca là như nhau
C Độ bên vỏ xe được sản xuất trong ca sáng và chiều không có sự khác biệt nhưng giữa ca sáng và tôi có sự khác biệt ; ca chiêu và tôi cũng có sự khác biệt
Trang 13D Độ bên vỏ xe được sản xuất trong ca sáng và chiêu không có sự khác biệt ; giữa ca chiêu và tôi cũng không có sự khác biệt nhưng giữa ca sáng và tôi có sự khác biệt Chon cau C
Trang 14BÀI TẬP TRONG SÁCH BASIC BUSINESS STATISTICS: CONCEPTS AND APPLICATIONS (50 diém): Chui > doc lưu ý cho từng bài
Trang 15F= FINV(0.05,4,30) = 2.689627574
— Gia tri téi han dudi trén là 2.6896
c) Cap giả thuyết:
(Lưu ý: có những nhom /am kiém tra giả định phương sai có bằng nhau không-> Nếu chứng minh được phương sai không bằng nhau, không thực hiện kiêm định -> Vẫn được chấp nhận cho trọn điểm bài này Còn nếu làm muốn làm kiểm định sự khác biệt trung bình bắt buộc bước 1 phải có câu giả định “Các điều kiện thỏa mãn” - thống nhất cho những bài sau thiéu cau nay -0,25d)
BI: Giả định các điều kiện thỏa mãn
HO: wl = H2 = h3 = H4 = hệ (Không có sự khác biệt grữa các nhóm)
HI: 3! tỉ z tj (Có ít nhất một nhóm khác biệt với các nhóm còn lại)
Ta thấy rằng Fạ` > F23 (3 > 2.6896) nên ta chấp nhận HI —> Có ít nhất một nhóm khác biệt với các nhóm còn lại
Các cặp giả thuyết cần kiểm định:
HO: pl = p2 HO: 2 = k3 H0: k9 = k4 H0: tủ = ps5 HI: h1 #2 HI: h2 # h3 HH: h3 # H4 HI: H4 #5
Trang 16bình phương
nhom
Tỷ số F Fo
Trang 17SS W= 560 SST = 800
Dữ kiện của đề: c = 4 ; Moi nhom co 8 gia tri;
Trang 18a
BI: Không cần thực hiện bước I - Thỏa các điều kiện
B2: Xây dựng cặp giả thuyết
HO: Í=u2=u3=b4
H1:4! wi 4 yj
H0: Cả 4 nhóm không có sự khác biệt về mức đân số trung bình
HI: Có ít nhất một nhóm có sự khác biệt về mức dân số trung bình
B3/B4: Lay bang tr cau 11.5,
Trang 19biệt trung bình bắt buộc bước 1 phải có câu giả định “Các điều kiện thỏa mãn”)
Trang 20HO: pl = p2 H0: 2 = H3 H0: k3 = tt H0: tủ = ps5 HO: kŠ = k6 HI: h1 #2 HI: H2 # h3 HH: h3 # H4 HI: H4 #5 HI: H5 # 6
HO: pl = 3 HO: p2 = 4 HO: 3 = 5 HO: p4 = t6
H1: pl # p3 Hi:p24p4 Hi: p34 p5 HI: H4 # 6
Trang 21kiêm định sự khác biệt trung bình bắt buộc bước L phải có câu giả định “Các điều
kiện thỏa mãn”)
a)
BI: Kiểm tra các điều kiện: Giả định các điều kiện thỏa mãn
B2: Xây dựng cặp kiểm định:
Trang 22H0: til = H2 = t3 = n4 (Không có sự khác biệt về sức bên trung bình của các túi rác từ
F0=48.108 > F, bác bồ H0 Với mức ý nghĩa 5%, có ít nhất một túi rác từ | hang cd
sự khác biệt về sức bền trung bình so với các túi rác còn lại
b) Ta xây dựng các cặp giả thuyết sau:
Do các mẫu đều có cùng cỡ mẫu nên ta chi can tinh | gid tri kiếm định đại diện
Tính độ lệch tuyệt đối giữa các cặp trung bình trên mẫu:
Trang 23So sánh và kết luận:
[XI-X2| = 0.9 < T Chấp nhận H0 Với mức ý nghĩa 5%, không có sự khác biệt
về sức bền trung bình giữa túi rác hãng I và túi rác hãng 2
[XI-X3|= 0.5 < T Chấp nhận H0 Với mức ý nghĩa 5%, không có sự khác biệt
về sức bên trung bình giữa túi rác hang | va túi rác hãng 3
|XI-X4| = 16.1 >T Bác bỏ H0 Với mức ý nghĩa 5%, có sự khác biệt về sức bên trung bình giữa túi rác hãng I và túi rác hãng 4
|X2-X3| = 1.4 < T Chấp nhận H0 Với mức ý nghĩa 5%, không có sự khác biệt
về sức bên trung bình giữa túi rác hãng 2 và túi rác hãng 3
|X2-X4| = 17 > T Bác bỏ H0 Với mức ý nghĩa 5%, có sự khác biệt về sức bền trung bình giữa túi rác hãng 2 và túi rác hãng 4
|X3-X4| = 15.6 > T Bác bỏ H0 Với mức ý nghĩa 5%, có sự khác biệt về
sức bền trung bình giữa túi rác hãng 3 và túi rác hãng 4
e) Đề kiểm định, ta xử lý số liệu theo giá trị thay đôi sức bền của túi rác như sau:
Số liệu xử ly duoc = |Gia tri strc bén - Gia tri strc bén trung binh|
Trang 24BI: Kiểm tra các điều kiện: Các điều kiện đã thỏa mãn
Trang 25hơn rât nhiêu so với túi của 3 hãng còn lại
11.9, (3đ)
(Lưu ÿ: có những nhóm /ờzn câu e rước đề kiêm tra giả định phương sai có băng nhau không-> Ở bài này, phương sai bằng nhau thì vẫn thực hiện kiếm định bình thường Còn k làm câu kiểm định phương sai câu c thì phải có câu giả định “Các điều kiện thỏa mãn”)
Trang 26BI: Giả định “Các điều kiện thỏa mãn”
(1: Main; 2: Satellite 1; 3: Satellite 2; 4: Satellite 3)
Co p-value < a (0.000859036 < 0.05) hay F > Fo 6.372 > 2.769) — Bác bỏ Hạ > Có
sự khác biệt giưHa thời gian chờ trung bình trong 4 cơ sở
Hoặc
Trang 27- _ Tại mỗi địa điểm chọn ngẫu nhiên 15 trường hợp cấp cứu
Trang 28=> Fụ= 2104,3325/330,2338 =6,3722
- So sánh với giá trị F trong bang Fisher:
F(ø;k—1;n—kƑ F(0,05;3; 56)=2,769430932
=> F,> F(0,05 ;3;56) => Bác bỏ H0, chấp nhận HI hay có ít nhất một trong các địa điểm khác với các địa điểm khác về thời gian chờ đợi trung bình,
So sánh lần lượt với T, ta thấy:
T<|X, - X;| — Với mức ý nghĩa 5%, có sự khác biệt về thời gian chờ trung bình của
cơ sở chính và cơ sở Ï
T>Ä, - X;| — Với mức ý nghĩa 5%, không có sự khác biệt về thời gian chờ trung
binh của cơ sở chính và cơ sở 2
T<X; - Xu|— Với mức ý nghĩa 5%, có sự khác biệt về thời gian chờ trung bình của
cơ sở chính và cơ sở 3
T> |; - X;| — Với mức ý nghĩa 5%, không có sự khác biệt về thời gian chờ trung
binh của cơ sở | và cơ sở 2
T > |X, - X,| — Với mức ý nghĩa 5%, không có sự khác biệt về thời gian chờ trung
binh của cơ 1 va co so 3
T > |X; - X,| Voi mite y nghia 5%, khong c6 su khac biét vé thoi gian cho trung
binh của cơ sở 2 và cơ sở 3
Trang 29- Su dung gia tri:
- Taco giá trị phương sai như sau:
=> Phương sai max là 408,28617; phương sai min là 205,35325 => F= 1,988 Tra bảng có giá trị =F(4,59):0,05=2,53>1,988 => Chap nhan HO Kết luận: Không có đủ bằng chứng để kết luận rằng sự khác biệt về thời gian chờ đợi giữa bốn địa điểm là khác nhau
11.10 (4đ)
(Lưu ÿ: có những nhóm /ờzn câu e rước đề kiêm tra giả định phương sai có băng nhau không-> Ở bài này, phương sai không băng nhau thì không thực hiện tiếp các bước kiêm định sau -> Vẫn được chấp nhận cho trọn điểm bài này Còn nếu làm muốn làm kiêm định sự khác biệt trung bình bắt buộc bước 1 phải có câu giả định
“Các điều kiện thỏa mãn”)
a
BI: Giả định “Các điều kiện thỏa mãn”
Trang 30Với n,=6; N=30và Giá trị trung bình mỗi gia tri i (phan sample Mean trong bang trén)
ta tính được giá trị trung bình trên toàn bộ các mẫu là 14,27