Bài báo cáo này là một nỗ lực nhỏ để áp dụng những kiếnthức đã học về thống kê ứng dụng vào việc phân tích một số dữ liệu thực tế.. PHẦN MỞ ĐẦUTrong suốt quá trình tìm hiểu và thực hành
Trang 1ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC KINH TẾ - LUẬT
MÔN : THỐNG KÊ ỨNG DỤNG
Giảng viên: Phạm Văn Chững Thành viên nhóm: Tiktok Shop
Trang 2MỤC LỤC
LỜI NÓI ĐẦU 1
PHẦN MỞ ĐẦU 2
A KẾT QUẢ THỐNG KÊ 2
TỔNG QUAN KHẢO SÁT 2
Bảng tần số, tần suất 3
Biểu đồ 4
Phân tổ dữ liệu 4
1 Các đại lượng thống kê 5
ƯỚC LƯỢNG THAM SỐ 5
Ước lượng trung bình tổng thể 5
Ước lượng phương sai tổng thể 5
1 Ước lượng khoảng tần suất tổng thể 6
I KIỂM ĐỊNH 6
1 KIỂM ĐỊNH 1 TỔNG THỂ 6
II KIỂM ĐỊNH 2 TỔNG THỂ 9
Trang 3LỜI NÓI ĐẦU
Trước hết, nhóm em xin gửi lời cảm ơn chân thành đến thầy Phạm Văn Chững, giảng viên môn Thống kê ứng dụng, đã hướng dẫn và giúp đỡ chúng em trong quá trình hoàn thành bài tiểu luận này Cũng xin cảm ơn các bạn trong nhóm đã cùng nhau thảo luận và chia sẻ kiến thức về đề tài Bài báo cáo này là một nỗ lực nhỏ để áp dụng những kiến thức đã học về thống kê ứng dụng vào việc phân tích một số dữ liệu thực tế Chúng em
hy vọng bài báo cáo này sẽ mang lại những thông tin hữu ích cho người đọc và đóng góp một phần nào đó vào lĩnh vực nghiên cứu của môn học.
Trang 4PHẦN MỞ ĐẦU
Trong suốt quá trình tìm hiểu và thực hành môn học Thống Kê Ứng Dụng, phần mềm STATA chính là nhân tố đóng vai trò then chốt trong việc đưa ra những kết quả chính xác về Quản lý
dữ liệu và phân tích thống kê, trong đó phải kể đến:
STATA cũng trội hơn về lĩnh vực phân tích dữ liệu theo lược đồ mẫu, cho khả năng áp dụng chúng trong phân tích số liệu điều tra bởi các công cụ hồi quy, hồi quy logistic, hồi quy poison, hồi quy probit, Điểm yếu nhất là khả năng phân tích phương sai và phân tích nhiều chiều truyền thống như phân tích phương sai nhiều chiều, phân tích nhóm tổ
Về vẽ đồ thị: STATA cho một sự kết hợp tốt giữa việc dễ sử dụng và sức mạnh phân tích Tuy STATA dễ học và cũng có những công cụ mạnh về quản lý dữ liệu, nhưng cũng như đã nêu trong phần phân tích, có một số thủ tục thống kê trong STATA cũng bị cắt
bỏ Trong STATA khả năng tải các chương trình phát triển bởi những người sử dụng khác về là dễ dàng và đồng thời có khả năng tạo ra các chương trình riêng của người sử dụng, để chúng trở thành một bộ phận của STATA
A KẾT QUẢ THỐNG KÊ
TỔNG QUAN KHẢO SÁT
Chủ đề khảo sát: Điều tra mẫu gồm 101 sinh viên và hành vi mua sắm trên TikTok Shop của
những sính viên này.
Các biến bao gồm:
a Giới tính:
Dữ liệu định tính
Thang đo định danh
b Mức thu nhâp hằng tháng
Gồm 4 mức: 1000000đ, 3000000đ, 5000000đ, 7000000đ
Dữ liệu định lượng
Thang đo tỷ lệ
c Số tiền chi cho việc mua sắm online
Trang 5Gồm 4 mức: 250000đ, 750000đ, 1500000đ, 3000000đ.
Dữ liệu dịnh lượng
Thang đo tỷ lệ
d Số tiền chi cho việc mua hàng trên nền tảng TikTokShop
Gồm 4 mức: 1000000đ, 3000000đ, 5000000đ, 7000000đ.
Dữ liệu định lượng
Thang đo tỷ lệ
e Mức độ tin tưởng TikTokShop trước khi mua hàng
Gồm 4 mức: không tin tưởng – tin tưởng có chọn lọc - tin tưởng – hoàn toàn tin tưởng
Dữ liệu định tính
Thang đo khoảng
Tuy nhiên, để tiện cho việc phân tích thống kê, nhóm chúng em đã mã hóa dữ liệu trên phần mềm stata bằng cách gán giá trị cho biến:
không tin tưởng – 1
tin tưởng có chọn lọc - 2
tin tưởng – 3
hoàn toàn tin tưởng – 4
f Mức độ tin tưởng TikTokShop trước khi mua hàng:
Mục đích nhóm chúng em muốn điều tra thêm biến này là để phân tích xem độ tin tưởng của khách hàng đối với TikTok Shop thông qua hành vi mua hàng Nghĩa là trước khi mua hàng, được sự giới thiệu của người thân, bạn bè nên khách hàng đã có một sự tin tưởng nhất định Sau khi mua, bản thân khách hàng tự mình trải nghiệm, từ đó mức độ tin tưởng TikTok Shop có thể tăng lên hoặc giảm đi, hoặc không đổi
Biến này cũng gồm bốn mức: không tin tưởng – tin tưởng có chọn lọc - tin tưởng – hoàn toàn tin tưởng và được mã hóa như biến mức độ tin tưởng trước khi mua
Trang 6Bảng tần số, tần suất
Giải thích: Tần số Nam, nữ lần lượt là 32, 69;
Tần suất Nam, nữ lần lượt là 31,68%; 68,32%.
Tần suất tích luỹ Nam, nữ lần lượt là 31,68%; 100%.
Biểu đồ
Trang 7Phân tổ dữ liệu
Giải thích: Trung vị (Med) là 250000; Các phân vị Q1, Q2 và Q3 lần lượt là 250000,
250000 và 750000; Min: 250000; Max: 3000000.
1 Các đại lượng thống kê
Trang 8 Giải thích: Kích cỡ mẫu: 101; Trung bình mẫu (Mean): 549505; Độ lệch chuẩn mẫu
(s): 484793,5 Giá trị nhỏ nhất (Min): 250000, giá trị lớn nhất (Max): 3000000
ƯỚC LƯỢNG THAM SỐ
Ước lượng trung bình tổng thể
Ước lượng số tiền trung bình chi cho mua hàng trên TikTok Shop với độ tin cậy 95%
Gi i thích: ả Trung bình mẫu Mean = 549505, std.err = == 48238.76
Vậy, khoảng tin cậy đối xứng 95% của số tiền trung bình chi cho mua hàng trên TikTok
Shop là (453800.6; 645209.3)
Ước lượng phương sai tổng thể
Ước lượng phương sai mức độ tin tưởng TikTok Shop với độ tin cậy 95%
Giải thích: Phương sai mẫu s 2 = 0.5851485
Trang 9 Vậy, với độ tin cậy 95 %, ước lượng hai phía cho phương sai độ tin tưởng TikTokShop là
(0.4516387; 0.7883769)
1 Ước lượng khoảng tần suất tổng thể
Ước lượng tỉ lệ nam mua hàng trên TikTok Shop với độ tin cậy 95%
Giải thích: f= = 0.3168317, std.err = =0.0462932
Vậy, tỷ lệ nam mua hàng trên TikTok Shop nằm trong khoảng (0.2278132; 0.4169196)
I KIỂM ĐỊNH
1 KIỂM ĐỊNH 1 TỔNG THỂ
a Kiểm định trung bình một tổng thể
Kiểm tra xem số tiền chi cho mua sắm online hàng tháng có phải là 500000đ hay không, mức ý nghĩa 5%
Trang 10 Giải thích: Mean (Trung bình mẫu) = 653465.3, std.dev (độ lệch chuẩn
mẫu)=s=401513.2; std.err = = =39952.06
- Cặp giả thuyết: H0 : Mean = 500000
H1 : mean < 500000
P–value = 0.9999 > 5% => Chưa có cơ sở bác bỏ H0, ý kiến cho rằng số tiền trung bình
chi mua sắm online nhỏ hơn 500000 là sai.
- Cặp giả thuyết: H0: Mean = 500000
H1: Mean != 500000
P-value =0.0002 < 5% => Bác bỏ H0, chấp nhận H1 rằng số tiền trung bình chi mua sắm
online khác 500000 là đúng
- Cặp giả thuyết :H0 : Mean = 500000
H1 : mean > 500000
P–value = 0.0001 < 5% => Bác bỏ H0, chấp nhận H1 rằng số tiền trung bình chi mua sắm
online lớn hơn 500000 là đúng.
b Kiểm định phương sai 1 tổng thể
Kiểm tra xem phương sai số tiền mua hàng trên TikTok Shop có phải bằng 200000đ hay không, mức ý nghĩa 5%
Trang 11 Giải thích: Mean(Trung bình mẫu)=549505, std.dev (độ lệch chuẩn mẫu)=s=484793.5;
std.err = = =48238.76
- Cặp giả thuyết: H0: sd = 200000
H1: sd < 200000
P-value = 1.0000 > 5% => Chưa đủ cơ sở bác bỏ H0, ý kiến cho rằng phương sai số
tiền mua hàng trên TikTokShop nhỏ hơn 200000 là sai
- Cặp giả thuyết: H0: sd = 200000
H1: sd != 200000
P-value = 0.0000 < 5% => Bác bỏ H0, chấp nhận H1 rằng phương sai số tiền mua
hàng trên TikTokShop khác 200000 là đúng
- Cặp giả thuyết: H0: sd = 200000
H1: sd > 200000
P-value = 0.0000 < 5% => Bác bỏ H0, chấp nhận H1 rằng phương sai số tiền mua
hàng trên TikTokShop lớn hơn 200000 là đúng
c Kiểm định tần suất tổng thể
Trang 12Kiểm định xem tỉ lệ nam giới mua hàng trên TikTok Shop có bằng 50% hay không, mức ý nghĩa 5%
Giải thích: Tiêu chuẩn kiểm định z = = = -3.6816
- Cặp giả thuyết H0: p = 0.5
H1: p < 0.5
P-value = 0.0001 < 5% => Bác bỏ H0, chấp nhận H1 rằng tỉ lệ nam mua hàng trên
TikTok Shop nhỏ hơn 50% là đúng.
- Cặp giả thuyết H0: p = 0.5
H1: p != 0.5
P-value = 0.0002 < 5% => Bác bỏ H0, chấp nhận H1 rằng tỉ lệ nam mua hàng trên
TikTok Shop khác 50% là đúng.
- Cặp giả thuyết H0: p = 0.5
H1: p > 0.5
P-value = 0.9999 > 5% => Chấp nhận H0, ý kiến cho rằng tỉ lệ nam mua hàng trên
TikTok Shop lón hơn 50% là sai.
II KIỂM ĐỊNH 2 TỔNG THỂ
*Trường hợp 2 mẫu độc lập:
Trang 13a Kiểm định trung bình 2 tổng thể
Kiểm tra số tiền chi mua hàng TikTok Shop giữa nam và nữ có khác nhau không, với mức ý nghĩa 5%
Giải thích: t = =1.7451
- Cặp giả thuyết H0: mean(nam) = mean(nữ)
H1: mean(nam) < mean(nữ)
P-value = 0.9580 > 5% => Chưa đủ cơ sở bác bỏ H0, ý kiến cho rằng số tiền trung
bình mua hàng trên TikTokShop của nam nhỏ hơn so với nữ là sai.
- Cặp giả thuyết H0: mean(nam) = mean(nữ)
H1: mean(nam) != mean(nữ)
P-value = 0.0841 > 5% => Chưa đủ cơ sở bác bỏ H0, ý kiến cho rằng số tiền trung
bình mua hàng trên TikTokshop của nam và nữ khác là sai.
- Cặp giả thuyết H0: mean(nam) = mean(nữ)
H1: mean(nam) > mean(nữ)
Trang 14P-value = 0.0420 < 5% => Bác bỏ H0, chấp nhận H1 số tiền trung bình mua hàng trên
TikTokShop của nam lớn hơn so với nữ là đúng.
b Kiểm định phương sai 2 tổng thể
Kiểm tra xem mức độ đồng đều về số tiền chi cho mua hàng TikTok Shop giữa nam và nữ, với mức ý nghĩa 5%
Giải thích: tiêu chuẩn kiểm định f= =2.4071
- Cặp giả thuyết: Ho: Sd(nam)=sd(nữ)
H1: sd(Nam) < sd(nữ)
P-value = 0.9987 > 5% => chưa đủ cơ sở bác bỏ H0, ý kiến cho rằng mức độ đồng đều về
số tiền chi cho mua hàng TikTokShop của Nam nhỏ hơn Nữ là sai.
- Cặp giả thuyết: Ho: Sd(nam)=sd(nữ)
H1: sd(Nam) != sd(nữ)
P-value = 0.0026 < 5% => Bác bỏ H0, chấp nhận H1 rằng mức độ đồng đều về số tiền chi
cho mua hàng TikTokShop của Nam khác Nữ là đúng.
- Cặp giả thuyết: Ho: Sd(nam)=sd(nữ)
Trang 15H1: sd(Nam) > sd(nữ)
P-value = 0.0013 < 5% => Bác bỏ H0, chấp nhận H1, rằng mức độ đồng đều về số tiền chi
cho mua hàng TikTokShop của Nam lớn Nữ là đúng.
*Trường hợp 2 mẫu liên hệ: Kiểm định trung bình 2 mẫu liên hệ.
Kiểm định xem trước và sau khi mua hàng trên TikTok Shop, mức độ tin tưởng của khách hàng
có thay đổi không, mức ý nghĩa 5% (nghĩa là trước khi mua hàng, được sự giới thiệu của người thân, bạn bè nên đã có một sự tin tưởng nhất định Sau khi mua, bản thân khách hàng tự mình trải nghiệm, từ đó mức độ tin tưởng TikTok Shop có thể tăng lên hoặc giảm đi, hoặc không đổi)
Giải thích:
- Cặp giả thuyết H0: mean(trước khi mua)=mean(sau khi mua)
H1: mean(trước khi mua) < mean(sau khi mua)
P-value = 0.0000 < 5%, Bác bỏ H0, chấp nhận H1 rằng mức độ tin tưởng của khách
hàng tăng lên sau khi mua hàng.
- Cặp giả thuyết H0: mean(trước khi mua)=mean(sau khi mua)
H1: mean(trước khi mua) != mean(sau khi mua)
Trang 16P-value = 0.0000 < 5%, Bác bỏ H0, chấp nhận H1 rằng mức độ tin tưởng của khách
hàng trước và sau khi mua là khác nhau.
- Cặp giả thuyết H0: mean(trước khi mua)=mean(sau khi mua)
H1: mean(trước khi mua) > mean(sau khi mua)
P-value = 1.0000 > 5%, chưa đủ cơ sở bác bỏ H0, ý kiến cho rằng mức độ tin tưởng của
khách hàng giảm đi sau khi mua là sai.