Tuy STATA dễ học và cũng có những công cụ mạnh về quản lý dữ liệu, nhưng cũng như đã nêu trong phần phân tích, có một số thủ tục thông kê trong STATA cũng bị cắt bỏ.. Mức độ tin tưởng TI
Trang 1DAI HOC QUOC GIA THANH PHO HO CHI MINH
TRƯỜNG ĐẠI HOC KINH TE - LUAT
BAO CAO TIEU LUAN
MON : THONG KE UNG DUNG
Giảng viên: Phạm Văn Chững
Thành viên nhóm: Tiktok Shop
Dương Ngọc Trang | 15224141739
Thành phố Hỗ Chí Minh, Tháng 11 Năm 2023
Trang 2MUC LUC LOT NOL DAU oie ccccccccscssessesssessesssssessessessessessessessusssssrssresisssesiessesivssesssatssrsaesavseavsieavsrsavseeseesees PHAN MO DAU Luo oeseecsscssssssessecsessessessessssssesressssressessesiesssssesssssnsaresisaresissressessesaessssansssessanseseseen A._ KẾT QUÁ THÔNG KỂ 2S S2 1E 1211271211211 21102 1102121212112 10a TONG QUAN KHẢO SÁTT c 2s212221221121211211211211221122112222 121 n1 nen
BiGU GO cccccccccceccecessessessessssesssesssssesssssessessesivsssssvssissssstesussiesiessetivsseseesavsesieecsivessseseanensanens Phân tô dit QU cece ccccecceccessessessessessessessessssvessssrssiessessessvsssscssessssessussiesscssesessseseesassnsveees
1 Cac dai luong thong oe ceeecceececccccceccccccsseesestettttseeesevececersresstttttesteseeeccceeceeeeenaenns
ƯỚC LƯỢNG THAM SÔ 52 1 22 1222112212212 nen re
Ước lượng trung bình tổng thỂ 5c 1 1 E1 2E1212211112112111 21111111 121111 121 erre Ước lượng phương sai tổng thỂ 5 - S 192121121211111111 1211112121121 1k He g
1 Ước lượng khoảng tần suất tổng thỂ - S2 1EE1E112111121121121211 112111 1kg
I[_ KIẾM ĐỊNH S2 S2 2E HH HH H22 t1 221gr
1 KIẾM ĐỊNH I TÔNG THỂ 2 5 222E2212E127151122171211112112121221 21211 rrg IL_ KIẾM ĐỊNH 2 TÔNG THỂ 52 1 2 EE212121121121121121121121111 21.11211121 errere
Trang 3LOI NOI DAU
Trước hết, nhóm em xin gửi lời cảm ơn chân thành đến thầy Phạm Văn Chững, giảng
viên môn Thống kê ứng dụng, đã hướng dẫn và giúp đỡ chúng em trong quá trình hoàn thành bài tiêu luận này Cũng xin cám ơn các bạn trong nhóm đã cùng nhau thảo luận và
chia sẻ kiến thức về đề tài Bài báo cáo này là một nỗ lực nhỏ để áp dụng những kiến thức đã học về thống kê ứng dụng vào việc phân tích một số đữ liệu thực tế Chúng em
hy vọng bài báo cáo nảy sẽ mang lại những thông tin hữu ích cho người đọc và đóng góp một phân nảo đó vào lĩnh vực nghiên cứu của môn học
1|Page
Trang 4PHAN MO DAU
Trong suốt quá trình tìm hiểu và thực hành môn học Thông Kê Ứng Dung, phan mém STATA chính là nhân tô đóng vai trò then chôt trong việc đưa ra những kết quả chính xác về Quản lý
dữ liệu và phân tích thống kê, trong đó phải kê đến:
LO STATA cũng trội hơn về lĩnh vực phân tích dữ liệu theo lược đồ mẫu, cho khá năng áp
dụng chúng trong phân tích số liệu điều tra bởi các công cụ hồi quy, hồi quy logistic, hồi quy poison, hồi quy probi(, Điểm yếu nhất là khả năng phân tích phương sai và phân tích nhiều chiều truyền thống như phân tích phương sai nhiều chiều, phân tích nhóm tô
O Về vẽ đồ thị: STATA cho một sự kết hợp tốt giữa việc dễ sử dụng và sức mạnh phân
tích Tuy STATA dễ học và cũng có những công cụ mạnh về quản lý dữ liệu, nhưng cũng như đã nêu trong phần phân tích, có một số thủ tục thông kê trong STATA cũng bị cắt
bỏ Trong STATA khả năng tải các chương trình phát triển bởi những người sử dụng khác về là dễ dàng và đồng thời có khả năng tạo ra các chương trình riêng của người sử
dụng, dé chúng trở thanh mot b6 phan cia STATA
A KET QUA THONG KE
TONG QUAN KHAO SAT
Chủ đề khảo sát: Điều tra mẫu gồm I01 sinh viên và hành vi mua sắm trên TikTok Shop của những sính viên nảy
Các biến bao gồm:
a Giới tính:
L1 Dữ liệu định tính
L Thang đo định danh
b Mức thu nhâp hằng tháng
Gồm 4 mức: 1000000đ, 3000000đ, 5000000đ, 7000000đ
L' Dữ liệu định lượng
1 Thang đo tỷ lệ
c Sô tiên chi cho việc mua sam online
Trang 5Gồm 4 mức: 250000đ, 750000đ, 1500000đ, 3000000đ
CO Dữ liệu dịnh lượng
LI Thang đo tỷ lệ
d Số tiền chỉ cho việc mua hàng trên nền tảng TikTokShop
Gồm 4 mức: 1000000đ, 3000000đ, 5000000đ, 7000000đ
L! Dữ liệu định lượng
LI Thang đo tỷ lệ
e Mức độ tin tưởng TIkTokShop trước khi mua hàng
Gồm 4 mức: không tin tưởng — tin tưởng có chọn lọc - tin tưởng — hoàn toàn tin tưởng
Lï Dữ liệu định tính
LI Thang đo khoảng
Tuy nhiên, đề tiện cho việc phân tích thống kê, nhóm chúng em đã mã hóa dữ liệu trên phần mém stata bang cach gan giá trị cho biện:
LI không tin tưởng — Ì
LI tin tưởng có chọn lọc - 2
C1 tin tưởng - 3
LI hoàn toàn tin tưởng — 4
£_ Mức độ tin tưởng TIkTokShop trước khi mua hàng:
Mục đích nhóm chúng em muốn điều tra thêm biến này là để phân tích xem độ tin tưởng của khách hàng đổi với TIkTok Shop thông qua hành vĩ mua hàng Nghĩa là trước khi mua
hàng, được sự giới thiệu của người thân, bạn bè nên khách hàng đã có một sự tin tưởng nhật
định Sau khi mua, bản thân khách hàng tự mình trải nghiệm, từ đó mức độ tin tưởng TikTok Shop có thê tăng lên hoặc giảm ổi, hoặc không đôi
Biến này cũng gồm bốn mức: không tin tưởng — tin tưởng có chọn lọc - tin tưởng — hoàn
toàn tin tưởng và được mã hóa như biên mức độ tin tưởng trước khi mua
3|Page
Trang 6
Bang tan số, tần suât
- tab gioitinh
2 Giới
tính Freq Percent Cum
Nữ 69 68.32 100.00
f1 Giải thích: Tần số Nam, nữ lần lượt là 32, 69:
Tần suất Nam, nữ lần lượt là 31,68%; 68,32%
Tần suất tích luỹ Nam, nữ lần lượt là 31,68%; 100%
Biêu đồ
Trang 7frequency
Phân tổ dữ liệu
.„ sum sotienchitramuahangTikTokShop, detail
5 Số tiền chi cho việc mua hàng trên
TikTok Shop mỗi tháng
1%
5%
19%
25%
50%
75%
90%
95%
99%
Percentiles
250000
250000
250000
250000
250000
750000
1590000
1590000
1590000
Smallest
250000
250000
250000
250000
Largest
1590000
1500000
1500000
3000000
Obs Sum of wet
Mean
Std dev
Variance
Skewness
Kurtosis
101
101
549595 484793.5 2.35e+11 2.07532 8.484396
H Giải thích: Trung vị (Med) là 250000; Các phân vị Q1, Q2 và Q3 lần lượt là 250000,
250000 va 750000; Min: 250000; Max: 3000000
5|Page
Trang 8sum sotienchitramuahangTikTokShop
Variable | Obs Mean Std dev Min Max
sotienchit~p | 101 549595 484793.5 250000 3000000
[7 Giải thích: Kích cỡ mẫu: 101; Trung bình mẫu (Mean): 549505: Độ lệch chuẩn mẫu
(s): 484793,5 Giá trị nhỏ nhất (Mi): 250000, giá trị lớn nhất (Max): 3000000
ƯỚC LƯỢNG THAM SỐ
Ước lượng trung bình tổng thể
Ước lượng số tiền trung bình chỉ cho mua hàng trên TikTok Shop với độ tin cậy 95%
Ci means sotienchitramuahangTikTokShop
Variable | Obs Mean Std err [95% conf interval]
sotienchit~p | 191 549595 48238 76 453800.6 645209.3
F7 Giả ¡ thích: Trung bình mẫu Mean = 549505, std.err= == 48238.76
r7 Vậy, khoảng tin cậy đối xứng 95% của số tiền trung bình chỉ cho mua hàng trên TikTok Shop la (453800.6; 645209.3)
Ước lượng phương sai tong thé
Ước lượng phương sai mức độ tin tưởng TIkTok Shop với độ tin cậy 95%
- ci variance mucdotintuongTikTokShop
Variable | Obs Variance [95% conf interval]
mucdotintu~p | 101 -5851485 4516387 7883769
H Giải thích: Phương sai mẫu s?= 0.585 1485
Trang 9DO Vay, voi do tin cay 95 %, ước lượng hai phía cho phương sai độ tin tưởng TIkTokShop là (0.4516387; 0.7883769)
1 Ước lượng khoảng tần suất tông thể
Ước lượng tí lệ nam mua hàng trén TikTok Shop với độ tin cậy 95%
„ Cii proportions 101 32, exact
Binomial exact
Variable | Obs Proportion Std err [95% conf interval]
O Vay, ty 1é nam mua hàng trên TikTok Shop nằm trong khoảng (0.2278132; 0.4169196)
1 KIEM DINH 1 TONG THE
a Kiểm định trung bình một tông thể
Kiểm tra xem số tiền chỉ cho mua sắm online hàng tháng có phải là 500000đ hay không, mức ý nghĩa 5%
7|Page
Trang 10One-sample t test
sotien-e 101 653465 3 39952.06 401513.2 574201.6 732729.1
Pr(T < t) = @.9999 Pr(|T| > |t]) = 0.0002 Pr(T > t) = @.0001
D Giải thích: Mean (Trung binh mau) = 653465.3, std.dev (d6 lệch chuẩn
- Cap gia thuyét: HO : Mean = 500000
H1 : mean < 500000
P-value = 0.9999 > 5% => Chua co co so bac bo HO, y kién cho rang s6 tién trung binh chi mua săm online nhỏ hơn 500000 là sai
- _ Cặp giả thuyết: H0: Mean = 500000
HI: Mean != 500000
P-value =0.0002 < 5% => Bác bỏ H0, chấp nhận HI rằng số tiền trung bình chỉ mua sắm online khác 500000 là đúng
- Cặp giá thuyết :H0 : Mean = 500000
HI : mean > 500000 P-value = 0.0001 < 5% => Bác bỏ H0, chấp nhận HI rằng số tiền trung bình chỉ mua sắm online lớn hơn 500000 là đúng
b Kiểm định phương sai 1 tổng thể
Kiểm tra xem phương sai sô tiền mua hàng trên TikTok Shop có phải bằng 200000đ hay không, mức ý nghĩa 5%
Trang 11
D Giải thích: Mean(Trung bình mẫu)=549505, std.dev (độ lệch chuân mẫu)=s=484793.5;
std.err = = =48238.76
Cap gia thuyét: HO: sd = 200000
H1: sd < 200000
P-value = 1.0000 > 5% => Chưa đủ cơ sở bác bỏ H0, ý kiến cho rằng phương sai số tiên mua hàng trên TIkTokShop nhỏ hơn 200000 là sai
Cặp giả thuyết: H0: sd = 200000
HI: sd !=200000
P-value = 0.0000 < 5% => Bac bé H0, chấp nhận HI rằng phương sai số tiền mua hang trén TikTokShop khac 200000 là đúng
Cap gia thuyét: HO: sd = 200000
H1: sd > 200000
P-value = 0.0000 < 5% => Bác bỏ H0, chấp nhận HI rằng phương sai số tiền mua hàng trên TiklokShop lớn hơn 200000 là đúng
9|Page
Trang 12Kiểm định xem tí lệ nam giới mua hàng trên TikTok Shop có bằng 50% hay không, mức ý nghĩa 5%
+ prtesti 101 32 9.5, count
H9: p = @.5
Pr(Z < z) = 0.0001 Pr(|Z| > |z]) = @.0002 Pr(Z > z) = @.9999
D Giải thích: Tiéu chuan kiém dinh z= = =-3.6816
- Cap gia thuyét HO: p =0.5
H1: p<0.5
P-value = 0.0001 < 5% => Bác bỏ H0, chấp nhận HI rằng tỉ lệ nam mua hàng trên
TikTok Shop nhỏ hơn 50% là đúng
- _ Cặp giả thuyết H0: p=0.5
HI:p!=0.5
P-value = 0.0002 < 5% => Bác bỏ H0, chấp nhận HI rằng tỉ lệ nam mua hàng trên
TikTok Shop khác 50% là đúng
- _ Cặp giả thuyết H0: p=0.5
HI:p>0.5 P-value = 0.9999 > 5% => Chấp nhận H0, ý kiến cho rằng tỉ lệ nam mua hàng trên TIkTok Shop lớn hơn 50% la sai
II KIEM DINH 2 TONG THE
*Truong hop 2 mau déc lap:
Trang 13a Kiém dinh trung binh 2 tong thé
Kiểm tra số tiền chi mua hàng TikTok Shop giữa nam và nữ có khác nhau không, với mức ý nghĩa 5%
ttest sotienchitramuahangTikTokShop, by ( gioitinh)
Two-sample t test with equal variances
Group Obs Mean Std err Std dev [95% conf interval]
Nam 32 671875 109662.6 620345.6 448216.6 895533.4
Nữ 69 492753.6 48135.25 399841.5 396701.2 588806
f1 Giải thích: t= =1.7451
-_ Cặp giả thuyết H0: mean(nam) = mean(nữ)
H1: mean(nam) < mean(nữ) P-value = 0.9580 > 5% => Chưa đủ cơ sở bác bỏ H0, ý kiến cho rằng số tiền trung bình mua hàng trên TikTokShop cua nam nhỏ hơn so với nữ là sai
- _ Cặp giả thuyết H0: mean(nam) = mean(nữ)
H1: mean(nam) != mean(ntr) P-value = 0.0841 > 5% => Chưa đủ cơ sở bác bỏ H0, ý kiến cho rằng số tiền trung bình mua hàng trên TIkTokshop của nam và nữ khác là sa1
- _ Cặp giả thuyết H0: mean(nam) = mean(nữ)
HT: mean(nam) > mean(nữ)
11|Page
Trang 14P-value = 0.0420 < 5% => Bác bỏ H0, chấp nhận HI số tiền trung bình mua hàng trên TIkTokShop của nam lớn hơn so với nữ là đúng
b _ Kiếm định phương sai 2 tong thé
Kiểm tra xem mức độ đồng đều về số tiền chỉ cho mua hàng TikTok Shop giữa nam và nữ, với mức ý nghĩa 5%
sdtest sotienchitramuahangTikTokShop, by(giditinh)
Variance ratio test
Group Obs Mean Std err Std dev [95% conf interval]
H@: ratio = 1 Degrees of freedom = 31, 68
Ha: ratio < 1 Ha: ratio !=1 Ha: ratio > 1
D Giải thích: tiêu chuẩn kiểm định f= =2.4071
- _ Cặp giả thuyết: Ho: Sd(nam)=sd(nữ)
HI: sd(Nam) < sd(nữ) P-value = 0.9987 > 5% => chưa đủ cơ sở bác bỏ H0, ý kiến cho rằng mức độ đồng đều về
sô tiên chỉ cho mua hàng TIkTokShop của Nam nhỏ hơn Nữ là sai
- _ Cặp giả thuyết: Ho: Sd(nam)=sd(nữ)
HI: sd(Nam) != sd(nữ) P-value = 0.0026 < 5% => Bác bỏ H0, chấp nhận HI rằng mức độ đồng đều về số tiền chi cho mua hàng TIkTokShop của Nam khác Nữ là đúng
- _ Cặp giả thuyết: Ho: Sd(nam)=sd(nữ)
Trang 15HI: sd(Nam) > sd(nữ) P-value = 0.0013 < 5% => Bác bỏ H0, chấp nhận HI, rằng mức độ đồng đều về số tiền chi cho mua hàng TIkTokShop của Nam lớn Nữ là đúng
*Trường hợp 2 mẫu liên hệ: Kiểm định trung bình 2 mẫu liên hệ
Kiểm định xem trước và sau khi mua hàng trên TikTok Shop, mức độ tin tưởng của khách hàng
có thay đôi không, mức ý nghĩa 5% (nghĩa là trước khi mua hàng, được sự giới thiệu của người
thân, bạn bè nên đã có một sự tin tưởng nhất định Sau khi mua, bản thân khách hàng tự mình
trải nghiệm, từ đó mức độ tin tưởng TikTok Shop có thê tăng lên hoặc giảm đi, hoặc không đổi)
„ ttest mucdotintuongTikTokShop == mucdotintuongsaukhimua
Paired t test
mucdot~p 191 2.069307 9761154 76495 1.918296 2.220318
mucdot~a 191 2.920792 9779479 7833667 2.766146 3.075438
diff 191 -.8514851 „117217 1.178016 -1.08404 -.6189299
Pr(T < t) = 0.0000 Pr(|T| > |t|) = 9.09 Pr(T > t) = 1.0000
H Giải thích:
- _ Cặp giả thuyết H0: mean(trước khi mua)=mean(sau khi mua)
HI: mean(trước khi mua) < mean(sau khi mua) P-value = 0.0000 < 5%, Bác bỏ H0, chấp nhận HI rằng mức độ tin tưởng của khách hàng tăng lên sau khi mua hàng
- _ Cặp giả thuyết H0: mean(trước khi mua)=mean(sau khi mua)
HT: mean(trước khi mua) != mean(sau khi mua)
13|Page