Kiểm tra dữ liệu Đối với mối tương quan giữa giới tính và tần suất sử dụng: kiểm tra dữ liệu để kết luận biến số giới tính nam, nữ có ảnh hưởng đến biến số tần suất sử dụng thức ăn nhanh
Link Google drive 27
hftps:/⁄⁄p.zaloapp.com/cf?url=hftps%3.A%2F%2F forms.gle
Kết luận: vậy số người khảo sát tối thiêu là 217 người
CHƯƠNG II: XỬ LÝ SÓ LIỆU
Để xác định mối tương quan giữa các biến số và tần suất sử dụng thức ăn nhanh, cần kiểm tra dữ liệu liên quan đến giới tính, thời gian học tập, phân loại sinh viên, sở thích nấu ăn và nơi ở Cụ thể, cần phân tích xem giới tính (nam, nữ) có ảnh hưởng đến tần suất sử dụng thức ăn nhanh hay không Tiếp theo, cần xem xét liệu thời gian học tập có tác động đến thói quen sử dụng thức ăn nhanh hay không Bên cạnh đó, việc phân loại sinh viên cũng cần được kiểm tra để đánh giá ảnh hưởng đến tần suất sử dụng Hơn nữa, sở thích nấu ăn có thể có vai trò quan trọng trong việc quyết định tần suất sử dụng thức ăn nhanh Cuối cùng, cần phân tích liệu nơi ở có ảnh hưởng đến tần suất sử dụng thức ăn nhanh hay không.
XU LY SO LIEU 8 1 Kid tra dit QU ccscsscssssesscsssssesssssssesssssssscssssscsscssesssssessssscssssssscsssscsasecsasecessssens 8 2 Mã hóa và rÚt frÍCh c0 0< S0 10 999050505 939.950.958 058 5.585 5005 9900.55.0805 50508845 98900 8
Mã hóa 8
Để sử dụng các biến số trong phần mềm R, chúng ta không thể giữ nguyên tên biến mà cần phải mã hóa chúng cho phù hợp Việc này giúp phần mềm có thể xử lý các biến một cách hiệu quả.
Có 2 loại giới tính mà nhóm khảo sát là “Nam” và “Nữ”, đối với biến giới tính
“Nam” sẽ được mã hóa thành “GT01”, còn đôi với biên giới tính “Nữ” sẽ được mã hóa thành “GT02”
Có 4 nhóm sinh viên mà nhóm khảo sát là “Sinh viên năm 1”, “Sinh viên năm 2”,
Sinh viên năm 2 được mã hóa thành "SV2", sinh viên năm 3 thành "ŠV3", sinh viên năm 4 thành "SV4", và sinh viên năm L thành "SVI".
Có 5 mức độ ưa thích mà nhóm khảo sát là “Rất không thích”, “Không thích”,
Các mức độ sở thích được mã hóa như sau: "Rất không thích" là "01", "Không thích" là "02", "Bình thường" là "03", "Thích" là "04" và "Rất thích" là "05".
Có 3 loại nơi ở là “Ký túc xá”, “Nhà trọ” và “Sống chung với người thân” Đối với biến “Nhà trọ” sẽ được mã hóa thành “NI”, “Ký túc xá” sẽ được mã hóa thành
“N2”, * Sông với người thân” sẽ được mã hóa thành “N3”
Ta quy đổi đữ liệu từ thang tỉ lệ về thang khoảng đoạn như sau:
TG2: từ 6 giờ đến 10 giờ
TG3: từ II giờ đến 15 giờ
TG4: từ l6 giờ đến 20 giờ
Có 4 nhóm thu nhập mà nhóm đã khảo sát là “Dưới 3 triệu”, ”Từ 3 — 7 triệu”, "Từ
Biến thu nhập được mã hóa như sau: “Dưới 3 triệu” thành “TN1”, “Từ 3 — 7 triệu” thành “TN2”, “Từ 7 — 10 triệu” thành “TN3”, và “Trên 10 triệu” thành “TN4” Đối với biến “Tần suất sử dụng” mà nhóm khảo sát, sẽ được mã hóa theo cách tương tự.
2.2 Rút trích Đôi với môi tương quan giữa giới tính và tân suất sử dụng: ta tiên hành rút Ậ &€ z trích so sánh dữ liệu của 2 biến số “giới tính” và “tần suất sử dụng”
Bước 1: Mở bảng đữ liệu mà ta khảo sát được trong Excell
Bước 2: Chọn Sort and Filter a chon Filter
Bước 3: chọn ~' trong tiêu đề của cột, chọn GT0I
Bước 4: Copy đữ liệu của biến số tần suất sử dụng ứng với biến số GT01.
Bước 5: Tạo sheet “Giới tính và tần suất”, sau đó dán dữ liệu đã sao chép Đối với mối tương quan giữa giới tính của sinh viên và tần suất sử dụng, ta tiến hành rút trích và so sánh dữ liệu của hai biến số “phân loại sinh viên” và “tần suất sử dụng”.
Để tiến hành so sánh mối quan hệ giữa sở thích nấu ăn và tần suất sử dụng, chúng ta cần rút trích dữ liệu từ hai biến số: "sở thích nấu ăn" và "tần suất sử dụng" Việc này giúp xác định cách thức mà sở thích nấu ăn ảnh hưởng đến tần suất sử dụng thực phẩm.
Để tiến hành rút trích dữ liệu, chúng ta so sánh hai biến số "nơi ở" và "tần suất sử dụng" Phương pháp này tương tự như cách rút trích biến số "giới tính" và "tần suất sử dụng", nhằm xác định mối tương quan giữa nơi ở và tần suất sử dụng.
Để thực hiện việc rút trích dữ liệu, chúng ta sẽ áp dụng phương pháp tương tự như với các biến số "giới tính" và "tần suất sử dụng" Đối với mối tương quan giữa thu nhập và tần suất sử dụng, chúng ta cần so sánh dữ liệu từ hai biến số này, từ đó rút ra những kết luận có ý nghĩa về sự liên kết giữa chúng.
Cách tiên hành: tương tự với cách rút trích biên sô “giới tính” và “tân suat str dụng”
Số liệu Mã hóa RÚT TRÍCH
Giới tính của Tân số được phân loại như sau: Nam là GT0I GTO1 (TSI, TS2 ) và Nữ là GT02 GT02 (TSI1, TS2 ) Đối với sinh viên, năm I được ký hiệu là SVI (TSI, TS2 ), trong khi sinh viên năm II được ký hiệu là SV2.
SV2 (TSI, TS2 ) SV3 (TSI, TS2 ) SV4 (TSI, TS2 )
Rat khong thích: 01 Không thích: 02
Rat thich: 05 05 (TSI, TS2 ) Nơi ở Tân số bao nhiêu | Nhà trọ: NI NI (TS1, TS2 ) bạn ở nhà trọ, ktx, | Ký túc xá: N2 N2 (TSI, TS2, )
Sống chung với người | N3 (TSI, TS2 ) thân: N3
Thời gian | Sô giờ học tập, làm | 0-5 giờ: TGI TGI (TS1, TS2, ) sinh hoạt việc 6-10 gio: TG2 TG2 (TSI, TS2, )
11-15 giờ: TG3 TG3 (TSI, TS2, ) 16-20 gio: TG4 TG4 (TS1, TS2 ) Thu nhập Thu nhập hàng | Dưới 3 triệu: TNI TNI (TSI, TS2 ) thang Từ 3-7 triệu: TN2 TN2 (TS1, TS2 )
Trên 10 triệu: TN4 TN3 (TS1, TS2, )
Biên sô Số liệu Mã hóa Xử lý số liệu
Giới tính Tan so bao nhiêu nam, nữ?
+ Thông kê mô tả: giá trị trung bình, trung vị, mode, max, min, range, variance, SD a nhan xét về giới tính GT0I và GT02
Vẽ đồ thị boxplot à giải thích
+ Thông kê diễn giải: ® Kiểm tra đữ liệu có phân phối
; chuẩn hay không Nêu có: áp dụng T-test để kiểm định sự khác biệt hay không
Nếu Không: áp dụng Wilcoxon
Tân số bao nhiêu sinh viên năm
Sinh vién nam 1: SV1 Sinh vién nam 2: SV2 Sinh vién nam 3: SV3 Sinh vién nam 4: SV4
+ Thông kê mô tả: giá trị trung bình, trung vị, mode, mã, mm, range, varlance, sd à nhận xét về sinh viên SVI, SV2,
SV3, SV4, SV3,SV4 + Thông kê diễn giải: ® Kiểm tra đữ liệu có phân phối chuẩn hay không + Nếu có: áp dụng
Anova để kiểm định sự khác biệt hay không + Nếu Không: áp dụng Krusal Wallis Rank Sum Test
Sở thích nâu an Tần sô bao nhiêu
Bạn thích nâu ăn Rat không thích: 01
Không thích: 02 Bình thường: 03 Thích: 04 + Thông kê mô tả: giá trị trung bình, trung vị, mode, mã, mm, range, varlance, sd à nhận xét
Để kiểm tra xem dữ liệu có phân phối chuẩn hay không, chúng ta thực hiện thống kê diễn giải Nếu dữ liệu có phân phối chuẩn, phương pháp Anova sẽ được áp dụng để kiểm định sự khác biệt Ngược lại, nếu dữ liệu không có phân phối chuẩn, chúng ta sẽ sử dụng bài kiểm tra Kruskal-Wallis Rank Sum.
Nơi ở Tan so bao nhiêu bạn ở nhà trọ, ktx,
Ký túc xá: N2 Sống chung với người thân: N3
Trong bài viết này, chúng tôi sẽ thực hiện thống kê mô tả bao gồm các giá trị trung bình, trung vị, mode, mã, mm, khoảng cách, phương sai và độ lệch chuẩn để nhận xét về các nhóm NI, N2 và N3 Tiếp theo, chúng tôi sẽ tiến hành thống kê diễn giải bằng cách kiểm tra xem dữ liệu có phân phối chuẩn hay không Nếu dữ liệu có phân phối chuẩn, chúng tôi sẽ áp dụng phương pháp ANOVA để kiểm định sự khác biệt giữa các nhóm Ngược lại, nếu dữ liệu không phân phối chuẩn, chúng tôi sẽ sử dụng kiểm định Kruskal-Wallis Rank Sum Test.
Thu nhập Thu tháng nhập hàng Dưới 3 triệu: TNI
Từ 7 -10 triệu: TN3 Trên l0 triệu: TN4
Trong thống kê mô tả, chúng ta xem xét các chỉ số như giá trị trung bình, trung vị, mode, mã, mm, khoảng cách, phương sai và độ lệch chuẩn để đưa ra nhận xét về các biến TNI, TN2, TN3 và TN4 Tiếp theo, trong thống kê diễn giải, cần kiểm tra xem dữ liệu có phân phối chuẩn hay không Nếu dữ liệu đạt yêu cầu phân phối chuẩn, chúng ta sẽ áp dụng phương pháp ANOVA để kiểm định sự khác biệt giữa các nhóm.
Nếu Không: áp dụng Krusal Wallis Rank Sum Test
Thời gian học và số giờ học tập được phân tích qua các chỉ số thống kê như giá trị trung bình, trung vị, mode, mã, mm, khoảng, phương sai và độ lệch chuẩn Các nhận xét về các nhóm TNI, TN2, TN3 và TN4 được đưa ra dựa trên những số liệu này Để kiểm tra dữ liệu có phân phối chuẩn hay không, nếu có, áp dụng phương pháp ANOVA để kiểm định sự khác biệt giữa các nhóm Nếu dữ liệu không phân phối chuẩn, sử dụng bài kiểm tra Kruskal-Wallis Rank Sum Test để phân tích.
CHUONG III: KET QUA VA BAN LUAN
3.1 Đôi với môi tương quan giữa giới tính và tần suat sử dụng:
Shapiro-Wilk normality test data: GT01
Vì p-value nhỏ hơn 0.05 nên số liệu không phân phối chuẩn
Vì p-value nhỏ hơn 0.05 nên số liệu không phân phối chuẩn
Thống kê mô tả giữa GT01 VÀ GT02 mean sd se(mean) var IQR OF 25% 50% 75% 100% Tan.suatin
Đối với mối tương quan giữa phân loại sinh viên và tần suất sử dụng
Shapiro-Wilk normality test data: 5V1
Vì p-value nhỏ hơn 0.05 nên số liệu không phân phối chuẩn
Shapiro-Wilk normality test data: 5v2
Vì p-value nhỏ hơn 0.05 nên số liệu không phân phối chuẩn
Shapiro-Wilk normality test data: 5V3
Vì p-value nhỏ hơn 0.05 nên số liệu không phân phối chuẩn
Shapiro-Wilk normality test data: 5V4
Vì p-value nhỏ hơn 0.05 nên số liệu không phân phối chuẩn
Thống kê mô tả giữa SV1, SV2, SV3, SV4 mean sd IQR O% 25% 50% 75% 100% tần.suất:n
SD = 2.38; var = 5.66 Đồ thị Boxplot
Đồ thị Boxplot của SVI cho thấy dữ liệu dao động từ 1 đến 7, không có giá trị ngoại lai Tập dữ liệu này phản ánh giá trị tuyến tính trong khoảng từ 1 đến 7.
7 Max của tập dữ liệu là 8, Mm của tập đữ liệu là l và Range của là 6 Gia tri trung vị năm lệch về Q¡ do đó đữ liệu có xu hướng giảm Đồ thị Boxplot của SV2 cho thấy đữ liệu dao động trong khoảng từ I đến 7, không có giá trị ngoại lai Vay tap đữ liệu sẽ đúng giá trị tuyến tính trong khoảng từ I đến
7 Max của tập dữ liệu là 8, Mm của tập đữ liệu là l và Range của là 6 Gia tri trung vị năm lệch về Q¡ do đó đữ liệu có xu hướng giảm Đồ thị Boxplot của SV3 cho thấy đữ liệu dao động trong khoảng từ I đến 8, không có giá trị ngoại lai Vay tap đữ liệu sẽ đúng giá trị tuyến tính trong khoảng từ I đến
8 Max của tập dữ liệu là 8, Min cua tập đữ liệu là l và Range của là 7 Gia tri trung vị nằm lệch về Q¡ do đó dữ liệu có xu hướng giảm Đồ thị Boxplot của SV4 cho thấy đữ liệu dao động trong khoảng từ I đến 8, không có giá trị ngoại lai Vay tap đữ liệu sẽ đúng giá trị tuyến tính trong khoảng từ I đến
8 Max của tập dữ liệu là 8, Min cua tập đữ liệu là l và Range của là 6 Gia trị trung vị nằm lệch về Q¡ do đó dữ liệu có xu hướng giảm
- _ Kiêm tra dữ liệu định lượng, phân phôi chuân:
Kiểm tra sự khác biệt giữa 2 biến: phân loại sinh viên và tần suất sử dụng
Vì 4 dữ liệu của 2 biến số không phân phối chuẩn, ta tiền hành kiểm định phi tham số (sử dụng kiểm định Kruskal)
Kruskal-Wallis rank sum test data: tan.suat by N&m.sinh.vién
Kruskal-Wallis chi-squared = 1.2817, df = 3, p-value = 0.7335
- _ Nhận xét: vì p-value lớn hơn 0.05 nên không có sự khác biệt giữa các nhóm.
Đối với mối tương quan giữa sở thích nấu ăn và tần suất sử dụng
Vì p-value nhỏ hơn 0.05 nên số liệu không phân phối chuẩn
Shapiro-Wilk normality test aata: X02
Vi p-value lớn hơn 0.05 nên số liệu phân phối chuẩn
Shapiro-Wilk normality test data: X03
Vì p-value nhỏ hơn 0.05 nên số liệu không phân phối chuẩn
Vì p-value nhỏ hơn 0.05 nên số liệu không phân phối chuẩn
Shapiro-Wilk normality test data: X05
Vì p-value nhỏ hơn 0.05 nên số liệu không phân phối chuẩn
Thống kê mô tả giữa 01, 02, 03, 04, 05 mean sd se(mean) var IQR O& 25% 50% 75$ 100$ tân.suât:n
SD =2.33; var = 5.43 Đồ thị Boxplot
Đồ thị Boxplot của tập dữ liệu 01 cho thấy phần lớn dữ liệu tập trung quanh giá trị 2, với hai điểm ngoại lai là 1 và 7 Ngược lại, đồ thị Boxplot của tập dữ liệu 02 chỉ ra rằng dữ liệu dao động trong khoảng từ 1 đến 8 mà không có giá trị ngoại lai nào Do đó, tập dữ liệu này phản ánh giá trị tuyến tính trong khoảng từ 1 đến 8.
8 Max của tập đữ liệu là §, Mm của tập đữ liệu là I và Range là 7 Giá trị trung vị năm lệch về Q¡ do đó tập dữ liệu có xu hướng giảm Đồ thị Boxplot của 03 cho thấy dữ liệu dao động trong khoảng từ I đến 8, không có giá trị ngoại lai Vậy tập đữ liệu sẽ đúng giá trị tuyến tính trong khoảng từ 1 đến
8 Max của tập dữ liệu là 8, Mm của tap dir ligu la | va Range cua la 8 Gia trị trung vị nằm lệch về Q¡ đo đó tập đữ liệu có xu hướng giảm Đồ thị Boxplot của 04 cho thấy dữ liệu đao động trong khoảng từ 1 đến 7, không có giá trị ngoại lai Vậy tập đữ liệu sẽ đúng giá trị tuyến tính trong khoảng từ 1 đến
7 Max của tập dữ liệu là 7, Mm của tap dir ligu la | va Range cua la 6 Gia tri trung vị nằm lệch về Q¡ đo đó tập đữ liệu có xu hướng giảm Đồ thị Boxplot của 05 cho thấy dữ liệu dao động trong khoảng từ I đến 8, không có giá trị ngoại lai Vậy tập đữ liệu sẽ đúng giá trị tuyến tính trong khoảng từ 1 đến
8 Max của tập dữ liệu là 8, Min cua tập đữ liệu là l và Range của là 7 Gia tri trung vị nằm lệch về Q¡ đo đó tập đữ liệu có xu hướng giảm
Kruskal-Wallis rank sum test
: =3 ( x data: taén.suat by So.thich.nau.an
Kruskal-Wallis chi-squared = 8591, df = 4, p-value = 0.09688
Nhận xét: vì p-value > 0.05 nên không có sự khác biệt giữa 3 nhóm.
Đối với mỗi tương quan giữa nơi ở và tần suất sử dụng ôô ô<< 22
Shapiro-Wilk normality test data: N1
Vì p-value nhỏ hơn 0.05 nên số liệu không phân phối chuẩn
Shapiro-Wilk normality test data: N2
Vi p-value lớn hơn 0.05 nên số liệu phân phối chuẩn
Vì p-value nhỏ hơn 0.05 nên số liệu không phân phối chuẩn
Thống kê mô tả giữa N1, N2, N3: mean sd se (mean) var IQR 0$ 25$ 50% 75% 100% Tan.suat:n N1 3.736434 2.213310 0.1948711 0 4.00 1 2 3.0 6.00 8 129
SD =1.76; var = 3.12 Đồ thị Boxplot
Đồ thị Boxplot của NI cho thấy dữ liệu dao động trong khoảng từ 1 đến 8 và không có giá trị ngoại lai Do đó, tập dữ liệu này phản ánh đúng giá trị tuyên tính trong khoảng từ 1 đến 8.
8 Max của tập dữ liệu là 8, Min cua tập đữ liệu là l và Range của là 7 Gia tri trung vị năm lệch về Q¡ do đó tập dữ liệu có xu hướng giảm Đồ thị Boxplot của N2 cho thấy đữ liệu đao động trong khoáng từ l đến 7, không có giá trị ngoại lai Vậy tập dữ liệu sẽ đúng giá trị tuyên tính trong khoảng từ l đến
7 Max của tập dữ liệu là 7, Mm của tap dir ligu la | va Range cua la 6 Gia tri trung vi nam Iéch vé Q; do do tap dt liéu co xu hướng giảm Đồ thị Boxplot của N3 cho thấy đữ liệu dao động trong khoảng từ I đến 8, có giá trị ngoại lai là 8 Vậy tập đữ liệu sẽ đúng giá trị tuyến tính trong khoáng từ l đên
7 Max của tập dữ liệu là 7, Mm của tap dir ligu la | va Range cua la 6 Gia tri trung vi nam Iéch vé Q; do do tap dt liéu co xu hướng giảm
Kiêm tra sự khác biệt giữa 2 biên: nơi ở và tần suat sử dụng
Kruskal-Wallis rank sum test data: Tần.suật by Nơi.ở
Kruskal-Wallis chi-squared = 8.5382, df = 2, p-value = 0.01399
Vi p-value nho hon 0.05 nén co tồn tại ít nhất một sự khác biệt giữa 3 nhóm
> kruskalmc (Tần suắt ~ Nơi.ở, dataaset)
Multiple comparison test after Kruskal-Wallis alpha: 0.05
Comparisons obs.dif critical.dif stat.signif
Kết luận: Không có sự khác biệt giữa NI và N2, N2 và N3 vì giá trị quan sát được nhỏ hơn giá trị tham sô
Có sự khác biệt giữa NI và N3 vì giá trị quan sát được lớn hơn giá trị tham sô
3.5 Đối với mỗi tương quan giữa thu nhập và tần suất sử dụng
Shapiro-Wilk normality test data: TN1
Vì p-value nhỏ hơn 0.05 nên số liệu không phân phối chuẩn
Shapiro-Wilk normality test data: TN2
Vì p-value nhỏ hơn 0.05 nên số liệu không phân phối chuẩn
Shapiro-Wilk normality test data: TN3
Vi p-value lớn hơn 0.05 nên số liệu phân phối chuẩn
Shapiro-Wilk normality test data: TN4
Vi p-value lớn hơn 0.05 nên số liệu phân phối chuẩn
Thông kê mô tả giữa TN1, TN2, TN3 VÀ TN4 mean sd se(mean) var IQR 0% 25% 50$ 75% 100% Tân.suât:n
SD =2.57; var = 6.63 Đồ thị Boxplot
Đồ thị Boxplot của TNI1 cho thấy dữ liệu dao động trong khoảng từ 1 đến 7, mà không có giá trị ngoại lai Điều này cho thấy tập dữ liệu phản ánh đúng giá trị tuyến tính trong khoảng từ 1 đến 7.
7 Max của tập dữ liệu là 7, Mm của tap dir ligu la | va Range cua la 6 Gia tri trung vị nằm lệch về Q¡ đo đó tập đữ liệu có xu hướng giảm Đồ thị Boxplot của TN2 cho thấy đữ liệu đao động trong khoảng từ 1 đến 8, không có giá trị ngoại lai Vậy tập đữ liệu sẽ đúng giá trị tuyến tính trong khoảng từ 1 đến
7 Max của tập dữ liệu là 7, Mm của tap dir ligu la | va Range cua la 6 Gia tri trung vị nằm lệch về Q¡ đo đó tập đữ liệu có xu hướng giảm Đồ thị Boxplot của TN3 cho thấy đữ liệu đao động trong khoảng từ 1 dén 6, không có giá trị ngoại lai Vậy tập đữ liệu sẽ đúng giá trị tuyến tính trong khoảng từ 1 đến
6 Max của tập dữ liệu là 6, Mm của tập đữ liệu là l và Range của là 5 Gia tri trung vị nằm lệch về Q3 do đó tập dữ liệu có xu hướng tăng Đồ thị Boxplot của TN4 cho thấy đữ liệu đao động trong khoảng từ 1 đến 8, không có giá trị ngoại lai Vậy tập đữ liệu sẽ đúng giá trị tuyến tính trong khoảng từ 1 đến
8 Max của tập dữ liệu là 8, Min cua tap đữ liệu là I và Range của là 7 Giá trị trung vị nằm lệch về Q1 đo đó tập dữ liệu có xu hướng giảm
Kruskal-Wallis rank sum test data: Tân.suât by Thu.nhập
Kruskal-Wallis chi-squared = 11.242, df = 3, p-value = 0.01049
Vi p-value nho hon 0.05 nén co tồn tại ít nhất một sự khác biệt giữa 4 nhóm obs.dif critical.dif stat.signif
- Nhận xét: có sự khác biệt giữa TNI và TN2, không có sự khác biệt giữa TNI và TN3, TN2 và TN3, TN2 và TN4, TN3 và TN4
3.6 Đối với mối tương quan giữa thời gian học tập và tần suất sử dụng
Shapiro-Wilk normality test data: TGl
Vì p-value nhỏ hơn 0.05 nên số liệu không phân phối chuẩn
Vì p-value nhỏ hơn 0.05 nên số liệu không phân phối chuẩn
Shapiro-Wilk normality test data: TG3
Vì p-value nhỏ hơn 0.05 nên số liệu không phân phối chuẩn
Shapiro-Wilk normality test data: TG4
Vi p-value lớn hơn 0.05 nên số liệu phân phối chuẩn
- _ Thống kê mô tả giữa TG1, TG2, TG3 VÀ TG4 mean sd se(mean) var IQR 0% 25% 50% 75% 100% TAN.SUAT:n TGl 3.710526 2.264985 0.3674291 5.130156 3.75 1 2 3 5.75 8 38
SD =2.11; var = 4.43 Đồ thị Boxplot
Đồ thị Boxplot của TGI cho thấy dữ liệu dao động từ 1 đến 8, không có giá trị ngoại lai, với Max là 8, Min là 1 và Range là 7, cho thấy xu hướng giảm Boxplot của TG2 chỉ ra dữ liệu trong khoảng từ 1 đến 7, có giá trị ngoại lai là 8, không được tính vào tập dữ liệu, với Max là 7, Min là 1 và Range là 6, cho thấy xu hướng ổn định TG3 có dữ liệu từ 1 đến 8, Max là 8, Min là 1 và Range là 7, với giá trị trung vị lệch về Q1, cho thấy xu hướng giảm Cuối cùng, Boxplot của TG4 cho thấy dữ liệu dao động từ 1 đến 7, với Max là 7, Min là 1 và Range là 6, và giá trị trung vị lệch về Q3, cho thấy xu hướng tăng.
Kruskal-Wallis rank sum test data: TAN.SUAT by TIM
Kruskal-Wallis chi-squared = 5.9987, df = 3, p-value = 0.1117
- _ Nhận xét: vì p-value > 0.05 nên không có sự khác biệt giữa 4 nhóm
CHUONG IV: KET LUAN Đối với mỗi tương quan giữa giới tính và tần suất sử dụng: thông qua mục 3.1, ta thấy rằng giới tính không có sự ảnh hưởng đến nhu cầu sử đụng thức ăn nhanh của sinh viên Đại học Công nghiệp TP.HCM Đối với mối tương quan giữa phân loại sinh viên và tần suất sử dụng: thông qua mục 3.2, ta thấy rằng sinh viên năm 1, sinh viên năm 2, sinh viên năm 3, sinh viên năm 4 không có sự ảnh hưởng đến nhu cầu sử dụng thức ăn nhanh của sinh viên Đại học Công nghiệp TP.HCM Đối với mối tương quan giữa sở thích nấu ăn và tần suất sử dụng: thông qua mục 3.3, ta thây rằng sở thích nâu ăn không có sự ảnh hưởng đến nhu cầu sử dụng thức ăn nhanh của sinh viên Đại học Công nghiệp TP.HCM Đối với mối tương quan ứiữa nơi ở và tần suất sử dụng: thụng qua mục 3.4, ta thay rang nơi ở có sự ảnh hưởng đến nhu cầu sử dụng thức ăn nhanh của sinh viên Đại học Công nghiệp TP.HCM:
Theo phân tích dữ liệu từ phần mềm R, nhóm nghiên cứu đã xác định ít nhất một sự khác biệt đáng kể trong các thông số được khảo sát.
+ Phân tích nhóm nhà trọ và ký túc xá: qua kết quả phân tích cho thấy không có sự khác biệt giữa hai nhóm
+ Phân tích nhóm nhà trọ và sống chung với người thân: qua kết quả phân tích cho thấy có sự khác biệt giữa hai nhóm
+ Phân tích nhóm ký túc xá và sống chung với người thân: qua kết quả phân tích cho thầy không có sự khác biệt giữa hai nhóm
Nếu tôi là chủ cửa hàng thức ăn nhanh, tôi sẽ chú trọng đầu tư vào đối tượng khách hàng là sinh viên sống tại nhà trọ và cùng với người thân Mối quan hệ giữa thu nhập và tần suất sử dụng thức ăn nhanh cho thấy rằng thu nhập hàng tháng của sinh viên có ảnh hưởng đáng kể đến nhu cầu tiêu thụ thức ăn nhanh tại Đại học Công nghiệp TP.HCM.
+ Phân tích nhóm thu nhập dưới 3 triệu và nhóm thu nhập từ 3 đến 7 triệu: qua kết quả phân tích cho thấy có sự khác biệt giữa 2 nhóm
+ Phân tích nhóm thu nhập dưới 3 triệu và nhóm thu nhập từ 7 đến l0 triệu: qua kết quả phân tích cho thấy không có sự khác biệt giữa 2 nhóm
+ Phân tích nhóm thu nhập dưới 3 triệu và nhóm thu nhập trên l0 triệu: qua kết quả phân tích cho thấy không có sự khác biệt giữa 2 nhóm
+ Phân tích nhóm thu nhập 3 đến 7 triệu và nhóm thu nhập từ 7 đến l0 triệu: qua kết quả phân tích cho thấy không có sự khác biệt giữa 2 nhóm
+ Phân tích nhóm thu nhập 3 đến 7 triệu và nhóm thu nhập trên l0 triệu: qua kết quả phân tích cho thấy không có sự khác biệt giữa 2 nhóm
+ Phân tích nhóm thu nhập từ 7 đến 10 triệu và nhóm thu nhập trên I0 triệu: qua kết quả phân tích cho thấy không có sự khác biệt giữa 2 nhóm
Nếu tôi là chủ cửa hàng thức ăn nhanh, tôi sẽ chú trọng và đầu tư vào nhóm khách hàng có thu nhập dưới 3 triệu và từ 3 đến 7 triệu Bên cạnh đó, theo phân tích ở mục 3.6, thời gian học tập không ảnh hưởng đến nhu cầu sử dụng thức ăn nhanh của sinh viên tại Đại học Công nghiệp TP.HCM.
Đề xuất chung cho thấy rằng hầu hết các yếu tố mà nhóm khảo sát không tác động đến nhu cầu sử dụng thức ăn nhanh của sinh viên Đại học Công nghiệp TP.HCM Để hoàn thiện đề tài, nhóm cần mở rộng khảo sát để tìm ra những yếu tố thực sự ảnh hưởng đến nhu cầu này, như “độ tuổi bắt đầu sử dụng thức ăn nhanh”, “mức chi tiêu hàng tuần”, và “ngành học”.
Sheet dữ liệu thô => Nguyễn Như
Đối với mối tương quan giữa thu nhập và tần suất sử CL 25
3.5.1 Thông kê mồ tả e Xét TNI
Shapiro-Wilk normality test data: TN1
Code: normalityTest(~TN1, test="shapiro.test", dataaset) e Xét TN2
Shapiro-Wilk normality test data: TN2
Code: normalityTest(~TN2, test="shapiro.test", dataaset) e Xét TN3
Shapiro-Wilk normality test data: TN3
Code: normalityTest(~TN3, test="shapiro.test", dataaset) se XétTN4
Shapiro-Wilk normality test data: TN4
Code: normalityTest(~TN4, test="shapiro.test", dataaset) e Thông kê mô tả giữa TN1, TN2, TN3 VÀ TN4 mean sd se(mean) var IQR 0% 25% 50$ 75% 100$ Tân.suât:n
Code: numSummary(Dataset[,"Tan.suat", dropSE], groupsaset$Thu.nhập, statistics=c("mean", "sd", "se(mean)”, "var", "TOR", "quantiles"), quantiles=c(0,.25,.5,.75,1)) ô - Đồ thị Boxplot
Code: Boxplot(Tan.suat ~ Thu.nhap, dataaset, id=list(method="y"))
Kruskal-Wallis rank sum test data: Tdan.sudt by Thu.nhap
Kruskal-Wallis chi-squared = 11.242, df = 3, p-value = 0.01049
Code: Tapply(Tan.suat ~ Thu.nhap, median, na.action=na.omit, dataaset) # medians by group kruskal.test(Tan.suat ~ Thu.nhap, dataaset) obs.dif critical.dif stat.signif
Code: kruskalme(Tan.suat ~ Thu.nhap, dataaset
Đối với mỗi tương quan giữa thời gian học tập và tần suất sử dụng
3.6.1 Thống kê mô tả se XétTGI
Shapiro-Wilk normality test data: TG1
Code: normalityTest(~TG1, test="shapiro.test", dataaset) e Xét TG2
Shapiro-Wilk normality test data: TG2
Code: normalityTest(~TG2, test="shapiro.test", dataaset) se Xét TG3
Shapiro-Wilk normality test data: TG3
Code: normalityTest(~TG3, test="shapiro.test", dataaset) e XétTG4