1. Trang chủ
  2. » Luận Văn - Báo Cáo

Khảo sát nhu cầu sử dụng thức ăn nhanh của sinh viên Đại học công nghiệp thành phố hồ chí minh

56 2 0
Tài liệu được quét OCR, nội dung có thể không chính xác
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Khảo sát nhu cầu sử dụng thức ăn nhanh của sinh viên Đại học Công nghiệp Thành phố Hồ Chí Minh
Tác giả Nguyễn Lợi Thỏi Sơn, Pham Thanh Khương, Nguyễn Thị Quynh Như, Phan Thị Tiểu Như, Phan Thị Quỳnh Như, Vũ Huỳnh Minh Quân, Tạ Văn Sang, Nguyễn Minh Trử
Người hướng dẫn T.S Nguyễn Ngọc Tuấn
Trường học Đại học Công nghiệp Thành phố Hồ Chí Minh
Chuyên ngành Xử lý số liệu thực nghiệm
Thể loại tiểu luận
Năm xuất bản 2023
Thành phố Thành phố Hồ Chí Minh
Định dạng
Số trang 56
Dung lượng 8,34 MB

Cấu trúc

  • 4. Link Google drive 27 (6)
  • CHUONG II: XU LY SO LIEU 8 1. Kid tra dit QU. ccscsscssssesscsssssesssssssesssssssscssssscsscssesssssessssscssssssscsssscsasecsasecessssens 8 2. Mã hóa và rÚt frÍCh..................... c0 0< S0 10 999050505 939.950.958 058 5.585 5005 9900.55.0805 50508845 98900 8 (0)
    • 2.1 Mã hóa 8 (8)
    • 2.2 Rit trichi..ccccccccccsssssccsssssssccccssnncssccssssnncccsssssssecccsnsncassssssnnnsccesssssseccssnnnaaaacessassceeses 9 3. XỬ ý.................. HH“ HÀ HH HO HH HH HH HH TH HT HT. TT TH 0 12 CHƯƠNG II: KÉT QUÁ VÀ BÀN LUẬNN..........................--5- sec sccscseceeecrsrsersreersrs 14 (0)
    • 3.1 Đối với mỗi tương quan giữa giới tớnh và tần suất sử dụng:........................ô 14 (0)
    • 3.2 Đối với mối tương quan giữa phân loại sinh viên và tần suất sử dụng (16)
    • 3.3 Đối với mối tương quan giữa sở thích nấu ăn và tần suất sử dụng (19)
    • 3.4 Đối với mỗi tương quan giữa nơi ở và tần suất sử dụng............................ ôô ô<< 22 (22)
    • 3.5 Đối với mối tương quan giữa thu nhập và tần suất sử CL 25 (53)
    • 3.6 Đối với mỗi tương quan giữa thời gian học tập và tần suất sử dụng (55)

Nội dung

Kiểm tra dữ liệu Đối với mối tương quan giữa giới tính và tần suất sử dụng: kiểm tra dữ liệu để kết luận biến số giới tính nam, nữ có ảnh hưởng đến biến số tần suất sử dụng thức ăn nhanh

Link Google drive 27

hftps:/⁄⁄p.zaloapp.com/cf?url=hftps%3.A%2F%2F forms.gle

Kết luận: vậy số người khảo sát tối thiêu là 217 người

CHƯƠNG II: XỬ LÝ SÓ LIỆU

Để xác định mối tương quan giữa các biến số và tần suất sử dụng thức ăn nhanh, cần kiểm tra dữ liệu liên quan đến giới tính, thời gian học tập, phân loại sinh viên, sở thích nấu ăn và nơi ở Cụ thể, cần phân tích xem giới tính (nam, nữ) có ảnh hưởng đến tần suất sử dụng thức ăn nhanh hay không Tiếp theo, cần xem xét liệu thời gian học tập có tác động đến thói quen sử dụng thức ăn nhanh hay không Bên cạnh đó, việc phân loại sinh viên cũng cần được kiểm tra để đánh giá ảnh hưởng đến tần suất sử dụng Hơn nữa, sở thích nấu ăn có thể có vai trò quan trọng trong việc quyết định tần suất sử dụng thức ăn nhanh Cuối cùng, cần phân tích liệu nơi ở có ảnh hưởng đến tần suất sử dụng thức ăn nhanh hay không.

XU LY SO LIEU 8 1 Kid tra dit QU ccscsscssssesscsssssesssssssesssssssscssssscsscssesssssessssscssssssscsssscsasecsasecessssens 8 2 Mã hóa và rÚt frÍCh c0 0< S0 10 999050505 939.950.958 058 5.585 5005 9900.55.0805 50508845 98900 8

Mã hóa 8

Để sử dụng các biến số trong phần mềm R, chúng ta không thể giữ nguyên tên biến mà cần phải mã hóa chúng cho phù hợp Việc này giúp phần mềm có thể xử lý các biến một cách hiệu quả.

Có 2 loại giới tính mà nhóm khảo sát là “Nam” và “Nữ”, đối với biến giới tính

“Nam” sẽ được mã hóa thành “GT01”, còn đôi với biên giới tính “Nữ” sẽ được mã hóa thành “GT02”

Có 4 nhóm sinh viên mà nhóm khảo sát là “Sinh viên năm 1”, “Sinh viên năm 2”,

Sinh viên năm 2 được mã hóa thành "SV2", sinh viên năm 3 thành "ŠV3", sinh viên năm 4 thành "SV4", và sinh viên năm L thành "SVI".

Có 5 mức độ ưa thích mà nhóm khảo sát là “Rất không thích”, “Không thích”,

Các mức độ sở thích được mã hóa như sau: "Rất không thích" là "01", "Không thích" là "02", "Bình thường" là "03", "Thích" là "04" và "Rất thích" là "05".

Có 3 loại nơi ở là “Ký túc xá”, “Nhà trọ” và “Sống chung với người thân” Đối với biến “Nhà trọ” sẽ được mã hóa thành “NI”, “Ký túc xá” sẽ được mã hóa thành

“N2”, * Sông với người thân” sẽ được mã hóa thành “N3”

Ta quy đổi đữ liệu từ thang tỉ lệ về thang khoảng đoạn như sau:

TG2: từ 6 giờ đến 10 giờ

TG3: từ II giờ đến 15 giờ

TG4: từ l6 giờ đến 20 giờ

Có 4 nhóm thu nhập mà nhóm đã khảo sát là “Dưới 3 triệu”, ”Từ 3 — 7 triệu”, "Từ

Biến thu nhập được mã hóa như sau: “Dưới 3 triệu” thành “TN1”, “Từ 3 — 7 triệu” thành “TN2”, “Từ 7 — 10 triệu” thành “TN3”, và “Trên 10 triệu” thành “TN4” Đối với biến “Tần suất sử dụng” mà nhóm khảo sát, sẽ được mã hóa theo cách tương tự.

2.2 Rút trích Đôi với môi tương quan giữa giới tính và tân suất sử dụng: ta tiên hành rút Ậ &€ z trích so sánh dữ liệu của 2 biến số “giới tính” và “tần suất sử dụng”

Bước 1: Mở bảng đữ liệu mà ta khảo sát được trong Excell

Bước 2: Chọn Sort and Filter a chon Filter

Bước 3: chọn ~' trong tiêu đề của cột, chọn GT0I

Bước 4: Copy đữ liệu của biến số tần suất sử dụng ứng với biến số GT01.

Bước 5: Tạo sheet “Giới tính và tần suất”, sau đó dán dữ liệu đã sao chép Đối với mối tương quan giữa giới tính của sinh viên và tần suất sử dụng, ta tiến hành rút trích và so sánh dữ liệu của hai biến số “phân loại sinh viên” và “tần suất sử dụng”.

Để tiến hành so sánh mối quan hệ giữa sở thích nấu ăn và tần suất sử dụng, chúng ta cần rút trích dữ liệu từ hai biến số: "sở thích nấu ăn" và "tần suất sử dụng" Việc này giúp xác định cách thức mà sở thích nấu ăn ảnh hưởng đến tần suất sử dụng thực phẩm.

Để tiến hành rút trích dữ liệu, chúng ta so sánh hai biến số "nơi ở" và "tần suất sử dụng" Phương pháp này tương tự như cách rút trích biến số "giới tính" và "tần suất sử dụng", nhằm xác định mối tương quan giữa nơi ở và tần suất sử dụng.

Để thực hiện việc rút trích dữ liệu, chúng ta sẽ áp dụng phương pháp tương tự như với các biến số "giới tính" và "tần suất sử dụng" Đối với mối tương quan giữa thu nhập và tần suất sử dụng, chúng ta cần so sánh dữ liệu từ hai biến số này, từ đó rút ra những kết luận có ý nghĩa về sự liên kết giữa chúng.

Cách tiên hành: tương tự với cách rút trích biên sô “giới tính” và “tân suat str dụng”

Số liệu Mã hóa RÚT TRÍCH

Giới tính của Tân số được phân loại như sau: Nam là GT0I GTO1 (TSI, TS2 ) và Nữ là GT02 GT02 (TSI1, TS2 ) Đối với sinh viên, năm I được ký hiệu là SVI (TSI, TS2 ), trong khi sinh viên năm II được ký hiệu là SV2.

SV2 (TSI, TS2 ) SV3 (TSI, TS2 ) SV4 (TSI, TS2 )

Rat khong thích: 01 Không thích: 02

Rat thich: 05 05 (TSI, TS2 ) Nơi ở Tân số bao nhiêu | Nhà trọ: NI NI (TS1, TS2 ) bạn ở nhà trọ, ktx, | Ký túc xá: N2 N2 (TSI, TS2, )

Sống chung với người | N3 (TSI, TS2 ) thân: N3

Thời gian | Sô giờ học tập, làm | 0-5 giờ: TGI TGI (TS1, TS2, ) sinh hoạt việc 6-10 gio: TG2 TG2 (TSI, TS2, )

11-15 giờ: TG3 TG3 (TSI, TS2, ) 16-20 gio: TG4 TG4 (TS1, TS2 ) Thu nhập Thu nhập hàng | Dưới 3 triệu: TNI TNI (TSI, TS2 ) thang Từ 3-7 triệu: TN2 TN2 (TS1, TS2 )

Trên 10 triệu: TN4 TN3 (TS1, TS2, )

Biên sô Số liệu Mã hóa Xử lý số liệu

Giới tính Tan so bao nhiêu nam, nữ?

+ Thông kê mô tả: giá trị trung bình, trung vị, mode, max, min, range, variance, SD a nhan xét về giới tính GT0I và GT02

Vẽ đồ thị boxplot à giải thích

+ Thông kê diễn giải: ® Kiểm tra đữ liệu có phân phối

; chuẩn hay không Nêu có: áp dụng T-test để kiểm định sự khác biệt hay không

Nếu Không: áp dụng Wilcoxon

Tân số bao nhiêu sinh viên năm

Sinh vién nam 1: SV1 Sinh vién nam 2: SV2 Sinh vién nam 3: SV3 Sinh vién nam 4: SV4

+ Thông kê mô tả: giá trị trung bình, trung vị, mode, mã, mm, range, varlance, sd à nhận xét về sinh viên SVI, SV2,

SV3, SV4, SV3,SV4 + Thông kê diễn giải: ® Kiểm tra đữ liệu có phân phối chuẩn hay không + Nếu có: áp dụng

Anova để kiểm định sự khác biệt hay không + Nếu Không: áp dụng Krusal Wallis Rank Sum Test

Sở thích nâu an Tần sô bao nhiêu

Bạn thích nâu ăn Rat không thích: 01

Không thích: 02 Bình thường: 03 Thích: 04 + Thông kê mô tả: giá trị trung bình, trung vị, mode, mã, mm, range, varlance, sd à nhận xét

Để kiểm tra xem dữ liệu có phân phối chuẩn hay không, chúng ta thực hiện thống kê diễn giải Nếu dữ liệu có phân phối chuẩn, phương pháp Anova sẽ được áp dụng để kiểm định sự khác biệt Ngược lại, nếu dữ liệu không có phân phối chuẩn, chúng ta sẽ sử dụng bài kiểm tra Kruskal-Wallis Rank Sum.

Nơi ở Tan so bao nhiêu bạn ở nhà trọ, ktx,

Ký túc xá: N2 Sống chung với người thân: N3

Trong bài viết này, chúng tôi sẽ thực hiện thống kê mô tả bao gồm các giá trị trung bình, trung vị, mode, mã, mm, khoảng cách, phương sai và độ lệch chuẩn để nhận xét về các nhóm NI, N2 và N3 Tiếp theo, chúng tôi sẽ tiến hành thống kê diễn giải bằng cách kiểm tra xem dữ liệu có phân phối chuẩn hay không Nếu dữ liệu có phân phối chuẩn, chúng tôi sẽ áp dụng phương pháp ANOVA để kiểm định sự khác biệt giữa các nhóm Ngược lại, nếu dữ liệu không phân phối chuẩn, chúng tôi sẽ sử dụng kiểm định Kruskal-Wallis Rank Sum Test.

Thu nhập Thu tháng nhập hàng Dưới 3 triệu: TNI

Từ 7 -10 triệu: TN3 Trên l0 triệu: TN4

Trong thống kê mô tả, chúng ta xem xét các chỉ số như giá trị trung bình, trung vị, mode, mã, mm, khoảng cách, phương sai và độ lệch chuẩn để đưa ra nhận xét về các biến TNI, TN2, TN3 và TN4 Tiếp theo, trong thống kê diễn giải, cần kiểm tra xem dữ liệu có phân phối chuẩn hay không Nếu dữ liệu đạt yêu cầu phân phối chuẩn, chúng ta sẽ áp dụng phương pháp ANOVA để kiểm định sự khác biệt giữa các nhóm.

Nếu Không: áp dụng Krusal Wallis Rank Sum Test

Thời gian học và số giờ học tập được phân tích qua các chỉ số thống kê như giá trị trung bình, trung vị, mode, mã, mm, khoảng, phương sai và độ lệch chuẩn Các nhận xét về các nhóm TNI, TN2, TN3 và TN4 được đưa ra dựa trên những số liệu này Để kiểm tra dữ liệu có phân phối chuẩn hay không, nếu có, áp dụng phương pháp ANOVA để kiểm định sự khác biệt giữa các nhóm Nếu dữ liệu không phân phối chuẩn, sử dụng bài kiểm tra Kruskal-Wallis Rank Sum Test để phân tích.

CHUONG III: KET QUA VA BAN LUAN

3.1 Đôi với môi tương quan giữa giới tính và tần suat sử dụng:

Shapiro-Wilk normality test data: GT01

Vì p-value nhỏ hơn 0.05 nên số liệu không phân phối chuẩn

Vì p-value nhỏ hơn 0.05 nên số liệu không phân phối chuẩn

Thống kê mô tả giữa GT01 VÀ GT02 mean sd se(mean) var IQR OF 25% 50% 75% 100% Tan.suatin

Đối với mối tương quan giữa phân loại sinh viên và tần suất sử dụng

Shapiro-Wilk normality test data: 5V1

Vì p-value nhỏ hơn 0.05 nên số liệu không phân phối chuẩn

Shapiro-Wilk normality test data: 5v2

Vì p-value nhỏ hơn 0.05 nên số liệu không phân phối chuẩn

Shapiro-Wilk normality test data: 5V3

Vì p-value nhỏ hơn 0.05 nên số liệu không phân phối chuẩn

Shapiro-Wilk normality test data: 5V4

Vì p-value nhỏ hơn 0.05 nên số liệu không phân phối chuẩn

Thống kê mô tả giữa SV1, SV2, SV3, SV4 mean sd IQR O% 25% 50% 75% 100% tần.suất:n

SD = 2.38; var = 5.66 Đồ thị Boxplot

Đồ thị Boxplot của SVI cho thấy dữ liệu dao động từ 1 đến 7, không có giá trị ngoại lai Tập dữ liệu này phản ánh giá trị tuyến tính trong khoảng từ 1 đến 7.

7 Max của tập dữ liệu là 8, Mm của tập đữ liệu là l và Range của là 6 Gia tri trung vị năm lệch về Q¡ do đó đữ liệu có xu hướng giảm Đồ thị Boxplot của SV2 cho thấy đữ liệu dao động trong khoảng từ I đến 7, không có giá trị ngoại lai Vay tap đữ liệu sẽ đúng giá trị tuyến tính trong khoảng từ I đến

7 Max của tập dữ liệu là 8, Mm của tập đữ liệu là l và Range của là 6 Gia tri trung vị năm lệch về Q¡ do đó đữ liệu có xu hướng giảm Đồ thị Boxplot của SV3 cho thấy đữ liệu dao động trong khoảng từ I đến 8, không có giá trị ngoại lai Vay tap đữ liệu sẽ đúng giá trị tuyến tính trong khoảng từ I đến

8 Max của tập dữ liệu là 8, Min cua tập đữ liệu là l và Range của là 7 Gia tri trung vị nằm lệch về Q¡ do đó dữ liệu có xu hướng giảm Đồ thị Boxplot của SV4 cho thấy đữ liệu dao động trong khoảng từ I đến 8, không có giá trị ngoại lai Vay tap đữ liệu sẽ đúng giá trị tuyến tính trong khoảng từ I đến

8 Max của tập dữ liệu là 8, Min cua tập đữ liệu là l và Range của là 6 Gia trị trung vị nằm lệch về Q¡ do đó dữ liệu có xu hướng giảm

- _ Kiêm tra dữ liệu định lượng, phân phôi chuân:

Kiểm tra sự khác biệt giữa 2 biến: phân loại sinh viên và tần suất sử dụng

Vì 4 dữ liệu của 2 biến số không phân phối chuẩn, ta tiền hành kiểm định phi tham số (sử dụng kiểm định Kruskal)

Kruskal-Wallis rank sum test data: tan.suat by N&m.sinh.vién

Kruskal-Wallis chi-squared = 1.2817, df = 3, p-value = 0.7335

- _ Nhận xét: vì p-value lớn hơn 0.05 nên không có sự khác biệt giữa các nhóm.

Đối với mối tương quan giữa sở thích nấu ăn và tần suất sử dụng

Vì p-value nhỏ hơn 0.05 nên số liệu không phân phối chuẩn

Shapiro-Wilk normality test aata: X02

Vi p-value lớn hơn 0.05 nên số liệu phân phối chuẩn

Shapiro-Wilk normality test data: X03

Vì p-value nhỏ hơn 0.05 nên số liệu không phân phối chuẩn

Vì p-value nhỏ hơn 0.05 nên số liệu không phân phối chuẩn

Shapiro-Wilk normality test data: X05

Vì p-value nhỏ hơn 0.05 nên số liệu không phân phối chuẩn

Thống kê mô tả giữa 01, 02, 03, 04, 05 mean sd se(mean) var IQR O& 25% 50% 75$ 100$ tân.suât:n

SD =2.33; var = 5.43 Đồ thị Boxplot

Đồ thị Boxplot của tập dữ liệu 01 cho thấy phần lớn dữ liệu tập trung quanh giá trị 2, với hai điểm ngoại lai là 1 và 7 Ngược lại, đồ thị Boxplot của tập dữ liệu 02 chỉ ra rằng dữ liệu dao động trong khoảng từ 1 đến 8 mà không có giá trị ngoại lai nào Do đó, tập dữ liệu này phản ánh giá trị tuyến tính trong khoảng từ 1 đến 8.

8 Max của tập đữ liệu là §, Mm của tập đữ liệu là I và Range là 7 Giá trị trung vị năm lệch về Q¡ do đó tập dữ liệu có xu hướng giảm Đồ thị Boxplot của 03 cho thấy dữ liệu dao động trong khoảng từ I đến 8, không có giá trị ngoại lai Vậy tập đữ liệu sẽ đúng giá trị tuyến tính trong khoảng từ 1 đến

8 Max của tập dữ liệu là 8, Mm của tap dir ligu la | va Range cua la 8 Gia trị trung vị nằm lệch về Q¡ đo đó tập đữ liệu có xu hướng giảm Đồ thị Boxplot của 04 cho thấy dữ liệu đao động trong khoảng từ 1 đến 7, không có giá trị ngoại lai Vậy tập đữ liệu sẽ đúng giá trị tuyến tính trong khoảng từ 1 đến

7 Max của tập dữ liệu là 7, Mm của tap dir ligu la | va Range cua la 6 Gia tri trung vị nằm lệch về Q¡ đo đó tập đữ liệu có xu hướng giảm Đồ thị Boxplot của 05 cho thấy dữ liệu dao động trong khoảng từ I đến 8, không có giá trị ngoại lai Vậy tập đữ liệu sẽ đúng giá trị tuyến tính trong khoảng từ 1 đến

8 Max của tập dữ liệu là 8, Min cua tập đữ liệu là l và Range của là 7 Gia tri trung vị nằm lệch về Q¡ đo đó tập đữ liệu có xu hướng giảm

Kruskal-Wallis rank sum test

: =3 ( x data: taén.suat by So.thich.nau.an

Kruskal-Wallis chi-squared = 8591, df = 4, p-value = 0.09688

Nhận xét: vì p-value > 0.05 nên không có sự khác biệt giữa 3 nhóm.

Đối với mỗi tương quan giữa nơi ở và tần suất sử dụng ôô ô<< 22

Shapiro-Wilk normality test data: N1

Vì p-value nhỏ hơn 0.05 nên số liệu không phân phối chuẩn

Shapiro-Wilk normality test data: N2

Vi p-value lớn hơn 0.05 nên số liệu phân phối chuẩn

Vì p-value nhỏ hơn 0.05 nên số liệu không phân phối chuẩn

Thống kê mô tả giữa N1, N2, N3: mean sd se (mean) var IQR 0$ 25$ 50% 75% 100% Tan.suat:n N1 3.736434 2.213310 0.1948711 0 4.00 1 2 3.0 6.00 8 129

SD =1.76; var = 3.12 Đồ thị Boxplot

Đồ thị Boxplot của NI cho thấy dữ liệu dao động trong khoảng từ 1 đến 8 và không có giá trị ngoại lai Do đó, tập dữ liệu này phản ánh đúng giá trị tuyên tính trong khoảng từ 1 đến 8.

8 Max của tập dữ liệu là 8, Min cua tập đữ liệu là l và Range của là 7 Gia tri trung vị năm lệch về Q¡ do đó tập dữ liệu có xu hướng giảm Đồ thị Boxplot của N2 cho thấy đữ liệu đao động trong khoáng từ l đến 7, không có giá trị ngoại lai Vậy tập dữ liệu sẽ đúng giá trị tuyên tính trong khoảng từ l đến

7 Max của tập dữ liệu là 7, Mm của tap dir ligu la | va Range cua la 6 Gia tri trung vi nam Iéch vé Q; do do tap dt liéu co xu hướng giảm Đồ thị Boxplot của N3 cho thấy đữ liệu dao động trong khoảng từ I đến 8, có giá trị ngoại lai là 8 Vậy tập đữ liệu sẽ đúng giá trị tuyến tính trong khoáng từ l đên

7 Max của tập dữ liệu là 7, Mm của tap dir ligu la | va Range cua la 6 Gia tri trung vi nam Iéch vé Q; do do tap dt liéu co xu hướng giảm

Kiêm tra sự khác biệt giữa 2 biên: nơi ở và tần suat sử dụng

Kruskal-Wallis rank sum test data: Tần.suật by Nơi.ở

Kruskal-Wallis chi-squared = 8.5382, df = 2, p-value = 0.01399

Vi p-value nho hon 0.05 nén co tồn tại ít nhất một sự khác biệt giữa 3 nhóm

> kruskalmc (Tần suắt ~ Nơi.ở, dataaset)

Multiple comparison test after Kruskal-Wallis alpha: 0.05

Comparisons obs.dif critical.dif stat.signif

Kết luận: Không có sự khác biệt giữa NI và N2, N2 và N3 vì giá trị quan sát được nhỏ hơn giá trị tham sô

Có sự khác biệt giữa NI và N3 vì giá trị quan sát được lớn hơn giá trị tham sô

3.5 Đối với mỗi tương quan giữa thu nhập và tần suất sử dụng

Shapiro-Wilk normality test data: TN1

Vì p-value nhỏ hơn 0.05 nên số liệu không phân phối chuẩn

Shapiro-Wilk normality test data: TN2

Vì p-value nhỏ hơn 0.05 nên số liệu không phân phối chuẩn

Shapiro-Wilk normality test data: TN3

Vi p-value lớn hơn 0.05 nên số liệu phân phối chuẩn

Shapiro-Wilk normality test data: TN4

Vi p-value lớn hơn 0.05 nên số liệu phân phối chuẩn

Thông kê mô tả giữa TN1, TN2, TN3 VÀ TN4 mean sd se(mean) var IQR 0% 25% 50$ 75% 100% Tân.suât:n

SD =2.57; var = 6.63 Đồ thị Boxplot

Đồ thị Boxplot của TNI1 cho thấy dữ liệu dao động trong khoảng từ 1 đến 7, mà không có giá trị ngoại lai Điều này cho thấy tập dữ liệu phản ánh đúng giá trị tuyến tính trong khoảng từ 1 đến 7.

7 Max của tập dữ liệu là 7, Mm của tap dir ligu la | va Range cua la 6 Gia tri trung vị nằm lệch về Q¡ đo đó tập đữ liệu có xu hướng giảm Đồ thị Boxplot của TN2 cho thấy đữ liệu đao động trong khoảng từ 1 đến 8, không có giá trị ngoại lai Vậy tập đữ liệu sẽ đúng giá trị tuyến tính trong khoảng từ 1 đến

7 Max của tập dữ liệu là 7, Mm của tap dir ligu la | va Range cua la 6 Gia tri trung vị nằm lệch về Q¡ đo đó tập đữ liệu có xu hướng giảm Đồ thị Boxplot của TN3 cho thấy đữ liệu đao động trong khoảng từ 1 dén 6, không có giá trị ngoại lai Vậy tập đữ liệu sẽ đúng giá trị tuyến tính trong khoảng từ 1 đến

6 Max của tập dữ liệu là 6, Mm của tập đữ liệu là l và Range của là 5 Gia tri trung vị nằm lệch về Q3 do đó tập dữ liệu có xu hướng tăng Đồ thị Boxplot của TN4 cho thấy đữ liệu đao động trong khoảng từ 1 đến 8, không có giá trị ngoại lai Vậy tập đữ liệu sẽ đúng giá trị tuyến tính trong khoảng từ 1 đến

8 Max của tập dữ liệu là 8, Min cua tap đữ liệu là I và Range của là 7 Giá trị trung vị nằm lệch về Q1 đo đó tập dữ liệu có xu hướng giảm

Kruskal-Wallis rank sum test data: Tân.suât by Thu.nhập

Kruskal-Wallis chi-squared = 11.242, df = 3, p-value = 0.01049

Vi p-value nho hon 0.05 nén co tồn tại ít nhất một sự khác biệt giữa 4 nhóm obs.dif critical.dif stat.signif

- Nhận xét: có sự khác biệt giữa TNI và TN2, không có sự khác biệt giữa TNI và TN3, TN2 và TN3, TN2 và TN4, TN3 và TN4

3.6 Đối với mối tương quan giữa thời gian học tập và tần suất sử dụng

Shapiro-Wilk normality test data: TGl

Vì p-value nhỏ hơn 0.05 nên số liệu không phân phối chuẩn

Vì p-value nhỏ hơn 0.05 nên số liệu không phân phối chuẩn

Shapiro-Wilk normality test data: TG3

Vì p-value nhỏ hơn 0.05 nên số liệu không phân phối chuẩn

Shapiro-Wilk normality test data: TG4

Vi p-value lớn hơn 0.05 nên số liệu phân phối chuẩn

- _ Thống kê mô tả giữa TG1, TG2, TG3 VÀ TG4 mean sd se(mean) var IQR 0% 25% 50% 75% 100% TAN.SUAT:n TGl 3.710526 2.264985 0.3674291 5.130156 3.75 1 2 3 5.75 8 38

SD =2.11; var = 4.43 Đồ thị Boxplot

Đồ thị Boxplot của TGI cho thấy dữ liệu dao động từ 1 đến 8, không có giá trị ngoại lai, với Max là 8, Min là 1 và Range là 7, cho thấy xu hướng giảm Boxplot của TG2 chỉ ra dữ liệu trong khoảng từ 1 đến 7, có giá trị ngoại lai là 8, không được tính vào tập dữ liệu, với Max là 7, Min là 1 và Range là 6, cho thấy xu hướng ổn định TG3 có dữ liệu từ 1 đến 8, Max là 8, Min là 1 và Range là 7, với giá trị trung vị lệch về Q1, cho thấy xu hướng giảm Cuối cùng, Boxplot của TG4 cho thấy dữ liệu dao động từ 1 đến 7, với Max là 7, Min là 1 và Range là 6, và giá trị trung vị lệch về Q3, cho thấy xu hướng tăng.

Kruskal-Wallis rank sum test data: TAN.SUAT by TIM

Kruskal-Wallis chi-squared = 5.9987, df = 3, p-value = 0.1117

- _ Nhận xét: vì p-value > 0.05 nên không có sự khác biệt giữa 4 nhóm

CHUONG IV: KET LUAN Đối với mỗi tương quan giữa giới tính và tần suất sử dụng: thông qua mục 3.1, ta thấy rằng giới tính không có sự ảnh hưởng đến nhu cầu sử đụng thức ăn nhanh của sinh viên Đại học Công nghiệp TP.HCM Đối với mối tương quan giữa phân loại sinh viên và tần suất sử dụng: thông qua mục 3.2, ta thấy rằng sinh viên năm 1, sinh viên năm 2, sinh viên năm 3, sinh viên năm 4 không có sự ảnh hưởng đến nhu cầu sử dụng thức ăn nhanh của sinh viên Đại học Công nghiệp TP.HCM Đối với mối tương quan giữa sở thích nấu ăn và tần suất sử dụng: thông qua mục 3.3, ta thây rằng sở thích nâu ăn không có sự ảnh hưởng đến nhu cầu sử dụng thức ăn nhanh của sinh viên Đại học Công nghiệp TP.HCM Đối với mối tương quan ứiữa nơi ở và tần suất sử dụng: thụng qua mục 3.4, ta thay rang nơi ở có sự ảnh hưởng đến nhu cầu sử dụng thức ăn nhanh của sinh viên Đại học Công nghiệp TP.HCM:

Theo phân tích dữ liệu từ phần mềm R, nhóm nghiên cứu đã xác định ít nhất một sự khác biệt đáng kể trong các thông số được khảo sát.

+ Phân tích nhóm nhà trọ và ký túc xá: qua kết quả phân tích cho thấy không có sự khác biệt giữa hai nhóm

+ Phân tích nhóm nhà trọ và sống chung với người thân: qua kết quả phân tích cho thấy có sự khác biệt giữa hai nhóm

+ Phân tích nhóm ký túc xá và sống chung với người thân: qua kết quả phân tích cho thầy không có sự khác biệt giữa hai nhóm

Nếu tôi là chủ cửa hàng thức ăn nhanh, tôi sẽ chú trọng đầu tư vào đối tượng khách hàng là sinh viên sống tại nhà trọ và cùng với người thân Mối quan hệ giữa thu nhập và tần suất sử dụng thức ăn nhanh cho thấy rằng thu nhập hàng tháng của sinh viên có ảnh hưởng đáng kể đến nhu cầu tiêu thụ thức ăn nhanh tại Đại học Công nghiệp TP.HCM.

+ Phân tích nhóm thu nhập dưới 3 triệu và nhóm thu nhập từ 3 đến 7 triệu: qua kết quả phân tích cho thấy có sự khác biệt giữa 2 nhóm

+ Phân tích nhóm thu nhập dưới 3 triệu và nhóm thu nhập từ 7 đến l0 triệu: qua kết quả phân tích cho thấy không có sự khác biệt giữa 2 nhóm

+ Phân tích nhóm thu nhập dưới 3 triệu và nhóm thu nhập trên l0 triệu: qua kết quả phân tích cho thấy không có sự khác biệt giữa 2 nhóm

+ Phân tích nhóm thu nhập 3 đến 7 triệu và nhóm thu nhập từ 7 đến l0 triệu: qua kết quả phân tích cho thấy không có sự khác biệt giữa 2 nhóm

+ Phân tích nhóm thu nhập 3 đến 7 triệu và nhóm thu nhập trên l0 triệu: qua kết quả phân tích cho thấy không có sự khác biệt giữa 2 nhóm

+ Phân tích nhóm thu nhập từ 7 đến 10 triệu và nhóm thu nhập trên I0 triệu: qua kết quả phân tích cho thấy không có sự khác biệt giữa 2 nhóm

Nếu tôi là chủ cửa hàng thức ăn nhanh, tôi sẽ chú trọng và đầu tư vào nhóm khách hàng có thu nhập dưới 3 triệu và từ 3 đến 7 triệu Bên cạnh đó, theo phân tích ở mục 3.6, thời gian học tập không ảnh hưởng đến nhu cầu sử dụng thức ăn nhanh của sinh viên tại Đại học Công nghiệp TP.HCM.

Đề xuất chung cho thấy rằng hầu hết các yếu tố mà nhóm khảo sát không tác động đến nhu cầu sử dụng thức ăn nhanh của sinh viên Đại học Công nghiệp TP.HCM Để hoàn thiện đề tài, nhóm cần mở rộng khảo sát để tìm ra những yếu tố thực sự ảnh hưởng đến nhu cầu này, như “độ tuổi bắt đầu sử dụng thức ăn nhanh”, “mức chi tiêu hàng tuần”, và “ngành học”.

Sheet dữ liệu thô => Nguyễn Như

Đối với mối tương quan giữa thu nhập và tần suất sử CL 25

3.5.1 Thông kê mồ tả e Xét TNI

Shapiro-Wilk normality test data: TN1

Code: normalityTest(~TN1, test="shapiro.test", dataaset) e Xét TN2

Shapiro-Wilk normality test data: TN2

Code: normalityTest(~TN2, test="shapiro.test", dataaset) e Xét TN3

Shapiro-Wilk normality test data: TN3

Code: normalityTest(~TN3, test="shapiro.test", dataaset) se XétTN4

Shapiro-Wilk normality test data: TN4

Code: normalityTest(~TN4, test="shapiro.test", dataaset) e Thông kê mô tả giữa TN1, TN2, TN3 VÀ TN4 mean sd se(mean) var IQR 0% 25% 50$ 75% 100$ Tân.suât:n

Code: numSummary(Dataset[,"Tan.suat", dropSE], groupsaset$Thu.nhập, statistics=c("mean", "sd", "se(mean)”, "var", "TOR", "quantiles"), quantiles=c(0,.25,.5,.75,1)) ô - Đồ thị Boxplot

Code: Boxplot(Tan.suat ~ Thu.nhap, dataaset, id=list(method="y"))

Kruskal-Wallis rank sum test data: Tdan.sudt by Thu.nhap

Kruskal-Wallis chi-squared = 11.242, df = 3, p-value = 0.01049

Code: Tapply(Tan.suat ~ Thu.nhap, median, na.action=na.omit, dataaset) # medians by group kruskal.test(Tan.suat ~ Thu.nhap, dataaset) obs.dif critical.dif stat.signif

Code: kruskalme(Tan.suat ~ Thu.nhap, dataaset

Đối với mỗi tương quan giữa thời gian học tập và tần suất sử dụng

3.6.1 Thống kê mô tả se XétTGI

Shapiro-Wilk normality test data: TG1

Code: normalityTest(~TG1, test="shapiro.test", dataaset) e Xét TG2

Shapiro-Wilk normality test data: TG2

Code: normalityTest(~TG2, test="shapiro.test", dataaset) se Xét TG3

Shapiro-Wilk normality test data: TG3

Code: normalityTest(~TG3, test="shapiro.test", dataaset) e XétTG4

Ngày đăng: 02/01/2025, 09:56

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN