Trong đề án của nhóm chúng tôi ở môn nguyên lý thống kê, lấy số liệu thực tế của sinh viên Hoa Sen, chúng tôi sẽ phân tích xử lý số liệu từ đó đưa ra kết luận về sự ảnh hưởng của Interne
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC HOA SEN
KHOA KINH TẾ THƯƠNG MẠI
ĐỀ ÁN NGUYÊN LÝ THỐNG KÊ [VIỆC SỬ DỤNG INTERNET CỦA SINH VIÊN HOA SEN]
Giảng viên : Nguyễn Ngọc Ánh
Lớp : QT12DV01_0100
Sinh viên thực hiện:
1 Huỳnh Nguyễn Phương Vy
2 Hồ Minh Tú
3 Nguyễn Huỳnh Ngọc Hân
4 Âu Thiên Ái Vân
5 La Trần Minh Ân
Trang 2Thành phố Hồ Chí Minh, 12/06/2015
BỘ GIÁO DỤC
VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC HOA SENKHOA KINH
TẾ THƯƠNG MẠI
ĐỀ ÁN
NGUYÊN LÝ
THỐNG KÊ
[VIỆC SỬ DỤNG INTERNET
CỦA SINH VIÊN HOA SEN]
Giảng viên : Nguyễn Ngọc
Ánh
Lớp : QT12DV01_0100
Sinh viên thực hiện:
1 Huỳnh Nguyễn Phương Vy_2005232
2 Hồ Minh Tú_2136153
3 Nguyễn Huỳnh Ngọc Hân_2006735
4 Âu Thiên Ái Vân_2132175
5 La Trần Minh Ân_2132767
TRÍCH YẾU
Ngày nay, ai ai cũng phải thừa nhậnInternet đang dần ảnh hưởng ngày mộtnhiều đến đời sống của mỗi cá nhân.Liệu giới trẻ có phải trở thành “cơnnghiện” của Internet ngày nay? Internetxuất hiện như một thứ công cụ có thểkhám phá thế giới chỉ với một cái máytính có kết nối mạng Internet mang lạinhững thông tin bổ ích, có thể giúp conngười ước mơ, giúp con người có thể tìmtòi học hỏi những điều mới Tuy nhiên,bên cạnh mặt tích cực của Internet,Internet cũng là nguyên nhân ảnh hưởngkhông tốt đến việc học tập của giới trẻ.Bản thân mỗi người sử dụng Internet cần
có một kế hoạch và mục tiêu cụ thể,
2
Trang 3tránh xao nhãn khi sử dụng Internet.
Ngay trong đề án kỳ này, nhóm chúng
tôi sử dụng những phương pháp thống kê
của bộ môn từ đó đi thu thập và xử lý dữ
liệu, rồi đưa ra kết luận Đề án sẽ nói về
lượng thời gian trung bình sinh viên Hoa
Sen sử dụng Internet Từ đó sẽ đưa ra
mức độ ảnh hưởng của Internet đối với
đời sống sinh viên nói chung và sinh
viên của trường Đại học Hoa Sen nói
riêng
LỜI CẢM ƠN
Lời đầu tiên ,chúng tôi xin gửi lời cảm
ơn chân thành đến thầy Phạm Ngọc Ánh– giảng viên môn Nguyên lí thống kê đãtận tình hướng dẫn chúng tôi trong quátrình giảng dạy và hoàn thành tốt bài báocáo này Bên cạnh đó chúng tôi cũng xingửi lời cảm ơn tới các bạn sinh viên HoaSen đã nhiệt tình giúp đỡ chúng tôi đểhoàn thành tốt bài khảo sát
Xin chân thành cảm ơn!
3
Trang 4MỤC LỤC
Contents
4
Trang 5NHẬP ĐỀ
Thống kê là công việc mà hầu như bất kỳ
một doanh nghiệp dù lớn hay nhỏ đều
phải thực hiện Số liệu sau khi qua xử lý,
sẽ được thể hiện rõ ràng trên bảng biểu,
từ đó người sử dụng sẽ có thể xác định
mức trọng yếu và đưa ra những quyết
định sáng suốt Trong đề án của nhóm
chúng tôi ở môn nguyên lý thống kê, lấy
số liệu thực tế của sinh viên Hoa Sen,
chúng tôi sẽ phân tích xử lý số liệu từ đó
đưa ra kết luận về sự ảnh hưởng của
Internet trong đời sống của sinh viên
Đồng thời cũng là dịp giúp chúng tôi trau
dồi và phát triển kiến thức cần thiết cho
môn học này Qua đó chúng tôi cũng đề
ra mục tiêu :
• Mục tiêu đầu tiên của đề tài này là
cung cấp cho mọi người “Thời
gian sử dụng Internet của sinh
viên Hoa Sen” Các bạn sinh viên
thường sử dụng Internet để làm gì
và họ mất bao nhiêu thời gian sử
dụng Internet trong một ngày Từ
số liệu có được do khảo sát các
bạn sinh viên từ đó có cái nhìn
tổng quan nhu cầu và thời gian sử
dụng Internet trong một ngày của
sinh viên Hoa Sen
• Từ những kiến thức chúng tôi đang học ở môn Nguyên lí thống
kê, nhóm chúng tôi muốn tìm hiểunhu cầu và thời gian sử dụng Internet trong một ngày của sinh viên Hoa Sen Áp dụng những kiến thức đã học môn Nguyên lí thống kê để hoàn thành báo cáo một cách nỗ lực và tốt nhất (có thể), từ những lý thuyết đã học chúng tôi đã biết áp dụng môn học này vào thực tiễn
Đối tượng nghiên cứu: Sinh viên Hoa
Sen đi học bằng phương tiện gì và thời gian các bạn di chuyển từ nhà đến trường
Phạm vi nghiên cứu: Sinh viên Hoa
Sen
5
Trang 6BẢNG PHÂN CÔNG CÔNG VIỆC
1 Huỳnh Nguyễn Phương Vy Kiểm tra tính toán, tổng hợp bài
2 Hồ Minh Tú Trích yếu , lời dẫn , kết luận , anova
3 Nguyễn Huỳnh Ngọc Hân Bảng định tính
4 Âu Thiên Ái Vân Bảng định lượng , nhận xét
6
Trang 7CƠ SỞ LÝ THUYẾT
Khái niệm:
Có thể hiểu khái niệm thống kê trên hai góc độ:
• Góc độ lý luận: Thống kê là một môn khoa học kinh tế, nghiên cứu mặt lượng trong mối quan hệ chặt chẽ với mặt chất của các hiện tượng và quá trình kinh tế xãhội, phát sinh trong điều kiện thời gian và địa điểm cụ thể
• Góc độ nghiệp vụ: Thống kê có thể hiểu là các số liệu thể hiện thông tin về đối tượng nghiên cứu
Một cách tổng quát, có thể định nghĩa Thống kê là một nhánh của toán học liên quan đến việc thu thập, phân tích và trình bày các dữ liệu Đây là một khoa học bao gồm một hệ thống các phương pháp phân tích và dự đoán, giúp các nhà quản lí đựa ra các quyết định
Chức năng của thống kê :
Quá trình nghiên cứu thống kê trái qua ba giai đoạn có quan hệ chặt chẽ và mật thiết với nhau, trong đó giai đoạn trước làm tiền đề để thực hiện giai đoạn sau
1 Giai đoạn điều tra thống kê: bao gồm ghi chép, thu thập tài liệu thống kê
2 Giai đoạn tổng hợp và trình bày kết quả điều tra thu thập được
3 Giai đoạn phân tích và dự báo thống kê
Như vậy, thống kê có hai lĩnh vực:
- Thống kê mô tả bao gồm các phương pháp thu thập, trình bày dữ liệu và tính toán cácđặc trưng nhằm mô tả đối tượng nghiên cứu
- Thống kê suy diễn bao gồm các phương pháp mô hình hóa trên các dữ liệu liên quan sát để đưa ra các suy diễn về tập hợp các đơn vị được nghiên cứu Thống kê mô tả và thống kê suy diễn tạo thành thống kê ứng dụng, còn thống kê toán là lĩnh vực nghiên cứu
cơ sở lí thuyết của khoa học thống kê
Các lý thuyết áp dụng làm bài báo cáo :
Bảng tần số
Bảng tần số là một bảng tổng hợp, trình bày dữ liệu bằng cách phân chia chúng thành từng nhóm (lớp) khác nhau Bảng tần số bao gồm ba cột:
• Cột thứ nhất mô tả các biểu hiện hoặc giá trị (hay khoảng giá trị) của dữ liệu
• Cột thứ hai mô tả tần số tương ứng với các biểu hiện hoặc giá trị đó
Trang 8• Cột thứ 3 là tần suất (tỉ lệ %)
Có 3 cách lập bảng tần số
1 Bảng tần số cho dữ liệu định tính
2 Bảng tần số cho dữ liệu định lượng
3 Bảng tần số kết hợp hai tiêu thức thống kê
Mode
Khái niệm: mốt là giá trị xuất hiện nhiều nhất trong một dãy số, kí hiệu là M0
Cách xác định:
• Trường hợp dữ liệu không phân nhóm: mốt có giá trị có tần số lớn nhất
• Trường hợp dữ liệu phân nhóm có khoảng cách đều nhau: trước hết cần xác định nhóm chứa mốt là nhóm có tần số lớn nhất trị số của mốt được xác định gần đúng bởi công thức:
( )
1 min
Trong đó: Mo – Ký hiệu của Mốt
xMo min – Giới hạn dưới của tổ có mốt hMo – Trị số khoảng cách tổ có mốt fMo – Tần số của tổ có mốt
f(Mo – 1) – Tần số của tổ đứng trước tổ
Trang 9Nhưng việc xác định nhóm có mốt không căn cứ vào tần số mà căn cứ vào mật độ phân phối (Mật độ phân phối = tần số : khoảng cách nhóm)
Trung vị
Trong một tập dữ liệu đã sắp xếp theo thứ tự tăng dần thì trung vị, kí hiệu Me , là giá trị đứng giữa của tập dữ liệu Nói cách khác, trung vị chia dãy số làm hai phần, mỗi phần có
số đơn vị tổng thể bằng nhau
a Đối với dãy số lượng biến không có khoảng cách :
Me là giá trị của lượng biến ở vị trí thứ
- Giới hạn dưới của tổ có trung vị
hMe – Khoảng cách tổ có trung vị
Ʃfi – Tổng các tần số của dãy số lượng biến
S(Me - 1) – Tần số tích lũy của các tổ đứng trước tổ có số trung vị
fMe – Tần số của tổ có trung vị
Tứ phân vị
Trang 10Tứ phân vị chia dãy số lượng biến thành bốn phần, mỗi phần có số đơn vị bằng nhau Cách xác định:
Đối với dữ liệu không phân nhóm: dãy số lượng biến có ba tứ phân vị là
Q1: tứ phân vị thứ nhất là lượng biến đứng ở vị trí thứ
Q2: tứ phân vị thứ hai chính là số trung vị, đứng ở vị trí thứ
Q3 : tứ phân vị thứ ba là lượngbiến đứng ở vị trí thứ
Nếu n+1 không chia hết cho 4 thì tứ phân vị được xác định bằng cách thêm vào Chẳng hạn, với n=12 (đơn vị), ta có = 3 , = 9 Do đó, tứ phân vị thứ nhất bằng lượng biến ở vị trí thứ ba cộng với ¼ giá trị chênh lệch giữa lượng biến ở vị trí thứ ba và thứ tư Còn tứ phân vị thứ ba bằng với lượng biến ở vị trí thứ chín cộng với ¾ giá trị chênh lệch giữa lượng biến ở vị trí thứ chín và thứ mười
Khoảng biến thiên
Kí hiệu R, là chênh lệch giữa giá trị lớn nhất và giá trị nhỏ nhất của dãy lượng biến:
R = Xmax – Xmin
Trong đó: R – khoảng biến thiên
Xmax , Xmin – Lượng biến max, min
Khoảng biến thiên càng nhỏ thì tổng thể càng đồng đều, số trung bình càng có tính đại diện cao và ngược lại
Nhược điểm của khoảng biến thiên là chỉ phụ thuộc vào giá trị lớn nhất và giá trị nhỏ nhất của dãy lượng biến
Độ trải giữa
Kí hiệu
RQ , là sự chênh lệch giữa tứ phân vị thứ ba và tứ phân vị thứ nhất:
RQ = X3 – X1
Độ trải giữa thể hiện độ phân tán của 50% dữ liệu giữa của dãy số
Độ lệch tuyệt đối trung bình
Trang 11xi : giá trị lượng biến thứ i
Ta đã biết, độ lệch tiêu chuẩn đo lường sự biến thiên của tập dữ liệu Khi hai tập dữ liệu
có cùng giá trị trung bình thì tập dữ liệu nào có độ lệch tiêu chuẩn lớn hơn sẽ biến thiên nhiều hơn Tuy nhiên, nếu hai tập dữ liệu đó có giá trị trung bình khác nhau thì không thểkết luận được điều này bằng cách so sánh hai độ lệch tiêu chuẩn Lúc đó hệ số biến thiên được sử dụng để đo lường mức độ biến động tương đối của những tập dữ liệu có giá trị trung bình khác nhau
Công thức tính hệ số biến thiên cho tập dữ liệu tổng thể:
Công thức tính hệ số biến thiên cho tập dữ liệu mẫu:
CV = x 100%
Ước lượng tỉ lệ tổng thể
Giả sử tổng thể có 2 loại phần tử, 1 trong 2 loại có tính chất A nào đó Ta cần ước lượng
tỉ lệ P các phần tử có tính chất A của tổng thể với đội tin cậy 1-cho trước.Giả sử ta có mộtmẫu ngẫu nhiên gồm n phần tử của tổng thể (n >=40) và PP là tỉ lệ các phần tử có tính chất
A trong mẫu
Khi đó độ chính xác được tính theo công thức:
Khoảng ước lượng của P là (PP - ; PP + )
Trang 12Ước lượng trung bình tổng thể
Giả sử tổng thể có phân phối chuẩn và có giá trị trung bình chưa biết Ta cần ước lượng với độ tin cậy 1- (95%)cho trước Ta cũng giả thiết rằng ta đã có một mẫu gồm n quan sátđược chọn từ tổng thể đó và đã tính được trung bình mẫu (1 ước lượng điểm của ), độ lệch mẫu hiệu chỉnh S Khi đó tùy trường hợp cụ thể, ta có phương pháp tìm khoảng ước lượng như sau:
a Trường hợp đã biết phương sai :
Độ chính xác được tính bởi công thức trong đó Z là biến ngẫu nhiên có phân phối chuẩn)= - và là hàm phân phối xác suất Laplace
Khoảng ước lượng của là -+
b Trường hợp chưa biết phương sai của tổng thể:
+ Nếu cỡ mẫu n30 thì (tổng thể có phân phối bất kì)
+Nếu cỡ mẫu n30 và tổng thể có phân phối chuẩn thì trong đó có phân phối Student với
n-1 và bậc tự do (tra bảng phân phối dòng n-1, cột )
Kiểm định giả thiết
Giả sử ta có hai mẫu được chọn ngẫu nhiên, độc lập từ hai tổng thể có phân phối chuẩn là
X và Y
Gọi , là kích thước của hai mẫu tương ứng ,;,,, lần lượt là trung bình của tổng thể, phươngsai của tổng thể, trung bình mẫu, phương sai mẫu hiệu chỉnh tương ứng với hai mẫu đó
Ta cần kiểm định giả thuyết: :=;:( là trị số cho trước) với mức ý nghĩa
a Trường hợp đã biết phương sai của 2 tổng thể thì giá trị kiểm định:
Z=
b Trường hợp chưa biết phương sai của 2 tổng thể mà , thì thay phương sai của
tổng thể bởi phương sai mẫu hiệu chỉnh trong công thức trên nghĩa là Z=
Trang 13c Trường hợp chưa biết phương sai của 2 tổng thể mà hoặc thì giá trị kiểm định
T = Z = trong đó
Từ ta tra bảng phân phối Student với bậc tự để tìm
Khi đó nếu > ta bác bỏ giả thuyết
Trang 14PHIẾU KHẢO SÁT
Đề tài khảo sát : Việc sử dụng và thời gian sử dụng Internet có ảnh hưởng đến kết quả
học tập của sinh viên Hoa Sen không ?
Câu 1: Giới tính ?
a Nam
b Nữ
Câu 2 : Bạn thường sử dụng Internet vào việc gì ?
a Online các trang mạng xã hội ( facebook , twitter , … )
Trang 16Từ bảng khảo sát => Online Facebook có tần số lớn nhất 68 sinh viên (45.334%)
Trang 17KHOẢNG BIẾN THIÊN :
Khoảng biến thiên càng nhỏ thì tổng thể càng đồng đều, số trung bình càng có tính đại diện cao
Độ lệch tuyệt đối trung bình càng nhỏ, tổng thể càng đồng đều, tính chất đại diện của số trung bình càng cao Độ lệch tuyệt đối trung bình có ưu điểm hơn khoảng biến thiên vì nóxét đến tất cả các lượng biến trong dãy số
5,956
BẢNG ĐỊNH LƯỢNG
Trị sốgiữa Khoảngcách Tần số Tần suất(%) tích luỹ (S)Tần số
Tần suấttích luỹ(%)
Trang 182 – 3
3 – 4
2.53.54.5
111
633219
42%
21.33%
12.67%
99131150
66%87.33%100%
Trang 21ƯỚC LƯỢNG SỐ GIỜ TRUNG BÌNH SINH VIÊN HOA SEN SỬ DỤNG
INTERNET VỚI ĐỘ TIN CẬY 95%
Gọi µ là số giờ trung bình sinh viên Hoa Sen sử dụng Internet
Tìm µ với độ tin cậy 1 – α = 95 % = 0,95
Gọi P là tỉ lệ sử dụng Internet >4 giờ / ngày
Ta ước lượng P với độ tin cậy 1 – α = 90% = 0,9
Ta có n = 150
Số sinh viên sử dụng Internet >4 giờ là : 19 (sinh viên)
Trang 22KIỂM ĐỊNH GIẢ THIÉT
Có ý kiến cho rằng thời gian sử dụng Internet của sinh viên Nam và sinh viên Nữ là như nhau Kiểm định giả thiết trên với mức ý nghĩa là 5% ?
Gọi µx và µy lần lượt là thời gian sử dụng Internet của sinh viên nam và sinh viên nữĐặt giả thuyết Ho: µx – µy = 0
Trang 23Vậy thời gian sử dụng Internet của sinh viên nam và sinh viên nữ là khác nhau
BẢNG ANOVA
Trong 150 sinh viên , sau khi khảo sát thu thập được kết quả như sau
Giá trị biến định tínhOnline
Trang 24TRA BẢNG PHÂN PHỐI F VỚI MỨC Ý NGHĨA = 0.05 TA CÓ FK-1,N-K,=F3,15.0.05 = 3.287
VÌ F< F3,15.0.05 nên ta chấp nhận H0
Trang 25Nguồn biến
thiên
tổng các độ lệch bình phương
bậc tự do Trung bình của các
độ lệch bình phương ( phương sai)
Giá trị kiểm định F
− Có thể giao lưu kết bạn, trao đổi kiến thức, học hỏi kinh nghiệm
− Giảm stress sau những giờ học tập căng thẳng bằng cách nghe nhạc, xem phim, chơi games…tìm hiểu những vấn đề khác mà mình quan tâm
− Việc nghiện mạng xã hội sẽ làm cho sinh viên dễ tách biệt với xã hội, sống trong thế giới ảo, không quan tâm đến những người xung quanh
− Có rất nhiều sinh viên sử dụng thời gian học tập thay gì lên mạng tìm kiếm thông tin học tập thì nói chuyện tán gẫu
Trang 26 Như vậy, Internet là “một con dạo 2 lưỡi” không thể phủ nhận internet là một công
cụ cực kì hữu ích nếu như chúng ta biết sử dụng nó đúng cách, đúng nơi đúng chỗ,internet giúp cho việc tìm kiếm thông tin học tập, trao đổi thông tin, kinh nghiệm với nhau một cách nhanh chóng tốn ít thời gian, chi phí Nhưng nếu không biết sử dụng internet hợp lý thì sẽ gây ra những hậu quả không lường, việc nghiện internet
ở sinh viên là một vấn đề hết sức quan trọng, sinh viên dành quá thời gian sử dụnginternet sao lãng việc học tập không dành thời gian để học tập từ đó gây ảnh hưởng rất lớn đến kết quả học tập ở sinh viên
Trang 27KẾT LUẬN
Không phũ nhận mặt tốt của Internet, Internet giúp chúng ta dễ dàng cập nhật thông tin trên thế giới Mặt khác Internet còn giúp chúng ta có thể giữ liên lạc với bạn bè qua Yahoo Messenger, Facebook, twitter,… Bên cạnh đó, Internet còn là một trong những công cụ giải trí tiện lợi nhất với đa dạng các loại trò chơi từ Game Online đến Game Offline mà từ đó con người có thể thư giãn sau hàng giờ làm việc Tuy nhiên, Internet có thể dễ dàng trở thành một cơn nghiện bởi chính các tính năng tốt của nó Con người có thể ngồi hàng giờ trước máy tính vì một bài báo hấp dẫn Sinh viên có thể ngồi hàng giờ với một trận đấu trên game Chính bởi như thế, Internet dần ló ra những khuyết điểm trênnhững ưu điểm Ai cũng phải thừa nhận rằng, việc sử dụng Internet là cần thiết trong cuộc sống tuy nhiên, chúng ta cần phải giới hạn và sử dụng Internet một cách hợp lý để
từ đó chúng ta không bị xao nhãng vào Internet Hãy tự đưa ra cho mình thời gian và kế hoạch sử dụng Internet một cách hợp lý