Một cách tổng quát, có thể định nghĩa: Thống kê là một nhành của toán học liên quan đến việc thu thập, phân tích và trình bày các dữ liệu.. Thang đo tỉ lệ là loại thang đo dùng cho các d
Trang 1-BỘ MÔN
NGUYÊN LÝ THỐNG KÊ
NHÓM 5
CHIỀU CAO TRUNG BÌNH CỦA SINH
VIÊN NỮ TẠI ĐH HOA SEN
GIÁO VIÊN HƯỚNG DẪN: LÊ THỊ THIÊN HƯƠNG
Năm học: 2011 - 2012
KHOA KINH TẾ THƯƠNG MẠI
Trang 2-BỘ MÔN
NGUYÊN LÝ THÔNG KÊ
NHÓM 5
CHIỀU CAO TRUNG BÌNH CỦA SINH
VIÊN NỮ TẠI ĐH HOA SEN
GIÁO VIÊN HƯỚNG DẪN: LÊ THỊ THIÊN HƯƠNG
Phần dành riêng cho Khoa:
Trang 3khỏe mạnh Ta đã biết chiều cao phụ thuộc khá nhiều vào gen di truyền Tuynhiên, đây không phải yếu tố quyết định hoàn toàn mà còn phụ thuộc vào nhiềuyếu tố khác nhau Để phát triển chiều cao tốt nhất ta cần hiểu thêm các yếu tốnào ảnh hưởng đến chiều cao Khi có điều kiện thuận lợi cho đủ tất cả các yếu
tố ta sẽ phát triển được chiều cao tối ưu của mình
Vì vậy, nhóm chúng tôi thực hiện đề án “CHIỀU CAO TRUNG BÌNHCỦA SINH VIÊN NỮ TẠI ĐH HOA SEN” nhằm đưa ra cái nhìn tổng quátnhất về chiều cao và các yếu tố ảnh hưởng đến chiều cao cũng như tìm ra biệnpháp để phát triển chiều cao cũng như nâng cao sức khoẻ để thanh thiếu niên cóthể học tập và làm việc thật hiệu quả
Trang 4Chúng tôi xin gửi lời cảm ơn chân thành đến cô Lê Thị Thiên Hương vànhững giúp đỡ, góp ý giúp chúng tôi hoàn thành đề tài này một cách tốt và hiệuquả nhất.
Nhóm chúng tôi cũng xin gửi lời cảm ơn đến khoa Kinh Tế Thương Mạitrường Đaị học Hoa Sen vì đã tạo cơ hội cho chúng tôi học tập một môn học cótính ứng dụng cao vào thực tiễn và hỗ trợ tốt cho khả năng tổng hợp, xử lý sốliệu cho chúng tôi
Tuy nhiên do những hạn chế về mặt kiến thức cũng như thời gian, nhómchúng tôi không tránh khỏi những sai sót Rất mong sự đánh giá và góp ý củacô
Chúng tôi chân thành cảm ơn
Nhóm thực hiện đề án
Trang 5
Trang 7
TRÍCH YẾU i
LỜI CẢM ƠN ii
NHẬN XÉT iii
DANH SÁCH SINH VIÊN iv
MỤC LỤC v
BẢNG PHÂN CÔNG CÔNG VIỆC vi
BẢNG BIỂU – HÌNH ẢNH vii
A MỞ ĐẦU 1
1 Cơ sở lý thuyết 1
2 Đối tượng, phạm vi nghiên cứu và phương pháp nghiên cứu 19
3 Câu hỏi nghiên cứu 22
4 Giả thuyết nghiên cứu 22
B NỘI DUNG 23
2 Một số yếu tố tác động đến chiều cao của sinh viên nữ Đại học Hoa Sen 27
3 Một số giải pháp nhằm phát triển chiều cao của sinh viên nữ Hoa Sen 29
C KẾT LUẬN 31 TÀI LIỆU THAM KHẢO b PHỤ LỤC c
Trang 8Họ tên Các công việc thực hiện
1 Trần Thị Muội Thu thập dữ liệu, viết báo cáo,tính toán
2 Lê Thụy Bích Thủy Thu thập dữ liệu,viết báo cáo,tính toán
3 Võ Thị Thanh Trúc Thu thập dữ liệu, tổng hợp số liệuchỉnh sửa báo cáo 4.Phạm Trịnh Huyền Trân Thu thập dữ liệu,tổng hợp số liệu
5.Phạm Trần Thiên Lý Thu thập dữ liệut,ổng hợp số liệu
6.Lê Quỳnh Như Thu thập dữ liệu,tổng hợp số liệu
7.Nguyễn Thị CẩmVân Thu thập dữ liệu viết báo cáo,tính toán 8.Nguyễn Thị Thanh Trúc Thu thập dữ liệu viết báo cáo,tính toán 9.Nguyễn Thị Nguyệt Hồng Thu thập dữ liệu,tổng hợp số liệu
Trang 9Hình 1: Biểu đồ thanh đứng thể hiện chiều cao của sinh viên nữ Đại học Hoa Sen 24
Hình 2: Biểu đồ thể hiện giờ bắt đầu ngũ của sinh viên nữ Đại học Hoa Sen 28
Hình 3: Biểu đồ thể hiện gen di truyền chiều cao của sinh viên nữ Đại học Hoa Sen 29
Bảng 1: Phương pháp thu thập thông tin 6
Bảng 2: Bảng dữ liệu thu thập 23
Trang 10A MỞ ĐẦU
1 Cơ sở lý thuyết
CHƯƠNG I GIỚI THIỆU MÔN HỌC
I.1 KHÁI NIỆM VÀ CHỨC NĂNG CỦA THỐNG KÊ
1 Khái niệm
Có thể hiểu khái niệm thống kê trên hai góc độ:
nghiên cứu mặt lượng trong mối liên hệ chặt chẽ với mặt chấtcủa các hiện tượng và quá trình kinh tế xã hội, phát sinh trongđiều kiện thời gian và địa điểm cụ thể
hiển thôn tin về đối tượng nghiên cứu
Một cách tổng quát, có thể định nghĩa: Thống kê là một nhành của toán
học liên quan đến việc thu thập, phân tích và trình bày các dữ liệu Đây
là một khoa học bao gốm một hệ thống các phương pháp từ việc thu thập,trình bày, tóm tắt dữ liệu đến các phương pháp phân tích và dự đoán, giúpcác nhà quản lý đưa ra các quyết định
2 Chức năng của thống kê
Quá trình nghiên cứu thống kê trải qua ba giai đoạn có quan hệ chặt chẽ vàmật thiết với nhau, trong đó gian đoạn trước làm tiền đề để thực hiện giaiđoạn sau
(1) Giai đoạn điều tra thống kê: bao gồm ghi chép, thu thập tài liệu thốngkê
(2) Giai đoạn tổng hợp và trình bày kết quả điều tra thu thập được
(3) Giai đoạn phân tích và dự báo thống kê
Như vậy, thống kê có hai lĩnh vực:
Trang 11 Thống kê mô tả bao gồm các phương pháp thu thập trình bày dữliệu và tính toán các đặc trưng nhằm mô tả đối tượng nghiêncứu.
các dữ liệu quan sát để đưa ra các suy diễn về tập hợp các đơn
vị được nghiên cứu
Thống kê mô tả và thống kê suy diễn tạo thành thống kê ứng dụng, cònthống kê toán là lĩnh vực nghiên cứu cơ sở lý thuyết của khoa học thống kê
I.2 CÁC KHÁI NIỆM CƠ BẠN CỦA THỐNG KÊ
1 Tổng thể , đơn vị tổng thể, mẫu
Tổng thể thống kê (hay tổng thể) là tập hợp tất cả các đối tượng mà
ta nghiên cứu các đơn vị (hay phần tử) tạo thành tổng thể được gọi là đơn vịtổng thể Mẫu là một bộ phận lấy ra từ tổng thể
2 Biến
Biến là đặc điểm của đơn vị tổng thể, được chia ra thành hai loại:
Biến định tính thể hiện tính chất của đơn vị được khỏa sát
Biến định lượng thể hiện bằng các số
3 Dữ liệu
Dữ liệu là kết quả quan sát được của các biến, giá trị nhận được cóthể thay đổi từ đơn vị này sang đơn vị khác Dữ liệu cũng được phận biệtthành hai loại: dữ liệu định tính và định lượng
4 Tiêu thức thống kê
Tiêu thức thống kê là khái niệm dùng để chỉ các đặc điểm của đơn
vị tồng thể mà ta nghiên cứu
a Tiêu thức định tính là tiêu thức phản ánh tính chất của đơn
vị tổng thể, không thể hiện trực tiếp bằng các con số
b Tiêu thức định lượng (còn gọi là tiêu thức số lượng) là tiêu
thức có biểu hiện trực tiếp bằng con số
Lượng biến có tể phân biệt thành hai loại:
Trang 12 Lượng biến rời rạc là lượng biến mà các giá trị có thể có
của nó là hữu hạn hoặc vô hạn và có thể đếm được
Lượng biến liên tục là lượng iến mà các giá trị có thể có của
nó lấp kín cả một khoảng trên trục số
Thông thường, các giá trị của lượng biến liên tục là các số có cả phầnnguyên và phần thập phân, còn giá trị của lượng biến không liên tục là các sốnguyên
Các tiêu thức định tính và định lượng chỉ có hai biểu hiện không trùng nhau
trên một tổng thề được gọi là tiêu thức thay phiên.
b Chỉ tiêu chất lượng là các chỉ tiêu biểu hiện tính chất, trình
độ phổ biến, quan hệ so sánh trong tổng thể
I.3 CÁC BẬC ĐO LƯỜNG VÀ THANG ĐO DỮ LIỆU
Để thực hiện nghiên cứu, trong thống kê người ta sử dụng bốn cấp bậc đolường theo mức độ thông tin tăng dần, đó là thang đo: định danh, thứ bậc,khoảng và tỉ lệ
1 Thang đo định danh (hay thang đo phân loại) là bậc thấp nhất,
không thể hiện sự hơn kém Thang đo này được sử dụng chocác dữ liệu định tính, chỉ khác biệt nhau về tên gọi
2 Thang đo thứ bậc thể hiện sự hơn kém của dữ liệu nhưng
không biết chính xác mức độ hơn kém đó Thang đo này cũngđược sử dụng cho các dữ liệu định tính
Trang 133 Thang đo khoảng thể hiện được mức độ hơn kém giữa các giá
trị đo lường, trong đó giá trị 0 chỉ là quy ước mà không có ýnghĩa Thang đo khoảng được xem là thang đo thứ bậc cókhoảng cách đều nhau Thang đo này được sử dụng cho các dữliệu định lượng
4 Thang đo tỉ lệ là loại thang đo dùng cho các dữ liệu định
lượng, có đầy đủ các tình chất của thang đo khoảng, torng đógiá trị 0 có nghĩa thật sự, cho phép lấy tỉ lệ so sánh giữa hai giátrị thu thập Đây là thang đo ở bậc cao nhất trong hệ thốngthang đo
Trên thực tế, vấn đề thang đo khá phức tạp và ta có thể áp dụng thang đođịnh tính đối với các tiêu thức định lượng và ngược lại, áp dụng thang đođịnh lượng cho tiêu thức định tính Ngay cả khi dữ liệu đã thu thập xong tacũng có thể chuyển đổi dữ liệu định lượng thành dữ liệu định tính
CHƯƠNG II THU THẬP VÀ TRÌNH BÀY DỮ LIỆU
II.1 THU THẬP DỮ LIỆU
1 Xác định dữ liệu cần thu thập
Quá trình nghiên cứu thống kê cần phải có nhiều dữ liệu Việc thu thập dữliệu đòi hỏi nhiều thời gian, công sức, chi phí Do đó cần phải tiền hành thuthập dữ liệu một cách hệ thống, đáp ứng được mục tiêu nghiên cứu trong khảnăng nguồn nhân lực, kinh phí và thời gian cho phép Muốn vậy phải xácđịnh rõ những dữ liệu nào cần thu thập, thứ tự ưu tiên của các dữ liệu này
2 Nguồn dữ liệu
Khi nghiên cứu, ta có thể sử dụng các dữ liệu từ những nguồn có sẵn, đãđược công bố hoặc chưa công bố, hay có thể tự mình đi thu tthập dữ liệumới
Dữ liệu từ nguồn có sẵn, thường đã qua tổng hợp, xử lý, gọi là dữ liệu thứcấp
Dữ liệu thu thập trực tiếp từ các đối tượng nghiên cứu gọi là dữ liệu sơ cấp
Trang 14a Nguồn dữ liệu thứ cấp khá đa dạng, có thể là:
Các báo cáo nội bộ cơ quan, doanh nghiệp: các số liệubáo cáo về tình hình sản xuất, tiêu thụ, tài chính,…
Chính phủ: dân số, việc làm, mức sống dân cư, tàinguyên,…
b Nguồn dữ liệu sơ cấp
Dữ liệu sơ cấp được thu thập thông qua các cuộc điều tra khảo sát
Căn cứ vào tính liên tục hay không liên tục của việc ghi chép dữ liệu,người ta chia ra thành điều tra thường xuyên hay không thường xuyên
số liệu về hiện tượng nghiên cứu một cách có hệthồng, theo sát quá trình biến động cùa hiện tượng
ghi chéo chỉ khi cần có nhu cầu cần nghiên cứu hiệntượng dữ liệu điều tra không thường xuyên phản ánhtrạng thái của hiện tượng tại một thường điểm nhấtđịnh
Căn cứ vào phạm vi khảo sát, người ta lại chia ra thành điều tra toàn
bộ và không toàn bộ
liệu trên tất cả các đọn vị của tổng thể
một số đơn vị được chọn ra từ tổn thể đang nghiêncứu
3 Các phương pháp thu thập dữ liệu sơ cấp
a Thu thập trực tiếp
Trang 15 Phỏng vấn trực tiếp
b Thu thập gián tiếp
Ưu điểm, nhược điểm của các phương pháp thu thập thông tin trên đây cóthể tóm tắt trong bảng sau:
Bảng 1: Phương pháp thu thập thông tin
thư
Phỏng vấn qua Tel
Phỏng vấn trực tiếp
Tốc độ thu thập thông
Tỉ lệ cuâ hỏi được trả
ngẫu nhiên đơn giản, chọn mẫu hệ thống, chọn mẫu phân tầng, chọnmẫu cả khối hay nhiều giai đoạn
mẫu thuận tiện, lấy mẫu định mức, lấy mẫu phán đoán Mẫu phi xácsuất không đại diện được cho toán bộ tổng thể nhưng được chấp nhậntrong nghiên cứu khám phá và trong kiểm định giả thuyết
II.2 TRÌNH BÀY DỮ LIỆU
Trang 161 Bảng tần số
Bảng tần số là một bảng tổng hợp, trình bày dữ liệu bằng cách phân chiachúng thành từng nhóm (lớp) khác nhau Bảng tần số thường bao gồm bacột:
Cột thứ nhất mô tả các biểu hiện hoặc các giá trị (hay khoảng giá trị)của dữ liệu
Cột thứ hai mô tả tần số tương ứng với các biểu hiện hoặc giá trị đó
Cột thứ ba là các tần suất (tỉ lệ %)
a Cách lập bảng tần số cho dữ liệu định tính
Đối với các dữ liệu định tính như giới tính, nhành học,…, ta sẽ lập bảng tần
số gồm các thông tin sau đây:
Cột thứ nhất liệt kê tất cả các biểu hiện có thể có của tập dữ liệu
Cột thứ hai ghi tần số (số lần từng biểu hiện đó xuất hiện trong tập dữliệu) tổng của cột tần số phải bằng số phần tử của tập dữ liệu
Cột thứ ba ghi tần suất (bằng cách lấy tần số chia cho số phần tử củatập dữ liệu và nhân với 100%) Tổng của cột tần suất phải bằng 100%
b Cách lập bảng tần số cho dữ liệu định lượng
Có hai trường hợp: dữ liệu có ít giá trị và dữ liệu co nhiều giá trị
(1) Trường hợp dữ liệu có ít giá trị: Bảng tần số cũng có ba cột tương tựtrường hợp dữ liệu định tính, nhưng cột thứ nhất ghi các giá trị (lượng,biến) của dữ liệu
(2) Trường hợp dữ liệu có nhiều giá trị: Trước hết ta phân nhóm cho cácgiá trị rồi mới lập bảng tần số trên cơ sở dữ liệu đã phân nhóm
Trên thực tế, người ta thường phân nhóm với khoảng cách đều nhau
Giả sử mẫu dữ liệu có n phần tử, giá trị lớn nhất, nhỏ nhất của dữ liệu lần lượt là X max , X min Gọi k là số nhóm cần chia và h là khoảng cách giữa các
nhóm
Khi đó, người ta thường xác định k và h bới công thức:
Trang 17k =3√2 n , h=
Xmax−Xmink
Một số điều kiện phải tuân thủ khi phân nhóm:
Tất cả các nhóm phải bảo đảm bao quát hết tất cả các giá trị của mẫu
số liệu
Chú ý: Trong bảng tần số đôi khi người ta còn thêm vào cột tần số tích lũy
(hoặc tần suất tích lũy) thể hiện số lần quan sát (hoặc % số lần quan sát)cộng dồn đến giới hạn tr6en của một nhóm nào đó Nói cách khác, tần sốtích lũy cho thấy có bao nhiêu quan sát bằng hoặc nhỏ hơn một vị trí nào đócủa biến khảo sát
(3) Phân nhóm mở
Ngoài cách phân nhóm như trên ta còn có thể phân nhóm mở, trong đó nhómđầu tiên không có giới hạn dười và nhóm cuối cùng không có giới hạn trên,các nhóm còn lại có khoảng cách đều hoặc không đều nhau Mục đích củaphân nhóm mở là để nhóm đầu tiên và nhóm cuối cùng chứa các đơn vị cógiá trị đột biến và tránh việc lập quá nhiều tổ khi tính toán đối với phânnhóm mở người ta quy ước lấy khoảng cách của nhóm mở bằng khoảng cáchcủa nhóm gần nó nhất
c Cách lập bảng tần só kết hợp hai tiêu thức thống kê
Bảng tần số có thể có dùng để mô tả hai tiêu thức thống kê Ngoài ra bảngkết hợp này có thể được xoay theo chiều khác, hoặc tách riêng thông tin vềtần số, tần suất thành hai bảng riêng biệt
2 Đồ thị thống kê các loại
a Đồ thị thống kê cho dữ liệu định lượng
(1) Biểu đồ phân phối tần số
Trang 18Biểu đồ phân phối tần số (Histogram) được sử dụng để chuyển hóa thông tintr6en bảng tần số thành hình ảnh trực quan Đây là một loại đổ thị biểu diễn
sự phân phối tần số bằng các cột sao cho diện tích của cột tỉ lệ với tần số
(2) Đa giác tần số
Phương pháp thứ hai để biểu diễn phân phối tần số bằng đồ thị là dùng đagiác tần số để vẽ đa giác này, ta nối các trung điểm của cạnh đỉnh các cộttrong Histogram lại với nhau bằng các đoạn thẳng muốn đưởng biểu diễnkhông có vẽ lơ lửng trên không, ta thêm vào hai bên của Histogram hainhóm có tần số bằng 0
(3) Biểu đồ nhánh lá
Biểu đồ nhánh và lá (còn gọi là biểu đồ thân và lá) là một công cụ để tómlược và trình bày tập dữ liệu, giúp người xem thấy được dữ liệu gốc và cáchthức phân tán nó Để trình bày dữ liệu theo phương pháp nhánh và lá, mỗi trị
số được tách thành hai phần:
được đặt ở cột đầu tiên theo thứ tự tăng dần Số nhánh được chọn saocho nó có ít nhánh so với số quan sát (số lá) Thông thường số nhánhtrong khoảng từ 5 đến 20 là vừa
thứ tự tăng dần cũng có tể chia đôi một nhánh thành nhánh trên vànhánh dưới khi có quá nhiều lá
b Đồ thị thống kê cho dữ liệu định tính
(1) Biểu đồ dạng thanh (thanh đứng hay thanh ngang)
Trên biểu đồ này, mỗi thanh đại diện cho một phân loại của biến (tiêu thứcthống kê) mà ta quan tâm, chiều dài của thanh thể hiện tần số của các quansát thuộc về phân loại đó Còn chiều rộng của các thanh bằng nhau
Không nên nhầm lẫn giữa Histogram với biểu đồ thanh đứng đây là haicông cụ thống kê khác nhau, thể hiện hai loại dữ liệu định lượng, định tính.Giữa các thanh của Histogram không có khoảng cách, còn giữa các thanh
Trang 19của biểu đồ dạng thanh phải có khoảng cách vì mỗi thanh là một biểu hiệncủa biến phân loại.
(2) Biểu đồ hình tròn
Thường dùng dể mô tả kết cuấ (%) của vấn đề đang nghiên cứu Trên biểu
đồ, toàn bộ diện tích hình tròn dược chia thành nhiều mạnh nhỏ hỉnh rẻ quạt,diện tích mỗi mảnh tương ứng vối tỉ lệ của pahn6 loại mà nó đại diện trongtoàn thể và manh một màu khác nhau Thứ tự của các phân loại (theo chiềukim đồng hồ) là thứ tự nó được sắp xếp trong bảng tổng hợp
CHƯƠNG III TÓM TẮT DỮ LIỆU – BẢNG CÁC ĐẠI LƯỢNG THỐNG KÊ MÔ TẢ
Đối với dữ liệu định lượng, chúng ta có thể tóm tắt tốt hơn khi số lượngdữliệu lớn, đó là dùng các đại lượng thống kê mô tả Các đại lượng này đượcchia thành hai nhóm: nhóm các đại lượng thể hiện mức độ tập trung của dữliệu và nhóm thể hiện độ phân tán của dữ liệu Ở nhóm thứ nhất ta có trungbình cộng (được sử dụng nhiều nhất), mốt, turng vị Ở nhóm thứ hai ta cókhoảng biến thiên, độ lệch tuyệt đối bình quân, phương sai, độ lệch chuẩn(được sử dụng nhiều nhất) và hệ số biến thiên
III.1 CÁC ĐẠC TRƯNG ĐO LƯỜNG KHUYNH HƯỚNG TẬP TRUNG
1 Trung bình cộng (Arithmetic mean)
Trung bình cộng được xác định bằng cách cộng tất cả các giá trị của từngphần tử (các quan sát), sau đó đem chia cho tổng số phần tử (tổng số quansát)
Có hai loại turng bình cộng là trung bình cộng đơn giản (mean) và trung bìnhcộng có trong số (weighted mean)
a Trung bình cộng đơn giản
Trung bình tổng thể:
Trang 20Giả sử tổng thể có N phần tử (quan sát), X i là giá trị của phần tử thứ i Khi
Giả sử mẫu có n phần tử (hay còn nói cỡ mẫu là n), khi đó trung bình cộng
của mẫu (hay trung bình mẫu) là X =
Đây là trường hợp đặc biệt của trung bình cộng đơn giản khi giá trị X i
xuất hiện nhiều lần Giả sử giá trị X i xuất hiện fi lần, i = 1, 2,…, k (ta nói
f i là trọng số hay tần số của giá trị X i ) Khi đó,
Chú ý: trường hợp dữ liệu phân nhóm có khoảng cách thì turng bình mẫu
được tính gần đúng bởi công thức
giữa của các nhóm i ( X imax,X i
min là giới hạn trên, giới hạn dưới của nhóm i)
và f i là tần số của nhóm i
c Đặc điểm của trung bình cộng
Trang 21Trung bình cộng thường rất nhạy cảm với các đột biến (giá trị quá lớnhoặc quá nhỏ), giá trị trung bình sẽ kém tiêu biểu nếu trong dãy số có các giátrị đột biến.
h M olà khoảng cách của nhóm chứa M0 M o; f M0−1 f M o−1là tần số của
nhóm đứng trước nhóm chứa M0 M o; f M0 f M olà tần số của nhóm chứa
M0 M o; f M
0 +1 f M o+1là tần số của nhóm đứng sau nhóm chứa M0 M o
(3) Trường hợp dữ liệu phân nhóm có khoảng cách không đều: Mốt vẫn
được tính theo công thức (5) nhưng việc xác định nhóm có mốt khôngcăn cứ vào tần số mà căn cứ vào mật độ phân phối (Mật độ phân phối =Tần số: khoảng cách nhóm)