Một cách tổng quát ta đi đến định nghĩa về thống kê như sau: thống kê là hệ thốngcác phương pháp dùng để thu thập, xử lý và phân tích các con số mặt lượng củanhững hiện tượng số lớn để t
Trang 1BỘ Y TẾ TRƯỜNG CAO ĐẲNG KỸ THUẬT Y TẾ II
BÀI TIỂU LUẬN
Đề Tài: : đi u tra tình hình s c kh e và nh p tim c a 200 sinh ều tra tình hình sức khỏe và nhịp tim của 200 sinh ức khỏe và nhịp tim của 200 sinh ỏe và nhịp tim của 200 sinh ịp tim của 200 sinh ủa 200 sinh
viên 4 l p kỹ thu t y h c ớp kỹ thuật y học ật y học ọc
ĐÀ NẴNG - 2013
Trang 2PHẦN I GIỚI THIỆU MÔN HỌC
Trong đời sống hiện nay, Thống kê đang ngày càng trở nên cần thiết và quan trọng đối với mọi ngành kinh tế xã hội, một công cụ quan trọng trong công việc của cácnhà chuyên môn thuộc nhiều ngành khác nhau: y tế, tâm lý, giáo dục, xã hội học,
kỹ thuật, vật lý vv Thống kê cũng là một phần quan trọng trong các hoạt độngthường ngày trong xã hội như kinh doanh, công nghiệp, và chính quyền Thống kêgiúp ta phân tích các số liệu một cách khách quan và rút ra nhiều thông tin ẩn chứatrong các số liệu đó Để hiểu được điều đó, chúng ta cần biết trình bày các số liệuthống kê, cách tính các số đặc trưng của các số liệu này và hiểu ý nghĩa của chúng
Để đáp ứng yêu cầu của cuộc sống hiện đại thì thống kê là điều không thể thiếu đốivới bất kỳ ai, dù công việc của người đó có liên quan trực tiếp đến các phươngpháp thống kê hay không
Thuật ngữ “thống kê” có thể hiểu theo hai nghĩa:
Thứ nhất, thống kê là các số liệu thu thập để phản ánh các hiện tượng kinh tế - xãhội, tự nhiên, kỹ thuật… Chẳng hạn như sản lượng các loại sản phẩm chủ yếu đượcsản xuất trong nền kinh tế trong một năm nào đó; mực nước cao nhất hay thấp nhấtcủa một dòng sông tại một địa điểm nào đó trong năm
Thứ hai, thống kê là hệ thống các phương pháp được sử dụng để nghiên cứu cáchiện tượng kinh tế - xã hội, tự nhiên, kỹ thuật Công việc thống kê bao gồm nhiềuhoạt động trong đó có thể tóm tắt thành các mục lớn như sau:
Thu thập và xử lý số liệu
Điều tra chọn mẫu
Nghiên cứu mối liên hệ giữa các hiện tượng
Dự đoán
Trang 3 Nghiên cứu các hiện tượng trong hoàn cảnh không chắc chắn
Ra quyết định trong điều kiện không chắc chắn
Một cách tổng quát ta đi đến định nghĩa về thống kê như sau: thống kê là hệ thốngcác phương pháp dùng để thu thập, xử lý và phân tích các con số (mặt lượng) củanhững hiện tượng số lớn để tìm hiểu bản chất và tính quy luật vốn có của chúng(mặt chất) trong điều kiện thời gian và không gian cụ thể
Trong thực tế, thường phải nghiên cứu một tập hợp các phần tử đồng nhất theo mộthay nhiều dấu hiệu định tính hoặc định lượng đặc trưng cho các phần tử đó Chẳnghạn một doanh nghiệp phải nghiên cứu tập hợp các khách hàng của nó thì dấu hiệuđịnh tính có thể là mức độ hài lòng của khách hàng đối với sản phẩm hoặc dịch vụcủa doanh nghiệp đó, còn dấu hiệu định lượng là nhu cầu của khách hàng về sốlượng sản phẩm của doanh nghiệp
Để nghiên cứu tập hợp các phần tử này theo một dấu hiệu nhất định đôi khi người
ta sử dụng phương pháp nghiên cứu toàn bộ, tức là thống kê toàn bộ tập hợp đó vàphân tích từng phần tử của nó theo dấu hiệu nghiên cứu Chẳng hạn để nghiên cứudân số của một nước theo các dấu hiệu như tuổi tác, trình độ văn hóa, địa bàn cưtrú, cơ cấu nghề nghiệp… có thể tiến hành tổng điều tra dân số và phân tích từngngười theo các dấu hiệu trên, từ đó tổng hợp thành dấu hiệu chung cho toàn bộdân số của nước đó Tuy nhiên trong thực tế việc áp dụng phương pháp này gặpphải những khó khăn chủ yếu sau:
Nếu quy mô của tập hợp quá lớn thì việc nghiên cứu toàn bộ sẽ đòi hỏi nhiềuchi phí vật chất và thời gian
Nhiều khi cũng do quy mô của tập hợp quá lớn nên có thể xảy ra trường hợptính trùng hoặc bỏ sót các phần tử của nó
Trang 4PHẦN II: MỤC TIÊU BÀI TIỂU LUẬN
Trình bày các khái niệm cơ bản về toán thống kê như tổng thể, mẫu, kích
thước mẫu Trình bày các số liệu thu thập được và tính các số đặc trưng của
mẫu Phân biệt được mẫu, mẫu ngẫu nhiên và mẫu cụ thể
Giải được các bài toán liên quan đến vấn đề trong thực tế và y học qua lý
thuyết thống kê Cụ thể là đề tài của bài tiểu luận
Vận dụng, liên hệ toán học trong đời sống thực tiễn và hỗ trợ cho các môn
học khác, giúp cho sinh viên có cơ sở kiến thức để thực hành nghiên cứu
khoa học sau này
Rèn luyện tư duy logic, suy luận và các kỹ năng phân tích , tổng hợp và
khái quát trong khoa học
Bài tiểu luận có mục tiêu là điều tra tình hình sức khỏe và số nhịp tim của
các học sinh trong trường Qua đó đưa ra các kết luận về thong số thống kê
Liên hệ với thực tế về nhịp tim và tình hình sức khỏe để cung cấp thông tin
cho sinh viên
Đưa ra các giải pháp để giữ cho sức khỏe và nhịp tim bình thường
Trang 5
Mỗi đối tượng của tổng thể được gọi là một phần tử của tổng thể.
Số các phần tử của tổng thể được gọi là kích thước của tổng thể và ký hiệu là N.Chẳng hạn cần khảo sát chiều cao trung bình của học sinh tiểu học việt nam, thìtổng thể là tất cả các học sinh tiểu học việt nam Khảo sát số họ có con dưới 1 tuổitrong thành phố đà nẵng thì tổng thể là tập hợp các hộ gia đình sống trong một mộtđịa phương nào đó
Phương pháp nghiên cứu toàn bộ phần tử của tổng thể thường chỉ áp dụng cho cáctập hợp không có nhiều phần tử, có thể biết đầy đủ thông tin về mọi phần tử củatổng thể
Có thể vì số phần tử của tổng thể quá lớn (có khi là vô hạn), hoặc việc nghiên cứumọi phần tử của tổng thể tốn nhiều thời gian, chi phí, …, cũng có thể việc nghiêncứu gây ảnh hưởng nhất định đến phần tử Nói chung vì lý do nào đó mà ta khôngthể hoặc không cần phải khảo sát dấu hiệu H trên mọi phần tử của tổng thể Khi đóngười ta dùng phương pháp nghiên cứu mẫu
1.2.Mẫu.
Tập hợp một số đối tượng được lấy ra từ tổng thể được gọi là một mẫu Mỗi đối
Trang 6tượng của mẫu gọi là một phần tử của mẫu Số các phần tử của mẩu được gọi làkích thước mẩu và ký hiệu là n
Chẳng hạn cần khảo sát chiều cao của trẻ sơ sinh việt nam, người ta lấy ra 200 trẻ
sơ sinh việt nam để đo thì ta được một mẫu có kích thước n = 200
Từ kết quả nghiên cứu trên mẫu, ta đưa ra kết luận chung cho tổng thể (khái quáthóa), vì vậy việt lấy mẫu phải sao cho mẫu là hình ảnh thu nhỏ của tổng thể Muốnvậy, việc lấy mẩu phải đảm bảo nguyên tắc:
• Mẫu phải chọn ngẫu nhiên từ tổng thể, nghĩa là mọi phần tử của tổng thể đều cóthể rơi vào mẫu với cùng một xát xuất
• Các phân phối của mẫu phải được chọn độc lập nhau Chẳng hạn khi kiểm trachất lượng sản phẩm thì không được chọn những mẩu nhìn sạch, đẹp
1.3 các phương pháp lấy mẫu
- lấy mẫu ngẫu nhiên không hoàn lại: đánh số các cá thể trông tổng thể từ 1 đến N.rút ngẫu nhiên lần lượt n cá thể đưa vào một mẫu từ phương pháp lấy mẫu này tathấy: xác suất để cá thể đầu tiên có mặt trong mẫu là 1/N
- lấy mẫu ngẫu nhiên có hoàn lại: đánh số cá thể trong tổng thể từ 1 đến N rútngẫu nhiên từ tổng thể ra 1cá thể, ghi đặc tính của cá thể này rồi trả cá thể đó vềtổng thể, đặc tính vừa ghi được coi là phần tử đầu của mẫu Việc xác định các phần
tử tiếp theo của mẫu cũng được làm tương tự như trên Từ phương pháp lấy mẫungẫu nhiên có hoàn lại ta thấy : xác suất để mổi cá thể có mặt trong mẫu là 1/N.Mỗi cá thể có mặt nhiều lần trong mẫu
Trang 72 MẪU NGẪU NHIÊN.
Các tham số đặc trưng của tổng thể có thể xác định được một cách trực tiếp nếu ápdụng phương pháp nghiên cứu toàn bộ tổng thể song do những hạn chế người tathường áp dụng phương pháp mẫu
Phương pháp mẫu bằng cách chọn ra từ tổng thể n phần tử và chỉ tập trung nghiêncứu các phần tử đó mà thôi tập hợp n phần tử này được gọi là kích thước mẫu n Mẫu được chọn phải mang tính đại diện cho tổng thể, tức là phản ánh đúng đặcđiểm của tổng thể theo dấu hiệu nghiên cứu đó Mẫu được tạo lập với những giảthiết sau:
Lấy lần lượt từng phần tử vào mẫu
Mỗi phần tử được lấy vào mẫu một cách hoàn toàn ngẫu nhiên, tức làmọi phần tử của tổng thể đều có thể được lấy vào mẫu với khả năng nhưnhau
Các phần tử được lấy vào mẫu theo phương thức hoàn lại, tức là trướckhi lấy phần tử thứ k thì trả lại tổng thể thì trả lại phần tử thứ (k-1) mà ta
đã nghiên cứu xong (k=2, …, n)
Trong thực tế nếu kích thước của tổng thể khá lớn còn mẫu chỉ chiếm một phần rấtnhỏ của tổng thể thì phương thức lấy mẫu hoàn lại và không hoàn lại cho ta kết quảsai lệch không đáng kể Đặc biệt khi kích thước của tổng thể là vô hạn còn kíchthước của mẫu là hữu hạn thì không còn sự khác biệt giữa hai phương thức lấymẫu nói trên nữa Lúc đó có thể chọn lấy mẫu theo Phương thức không hoàn lại vàvẫn có thể giả thiết mẫu được chọn theo phương pháp hoàn lại
Giả sử mẫu kích thước n, mô hình hóa mẫu chọn được như sau:
Gọi Xi(i = )là giá trị của dấu hiệu χ đo lường được trên phần tử thứ i của mẫu
Trang 8Định Nghĩa: mẫu ngẫu nhiên kích thước n là tập hợp của n biến ngẫu nhiên độclập X1,X2,…,Xn được thành lập từ biến ngẫu nhiên X trong tổng thể nghiên cứu và
có cùng quy luật phân phối xác suất với x
Mẫu ngẫu nhiên thường được ký hiệu là: W = (X1, X2,…,Xn)
Mẫu ngẫu nhiên là tập hợp của n biến ngẫu nhiên, còn mẫu cụ thể lại là tập hợpcủa n giá trị cụ thể quan sát được khi thực hiện một phép thử đối với mẫu ngẫunhiên
3 CÁC PHƯƠNG PHÁP MÔ TẢ MẪU.
Giả sử từ tổng thể với biến ngẫu nhiên gốc X, rút ra một mẫu ngẫu nhiên kíchthước n và với quan sát cụ thể ta thu được các giá trị xi (I = 1, , k) Khi đó ta cóthể mô tả các số liệu bằng bảng phân phối, bằng hàm phân phối, bằng đồ thị
4 CÁC SỐ ĐẶC TRƯNG CỦA MẪU
4.1.Trung bình mẫu
Giả sử biến ngẫu nhiên gốc X trong tổng thể lập mẫu ngẫu nhiên kích thước n:
W = (X1, X2, , XN)
Trung bình mẫu là một thống kê, ký hiệu là được xác định: = i
Khi mẫu ngẫu nhiên nhận một giá trị cụ thể W = (X1, X2, , XN) thì trung bình mẫu
cũng nhận giá trị cụ thể bằng = i hoặc = ini
Trang 94.2 Trung vị mẫu
Trung vị mẫu, ký hiệu là Xe là giá trị nằm chính giữa, tức là giá trị chia các sốliệu mẫu thành hai phần bằng nhau
Với một mẫu cụ thể, ta sắp xếp các giá trị của mẫu theo thứ tự không giảm hoặc
không tang (giả sử không giảm là: x1 x2 … xn) thì trung vị mẫu là một số nằm
ở chính giữa mẫu, ký hiệu là Xe
● nếu n lẻ (n = 2k + 1) thì xe = xk + 1
● nếu n chẵn (n = 2k) thì xe =
4.3 Mốt mẫu
Mode, ký hiệu là Xo là giá trị có tần số lớn nhất trong dãy số liệu mẫu
Nếu các số liệu mẫu là ghép lớp theo bảng phân phối tần số thì mode được tính gần
đúng theo công thức Xo Xi-1 + b( )
trong đó là giới hạn dưới của lớp chứa mode; là tần số của lớp đứngtrước; ni-1 là tần số của lớp đứng sau; b là độ dài của lớp chứa mode
4.4 Khoảng biến thiên
Khoảng biến thiên, ký hiệu là R là R = Xmax – Xmin
Trang 10Nếu các số liệu mẫu được ghép lớp thì khoảng biến thiên là hiệu số giữa cận trêncủa lớp cuối cùng với cận dưới của lớp dầu tiên trong dãy phân phối các giá trị củamẫu
Việc tính khoảng biến thiên khá đơn giản song không mang lại nhiều thông tin về
độ phân tán của các giá trị mẫu
4.5 Phương sai mẫu và độ lệch chuẩn mẫu
Phương sai Aẫu, ký hiệu là S2 được xác định bằng công thức
Độ lệch chuẩn mẫu là căn bậc hai của phương sai mẫu: S =
Vì giá trị trung bình của S2 không bằng , nên với trường hợp mẫu có kích thước
nhỏ (n 30) thì thay cho phương sai người ta tính phương sai được xácđịnh bằng công thức:
Trang 11= 2 - , h là khoảng cách lớp
Ý nghĩa: Độ lệch chuẩn mẫu là đại lượng đặc trưng nhất cho độ phân tán các giá
trị của mẫu xung quanh trung bình mẫu
5 ƯỚC LƯỢNG CÁC THAM SỐ THỐNG KÊ
Giả sử cần phải nghiên cứu dấu hiệu χ trong tổng thể Như đã phân tích ở chươngtrước, một trong những mục tiêu cơ bản của việc nghiên cứu là xác định các tham
số đặc trưng của tổng thể như trung bình, phương sai, cơ cấu của tổng thể theo dấuhiệu nghiên cứu Đó là những chỉ tiêu tổng hợp để phân tích tổng thể cần nghiêncứu
Nếu dấu hiệu nghiên cứu trong tổng thể có thể xem như biến ngẫu nhiên X và giả
sử bằng phân tích lý thuyết đã xác định dạng phân phối xác suất của nó thì vấn đềxác định các tham số đặc trưng trong tổng thể sẽ được quy về bài toán xác định cáctham số đặc trưng của quy luật phân phối xác suất xác định biến ngẫu nhiên gốc
X Chẳng hạn, nếu đã biết được rằng, dấu hiệu nghiên cứu trong tổng thể có thểxem như biến ngẫu nhiên phân phối theo quy luật chuẩn thì bài toán đặt ra là phải
ước lượng (tức là xác định một cách gần đúng) các tham số kỳ vọng toán và
phương sai của nó vì các tham số trên hoàn toàn được xác định quy luật phânphối chuẩn và thực chất chúng chính là trung bình và phương sai của tổng thể Như vậy, bài toán ước lượng tham số có thể phát biểu như sau:
Trang 12Cho biến ngẫu nhiên X với quy luật phân phối xác suất đã biết, song chưa biết
tham số nào đó của nó Vậy vấn đề đặt ra là phải ước lượng (xác định một cách
gần đúng) giá trị
Phương pháp mẫu cho phép giải quyết bài toán trên bằng quy nạp thống kê nhưsau: Từ tổng thể nghiên cứu rút ra một mẫu ngẫu nhiên kích thước n và dựa vào đó
mà xây dựng một thống kê * dùng để ước lượng bằng cách này hay cách khác
Có hai phương pháp sử dụng * để ước lượng là phương pháp ước lượng điểm
và phương pháp ước lượng bằng khoảng tin cậy
5.1 Ước lượng điểm
Đây là cách tiếp cận quan trọng để nghiên cứu lý thuyết ước lượng Giả sử tổng thể
có tham số , sau khi khảo sát mẫu ta tính được thống kê, dựa vào các thống kê để
đưa ra một số T thay thế gọi là ước lượng điểm của Có nhiều ước lượng T cho
tham số , do đó phải lựa chọn dựa trên rất nhiều tiêu chuẩn như:
Ước lượng không chệch
Ước lượng hiệu quả
Ước lượng vững
5.2 Ước lượng khoảng
Đây là cách tiếp cận có nhiều ứng dụng trong các ngành khoa học đòi hỏi phảithường xuyên xử lý số liệu như sinh học, y học, hóa học, kinh tế… theo cách tiếp
Trang 13cận này sau khi tính các thống kê của mẫu quan sát ta đưa ra khoảng [ ] chứa
tham số Cận dưới và cận trên tính theo một quy tắc cụ thể dựa trên cácthống kê và dựa trên mức tin cậy P
Sau khi chọn mẫu ta đưa ra khoảng tin cậy [ ], nếu nằm trong [ ] thìkhoảng tin cậy đưa ra đúng, ngược lại là sai Như vậy mỗi khoảng tin cậy chỉ có
thể đúng hoặc sai, xác suất đúng là P, xác suất sai là = 1 – p
6 KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
6.1 Giả thuyết thống kê
Giả sử dấu hiệu nghiên cứu trong tổng thể có thể xem như biến ngẫu nhiên X Nếuchưa biết dạng phân phối xác suất của nó, song cơ sở để giả thuyết rằng X phânphối theo một quy luật A nào đó, người ta đưa ra giả thuyết: “biến ngẫu nhiên Xphân phối theo quy luật A”
Cũng có trường hợp dạng phân phối xác suất của X đã biết song tham số đặc trưng
của nó lại chưa biết, nếu có cơ sở để giả thuyết rằng giá trị của tham số bằng o (
o là hằng số đã biết), người ta đưa ra giả thuyết o
Khi nghiên cứu hai hay nhiều biến ngẫu nhiên độc lập thuộc các tổng thể khácnhau hay thuộc cùng một tổng thể, thường phải xét xem chúng độc lập hay phụthuộc nhau, các tham số đặc trưng của chúng có bằng nhau hay không… Nếu chưabiết một cách chắc chắn song có cơ sở để nhận định về các vấn đề đó cũng có thểđưa ra các giả thuyết tương ứng
Trang 14Từ đó có thể đưa ra định nghĩa sau:
Định nghĩa: Giả thuyết thống kê là giả thuyết về dạng phân phối xác suất của biếnngẫu nhiên, về các tham số đặc trưng của biến ngẫu nhiên hoặc về tính độc lập củacác biến ngẫu nhiên
Giả thuyết thống kê đưa ra được ký hiệu là H và được gọi là giả thuyết gốc
Khi đưa ra một giả thuyết thống kê, người ta còn nghiên cứu kèm theo nó mệnh đềmâu thuẫn với nó, gọi là giả thuyết đối và ký hiệu là K.Để khi giả thuyết H bị bác
bỏ thì thừa nhận giả thuyết đối K Khi đó H và K tạo nên cặp giả thuyết thống kê
Vì các giả thuyết thống kê có thể đúng hoặc sai nên cần kiểm định, tức là tìm ra kếtluận về tính thừa nhận được hay không thừa nhận được của giả thuyết đó Việckiểm định này gọi là kiểm định thống kê, vì nó dựa vào thông tin thực nghiệm củamẫu để kết luận
● Phương pháp chung để kiểm định một giả thuyết thống kê như sau:
Trước hết giả sử H đúng, từ đó dựa vào thông tin của mẫu rút ra từ tổng thể tìm
được một biến cố A nào đó, sao cho xác suất xảy ra biến cố A bằng bé đến mức
có thể, tức là có thể coi A không xảy ra trong một phép thử về biến cố này Lúc đó trên một mẫu cụ thể thực hiện một phép thử đối với biến cố A, nếu A xảy ra, điều
đó chứng tỏ H sai và bác bỏ nó; còn nếu A không xảy ra thì ta chưa có cơ sở để bác bỏ H, nêm phải chấp nhận giả thuyết cho đến khi có thông tin mới
● khi bác bỏ hay chấp nhận giả thuyết H ta có thể mắc phải hai loại sai lầm:
+ Sai lầm loại một: Bác bỏ giả thuyết H trong khi H đúng Ta thấy xác suất
mắc phải sai lầm loại này đúng bằng mức ý nghĩa ; sai lầm này có thể sinh ra do kích thước mẫu quá nhỏ, do phương pháp lấy mẫu…
Trang 15+ Sai lầm loại hai: Thừa nhận giả thuyết H trong khi giả thuyết H sai, Giả sử
xác suất mắc sai lầm loại 2 này là Sai lầm loại này có thể sinh ra do Giá trị thực
của tham số tổng thể, Mức ý nghĩa , Độ lệch chuẩn tổng thể , Cỡ mẫu n …
Ta thấy rằng sai lầm loại 1 và sai lầm loại 2 mâu thuẫn nhau, tức là với một mẫu kích thước n xác định thì không thể cùng một lúc giảm xác suất mắc hai loại sai
lầm nói trên được Khi ta giảm đi thì sẽ đồng thời làm tăng và ngược lại
Chẳng hạn nếu lấy = 0 thì sẽ không bác bỏ bất kỳ giả thuyết nào, kể cả giả thuyết
sai, như vậy sẽ đạt cực đại
Vì vậy người ta thường chọn trước giới hạn trên của xác xuất phạm sai lầm loại 1
là và tìm miền S sao cho xác suất phạm sai lầm loại 2 là nhỏ nhất
6.2 Các b ướp kỹ thuật y học ủa 200 sinh c c a m t bài toán ki m đ nh ột bài toán kiểm định ểm định ịp tim của 200 sinh
Bước 1: Phát biểu các giả thuyết H và đối thuyết K
Bước 2: định mức ý nghĩa α
Bước 3: Chọn tiêu chuẩn kiểm định ( Khi n >=30 tiêu chuẩn là phân phối
chuẩn, ngược lại khi n <30 tiêu chuẩn là phân phối Student )
Bước 4: Thiết lập miền bác bỏ H
Bước 5: Từ mẫu cụ thể đưa ra quyết định: chấp nhận hay bác bỏ H.
Trang 16PHẦN IV BÀI TẬP THỰC HÀNH
Đề Tài: điều tra tình hình sức khỏe và nhịp tim của 200 sinh viên 4 lớp kỹ thuật y
học , thu được số liệu sau đây
(lần/phút)
Số bệnhmắc phải
Trang 1867 Lê Văn Tiên 76 0