1. Trang chủ
  2. » Giáo Dục - Đào Tạo

CHƯƠNG 2: THỐNG KÊ potx

74 562 2

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 74
Dung lượng 737,21 KB

Nội dung

Chương 2 THỐNG Bài 1 THAM SỐ MẪU MỤC TIÊU 1. Trình bày được công thức định nghĩa và công thức tính các tham số mẫu. 2. Tính được các tham số mẫu và nêu được ý nghĩa của chúng. 1. CÁC KHÁI NIỆM  Khoảng số thực khoảng đóng [a, b] = {x là số thực : a ≤ x ≤ b} khoảng nửa đóng nửa mở [a, b) = {x là số thực : a ≤ x < b} hoặc (a, b] = {x là số thực : a < x ≤ b} khoảng mở (a, b) = {x là số thực : a < x < b}.  Ký hiệu tổng:  Tập hợp tổng quát và tập hợp mẫu Tập hợp tổng quát là tập hợp bao gồm tất cả các đối tượng cần nghiên cứu. Số phần tử của tập hợp tổ ng quát gọi là kích thước tập hợp tổng quát, ký hiệu là N. Vì các điều kiện hạn chế, thường lấy ra một mẫu để nghiên cứu. Tập hợp mẫu là tập hợp gồm các đố i tượng lấy ra để nghiên cứu. Số phần tử của tập hợp mẫu gọi là kích thước mẫu, ký hiệu n. Nói chung N ≥ n. 1 2 1 = = + + + ∑ n i n i x x x x 1 1 1 ( ) = = = + = + ∑ ∑ ∑ n n n i i i i i i i x y x y 1 1 = = = ∑ ∑ n n i i i i ax a x 1 . = = ∑ n i a n a Page 1 of 74 12/10/2012 file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm Cần lấy mẫu ngẫu nhiên, khách quan sao cho tính chất của tập hợp mẫu phản ánh đúng tính chất tập hợ p tổng quát. Có hai cách lấy các phần tử ra để nghiên cứu. Lấy có hoàn lại là lấy ra một phần tử để nghiên cứu rồi tr ả lại tập hợp mẫu. Kết quả các lần nghiên cứu sau không phụ thuộc các kết quả nghiên cứu trước đó, phép th ử độc lập. Lấy không hoàn lại là lấy ra một phần tử để nghiên cứu sau đó không trả lại tập hợp mẫu. Kết qu ả các nghiên cứu sau phụ thuộc kết quả các nghiên cứu trước, phép thử không độc lập.  Dấu hiệu nghiên cứu Khi nghiên cứu chỉ quan tâm xem xét một số mặt, một số tính chất của đối tượng nghiên cứu. Các đặ c tính, tính chất cần nghiên cứu gọi là dấu hiệu nghiên cứu. Có dấu hiệu nghiên cứu về chất, có dấu hiệ u nghiên cứu về lượng. Các dấu hiệu về chất được nghiên cứu khả năng xuất hiện của chúng, các dấu hiệu v ề lượng được tính các tham số mẫu. 2. SẮP XẾP SỐ LIỆU Khi tiến hành nghiên cứu, số liệu thu được theo thứ tự thời gian. Như vậy số liệu chưa có thứ tự theo giá trị. Trước khi tính các tham số mẫu, số liệu được sắp xếp theo thứ tự giá trị. Việc sắp xếp lại số liệu không làm thay đổi kết quả tính. Có những bài toán mà thuật toán đòi hỏi phả i giữ nguyên thứ tự thu được theo thời gian thì không được sắp xếp lại số liệu. Sắp xếp số liệu thành dãy tăng hoặc bằng gọi là dãy không giảm (1) Sắp xếp số liệu thành dãy giảm hoặc bằng gọi là dãy không tăng (2) Có thể sắp xếp số liệu thành dãy các giá trị khác nhau tăng dần tương ứng với tần số xuất hiện củ a chúng. với (3) Với những nghiên cứu có kích thước mẫu n rất lớn, để tính các tham số mẫu thuận tiện mà sai số không đáng kể, có thể phân chia số liệu thành nhiều lớp. Gọi k là số lớp cần phân chia : k ≥ 1 + 3,32 lgn. Gọi khoảng rộng của mỗi lớp là ∆x Như vậy sai số . Với ∆x đã biết, phân chia số liệu vào các lớp từ α i– 1 đến α i . 1 2 3 n x x x x ≤ ≤ ≤ ≤ 1 2 3 n x x x x ≥ ≥ ≥ ≥ 1 2 k x x x K 1 2 k m m m K k i i 1 m n = = ∑ x R x k ∆ ≤ x 2 ∆ δ = Page 2 of 74 12/10/2012 file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm Kết quả thu được dãy giá trị giữa các lớp tương ứng với tần số xuất hiện của lớp: Đôi khi từ số liệu thu được, chọn δ sao cho phù hợp với số liệu, từ đó có: ∆x = 2δ, sau đó phân chia số liệu vào các lớp như trên. Gọi x là áp lực động mạch phổi thì tâm thu bệnh nhân hẹp hai lá (mmHg). Đo 153 bệnh nhân, , . Lấy k = 9 . Sắp xếp số liệu vào 9 lớp được kết quả sau: Chú ý : Từ số liệu chia k lớp sẽ thành k + 1 lớp. Tính các tham số mẫu khi chia lớp sẽ có sai số. 3. CÁC THAM SỐ MẪU Trong phần này chỉ nêu các tham số mẫu thường dùng. Đó là trung bình mẫu, phương sai và độ lệ ch mẫu. 3.1. Trung bình mẫu  Định nghĩa và công thức tính theo (1) (4) theo (3) (5) . (6) Trong (6) với x 0 và ∆x tuỳ chọn. (α i-1 - α i ) 13 – 28 28 – 43 43 – 58 58 – 73 73 – 88 88 – 103 103 – 118 118 – 133 133 – 148 148 – 163 x i 20,5 35,5 50,5 65,5 80,5 95,5 110,5 125,5 140,5 155,5 m i 6 20 33 24 28 12 17 8 4 1 i i max x 157 ∀ = i i min x 15 ∀ = x R 157 15 142 = − = k 1 3,32lg153 8,2 ≥ + = 142 x 15,77 x 15 9 ∆ ≤ = ⇒ ∆ = 10 i i 1 m 153 = = ∑ x n i i 1 1 x x n = = ∑ k i i i 1 1 m x n = = ∑ k 0 i i 0 i 1 1 x x . m u x xu n = = + ∆ = + ∆ ∑ i 0 i x x u x − = ∆ Page 3 of 74 12/10/2012 file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm Từ (5) suy ra (6) bằng cách thay vào (5) Trung bình cộng là trị số bình quân của các giá trị khác nhau, nhưng thuộc cùng một loại.  có cùng đơn vị x i . Số thập phân của hơn số thập phân của x i một chữ số.  là tâm quần tụ của tập hợp mẫu.  Tính chất 3.2. Phương sai s 2 , độ lệch mẫu s  Định nghĩa và công thức tính theo (1) (7) theo (3) (8) (9) (10) trong đó với ∆x, x 0 tuỳ chọn, ∆x ≠ 0. Từ (8), sau khi bình phương và thay suy ra (9). Trong (9) thay d ẫ n đế n 0 . = ∆ + i i x x u x k k k 0 i i 0 i i i i 1 i 1 i 1 x 1 x m ( x.u x ) m u m n n n = = = ∆ ∆ + = + ∑ ∑ ∑ k 0 i i i 1 1 x x m u n = = + ∆ ∑ x x x i i 0 0 0 y x x y x x x y-x = + ⇒ = + ⇔ = i i x x y ( x 0) y x xy x x = ∆ ≠ ⇒ = ⇔ = ∆ ∆ ∆ i i i z y x z y x . = + ⇒ = + n 2 2 i i 1 1 s (x x) n 1 = = − − ∑ k 2 i i i 1 1 m (x x) n 1 = = − − ∑ 2 k k 2 i i i i i 1 i 1 1 n m x m x n(n 1) = =       = −       −     ∑ ∑ 2 2 k k 2 i i i i i 1 i 1 x n m u m u n(n 1) = =     ∆   = −       −     ∑ ∑ i 0 i x x u x − = ∆ k i i i 1 1 x m x n = = ∑ i i 0 x x.u x = ∆ + Page 4 of 74 12/10/2012 file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm s 2 = . (10) được chứng minh.  s 2 không cùng đơn vị với x i .  s = được gọi là độ lệch mẫu. s có cùng đơn vị và số thập phân với . Như vậy s 2 có số thập phân gấp hai số thập phân của s.  s 2 là trung bình của bình phương khoảng lệch giữa x i và cho nên gọi tắt là phương sai. s 2 hay s cho biết mức độ tản mạn của x i so với tâm của mẫu là như vậy cũng cho biết độ đại diện của cho các x i tố t hay không. Khi đo một đại lượng nhiều lần, s 2 và s cho biết độ chính xác của các giá trị đo được, s 2 hay s được xem là sai số của cách đo. s và cùng đơn vị, có cùng số thập phân. Người ta thường viết ± s đại diện cho mẫu thu được. Công thức (6) và (10) được sử dụng khi các x i lớn hoặc có số thập phân hoặc cách đều.  Tính chất khi X và Y là hai đại lượng độc lập.  Các công thức khác Trong một số trường hợp, phương sai được cho dưới dạng sau: đượ c xem là ph ươ ng sai lý thuy ế t DX c ủ a đạ i l ượ ng ng ẫ u nhiên khi n đủ l ớ n . với MX đã biết. (11) 2 k k 2 i i 0 i i 0 i 1 i 1 1 n m ( xu x ) m ( xu x ) n(n 1) = =       ∆ + − ∆ +       −     ∑ ∑ 2 k k k 2 2 2 2 i i 0 i i 0 i i i 1 i 1 i 1 k 2 0 i i 0 i 1 1 n x m u 2nx x m u (nx ) x m u n(n 1) 2nx x m u (nx ) = = = =    = ∆ + ∆ + − ∆ −      −      − ∆ −    ∑ ∑ ∑ ∑ 2 2 k k 2 i i i i i 1 i 1 x n m u m u n(n 1) = =     ∆   = −       −     ∑ ∑ 2 s x x , x x x x 2 2 i i 0 y x y x x s s = + ⇒ = 2 2 2 2 2 i x i y x y 2 x s y ( x 0) s s x s x x = ∆ ≠ = ⇔ = ∆ ∆ ∆ 2 2 2 i i i z x y z x y s s s = + ⇒ = + *2 2 1 1 ( ) = = − ∑ k i i i s m x MX n *2 s Page 5 of 74 12/10/2012 file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm . (12) là phương sai chệch của phương sai lý thuyết của đại lượng ngẫu nhiên. Cách viết (12) thường gặ p trong các công thức tính tham số của đường cong hồi quy và hệ số tương quan tuyến tính. 3.3. Phương sai của k dãy giá trị Trong các nghiên cứu đồng thời k đại lượng, số liệu được cho dưới dạng sau: Gọi là trung bình chung của k dãy, là trung bình của dãy thứ j (13) (14) Tuỳ thuộc k dãy giá trị của cùng một đại lượng hay của k đại lượng khác nhau sẽ có tương ứ ng hai ph ương sai.  Phương sai của k dãy giá trị của cùng một đại lượng (15) (16) 2 2 = − x x 2 * s 1 2 j k 1 2 j k 11 12 1j 1k 21 22 2 j 2k i1 i2 ij ik n 1 n 2 n j n k X X X X x x x x x x x x x x x x x x x x K K K K K K M M K M K M K K M M K M K M K K x j x j k,n ij j,i 1 1 x x N = = ∑ j n j ij j i 1 1 x x n = = ∑ j 1,k = 2 S k 2 2 j j j 1 1 S n (x x) k 1 = = − − ∑ j j 2 2 n k,n k ij ij j j 1 i 1 j,i 1 1 1 1 x x k 1 n N = = =             = −       −         ∑ ∑ ∑ Page 6 of 74 12/10/2012 file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm với , . là trung bình của bình phương khoảng lệch giữa trung bình của từng dãy và trung bình chung củ a k dãy Thực hiện bình phương công thức (15) Thu được công thức (16)  Phương sai của k dãy giá trị của k đại lượng khác nhau thuộc cùng một loại S 2 (17) (18) , với và B đã biết. là trung bình của bình phương các khoảng lệch giữa các giá trị trong dãy và trung bình của dãy. Thực hiện bình phương công thức (17) B C k 1 − − j 2 n k ij j j 1 i 1 1 B x n = =     =     ∑ ∑ j 2 k,n ij j,i 1 1 C x N =     =     ∑ 2 S 2 2 2 1 1 ( 2 ) 1 = = − + − ∑ k j j j j S n x x x x k 2 , 2 1 1 , 1 1 1 2 1 − = = =         = − +     −       ∑ ∑ ∑ j j n k n k ij ij j j i j i x x x Nx k n 2 2 , 1 1 , 1 1 1 1 1 = = =             = −       −         ∑ ∑ ∑ j j n k n k ij ij j j i j i x x k n N j k, n 2 2 ij j j, i 1 1 S (x x ) N k = = − − ∑ j j 2 k,n n k 2 i j ij j j,i 1 j 1 i 1 1 1 x x N k n = = =         = −     −       ∑ ∑ ∑ 2 A B S N k − = − j k,n 2 ij j,i 1 A x = = ∑ 2 S j k,n 2 2 ij j j, i 1 1 S (x x ) N k = = − − ∑ j k,n 2 2 ij j ij j j,i 1 1 (x 2x x x ) N k = = − + − ∑ Page 7 of 74 12/10/2012 file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm Công thức (18) được chứng minh. 3.4. Các tham số khác  Hệ số biến thiên C v ( 0 / 00 ) C v cho biết độ chính xác tương đối giữa s so với . C v là tỷ số, viết dưới dạng % hay 0 / 00 . , cho phép so sánh độ chính xác tương đối giữa các đại lượng không cùng đơn vị.  Số trung vị : là giá trị giữa của n giá trị đã sắp xếp  Số mốt M 0 M 0 = x i mà m i lớn nhất trong các m 1 , m 2 , , m k M 0 là giá trị hay gặp nhất trong k giá trị x 1 , x 2 , …, x k . Với số liệu chuẩn theo một nghĩa nào đấy thì M e = M 0 = Vậy M e , M 0 là các giá trị cũng cho biết tâm của tập hợp mẫu.  Trung bình nhân, Trung bình điều hoà. Khi nghiên cứu thu được dãy số liệu x 1 x 2 . . . x n . Đôi khi sử dụng trung bình nhân hoặc trung bình điều hoà trong xử lý số liệu. Công thứ c tính có dạng sau: Ví dụ: 1. Gọi X là áp lực động mạch phổi thời tâm trương người bình thường j j j 2 k,n n n k k 2 j ij ij j ij j j,i 1 j 1 i 1 j 1 i 1 1 1 x 2 x x n x N k n = = = = =         = − +     −       ∑ ∑ ∑ ∑ ∑ j j 2 k,n n k 2 i j ij j j,i 1 j 1 i 1 1 1 x x N k n = = =         = −     −       ∑ ∑ ∑ v s C x = x e M e M x g h 1 2 1 2 1 1 1 = = + + + n n n g x x x h x x x Page 8 of 74 12/10/2012 file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm Đo 30 người được kết quả sau: Tính các tham số của mẫu trên. Giải: Cách 1. Lập bảng tính theo (5) và theo (9) . Cách 2. Lập bảng kiểm tra, tính theo (6) và theo (10). Giá tr ị x i (mm Hg) 2 3 4 5 6 7 8 9 S ố ng ườ i m i 1 4 7 8 2 5 2 1 i x i m i m i x i m i 1 2 1 2 4 2 3 4 12 36 3 4 7 28 112 4 5 8 40 200 5 6 2 12 72 6 7 5 35 245 7 8 2 16 128 k = 8 9 1 9 81 ∑ ∑∑ ∑ 30 154 878 Chọn x 0 = 5 và ∆x = 1 dẫn đến x 2 x s 2 i x 154 x 5,133 5,1. 30 = = − % 2 2 2 x 1 2624 s [30 878 154 ] 3,0161 1,74 30 29 870 = × − = = − × % v 1,74 C 0,339 5,13 = = e 30 2 M x 5, = = 0 M 5 = x 2 x s i i i x -5 u = = x -5 1 Page 9 of 74 12/10/2012 file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm Các giá trị của và trùng với các kết quả trên. 2. Gọi X là lượng Protein huyết thanh người bình thường (g/l). Điện di 17 mẫu của 17 người thu đượ c kết quả sau: Tính các tham số của mẫu trên Giải: Lập bảng tính theo (6) và theo (10) với và . 3. Gọi X 1 , X 2 , X 3 , X 4 là thời gian hết ký sinh trùng sốt rét trong máu (giờ) của bốn nhóm bệ nh nhân điều trị theo bốn cách khác nhau. Kết quả nghiên cứu thu được số liệu sau: Giá trị x i (g/l) 6,9 7,2 7,6 8,2 8,5 Số người m i 2 3 5 6 1 X 1 18 37 46 46 46 51 62 78 85 90 X 2 38 41 41 42 43 44 45 50 50 52 X 3 36 48 50 52 58 60 60 68 74 74 36 38 40 42 48 60 62 70 72 72 1 5 4 5,133 5,1. 30 = + × = −x % 2 2 2 2 x 1 2624 s [30 88 4 ] 3,0161 1,74 30 29 870 = × − = = − × % x 2 x s x 2 x s i i x 7,5 u 0,1 − = i i x 8 v 0,1 − = 0,1 0,1 x = 7,5+ ×36 = 8+ ×(-49) = 7,71 17 17 2 2 2 2 2 2 2 x 0,1 0,1 0,1 ×7170 s = 17×498-36 = 17×563- 49 = = 0, 2636 = 0,51 17×16 17×16 272         x s 7,71 0,51(g / l) ± = ± v e 0 0,51 C 0,066, M 7,6, M 8,2 7,71 = = = = Page 10 of 74 12/10/2012 file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm [...]... không ? i u tra n i tư ng nghiên c u th y m có úng không ? Trên ây là nh ng bài toán ki m 1 GI THI T VÀ i tư ng có c tính A Kh năng xu t hi n hi n tư ng A là po nh gi thi t th ng I GI THI T Trong bài toán ki m nh gi thi t th ng kê, gi thi t c n ki m nh ký hi u H 0 , ư c nêu ra dư i d ng: các t l như nhau, các trung bình như nhau Các gi thi t i l p v i gi thi t H 0 g i t t là i thi t, ký hi u H1 i gi... trung bình c a s li u trên (S li u Finney) K t qu : A 0,02846; B 0,0247; C 0,0253; D 0,0255; file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm E s khác 12/10/2012 Page 14 of 74 Bài 2 KI M NH GI THI T TH NG M C TIÊU Trình bày ư c các bư c c a bài toán ki m nh i u tr m t b nh b ng nhi u phương pháp, m i phương pháp có m t t l kh i nh t kh i c a các phương pháp có như nhau không ? nh Các t l nh lư ng Protein... t(8 + 10 – 2; 0,01/2) = 2,921 Do T = 3,173 > 2,921 : bác b gi thi t H0 Trung bình hai dãy s li u khác nhau m c 99% ư ng kính trung bình c a các viên thu c do hai máy d p ra là khác bi t có ý nghĩa th ng Không nên dùng hai máy d p các viên thu c N u c n dùng c hai máy thì ph i ch nh máy file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm 12/10/2012 Page 20 of 74 2 nh lư ng Protein toàn ph n trong huy t thanh... 1; α/2): ch p nh n gi thi t H0 Ngư c l i T > t(n – 1; α) ho c t(n – 1; α/2): bác b gi thi t H0, ch p nh n 2.2 Các xác su t c a bài toán ki m i thi t H1 nh Khi ti n hành bài toán ki m nh gi thi t th ng kê, k t lu n c a bài toán ki m nh úng hay sai ph thu c vào H0 úng hay sai Trong ph n này c n xét các xác su t liên quan t i ki m nh Bài toán ư c gi i v i gi thi t: H0: MX = µ 0 ; H1: MX ≠ µ 0 và bi t DX . những bài toán kiểm định giả thiết thống kê. 1. GIẢ THIẾT VÀ ĐỐI GIẢ THIẾT Trong bài toán kiểm định giả thiết thống kê, giả thiết cần kiểm định ký hiệu. Chương 2 THỐNG KÊ Bài 1 THAM SỐ MẪU MỤC TIÊU 1. Trình bày được công thức định

Ngày đăng: 11/03/2014, 16:20

TỪ KHÓA LIÊN QUAN

w