D. Phân ph i nh ố ị thứ c (Binomial distribution)
A. Phân ph i chu n ố ẩ
Nếu 𝑋~𝑁 𝑎, 𝜎( 2) E(X)=a 𝐷(𝑋) = 𝜎2
B.Phân ph i chuố ẩn chuẩn t c ắ
Tuy v y m t trong nh ng ng dậ ộ ữ ứ ụng đầu tiên được Gauss áp d ng phân ph i chuụ ố ẩn vo năm 1809, khi ông dùng nó để nghiên cứu thiên văn học. Nhưng trong cuốn An Introduction to Mathematical Statistics and Its Application c a Larsen và ủ
Marx, Lambert Quetelet lần đầu đưa dữ liệu th ng kê trong nhiố ều trường h p trong ợ
xã h (Ghahramani, 1999) ội.
Các bi n ng u nhiên phân ph i Chuế ẫ ố ẩn có đồ thị quả chng t i vạ ị trí khác nhau, độ
cao thấp khác nhau, do đó khơng thuận l i trong tính tốn các xác suợ ất. Để việc tính tốn được thuận lợi, ta xét một biến ngẫu nhiên phân phối Chuẩn đặc biệt là biến ng u nhiên phân ph i Chu n hóa. ẫ ố ẩ
Là phân ph i chu n v i giá tr trung bình bố ẩ ớ ị ằng 0 v độ lệch chuẩn bằng 1.
i. Đại lượng ngẫu nhiên 𝑋~𝑁 0,1( ) gọi là phân ph i chu n chu n t c ố ẩ ẩ ắ
Nếu X có phân ph i chu n chu n t c thì hàm mố ẩ ẩ ắ ật độ ủ c a X là 𝑓(𝑥) =√2𝜋1 𝑒−𝑥22 là hàm mật độ Gauss.
Hình 6. Biểu đồ hàm mật độ phân ph i chuố ẩn chu n tẩ ắc ii. Tính ch t c a phân ph i chu n chu n t c ấ ủ ố ẩ ẩ ắ
Nếu 𝑋~𝑁 𝑎, 𝜎( 2) thì 𝑌 =𝑋−𝑎𝜎 ~𝑁 0,1( )
C.Tích phân Laplace
i. Cho f(x) là hàm mật độ Gauss. Khi đó ta có hm phân phối Gauss
𝐹(𝑢) = ∫ 𝑓(𝑥)𝑑𝑥−∞𝑢
Và tích phân Laplace 𝛷(𝑢) = ∫ 𝑓(𝑥)𝑑𝑥0𝑢 =√2𝜋1 ∫ 𝑒0𝑢 −𝑥22𝑑𝑥 Giữa hàm phân ph i Gauss và tích phân Laplace có mối liên h ố ệ F(u)=1/2+Φ(u) D.Cơng th c tính xác su t ứ ấ Nếu 𝑋~𝑁 𝑎, 𝜎( 2) 𝑃(𝛼 < 𝑋 < 𝛽 = 𝛷) (𝛽−𝑎𝜎 ) − 𝛷 (𝛼−𝑎𝜎 ) 𝑃(|𝑋 − 𝑎| < 𝛼) = 2𝛷 (𝛼𝜎) với α>0 Nếu 𝑋~𝑁 0,1( ) 𝑃(𝛼 < 𝑋 < 𝛽 = 𝛷) (𝛽)− 𝛷(𝛼) 𝑃(|𝑋| < 𝛼 = 2𝛷) (𝛼) với α>0
+Ví d : Bài toán c a Lambert Quetelet ụ ủ
Giả s ử trung bình độ ộ r ng c a ng c củ ự ủa một người đn ông trưởng thành trung bình l 39,8 inch v độ lệch chuẩn là 2.05 inch. V y xác su t khi ch n ng u nhiên ậ ấ ọ ẫ 20 người nam, 5 người đầu có độ rộng của ng c mình ít nh t 40inch? ự ấ
Giải: G i p là xác suọ ất khi chọn được người đn ơng có độ rộng ngực của mình t ừ
40 inch tr lên. Nở ếu X là bi n có phân ph i chu n v i tr ế ố ẩ ớ ị trung bình l 39.8 v độ
lệch chuẩn l 2.05 thì ta có đồ thị:
Hình 7. Hình th ểhiện ví d phân ph i chu n ụ ố ẩ
Gọi i l độ rộng của ngực i=33,…..Ta phân tích thấy được độ rộng i từ 33 đến 48 inch có t n s ầ ố tương đối với phần đồ có hàm mthị ật độ P(i- 1/2<X<1/2) khi X là bi n có phân phế ối đều với
X có phân ph i chuố ẩn 𝑋~𝑁 𝑎, 𝜎( 2)
Vậy sử dụng bảng tra tích phân Laplace ta có thể tìm được:
𝑝 = 𝑃 𝑋 ≥( 40)= 𝑃(𝑋 − .839
2.05 ≥40 39− .82.05 ) = 𝑃 (𝑋 − .82.05 ≥ 0.1)39 = 𝑃 𝑍 ≥ 0.1 = 1 − 𝛷 0.1 ≈ 1 − 0.5398 ≈ 0.( ) ( ) 46 Vậy xác suất để 5 người chọn đầu thỏa yêu c u bài toán là ầ
:𝐶205(0.46)5(0.54)15≈ 0.03
3.2.4 Phân phối Chi-Bình phương( Chi-Squared)
Phân ph i Chi-ố bình phương (Chi squared) đượ- c sử d ng r ng rãi trong thụ ộ ống kê để
tính tốn nh ng giá tr sau: ữ ị
Ước lượng khoảng tin cậy cho độ ệ l ch chu n c a t p t ng th i v i mẩ ủ ậ ổ ể đố ớ ột
phân ph i chu n, s dố ẩ ử ụng độ ệ l ch chu n c a mẩ ủ ẫu.
Để kiểm tra độ độc lập của hai phân lo i tiêu chuạ ẩn đối với các biến đa tính. Để nghiên cứu độbi n thiên mẫu trong trường hợp phân ph i là phân phế ố ối
chuẩn.
Để kiểm th l ch gi a các tử độ ệ ữ ần s kố ỳ v ng và t n s ọ ầ ốthự ếc t .
Nếu có n biến ngẫu nhiên Chuẩn hóa , khi bình phương các biến đó rồi lấy t ng, thì ổ
tổng đó sẽ phân ph i theo mố ột quy luật g i là quy luọ ật “Chi – bình phương”, ký
hiệu l χ2(n), đọc là quy luật “Chi – bình phương bậc tự do n”.
i. Đại lượng ngẫu nhiên 𝜒2 g i là có phân phọ ối Chi-bình phương n bậc tự
do nếu 𝛘2=𝑋12+ 𝑋22+ ⋯ + 𝑋𝑛2 trong đó 𝑋12, 𝑋22, … , 𝑋𝑛2 l các đại
lượng ngẫu nhiên có phân ph i chu n chu n t c. V y hàm mố ẩ ẩ ắ ậ ật đọ có dạngL
𝑓(𝑥) = { 1 𝛤 (𝑛2)2𝑛2𝑥𝑛2
−1𝑒−𝑥/2, 𝑥 > 0 0, 𝑥 ≤ 0
Ký hiệu 𝜞(x) là hàm gamma (x) =𝜞 ∫ 𝑡0+∞ 𝑥−𝑡𝑒−𝑡𝑑𝑡. Trong trường hợp này ta ký hiệu X~χ2(n)
ii. Tính ch t phân ph i Chi-ấ ố bình phương
Nếu X~χ2(n)
E(χ2) = n, D χ2( ) = 2n
Với quy lu t Khi ậ – bình phương bậc tự do , ta cn ần quan tâm giá tr t i hị ớ ạn
mức α, là m t con s sao cho bi n ng u nhiên lộ ố ế ẫ ớn hơn con số đó bằng đúng
α. Con s ố đó ký hiệu là 𝜒𝑎2(𝑛), đọc là giá tr t i h n mị ớ ạ ức α bậc tự do n. Sử dụng bảng giá tr t i h n ị ớ ạ
+Ví dụ:Muốn tra giá tr tị ới h n Khi ạ – bình phương mức 0,05 bậc tự do 10, tìm
cột 0,05 v dịng 10, đối chiếu được giá tr 18,31. Ta viị ết:𝜒0.052 (10) = 18 31.
3.2.5 Phân phối Student
Phân phối Student còn được g i là phân ph i T hay phân ph i T Student, trong ọ ố ố
tiếng anh là T Distribution hay Student’s t-distribution.
Phân ph i Student có hình dố ạng đố ứi x ng tr c gi a g n gi ng v i phân ph i chu n. ụ ữ ầ ố ớ ố ẩ
Khác biệt ở chỗ phần đi nếu trường h p có nhi u giá tr trung bình phân ph i xa ợ ề ị ố hơn sẽ khiến đồ thị dài và nặng. Phân phối student thường ứng dụng để mô t các ả
mẫu khác nhau trong khi phân ph i chu n l i dùng trong mô t t ng thố ẩ ạ ả ổ ể. Do đó, khi dùng để mơ tả mẫu càng l n thì hình d ng c a 2 phân ph i càng gi ng nhau. ớ ạ ủ ố ố
Phân ph i T ố – Student thường được dùng rộng rãi trong việc suy luận phương sai
tổng th khi có gi thiể ả ết tổng th phân phối chuể ẩn, đặc bi t khi c mệ ỡ ẫu càng nhỏ thì độ chính xác cng cao. Ngoi ra, cịn được ng dụng trong kiứ ểm định giả tiết v ề trung bình khi chưa biết phương sai tổng thể là bao nhiêu.
i. Cho U, V là các bi n ngế ẫu nhiên độ ậc l p, U có phân ph i Chu n hóa,V ố ẩ
có phân phối khi bình phương bậc tự do n, đại lượng ngẫu nhiên T g i là ọ
phân ph i Student n b c t do khi ố ậ ự 𝑇 =√𝑉/𝑛𝑈 và hàm mật độ xác suất có dạng: 𝑓𝑛(𝑥) =𝛤 (𝑛 + 12 ) √𝑛𝜋𝛤 (𝑛2)(1 + 𝑥2 𝑛 ) −𝑛+12
Trong trường hợp này ta ký hiệu 𝑇~𝑇(𝑛) ii. Cho 𝑇~𝑇(𝑛)
Đối với biến ngẫu nhiên phân ph i Student , ta c n quan tâm giá tr t i hố ầ ị ớ ạn
mức α, Con s ố đó ký hiệu là 𝑡𝛼(𝑛), đọc là giá tr t i h n mị ớ ạ ức α bậ ực t do n. là m t con sộ ố sao cho xác suất để T lớn hơn con số đó bằng đúng α.
Sử dụng bảng giá tr t i hị ớ ạn:
+Ví dụ:Tra giá tr t i h n mị ớ ạ ức 0,05 bậc t do 10, ta tìm cột 0,05 v dịng 10, đối ự
chiếu ơ tương ứng được con số 1,812. Ta viết 𝑡0.05(10)= 1.812
3.3 H s Z c a Altman ệ ố ủ
3.3.1 Giới thi u ệ
Công thức điểm Z để ự đo d án phá sản được Edward I. Altman, lúc đó l Trợ lý
Giáo sư Ti chính tại Đại học New York, xuất bản năm 1968. Cơng thức này có thể được s dử ụng để ự đoán xác suấ d t m t công ty s phá sộ ẽ ản trong vòng hai năm. Điểm Z được sử dụng để dự đốn các vụ vỡ nợ của cơng ty và là một biện pháp
kiểm sốt dễ tính tốn đối v i tình tr ng ki t qu tài chính c a các công ty trong ớ ạ ệ ệ ủ
các nghiên c u h c thuứ ọ ật. Điểm s Z s d ng nhi u giá tr thu nh p doanh nghiố ử ụ ề ị ậ ệp
và bảng cân đố ế toán để đo lười k ng s c kh e tài chính c a m t công ty. ứ ỏ ủ ộ Điểm này càng th p thì khấ ả năng phá sản cng cao. Các cơng ty có điểm Z trên 3 được xem
là kh e m nh và khơng có khỏ ạ ả năng phá sản. Điểm Z trong kho ng tả ừ 1.8 đến 3 là
vùng xám.Đây l một mơ hình tương đối chính xác - việc ứng dụng điểm Z thực tế trên thế giới đã dự đốn thnh cơng 72% sự phá s n c a các doanh nghiả ủ ệp trước 2
năm.
3.3.2 Cơng thức
Mơ hình này k t h p 5 ch sế ợ ỉ ố ti chính khác nhau để xác định khả năng phá sản
của các công ty.
Z score = 1,2*A1+1,4*A2+3,3*A3+0,6*A4+1,0*A5
Trong đó:
A1 = V n luân cố huyển ( = Tài s n ng n hả ắ ạn – ợ ngắ N n hạn)/Tổng tài sản.
Tỷ l này cung c p thông tin v tình hình tài chính ng n h n cệ ấ ề ắ ạ ủa doanh nghiệp
A2 = L i nhuợ ận chưa phân phối/Tổng tài s n. T lả ỷ ệ ny đo lường mức độ
phụ thuộc c a doanh nghi p vào n . ủ ệ ợ
A3 = EBIT (Lợi nhuận trước lãi vay và thuế)/Tổng tài s n ả
A4 = (Giá thị trường c a củ ổ phiếu*S ố lượng cổ phiếu lưu hnh)/Tổng
nợ.Cho th y giá trấ ị thị trường của doanh nghi p có thệ ể giảm bao nhiêu trước
khi n ợphải tr ả vượt quá tài s n ả
A5 = Hi u qu s d ng tài s n =Doanh thuệ ả ử ụ ả /Tổng tài s n. Tả ừ 1 đồng tài s n, ả
CHƯƠNG 4. KIỂM ĐỊNH GIẢ THIẾT 4.1 Khái niệm
Các nhà phân tích th ng kê ki m tra m t gi thuy t bố ể ộ ả ế ằng cách đo lường và ki m tra ể
một m u ng u nhiên cẫ ẫ ủa khơng gian m u ẫ đang được phân tích. Việc h làm là s ọ ử
dụng một không gian m u ẫ ngẫu nhiên để kiểm tra hai gi thuy t khác nhau: gi ả ế ả
thuyết kh ng và gi thuyô ả ết nghịch.
4.1.1 Giả thiết ông (Null Hypothesis) kh
Giả thuy t không H là m t lo i gi thuyế 0 ộ ạ ả ết được s d ng trong th ng kê giử ụ ố ả định
rằng khơng có ý nghĩa thống kê nào t n t i trong m t t p h p các quan sát nhồ ạ ộ ậ ợ ất định. Giả thuyết không được cho l đúng cho đến khi có bằng ch ng th ng kê bác ứ ố
bỏ nó v i mớ ột giả thuyết thay thế khác.
Giả thuy t không giế ả định r ng b t kì s khác biằ ấ ự ệt hay ý nghĩa no bạn quan sát
được trong m t t p hộ ậ ợp d u là do s ữliệ ựngẫu nhiên.
4.1.2 Giả thiết ngh ch (Alternative hypothesis) ị
Khái ni m v m t gi thuyệ ề ộ ả ết nghịch trong th nghi m do Jerzy Neyman và Egon ử ệ Pearson nghĩ ra, v nó được sử dụng trong bổ đề Neyman-Pearson(E. L. Lehmann,
1986). Nó t o thành m t thành ph n chính trong ạ ộ ầ thử nghi m gi thuy t th ng kê ệ ả ế ố
hiện đại. Tuy nhiên, nó khơng ph i là m t ph n trong công th c ki m tra gi thuyả ộ ầ ứ ể ả ết
thống kê của Ronald Fisher, và ông phản đối việc s d ng nó. Trong cách ti p c n ử ụ ế ậ
kiểm định của Fisher, ý tưởng trung tâm l đánh giá xem liệu tập dữ liệu quan sát có th là k t quể ế ả ngẫu nhiên hay không n u gi thuyế ả ết không được giả định là
đúng, khơng có định kiến về những gì các mơ hình khác có thể nắm giữ. Thử
nghiệm gi thuy t th ng kê hiả ế ố ện đại đáp ứng điều này lo i kiạ ểm định vì giả thuyết
4.1.3 Mức ý nghĩa
Trong th ng kê, m t k t qu ố ộ ế ả được gọi l có ý nghĩa thống kê nếu nó khơng có kh ả
xảy ra là do ng u nhiên. C m t ẫ ụ ừ Ý nghĩa thống kê được đặt tên bởi Ronald Fisher.
Trong thống kê, ý nghĩa khơng có nghĩa l quan trọng , nhưng nh ng nhà phân tích ữ
chỉ t p trung vào k t qu có th b sót các d ng m u tr l i quan tr ng mà có th ậ ế ả ể ỏ ạ ẫ ả ờ ọ ể rơi dưới ngưỡng được đặt ra cho kiểm định ý nghĩa.
4.1.4 Miền bác bỏ
Miền bác bỏ là miền xác địnhtrong đồ ị, được đo tron th g phân ph i l y mố ấ ẫu của
thống kê đang nghiên cứu, dẫn đến bác b ỏgiả thuyết không H trong m0 ột bài kiểm
tra gi thuy t. ả ế Miền bác b bỏ ổ sung cho vùng ch p nhấ ận v được liên k t v i xác ế ớ
suất α, được g i là mọ ức ý nghĩa..
4.1.5 Kiểm định giả thiêt thông kê