Phân phối Student

D. Công th c tính xác su t ứ ấ

3.2.5 Phân phối Student

Phân phối Student còn được g i là phân ph i T hay phân ph i T Student, trong ọ ố ố

tiếng anh là T Distribution hay Student’s t-distribution.

Phân ph i Student có hình dố ạng đố ứi x ng tr c gi a g n gi ng v i phân ph i chu n. ụ ữ ầ ố ớ ố ẩ

Khác biệt ở chỗ phần đuôi nếu trường h p có nhi u giá tr trung bình phân ph i xa ợ ề ị ố hơn sẽ khiến đồ thị dài và nặng. Phân phối student thường ứng dụng để mô t các ả

mẫu khác nhau trong khi phân ph i chu n l i dùng trong mô t t ng thố ẩ ạ ả ổ ể. Do đó, khi dùng để mơ tả mẫu càng l n thì hình d ng c a 2 phân ph i càng gi ng nhau. ớ ạ ủ ố ố

Phân ph i T ố – Student thường được dùng rộng rãi trong việc suy luận phương sai

tổng th khi có gi thiể ả ết tổng th phân phối chuể ẩn, đặc bi t khi c mệ ỡ ẫu càng nhỏ thì độ chính xác cng cao. Ngoi ra, cịn được ng dụng trong kiứ ểm định giả tiết v ề trung bình khi chưa biết phương sai tổng thể là bao nhiêu.

i. Cho U, V là các bi n ngế ẫu nhiên độ ậc l p, U có phân ph i Chu n hóa,V ố ẩ

có phân phối khi bình phương bậc tự do n, đại lượng ngẫu nhiên T g i là ọ

phân ph i Student n b c t do khi ố ậ ự 𝑇 =√𝑉/𝑛𝑈 và hàm mật độ xác suất có dạng: 𝑓𝑛(𝑥) =𝛤 (𝑛 + 12 ) √𝑛𝜋𝛤 (𝑛2)(1 + 𝑥2 𝑛 ) −𝑛+12

Trong trường hợp này ta ký hiệu 𝑇~𝑇(𝑛) ii. Cho 𝑇~𝑇(𝑛)

 Đối với biến ngẫu nhiên phân ph i Student , ta c n quan tâm giá tr t i hố ầ ị ớ ạn

mức α, Con s ố đó ký hiệu là 𝑡𝛼(𝑛), đọc là giá tr t i h n mị ớ ạ ức α bậ ực t do n. là m t con sộ ố sao cho xác suất để T lớn hơn con số đó bằng đúng α.

Sử dụng bảng giá tr t i hị ớ ạn:

+Ví dụ:Tra giá tr t i h n mị ớ ạ ức 0,05 bậc t do 10, ta tìm cột 0,05 v dịng 10, đối ự

chiếu ô tương ứng được con số 1,812. Ta viết 𝑡0.05(10)= 1.812

3.3 H s Z c a Altman ệ ố ủ

3.3.1 Giới thi u ệ

Công thức điểm Z để ự đo d án phá sản được Edward I. Altman, lúc đó l Trợ lý

Giáo sư Ti chính tại Đại học New York, xuất bản năm 1968. Công thức này có thể được s dử ụng để ự đốn xác suấ d t m t cơng ty s phá sộ ẽ ản trong vòng hai năm. Điểm Z được sử dụng để dự đoán các vụ vỡ nợ của công ty và là một biện pháp

kiểm sốt dễ tính tốn đối v i tình tr ng ki t qu tài chính c a các công ty trong ớ ạ ệ ệ ủ

các nghiên c u h c thuứ ọ ật. Điểm s Z s d ng nhi u giá tr thu nh p doanh nghiố ử ụ ề ị ậ ệp

và bảng cân đố ế toán để đo lười k ng s c kh e tài chính c a m t công ty. ứ ỏ ủ ộ Điểm này càng th p thì khấ ả năng phá sản cng cao. Các cơng ty có điểm Z trên 3 được xem

là kh e m nh và khơng có khỏ ạ ả năng phá sản. Điểm Z trong kho ng tả ừ 1.8 đến 3 là

vùng xám.Đây l một mơ hình tương đối chính xác - việc ứng dụng điểm Z thực tế trên thế giới đã dự đoán thnh công 72% sự phá s n c a các doanh nghiả ủ ệp trước 2

năm.

3.3.2 Công thức

Mơ hình này k t h p 5 ch sế ợ ỉ ố ti chính khác nhau để xác định khả năng phá sản

của các công ty.

Z score = 1,2*A1+1,4*A2+3,3*A3+0,6*A4+1,0*A5

Trong đó:

 A1 = V n luân cố huyển ( = Tài s n ng n hả ắ ạn – ợ ngắ N n hạn)/Tổng tài sản.

Tỷ l này cung c p thơng tin v tình hình tài chính ng n h n cệ ấ ề ắ ạ ủa doanh nghiệp

 A2 = L i nhuợ ận chưa phân phối/Tổng tài s n. T lả ỷ ệ ny đo lường mức độ

phụ thuộc c a doanh nghi p vào n . ủ ệ ợ

 A3 = EBIT (Lợi nhuận trước lãi vay và thuế)/Tổng tài s n ả

 A4 = (Giá thị trường c a củ ổ phiếu*S ố lượng cổ phiếu lưu hnh)/Tổng

nợ.Cho th y giá trấ ị thị trường của doanh nghi p có thệ ể giảm bao nhiêu trước

khi n ợphải tr ả vượt quá tài s n ả

 A5 = Hi u qu s d ng tài s n =Doanh thuệ ả ử ụ ả /Tổng tài s n. Tả ừ 1 đồng tài s n, ả

CHƯƠNG 4. KIỂM ĐỊNH GIẢ THIẾT 4.1 Khái niệm

Các nhà phân tích th ng kê ki m tra m t gi thuy t bố ể ộ ả ế ằng cách đo lường và ki m tra ể

một m u ng u nhiên cẫ ẫ ủa không gian m u ẫ đang được phân tích. Việc h làm là s ọ ử

dụng một không gian m u ẫ ngẫu nhiên để kiểm tra hai gi thuy t khác nhau: gi ả ế ả

thuyết kh ng và gi thuyô ả ết nghịch.

4.1.1 Giả thiết ông (Null Hypothesis) kh

Giả thuy t không H là m t lo i gi thuyế 0 ộ ạ ả ết được s d ng trong th ng kê giử ụ ố ả định

rằng khơng có ý nghĩa thống kê nào t n t i trong m t t p h p các quan sát nhồ ạ ộ ậ ợ ất định. Giả thuyết khơng được cho l đúng cho đến khi có bằng ch ng th ng kê bác ứ ố

bỏ nó v i mớ ột giả thuyết thay thế khác.

Giả thuy t không giế ả định r ng b t kì s khác biằ ấ ự ệt hay ý nghĩa no bạn quan sát

được trong m t t p hộ ậ ợp d u là do s ữliệ ựngẫu nhiên.

4.1.2 Giả thiết ngh ch (Alternative hypothesis) ị

Khái ni m v m t gi thuyệ ề ộ ả ết nghịch trong th nghi m do Jerzy Neyman và Egon ử ệ Pearson nghĩ ra, v nó được sử dụng trong bổ đề Neyman-Pearson(E. L. Lehmann,

1986). Nó t o thành m t thành ph n chính trong ạ ộ ầ thử nghi m gi thuy t th ng kê ệ ả ế ố

hiện đại. Tuy nhiên, nó khơng ph i là m t ph n trong công th c ki m tra gi thuyả ộ ầ ứ ể ả ết

thống kê của Ronald Fisher, và ông phản đối việc s d ng nó. Trong cách ti p c n ử ụ ế ậ

kiểm định của Fisher, ý tưởng trung tâm l đánh giá xem liệu tập dữ liệu quan sát có th là k t quể ế ả ngẫu nhiên hay không n u gi thuyế ả ết không được giả định là

đúng, khơng có định kiến về những gì các mơ hình khác có thể nắm giữ. Thử

nghiệm gi thuy t th ng kê hiả ế ố ện đại đáp ứng điều này lo i kiạ ểm định vì giả thuyết

4.1.3 Mức ý nghĩa

Trong th ng kê, m t k t qu ố ộ ế ả được gọi l có ý nghĩa thống kê nếu nó khơng có kh ả

xảy ra là do ng u nhiên. C m t ẫ ụ ừ Ý nghĩa thống kê được đặt tên bởi Ronald Fisher.

Trong thống kê, ý nghĩa khơng có nghĩa l quan trọng , nhưng nh ng nhà phân tích ữ

chỉ t p trung vào k t qu có th b sót các d ng m u tr l i quan tr ng mà có th ậ ế ả ể ỏ ạ ẫ ả ờ ọ ể rơi dưới ngưỡng được đặt ra cho kiểm định ý nghĩa.

4.1.4 Miền bác bỏ

Miền bác bỏ là miền xác địnhtrong đồ ị, được đo tron th g phân ph i l y mố ấ ẫu của

thống kê đang nghiên cứu, dẫn đến bác b ỏgiả thuyết không H trong m0 ột bài kiểm

tra gi thuy t. ả ế Miền bác b bỏ ổ sung cho vùng ch p nhấ ận v được liên k t v i xác ế ớ

suất α, được g i là mọ ức ý nghĩa..

4.1.5 Kiểm định giả thiêt thơng kê

Bài tốn kiểm nghiệm gi thiêt th ng kê t ng quáả ố ổ t đượ đặt dưới dạng sau: c i. Cho i l ng ng u nhiên X và mđạ ượ ẫ ột giả thiết H v0 ề ân ph i xác suph ố ất

của X. M t mộ ệnh đề khác v i H ớ 0đưuọc gọi là đói thiết H1. Cần kiểm nghiệm xem H dúng hay sao trên c s m0 ở ở ẫu lấy được là (𝑋1, 𝑋2, … , 𝑋𝑛) Trên không gian mẫu ta xác định miền W g i là ọ miền bác b ỏgiả thiêt H , ph n bù 0 ầ

của W ký hiệu là 𝑊 là miền ch p nh n gi thiêt H . ấ ậ ả 0

Mẫu đã l y ấ được (𝑥1, 𝑥2, … , 𝑥𝑛) là một điểm xác định c a ông gian m u. ủ kh ẫ

Mẫu đã l y ấ được (𝑥1, 𝑥2, … , 𝑥𝑛) ∈ 𝑤 ì ta coi gi thiêt H là sai và bác b th ả 0 ỏgiả thiết đó.

Mẫu đã l y ấ được (𝑥1, 𝑥2, … , 𝑥𝑛) ∈ 𝑊 ì ta coi gi thiêt H là ng và th ả 0 đú chấp nhận

ii. Các lo i sai l m: Trong vi c ch n mạ ầ ệ ọ ột quy tắc có thể mắc cá sai lc ầm

 Sai l m lo i I: Bác b ầ ạ ỏgiả thuy t H ế 0nhưng thự ếc t H0 là đúng. Sai l m n ầ ày

được c trđặ ưng b i ở 𝑃 = (𝑊

𝐻0)

 Sai l m lo i II: Ch p nh n gi thuyầ ạ ấ ậ ả ết H 0nhưng thực tế H là sai. Sai l0 ầm này được c trđặ ưng b i ở P=(𝑊𝐻1)

Quyết định bác b hay ỏ chấp nh n gi thuy t hồn tồn d a vào thơng tin m u, do ậ ả ế ự ẫ đó ta sẽ có xác su t m c sai l m lo i I và sai l m lo i II. Ký hiấ ắ ầ ạ ầ ạ ệu α l xác suất mắc

sai l m lo i I. ầ ạ

Lúc đó α được gọi là mức ý nghĩa. Ký hiệu β l xác suất mắc sai l m loại II. ầ α = P(sai lầm lo i I) = P(bác b Hạ ỏ 0 | H0 đúng)= P(chấp nh n H | H sai). ậ 0 1

β = P(sai lầm lo i II) = P (ch p nh n H | H sai) = P(ch p nh n Hạ ấ ậ 0 0 ấ ậ 0 | H 1đúng).

+Ví d : ụ

Giả thi t H cho rế 0 ằng:” bệnh nh ân A uống được thuốc B”.

Sai l m lo i 1 dầ ạ ẫn đến vi c ph i i tìm thcs ác khi b h nhân uệ ả đ kh ên ống được thuốc

Còn sai l m lo i 2 l i dầ ạ ạ ẫn đến k t lu n là cho bế ậ ệnh nhân u ng thu c B trong lúố ố c bệnh nhân khơng uống được thuốc đó.

iii. Các bước kiểm định giả thiết thống kê

Bước 1: Xác định tham s c n kiố ầ ểm định, đặt giả thuyết v đối thuyết. Bước 2: Xác định tiêu chu n th ng kê và tính giá tr c a tiêu chu n thẩ ố ị ủ ẩ ống kê đối với giá tr mị ẫu đã cho.

Bước 3: Xác định mi n bác b ề ỏW.

Bước 4: So sánh giá tr c a tiêu chu n th ng kê v i mi n bác b W và k t lu n bác ị ủ ẩ ố ớ ề ỏ ế ậ

bỏ hay ch p nh n gi thuy t Hấ ậ ả ế 0.

4.2 Kiểm định giả thi t tham s ế ố

4.2.1 Kiểm định á kì vgi trị ọng của ân phph ối chu n ẩ

i. Giả s t ng th có trung bình (k v ng) . M u có kích ử ổ ể ỳ ọ μ ẫ thước n, trung bình mẫu 𝑥, ph ng sai mươ ẫu hiệu chỉnh 2. Hãy kiểm định giảthiết H0:μ=μ0 với mức ý nghĩa α

A. Trường hợp 1:

 2 đã biết, H1:μ≠μ0

Tiêu chu n kiẩ ểm định:𝑍 =𝑋−𝜇0 √𝑛

Ta th y n u gi thuy t H ấ ế ả ế 0 đúng thì thống kê 𝑍0=𝑋−𝜇0 √𝑛 có phân ph i chuố ẩn N(0; 1), đồng thời X là một ước lượng không ch ch cho . ệ μ

Từ ta có quy t c kiđó ắ ểm định sau :

Tìm 𝑍𝛼 từ h ệthức 2𝛷 𝑍( 𝛼) = 1 − 𝛼

Nếu 𝑍0≤ 𝑍𝛼, thì chấp nhận H. Nếu 𝑍0> 𝑍𝛼 ì bác b H th ỏ

Nếu giá tr ị đó thuộc vào mi n tiêu chu n thì ta bác b ề ẩ ỏgiả thuy t, k t lu n k v ng ế ế ậ ỳ ọ

của bi n X th c s khác ế ự ự μ0. Ngượ ại, n u giá trc l ế ị đó nằm trong mi n ề chấp nhận

thì ph i k t lu n k v ng c a X không khác mả ế ậ ỳ ọ ủ μ0 ột cách có ý nghĩa.

+Ví d : ụ

Điểm trung bình n m nay c a 100 h c sinh là 5.9 ă ủ ọ điểm tốn cuối kì, có lđộ ệch

chuẩn là 1.21. Điểm trung bì mnh ới v a ừ thay đổ để đại t danh hiệu thi đua c a mơn ủ

tốn n m ngo là 5.72. V i mă ái ớ ức ý ngh a 1% có ĩ phả điểi m trung b h n m nay có ìn ă đạt tiêu chu n năm ngo ông? ẩ ái kh

Giải: Gi ảthiết H0:μ=μ0 =5.72 ( điểm n m naă y bằng năm trước)

2𝛷 𝑍( 𝛼) = 1 − 𝛼 = 1 − 0. => 𝑍01 𝛼= 2.58 𝑍0=|𝑋 − 𝜇 0|√𝑛 =|5.9 − 5.72|1.21 √100 = 1.49

Vì 𝑍0< 𝑍𝛼 nên ch p ấ nhận H 0. Vậy điểm mơn tốn n m nay không cao h n nă ơ ăm trước với mức ý ngh a ĩ 1%, nên không đạt được êu chu n nh n danh hi u thi ua. ti ẩ ậ ệ đ

B.Trường hợp 2  2 đã biết, H1:μ>μ0

Tiêu chu n kiẩ ểm định:𝑍 =𝑋−𝜇0 √𝑛

Phân phi nh ốị thức (Binomial distribution)

Phân phối mũ (Exponential Distribution)