D. Công thức tính xác suất
3.3 Hệ số Z của Altman
Công thức điểm Z để dự đoán phá sản được Edward I. Altman, lúc đó là Trợ lý
Giáo sư Tài chính tại Đại học New York, xuất bản năm 1968. Công thức này có thể được sử dụng để dự đoán xác suất một công ty sẽ phá sản trong vòng hai năm. Điểm Z được sử dụng để dự đoán các vụ vỡ nợ của công ty và là một biện pháp
kiểm soát dễ tính toán đối với tình trạng kiệt quệ tài chính của các công ty trong các nghiên cứu học thuật. Điểm số Z sử dụng nhiều giá trị thu nhập doanh nghiệp và bảng cân đối kế toán đểđo lường sức khỏe tài chính của một công ty. Điểm này càng thấp thì khả năng phá sản càng cao. Các công ty có điểm Z trên 3 được xem là khỏe mạnh và không có khả năng phá sản. Điểm Z trong khoảng từ 1.8 đến 3 là
vùng xám.Đây là một mô hình tương đối chính xác - việc ứng dụng điểm Z thực tế
trên thế giới đã dự đoán thành công 72% sự phá sản của các doanh nghiệp trước 2
năm.
3.3.2 Công thức
Mô hình này kết hợp 5 chỉ số tài chính khác nhau để xác định khả năng phá sản của các công ty.
Z score = 1,2*A1+1,4*A2+3,3*A3+0,6*A4+1,0*A5
Trong đó:
A1 = Vốn luân chuyển ( = Tài sản ngắn hạn – Nợ ngắn hạn)/Tổng tài sản. Tỷ lệ này cung cấp thông tin về tình hình tài chính ngắn hạn của doanh nghiệp
A2 = Lợi nhuận chưa phân phối/Tổng tài sản. Tỷ lệ này đo lường mức độ
phụ thuộc của doanh nghiệp vào nợ.
A3 = EBIT (Lợi nhuận trước lãi vay và thuế)/Tổng tài sản
A4 = (Giá thị trường của cổ phiếu*Số lượng cổ phiếu lưu hành)/Tổng nợ.Cho thấy giá trị thịtrường của doanh nghiệp có thể giảm bao nhiêu trước khi nợ phải trả vượt quá tài sản
A5 = Hiệu quả sử dụng tài sản =Doanh thu/Tổng tài sản. Từ 1 đồng tài sản, doanh nghiệp làm ra bao nhiêu đồng doanh thu thuần.
CHƯƠNG 4. KIỂM ĐỊNH GIẢ THIẾT 4.1 Khái niệm
Các nhà phân tích thống kê kiểm tra một giả thuyết bằng cách đo lường và kiểm tra một mẫu ngẫu nhiên của không gian mẫu đang được phân tích. Việc họ làm là sử
dụng một không gian mẫu ngẫu nhiên để kiểm tra hai giả thuyết khác nhau: giả
thuyết không và giả thuyết nghịch.
4.1.1 Giả thiết không (Null Hypothesis)
Giả thuyết không H0 là một loại giả thuyết được sử dụng trong thống kê giả định rằng không có ý nghĩa thống kê nào tồn tại trong một tập hợp các quan sát nhất
định. Giả thuyết không được cho là đúng cho đến khi có bằng chứng thống kê bác bỏ nó với một giả thuyết thay thế khác.
Giả thuyết không giả định rằng bất kì sự khác biệt hay ý nghĩa nào bạn quan sát
được trong một tập hợp dữ liệu là do sự ngẫu nhiên.
4.1.2 Giả thiết nghịch (Alternative hypothesis)
Khái niệm về một giả thuyết nghịch trong thử nghiệm do Jerzy Neyman và Egon
Pearson nghĩ ra, và nó được sử dụng trong bổ đề Neyman-Pearson(E. L. Lehmann, 1986). Nó tạo thành một thành phần chính trong thử nghiệm giả thuyết thống kê hiện đại. Tuy nhiên, nó không phải là một phần trong công thức kiểm tra giả thuyết thống kê của Ronald Fisher, và ông phản đối việc sử dụng nó. Trong cách tiếp cận kiểm định của Fisher, ý tưởng trung tâm là đánh giá xem liệu tập dữ liệu quan sát có thể là kết quả ngẫu nhiên hay không nếu giả thuyết không được giả định là
đúng, không có định kiến về những gì các mô hình khác có thể nắm giữ. Thử
nghiệm giả thuyết thống kê hiện đại đáp ứng điều này loại kiểm định vì giả thuyết nghịch H1 có thể chỉ là sự phủđịnh của giả thuyết không.
4.1.3 Mức ý nghĩa
Trong thống kê, một kết quả được gọi là có ý nghĩa thống kê nếu nó không có khả
xảy ra là do ngẫu nhiên. Cụm từ Ý nghĩa thống kê được đặt tên bởi Ronald Fisher. Trong thống kê, ý nghĩa không có nghĩa là quan trọng , nhưng những nhà phân tích chỉ tập trung vào kết quả có thể bỏ sót các dạng mẫu trả lời quan trọng mà có thể rơi dưới ngưỡng được đặt ra cho kiểm định ý nghĩa.
4.1.4 Miền bác bỏ
Miền bác bỏ là miền xác định trong đồ thị, được đo trong phân phối lấy mẫu của thống kê đang nghiên cứu, dẫn đến bác bỏ giả thuyết không H0 trong một bài kiểm tra giả thuyết. Miền bác bỏ bổ sung cho vùng chấp nhận và được liên kết với xác suất α, được gọi là mức ý nghĩa..
4.1.5 Kiểm định giả thiêt thông kê
Bài toán kiểm nghiệm giả thiêt thống kê tổng quát được đặt dưới dạng sau: i. Cho đại lượng ngẫu nhiên X và một giả thiết H0 về phân phối xác suất
của X. Một mệnh đề khác với H0đưuọc gọi là đói thiết H1. Cần kiểm nghiệm xem H0 dúng hay sao trên cở sở mẫu lấy được là (𝑋1, 𝑋2, … , 𝑋𝑛)
Trên không gian mẫu ta xác định miền W gọi là miền bác bỏ giả thiêt H0, phần bù của W ký hiệu là 𝑊 là miền chấp nhận giả thiêt H0.
Mẫu đã lấy được (𝑥1, 𝑥2, … , 𝑥𝑛) là một điểm xác định của không gian mẫu.
Mẫu đã lấy được (𝑥1, 𝑥2, … , 𝑥𝑛) ∈ 𝑤 thì ta coi giả thiêt H0 là sai và bác bỏ giả thiết
đó.
Mẫu đã lấy được (𝑥1, 𝑥2, … , 𝑥𝑛) ∈ 𝑊 thì ta coi giả thiêt H0 là đúng và chấp nhận giả thiet đó
ii. Các loại sai lầm: Trong việc chọn một quy tắc có thể mắc các sai lầm
Sai lầm loại I: Bác bỏ giả thuyết H0 nhưng thực tế H0 là đúng. Sai lầm này
được đặc trưng bởi 𝑃 = (𝐻𝑊
0)
Sai lầm loại II: Chấp nhận giả thuyết H0nhưng thực tế H0 là sai. Sai lầm này
được đặc trưng bởi P=(𝐻𝑊
1)
Quyết định bác bỏ hay chấp nhận giả thuyết hoàn toàn dựa vào thông tin mẫu, do
đó ta sẽ có xác suất mắc sai lầm loại I và sai lầm loại II. Ký hiệu α là xác suất mắc sai lầm loại I.
Lúc đó α được gọi là mức ý nghĩa. Ký hiệu β là xác suất mắc sai lầm loại II.
α = P(sai lầm loại I) = P(bác bỏ H0 | H0 đúng)= P(chấp nhận H0 | H1 sai).
β = P(sai lầm loại II) = P (chấp nhận H0 | H0 sai) = P(chấp nhận H0 | H1đúng).
+Ví dụ:
Giả thiết H0 cho rằng:” bệnh nhân A uống được thuốc B”.
Sai lầm loại 1 dẫn đến việc phải đi tìm thuôcs khác khi bênh nhân uống được thuốc B.
Còn sai lầm loại 2 lại dẫn đến kết luận là cho bệnh nhân uống thuốc B trong lúc bệnh nhân không uống được thuốc đó.
iii. Các bước kiểm định giả thiết thống kê
Bước 1: Xác định tham số cần kiểm định, đặt giả thuyết và đối thuyết.
Bước 2: Xác định tiêu chuẩn thống kê và tính giá trị của tiêu chuẩn thống kê đối với giá trị mẫu đã cho.
Bước 3: Xác định miền bác bỏ W.
Bước 4: So sánh giá trị của tiêu chuẩn thống kê với miền bác bỏ W và kết luận bác bỏ hay chấp nhận giả thuyết H0.
4.2 Kiểm định giả thiết tham số
4.2.1 Kiểm định giá trị kì vọng của phân phối chuẩn
i. Giả sử tổng thể có trung bình (kỳ vọng) μ. Mẫu có kích thước n, trung bình mẫu 𝑥, phương sai mẫu hiệu chỉnh 2. Hãy kiểm định giả thiết H0:μ=μ0 với mức ý nghĩa α A. Trường hợp 1: 2đã biết, H1:μ≠μ0 Tiêu chuẩn kiểm định:𝑍 = 𝑋−𝜇0 √𝑛 Ta thấy nếu giả thuyết H 0 đúng thì thống kê 𝑍0 =𝑋−𝜇0 √𝑛 có phân phối chuẩn
N(0; 1), đồng thời X là một ước lượng không chệch cho μ. Từđó ta có quy tắc kiểm định sau :
Tìm 𝑍𝛼 từ hệ thức 2𝛷(𝑍𝛼) = 1 − 𝛼
Nếu 𝑍0 ≤ 𝑍𝛼, thì chấp nhận H. Nếu 𝑍0 > 𝑍𝛼 thì bác bỏ H
Nếu giá trịđó thuộc vào miền tiêu chuẩn thì ta bác bỏ giả thuyết, kết luận kỳ vọng của biến X thực sự khác μ0. Ngược lại, nếu giá trịđó nằm trong miền chấp nhận thì phải kết luận kỳ vọng của X không khác μ0 một cách có ý nghĩa.
+Ví dụ:
Điểm trung bình năm nay của 100 học sinh là 5.9 điểm toán cuối kì, có độ lệch chuẩn là 1.21. Điểm trung bình mới vừa thay đổi đểđạt danh hiệu thi đua của môn toán năm ngoái là 5.72. Với mức ý nghĩa 1% có phải điểm trung bình năm nay có
đạt tiêu chuẩn năm ngoái không?
Giải: Giả thiết H0:μ=μ0 =5.72 ( điểm năm nay bằng năm trước)
2𝛷(𝑍𝛼) = 1 − 𝛼 = 1 − 0.01 => 𝑍𝛼 = 2.58 𝑍0 =|𝑋 − 𝜇 0|√𝑛 = |5.9 − 5.72|
1.21 √100 = 1.49
Vì 𝑍0 < 𝑍𝛼 nên chấp nhận H0 . Vậy điểm môn toán năm nay không cao hơn năm
trước với mức ý nghĩa 1%, nên không đạt được tiêu chuẩn nhận danh hiệu thi đua.
B. Trường hợp 2 2đã biết, H1:μ>μ0 Tiêu chuẩn kiểm định:𝑍 = 𝑋−𝜇0 √𝑛 Ta thấy nếu giả thuyết H 0 đúng thì thống kê 𝑍0 =𝑋−𝜇0 √𝑛 có phân phối chuẩn
Từđó ta có quy tắc kiểm định sau : 𝑃 (𝑋 − 𝜇 0√𝑛 > 𝑍𝛼) = 1 − 𝛼 Tìm 𝑍𝛼 từ hệ thức 2𝛷(𝑍𝛼) = 1 − 𝛼 Nếu 𝑍0 > 𝑍𝛼 thì chấp nhận H. C. Trường hợp 3 2đã biết, H1:μ<μ0 Tiêu chuẩn kiểm định:𝑍 = 𝑋−𝜇0 √𝑛 Ta thấy nếu giả thuyết H 0 đúng thì thống kê 𝑍0 =𝑋−𝜇0 √𝑛 có phân phối chuẩn
N(0; 1), đồng thời X là một ước lượng không chệch cho μ. Từđó ta có quy tắc kiểm định sau :
𝑃 (𝑋 − 𝜇 0√𝑛 < 𝑍𝛼) = 1 − 𝛼
Tìm 𝑍𝛼 từ hệ thức 2𝛷(𝑍𝛼) = 1 − 𝛼
Nếu 𝑍0 > 𝑍𝛼 thì bác bỏ H
ii. Giả sử tổng thể có trung bình (kỳ vọng) μ. Mẫu có kích thước n, trung bình mẫu 𝑥, phương sai mẫu hiệu chỉnh 2chưa biết. Hãy kiểm định giả thiết H0:μ=μ0 với mức ý nghĩa α
2 chưa biết, H1:μ≠μ0 Tiêu chuẩn kiểm định:𝑇 = 𝑋−𝜇0
√𝑛
Ta thấy nếu giả thuyết H 0 đúng thì thống kê 𝑇0 = 𝑋−𝜇0
√𝑛 có phân phối Student T(n-1), đồng thời X là một ước lượng không chệch cho μ.
Từđó ta có quy tắc kiểm định sau :
𝑃 (|𝑋 − 𝜇 0|√𝑛 ≤ 𝑇𝛼(𝑛 − 1)) = 1 − 𝛼
Tìm 𝑇𝛼 từ bảng phân phối Student
Nếu 𝑇0 ≤ 𝑇𝛼, thì chấp nhận H. Nếu 𝑇0 > 𝑇𝛼 thì bác bỏ H
+Ví dụ:
Một vưòn ươm cây giống, theo quy định khi nào cây cao trung bình trên 1m thì
đem ra trồng. Đo ngẫu nhiên 25 cây, được số liệu:
Chiều cao 0.8 0.9 1.0 1.1 1.2 1.3
Số cây 1 2 9 7 4 2
Với mức ý nghĩa 5%, có thể đem cây ra trồng không, gải thiết chiều cao của cây theo luật phân phối chuẩn.
Giải:
Gọi μ là chiều cao trung bình của cây trong vườn. Từ mẫu ta có: H0:μ=μ0 =1 ( chưa nên đem cây ra trồng)
-𝑇𝛼 = 𝑇0.05(24) = 2.064
-𝑇0 =|1.068−1|0.122 √25 = 2.787
Vì 𝑇0 > 𝑇𝛼 thì bác bỏ H, nên ta kết luận nên đem cây ra trồng
B. Trường hợp 2 2 chưa biết, H1:μ>μ0 Tiêu chuẩn kiểm định:𝑇 = 𝑋−𝜇0 √𝑛 Ta thấy nếu giả thuyết H 0 đúng thì thống kê 𝑇0 = 𝑋−𝜇0 √𝑛 có phân phối Student T(n-1), đồng thời X là một ước lượng không chệch cho μ.
Từđó ta có quy tắc kiểm định sau : 𝑃 (𝑋 − 𝜇 0√𝑛 > 𝑇𝛼(𝑛 − 1)) = 1 − 𝛼 Tìm 𝑇𝛼 từ bảng phân phối Student Nếu 𝑇0 > 𝑇𝛼, thì chấp nhận H. C. Trường hợp 3 2 chưa biết, H1:μ<μ0 Tiêu chuẩn kiểm định:𝑇 = 𝑋−𝜇0 √𝑛 Ta thấy nếu giả thuyết H 0 đúng thì thống kê 𝑇0 = 𝑋−𝜇0 √𝑛 có phân phối Student T(n-1), đồng thời X là một ước lượng không chệch cho μ.
Từđó ta có quy tắc kiểm định sau :
𝑃 (𝑋 − 𝜇 0√𝑛 < 𝑇𝛼(𝑛 − 1)) = 1 − 𝛼
Tìm 𝑇𝛼 từ bảng phân phối Student Nếu 𝑇0 > 𝑇𝛼, thì bác bỏ H.
4.2.2 Kiểm định so sánh hai trung bình
Cho hai biến ngẫu nhiên độc lập X và Y, trong đó X có phân phối chuẩn 𝑁(𝜇1; 𝜎12)
mẫu kích thước n1,biến Y có phân phối chuẩn 𝑁(𝜇2; 𝜎22) mẫu kích thước n2. Ta có giả thiết H0:𝜇1 = 𝜇2, ta có các dạng bài toán:
i. Trường hợp 𝜎12; 𝜎22đã biết: chia thành 3 đối thuyết H1:μ1>μ2 ;H1:μ1<μ2
;H1:μ1≠μ2 Ta có quy tắc kiểm định như sau: Tìm 𝑍𝛼 từ hệ thức 2𝛷(𝑍𝛼) = 1 − 𝛼;Tính thống kê 𝑍𝛼 = |𝑋 − 𝑌| √𝜎12 𝑛1 + 𝜎2 2 𝑛2 Nếu 𝑍0 ≤ 𝑍𝛼, thì chấp nhận H. Nếu 𝑍0 > 𝑍𝛼 thì bác bỏ H
ii. Trường hợp 𝜎12; 𝜎22 chưa biết: chia thành 3 đối thuyết H1:μ1>μ2
- Trong thống kê, bài toán Behrens-Fisher, được đặt theo tên của Walter
Behrens và Ronald Fisher, là bài toán ước lượng khoảng thời gian và kiểm
định giả thuyết liên quan đến sự khác biệt giữa giá trị trung bình của hai quần thể phân bố chuẩn khi phương sai của hai quần thể không được giả định là bằng nhau , dựa trên hai mẫu độc lập.
- Các giải pháp cho vấn đề Behrens-Fisher đã được trình bày sử dụng quan
điểm cổ điển hoặc suy luận Bayes và một trong hai giải pháp sẽ không hợp lệ về mặt hình thức được đánh giá theo quan điểm khác. Nếu việc xem xét chỉ bị giới hạn trong suy luận thống kê cổ điển, thì có thể tìm kiếm các giải pháp cho vấn đề suy luận dễ áp dụng theo nghĩa thực tế, ưu tiên sựđơn giản
này hơn bất kỳ sự không chính xác nào trong các câu xác suất tương ứng. Khi yêu cầu độ chính xác của các mức ý nghĩa của các thử nghiệm thống kê, có thể có yêu cầu bổ sung rằng thủ tục phải sử dụng tối đa thông tin thống kê trong tập dữ liệu. Ai cũng biết rằng có thể đạt được một thử nghiệm chính xác bằng cách loại bỏ ngẫu nhiên dữ liệu từ tập dữ liệu lớn hơn cho đến khi
các kích thước mẫu bằng nhau, tập hợp dữ liệu theo từng cặp và lấy chênh lệch, sau đó sử dụng phân phối Student thông thường để kiểm tra sự độ
chênh lệch giữa hai kỳ vọng bằng 0 rõ ràng điều này sẽ không phải là "tối
ưu" theo bất kỳnghĩa nào.
- Nhiệm vụ chỉ định ước lượng khoảng thời gian cho vấn đề này là một nhiệm vụ mà cách tiếp cận theo suy luận Frenquentist không cung cấp giải pháp chính xác, mặc dù có sẵn một số phép gần đúng. Các phương pháp tiếp cận Bayes tiêu chuẩn cũng không đưa ra được câu trả lời có thể được biểu thị dưới dạng các công thức đơn giản, nhưng các phương pháp tính toán hiện
đại của phân tích Bayes cho phép tìm ra các giải pháp chính xác về cơ bản. giữa phương pháp tiếp cận thường xuyên và Bayes để ước lượng khoảng thời gian.
Ta có quy tắc kiểm định như sau: Tìm 𝑇𝛼 = 𝑇𝛼/2(𝑛1+ 𝑛2− 2) từ bảng phân phối Student Tính thống kê 𝑇0 = |𝑋−𝑌| √𝜎12 𝑛1+𝜎22𝑛2 Nếu 𝑇0 ≤ 𝑇𝛼, thì chấp nhận H. Nếu 𝑇0 > 𝑇𝛼 thì bác bỏ H +Ví dụ:
Có hai phương pháp sản xuất . Phương án 1thử 6 mẫu thì trung bình cần 2.5 nguyên liệu,với phương sai là 0.1. Phương án 2 thử 5 mẫu thì trung bình cần 3.3 nguyên liệu , với phương sai là 0.195. Cần chọn phương án nào phù hợp, với mức ý nghĩa 0.05?
Giải: H0:𝜇1 = 𝜇2 (số trung bình các đơn vị nguyên liệu cần thiết để sản xuất ra một sản phẩm của hai phương pháp là bằng nhau)
-𝑇𝛼 = 𝑇0.025(9) = 2.26
-𝑇0 = |2.5−3.3|
√0.16 +0.1955 = 3.39
Vì 𝑇0 > 𝑇𝛼 thì bác bỏ H, nên số trung bình các đơn vị nguyên liệu để sản xuất ra một sản phẩm là không bằng nhau
4.2.3 Kiểm định phương sai
A. Kiểm định phương sai (A chi-square test)
i. Phép thửchi bình phương (Cochran, 1989)có thểđược sử dụng để kiểm
tra xem phương sai của một tập hợp có bằng một giá trịxác định hay không. Thử nghiệm này có thể là thử nghiệm hai phía hoặc thử nghiệm
một phía. Phép thử hai phía kiểm tra phương án thay thế rằng phương sai
thực nhỏhơn hoặc lớn hơn giá trịđược chỉđịnh. Phép thử một phía chỉ
kiểm tra theo một hướng. Việc lựa chọn kiểm tra hai phía hay một phía là do vấn đề quyết định.
ii. Giả sử tổng thể có phân phối chuẩn, phương sai 2, Mẫu có kích thước n, trung bình mẫu n, phương sai mẫu hiệu chỉnh s2. Hãy kiểm định giả thiết H0:=0 với mức ý nghĩa α