Hệ số Z của Altman

Một phần của tài liệu BÁO CÁO CUỐI KỲ MÔN HỌC PHÂN TÍCH DỮ LIỆU (Trang 52)

D. Công thức tính xác suất

3.3 Hệ số Z của Altman

Công thức điểm Z để dự đoán phá sản được Edward I. Altman, lúc đó là Trợ lý

Giáo sư Tài chính tại Đại học New York, xuất bản năm 1968. Công thức này có thể được sử dụng để dự đoán xác suất một công ty sẽ phá sản trong vòng hai năm. Điểm Z được sử dụng để dự đoán các vụ vỡ nợ của công ty và là một biện pháp

kiểm soát dễ tính toán đối với tình trạng kiệt quệ tài chính của các công ty trong các nghiên cứu học thuật. Điểm số Z sử dụng nhiều giá trị thu nhập doanh nghiệp và bảng cân đối kế toán đểđo lường sức khỏe tài chính của một công ty. Điểm này càng thấp thì khả năng phá sản càng cao. Các công ty có điểm Z trên 3 được xem là khỏe mạnh và không có khả năng phá sản. Điểm Z trong khoảng từ 1.8 đến 3 là

vùng xám.Đây là một mô hình tương đối chính xác - việc ứng dụng điểm Z thực tế

trên thế giới đã dự đoán thành công 72% sự phá sản của các doanh nghiệp trước 2

năm.

3.3.2 Công thức

Mô hình này kết hợp 5 chỉ số tài chính khác nhau để xác định khả năng phá sản của các công ty.

Z score = 1,2*A1+1,4*A2+3,3*A3+0,6*A4+1,0*A5

Trong đó:

 A1 = Vốn luân chuyển ( = Tài sản ngắn hạn – Nợ ngắn hạn)/Tổng tài sản. Tỷ lệ này cung cấp thông tin về tình hình tài chính ngắn hạn của doanh nghiệp

 A2 = Lợi nhuận chưa phân phối/Tổng tài sản. Tỷ lệ này đo lường mức độ

phụ thuộc của doanh nghiệp vào nợ.

 A3 = EBIT (Lợi nhuận trước lãi vay và thuế)/Tổng tài sản

 A4 = (Giá thị trường của cổ phiếu*Số lượng cổ phiếu lưu hành)/Tổng nợ.Cho thấy giá trị thịtrường của doanh nghiệp có thể giảm bao nhiêu trước khi nợ phải trả vượt quá tài sản

 A5 = Hiệu quả sử dụng tài sản =Doanh thu/Tổng tài sản. Từ 1 đồng tài sản, doanh nghiệp làm ra bao nhiêu đồng doanh thu thuần.

CHƯƠNG 4. KIỂM ĐỊNH GIẢ THIẾT 4.1 Khái niệm

Các nhà phân tích thống kê kiểm tra một giả thuyết bằng cách đo lường và kiểm tra một mẫu ngẫu nhiên của không gian mẫu đang được phân tích. Việc họ làm là sử

dụng một không gian mẫu ngẫu nhiên để kiểm tra hai giả thuyết khác nhau: giả

thuyết không và giả thuyết nghịch.

4.1.1 Giả thiết không (Null Hypothesis)

Giả thuyết không H0 là một loại giả thuyết được sử dụng trong thống kê giả định rằng không có ý nghĩa thống kê nào tồn tại trong một tập hợp các quan sát nhất

định. Giả thuyết không được cho là đúng cho đến khi có bằng chứng thống kê bác bỏ nó với một giả thuyết thay thế khác.

Giả thuyết không giả định rằng bất kì sự khác biệt hay ý nghĩa nào bạn quan sát

được trong một tập hợp dữ liệu là do sự ngẫu nhiên.

4.1.2 Giả thiết nghịch (Alternative hypothesis)

Khái niệm về một giả thuyết nghịch trong thử nghiệm do Jerzy Neyman và Egon

Pearson nghĩ ra, và nó được sử dụng trong bổ đề Neyman-Pearson(E. L. Lehmann, 1986). Nó tạo thành một thành phần chính trong thử nghiệm giả thuyết thống kê hiện đại. Tuy nhiên, nó không phải là một phần trong công thức kiểm tra giả thuyết thống kê của Ronald Fisher, và ông phản đối việc sử dụng nó. Trong cách tiếp cận kiểm định của Fisher, ý tưởng trung tâm là đánh giá xem liệu tập dữ liệu quan sát có thể là kết quả ngẫu nhiên hay không nếu giả thuyết không được giả định là

đúng, không có định kiến về những gì các mô hình khác có thể nắm giữ. Thử

nghiệm giả thuyết thống kê hiện đại đáp ứng điều này loại kiểm định vì giả thuyết nghịch H1 có thể chỉ là sự phủđịnh của giả thuyết không.

4.1.3 Mức ý nghĩa

Trong thống kê, một kết quả được gọi là có ý nghĩa thống kê nếu nó không có khả

xảy ra là do ngẫu nhiên. Cụm từ Ý nghĩa thống kê được đặt tên bởi Ronald Fisher. Trong thống kê, ý nghĩa không có nghĩa là quan trọng , nhưng những nhà phân tích chỉ tập trung vào kết quả có thể bỏ sót các dạng mẫu trả lời quan trọng mà có thể rơi dưới ngưỡng được đặt ra cho kiểm định ý nghĩa.

4.1.4 Miền bác bỏ

Miền bác bỏ là miền xác định trong đồ thị, được đo trong phân phối lấy mẫu của thống kê đang nghiên cứu, dẫn đến bác bỏ giả thuyết không H0 trong một bài kiểm tra giả thuyết. Miền bác bỏ bổ sung cho vùng chấp nhận và được liên kết với xác suất α, được gọi là mức ý nghĩa..

4.1.5 Kiểm định giả thiêt thông kê

Bài toán kiểm nghiệm giả thiêt thống kê tổng quát được đặt dưới dạng sau: i. Cho đại lượng ngẫu nhiên X và một giả thiết H0 về phân phối xác suất

của X. Một mệnh đề khác với H0đưuọc gọi là đói thiết H1. Cần kiểm nghiệm xem H0 dúng hay sao trên cở sở mẫu lấy được là (𝑋1, 𝑋2, … , 𝑋𝑛)

Trên không gian mẫu ta xác định miền W gọi là miền bác bỏ giả thiêt H0, phần bù của W ký hiệu là 𝑊 là miền chấp nhận giả thiêt H0.

Mẫu đã lấy được (𝑥1, 𝑥2, … , 𝑥𝑛) là một điểm xác định của không gian mẫu.

Mẫu đã lấy được (𝑥1, 𝑥2, … , 𝑥𝑛) ∈ 𝑤 thì ta coi giả thiêt H0 là sai và bác bỏ giả thiết

đó.

Mẫu đã lấy được (𝑥1, 𝑥2, … , 𝑥𝑛) ∈ 𝑊 thì ta coi giả thiêt H0 là đúng và chấp nhận giả thiet đó

ii. Các loại sai lầm: Trong việc chọn một quy tắc có thể mắc các sai lầm

 Sai lầm loại I: Bác bỏ giả thuyết H0 nhưng thực tế H0 là đúng. Sai lầm này

được đặc trưng bởi 𝑃 = (𝐻𝑊

0)

 Sai lầm loại II: Chấp nhận giả thuyết H0nhưng thực tế H0 là sai. Sai lầm này

được đặc trưng bởi P=(𝐻𝑊

1)

Quyết định bác bỏ hay chấp nhận giả thuyết hoàn toàn dựa vào thông tin mẫu, do

đó ta sẽ có xác suất mắc sai lầm loại I và sai lầm loại II. Ký hiệu α là xác suất mắc sai lầm loại I.

Lúc đó α được gọi là mức ý nghĩa. Ký hiệu β là xác suất mắc sai lầm loại II.

α = P(sai lầm loại I) = P(bác bỏ H0 | H0 đúng)= P(chấp nhận H0 | H1 sai).

β = P(sai lầm loại II) = P (chấp nhận H0 | H0 sai) = P(chấp nhận H0 | H1đúng).

+Ví dụ:

Giả thiết H0 cho rằng:” bệnh nhân A uống được thuốc B”.

Sai lầm loại 1 dẫn đến việc phải đi tìm thuôcs khác khi bênh nhân uống được thuốc B.

Còn sai lầm loại 2 lại dẫn đến kết luận là cho bệnh nhân uống thuốc B trong lúc bệnh nhân không uống được thuốc đó.

iii. Các bước kiểm định giả thiết thống kê

Bước 1: Xác định tham số cần kiểm định, đặt giả thuyết và đối thuyết.

Bước 2: Xác định tiêu chuẩn thống kê và tính giá trị của tiêu chuẩn thống kê đối với giá trị mẫu đã cho.

Bước 3: Xác định miền bác bỏ W.

Bước 4: So sánh giá trị của tiêu chuẩn thống kê với miền bác bỏ W và kết luận bác bỏ hay chấp nhận giả thuyết H0.

4.2 Kiểm định giả thiết tham số

4.2.1 Kiểm định giá trị kì vọng của phân phối chuẩn

i. Giả sử tổng thể có trung bình (kỳ vọng) μ. Mẫu có kích thước n, trung bình mẫu 𝑥, phương sai mẫu hiệu chỉnh 2. Hãy kiểm định giả thiết H0:μ=μ0 với mức ý nghĩa α A. Trường hợp 1:  2đã biết, H1:μ≠μ0 Tiêu chuẩn kiểm định:𝑍 = 𝑋−𝜇0  √𝑛 Ta thấy nếu giả thuyết H 0 đúng thì thống kê 𝑍0 =𝑋−𝜇0  √𝑛 có phân phối chuẩn

N(0; 1), đồng thời X là một ước lượng không chệch cho μ. Từđó ta có quy tắc kiểm định sau :

Tìm 𝑍𝛼 từ hệ thức 2𝛷(𝑍𝛼) = 1 − 𝛼

Nếu 𝑍0 ≤ 𝑍𝛼, thì chấp nhận H. Nếu 𝑍0 > 𝑍𝛼 thì bác bỏ H

Nếu giá trịđó thuộc vào miền tiêu chuẩn thì ta bác bỏ giả thuyết, kết luận kỳ vọng của biến X thực sự khác μ0. Ngược lại, nếu giá trịđó nằm trong miền chấp nhận thì phải kết luận kỳ vọng của X không khác μ0 một cách có ý nghĩa.

+Ví dụ:

Điểm trung bình năm nay của 100 học sinh là 5.9 điểm toán cuối kì, có độ lệch chuẩn là 1.21. Điểm trung bình mới vừa thay đổi đểđạt danh hiệu thi đua của môn toán năm ngoái là 5.72. Với mức ý nghĩa 1% có phải điểm trung bình năm nay có

đạt tiêu chuẩn năm ngoái không?

Giải: Giả thiết H0:μ=μ0 =5.72 ( điểm năm nay bằng năm trước)

2𝛷(𝑍𝛼) = 1 − 𝛼 = 1 − 0.01 => 𝑍𝛼 = 2.58 𝑍0 =|𝑋 − 𝜇 0|√𝑛 = |5.9 − 5.72|

1.21 √100 = 1.49

Vì 𝑍0 < 𝑍𝛼 nên chấp nhận H0 . Vậy điểm môn toán năm nay không cao hơn năm

trước với mức ý nghĩa 1%, nên không đạt được tiêu chuẩn nhận danh hiệu thi đua.

B. Trường hợp 2  2đã biết, H1:μ>μ0 Tiêu chuẩn kiểm định:𝑍 = 𝑋−𝜇0  √𝑛 Ta thấy nếu giả thuyết H 0 đúng thì thống kê 𝑍0 =𝑋−𝜇0  √𝑛 có phân phối chuẩn

Từđó ta có quy tắc kiểm định sau : 𝑃 (𝑋 − 𝜇 0√𝑛 > 𝑍𝛼) = 1 − 𝛼 Tìm 𝑍𝛼 từ hệ thức 2𝛷(𝑍𝛼) = 1 − 𝛼 Nếu 𝑍0 > 𝑍𝛼 thì chấp nhận H. C. Trường hợp 3  2đã biết, H1:μ<μ0 Tiêu chuẩn kiểm định:𝑍 = 𝑋−𝜇0  √𝑛 Ta thấy nếu giả thuyết H 0 đúng thì thống kê 𝑍0 =𝑋−𝜇0  √𝑛 có phân phối chuẩn

N(0; 1), đồng thời X là một ước lượng không chệch cho μ. Từđó ta có quy tắc kiểm định sau :

𝑃 (𝑋 − 𝜇 0√𝑛 < 𝑍𝛼) = 1 − 𝛼

Tìm 𝑍𝛼 từ hệ thức 2𝛷(𝑍𝛼) = 1 − 𝛼

Nếu 𝑍0 > 𝑍𝛼 thì bác bỏ H

ii. Giả sử tổng thể có trung bình (kỳ vọng) μ. Mẫu có kích thước n, trung bình mẫu 𝑥, phương sai mẫu hiệu chỉnh 2chưa biết. Hãy kiểm định giả thiết H0:μ=μ0 với mức ý nghĩa α

 2 chưa biết, H1:μ≠μ0 Tiêu chuẩn kiểm định:𝑇 = 𝑋−𝜇0

 √𝑛

Ta thấy nếu giả thuyết H 0 đúng thì thống kê 𝑇0 = 𝑋−𝜇0

 √𝑛 có phân phối Student T(n-1), đồng thời X là một ước lượng không chệch cho μ.

Từđó ta có quy tắc kiểm định sau :

𝑃 (|𝑋 − 𝜇 0|√𝑛 ≤ 𝑇𝛼(𝑛 − 1)) = 1 − 𝛼

Tìm 𝑇𝛼 từ bảng phân phối Student

Nếu 𝑇0 ≤ 𝑇𝛼, thì chấp nhận H. Nếu 𝑇0 > 𝑇𝛼 thì bác bỏ H

+Ví dụ:

Một vưòn ươm cây giống, theo quy định khi nào cây cao trung bình trên 1m thì

đem ra trồng. Đo ngẫu nhiên 25 cây, được số liệu:

Chiều cao 0.8 0.9 1.0 1.1 1.2 1.3

Số cây 1 2 9 7 4 2

Với mức ý nghĩa 5%, có thể đem cây ra trồng không, gải thiết chiều cao của cây theo luật phân phối chuẩn.

Giải:

Gọi μ là chiều cao trung bình của cây trong vườn. Từ mẫu ta có: H0:μ=μ0 =1 ( chưa nên đem cây ra trồng)

-𝑇𝛼 = 𝑇0.05(24) = 2.064

-𝑇0 =|1.068−1|0.122 √25 = 2.787

Vì 𝑇0 > 𝑇𝛼 thì bác bỏ H, nên ta kết luận nên đem cây ra trồng

B. Trường hợp 2  2 chưa biết, H1:μ>μ0 Tiêu chuẩn kiểm định:𝑇 = 𝑋−𝜇0  √𝑛 Ta thấy nếu giả thuyết H 0 đúng thì thống kê 𝑇0 = 𝑋−𝜇0  √𝑛 có phân phối Student T(n-1), đồng thời X là một ước lượng không chệch cho μ.

Từđó ta có quy tắc kiểm định sau : 𝑃 (𝑋 − 𝜇 0√𝑛 > 𝑇𝛼(𝑛 − 1)) = 1 − 𝛼 Tìm 𝑇𝛼 từ bảng phân phối Student Nếu 𝑇0 > 𝑇𝛼, thì chấp nhận H. C. Trường hợp 3  2 chưa biết, H1:μ<μ0 Tiêu chuẩn kiểm định:𝑇 = 𝑋−𝜇0  √𝑛 Ta thấy nếu giả thuyết H 0 đúng thì thống kê 𝑇0 = 𝑋−𝜇0  √𝑛 có phân phối Student T(n-1), đồng thời X là một ước lượng không chệch cho μ.

Từđó ta có quy tắc kiểm định sau :

𝑃 (𝑋 − 𝜇 0√𝑛 < 𝑇𝛼(𝑛 − 1)) = 1 − 𝛼

Tìm 𝑇𝛼 từ bảng phân phối Student Nếu 𝑇0 > 𝑇𝛼, thì bác bỏ H.

4.2.2 Kiểm định so sánh hai trung bình

Cho hai biến ngẫu nhiên độc lập X và Y, trong đó X có phân phối chuẩn 𝑁(𝜇1; 𝜎12)

mẫu kích thước n1,biến Y có phân phối chuẩn 𝑁(𝜇2; 𝜎22) mẫu kích thước n2. Ta có giả thiết H0:𝜇1 = 𝜇2, ta có các dạng bài toán:

i. Trường hợp 𝜎12; 𝜎22đã biết: chia thành 3 đối thuyết H1:μ1>μ2 ;H1:μ1<μ2

;H1:μ1≠μ2 Ta có quy tắc kiểm định như sau: Tìm 𝑍𝛼 từ hệ thức 2𝛷(𝑍𝛼) = 1 − 𝛼;Tính thống kê 𝑍𝛼 = |𝑋 − 𝑌| √𝜎12 𝑛1 + 𝜎2 2 𝑛2 Nếu 𝑍0 ≤ 𝑍𝛼, thì chấp nhận H. Nếu 𝑍0 > 𝑍𝛼 thì bác bỏ H

ii. Trường hợp 𝜎12; 𝜎22 chưa biết: chia thành 3 đối thuyết H1:μ1>μ2

- Trong thống kê, bài toán Behrens-Fisher, được đặt theo tên của Walter

Behrens và Ronald Fisher, là bài toán ước lượng khoảng thời gian và kiểm

định giả thuyết liên quan đến sự khác biệt giữa giá trị trung bình của hai quần thể phân bố chuẩn khi phương sai của hai quần thể không được giả định là bằng nhau , dựa trên hai mẫu độc lập.

- Các giải pháp cho vấn đề Behrens-Fisher đã được trình bày sử dụng quan

điểm cổ điển hoặc suy luận Bayes và một trong hai giải pháp sẽ không hợp lệ về mặt hình thức được đánh giá theo quan điểm khác. Nếu việc xem xét chỉ bị giới hạn trong suy luận thống kê cổ điển, thì có thể tìm kiếm các giải pháp cho vấn đề suy luận dễ áp dụng theo nghĩa thực tế, ưu tiên sựđơn giản

này hơn bất kỳ sự không chính xác nào trong các câu xác suất tương ứng. Khi yêu cầu độ chính xác của các mức ý nghĩa của các thử nghiệm thống kê, có thể có yêu cầu bổ sung rằng thủ tục phải sử dụng tối đa thông tin thống kê trong tập dữ liệu. Ai cũng biết rằng có thể đạt được một thử nghiệm chính xác bằng cách loại bỏ ngẫu nhiên dữ liệu từ tập dữ liệu lớn hơn cho đến khi

các kích thước mẫu bằng nhau, tập hợp dữ liệu theo từng cặp và lấy chênh lệch, sau đó sử dụng phân phối Student thông thường để kiểm tra sự độ

chênh lệch giữa hai kỳ vọng bằng 0 rõ ràng điều này sẽ không phải là "tối

ưu" theo bất kỳnghĩa nào.

- Nhiệm vụ chỉ định ước lượng khoảng thời gian cho vấn đề này là một nhiệm vụ mà cách tiếp cận theo suy luận Frenquentist không cung cấp giải pháp chính xác, mặc dù có sẵn một số phép gần đúng. Các phương pháp tiếp cận Bayes tiêu chuẩn cũng không đưa ra được câu trả lời có thể được biểu thị dưới dạng các công thức đơn giản, nhưng các phương pháp tính toán hiện

đại của phân tích Bayes cho phép tìm ra các giải pháp chính xác về cơ bản. giữa phương pháp tiếp cận thường xuyên và Bayes để ước lượng khoảng thời gian.

Ta có quy tắc kiểm định như sau: Tìm 𝑇𝛼 = 𝑇𝛼/2(𝑛1+ 𝑛2− 2) từ bảng phân phối Student Tính thống kê 𝑇0 = |𝑋−𝑌| √𝜎12 𝑛1+𝜎22𝑛2 Nếu 𝑇0 ≤ 𝑇𝛼, thì chấp nhận H. Nếu 𝑇0 > 𝑇𝛼 thì bác bỏ H +Ví dụ:

Có hai phương pháp sản xuất . Phương án 1thử 6 mẫu thì trung bình cần 2.5 nguyên liệu,với phương sai là 0.1. Phương án 2 thử 5 mẫu thì trung bình cần 3.3 nguyên liệu , với phương sai là 0.195. Cần chọn phương án nào phù hợp, với mức ý nghĩa 0.05?

Giải: H0:𝜇1 = 𝜇2 (số trung bình các đơn vị nguyên liệu cần thiết để sản xuất ra một sản phẩm của hai phương pháp là bằng nhau)

-𝑇𝛼 = 𝑇0.025(9) = 2.26

-𝑇0 = |2.5−3.3|

√0.16 +0.1955 = 3.39

Vì 𝑇0 > 𝑇𝛼 thì bác bỏ H, nên số trung bình các đơn vị nguyên liệu để sản xuất ra một sản phẩm là không bằng nhau

4.2.3 Kiểm định phương sai

A. Kiểm định phương sai (A chi-square test)

i. Phép thửchi bình phương (Cochran, 1989)có thểđược sử dụng để kiểm

tra xem phương sai của một tập hợp có bằng một giá trịxác định hay không. Thử nghiệm này có thể là thử nghiệm hai phía hoặc thử nghiệm

một phía. Phép thử hai phía kiểm tra phương án thay thế rằng phương sai

thực nhỏhơn hoặc lớn hơn giá trịđược chỉđịnh. Phép thử một phía chỉ

kiểm tra theo một hướng. Việc lựa chọn kiểm tra hai phía hay một phía là do vấn đề quyết định.

ii. Giả sử tổng thể có phân phối chuẩn, phương sai 2, Mẫu có kích thước n, trung bình mẫu n, phương sai mẫu hiệu chỉnh s2. Hãy kiểm định giả thiết H0:=0 với mức ý nghĩa α

Một phần của tài liệu BÁO CÁO CUỐI KỲ MÔN HỌC PHÂN TÍCH DỮ LIỆU (Trang 52)

Tải bản đầy đủ (PDF)

(98 trang)