1. Trang chủ
  2. » Tất cả

Luận văn thạc sĩ toán học tìm hiểu về các phương pháp tạo chỉ số thống kê và ứng dụng

20 0 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

ĐẠI HỌC QUỐC GIA HÀ NỘI ĐẠI HỌC KHOA HỌC TỰ NHIÊN —————————————– Nguyễn Phương Ly TÌM HIỂU VỀ CÁC PHƯƠNG PHÁP TẠO CHỈ SỐ THỐNG KÊ VÀ ỨNG DỤNG LUẬN VĂN THẠC SĨ KHOA HỌC Hà Nội Năm 2019 ĐẠI HỌC QUỐC GIA[.]

ĐẠI HỌC QUỐC GIA HÀ NỘI ĐẠI HỌC KHOA HỌC TỰ NHIÊN —————————————– Nguyễn Phương Ly TÌM HIỂU VỀ CÁC PHƯƠNG PHÁP TẠO CHỈ SỐ THỐNG KÊ VÀ ỨNG DỤNG LUẬN VĂN THẠC SĨ KHOA HỌC Hà Nội - Năm 2019 ĐẠI HỌC QUỐC GIA HÀ NỘI ĐẠI HỌC KHOA HỌC TỰ NHIÊN —————————————– Nguyễn Phương Ly TÌM HIỂU VỀ CÁC PHƯƠNG PHÁP TẠO CHỈ SỐ THỐNG KÊ VÀ ỨNG DỤNG Chuyên ngành: Lý thuyết xác suất thống kê toán học Mã số: 8460112.02 LUẬN VĂN THẠC SĨ KHOA HỌC NGƯỜI HƯỚNG DẪN KHOA HỌC: Hà Nội - Năm 2019 TS Trịnh Quốc Anh Lời nói đầu Trong bối cảnh hội nhập quốc tế nay, việc nâng cao lực đội ngũ cán yếu tố quan trọng cần trọng; vậy, giáo dục kiểm định đánh giá giáo dục phần then chốt giúp Việt Nam ta hiểu phân tích thơng tin để đối chiếu với mục tiêu, tiêu chuẩn đề ra, nhằm có định thích hợp để điều chỉnh, nâng cao chất lượng hiệu giáo dục Trong kiểm tra đánh giá lực, phản hồi thô học sinh có hai khía cạnh quan trọng độ xác thời gian phản hồi Từ trước đến nay, kiểm tra đánh giá người ta thường quan tâm đến độ xác câu trả lời dựa vào số câu sai để đánh giá lực học sinh Tuy nhiên gần đây, với phát triển máy tính cơng nghệ thơng tin, ta dễ dàng ghi lại thời gian phản hồi câu hỏi học sinh cho làm kiểm tra máy tính để từ đó, đưa kết xác lực học sinh Luận văn bước phát triển tiếp nối sau khóa luận em, nghiên cứu thêm yếu tố thời gian phản hồi đánh giá lực người học Luận văn gồm ba chương Chương 1: Kiến thức chuẩn bị Chương trình bày lại kiến thức chuẩn bị mơ hình ứng đáp câu hỏi, phân phối chuẩn, phân phối lognormal để làm tiền đề nghiên cứu mô hình phản hồi thời gian lognormal chương hai Các kiến thức suy luận Bayes, phương pháp xích Markov đặc biệt giải thuật Gibbs nhắc lại để giúp cho phần ước lượng tham số chương hai chương ba rõ ràng Chương 2: Mơ hình thời gian phản hồi ứng đáp câu hỏi lô-ga-rit chuẩn (Lognormal Item Response Theory) Chúng giới thiệu lại lịch sử phát triển mơ hình phản hồi thời gian, nói động lực để áp dụng mơ hình lơ-ga-rít chuẩn cho thời gian phản hồi thí sinh so sánh với mơ hình chuẩn cho thời gian phản hồi Phương Lời nói đầu pháp ước lượng tham số giải thuật Gibbs đưa phần Chương 3: Nghiên cứu thực nghiệm Phần trình bày lại rõ ràng nghiên cứu thực nghiêm áp dụng mô hình phản hồi thời gian lognormal cho phân tích liệu thi thích ứng Mỹ xếp mẫu, ước lượng tham số xem xét độ phù hợp mơ hình Luận văn hồn thành trường Đại học Khoa học tự nhiên - Đại học quốc gia Hà Nội, hướng dẫn TS Trịnh Quốc Anh Em chân thành cảm ơn thầy Trịnh Quốc Anh, nghiên cứu sinh học trị thầy Trong q trình nghiên cứu, nhiều sơ suất em thầy tận tình dạy dỗ, hướng dẫn, động viên em suốt thời gian làm viêc Ngoài em muốn gửi lời cám ơn sâu sắc đến thành viên nhóm seminar Xác suất thống kê, Đại học Khoa học tự nhiên góp ý nhiều trình em hồn thành luận văn Em xin bày tỏ lịng biết ơn thầy cán trường Đại học khoa học tự nhiên quan tâm giúp đỡ trình học tập nghiên cứu trường Em xin tỏ lòng biết ơn sâu sắc đến gia đình, bố mẹ, anh chị em anh Phạm Hồng Việt bên cạnh đồng hành, giúp đỡ, tạo điều kiện suốt trình em học tập làm luận văn thạc sĩ Cảm ơn hai thiên thần bé nhỏ Hồng Quân, Hồng Ngọc động lực to lớn giúp em cố gắng vượt qua khó khăn q trình nghiên cứu để hoàn thành luận văn Hà Nội, ngày 10 tháng 12 năm 2019 Nguyễn Phương Ly Mục lục Lời nói đầu Danh mục ký hiệu chữ viết tắt Kiến thức chuẩn bị 10 1.1 Mô hình IRT 10 1.2 Phân phối chuẩn 15 1.3 Phân phối lognormal 18 1.4 Suy luận Bayes 21 1.4.1 Suy luận Bayes cho biến ngẫu nhiên rời rạc 22 1.4.2 Suy luận Bayes cho biến ngẫu nhiên liên tục 23 Phương pháp xích Markov Monte Carlo (MCMC) 24 1.5.1 Phương pháp Monter Carlo 24 1.5.2 Phương pháp xích Markov Monte Carlo (MCMC) 26 Giải thuật Gibbs 28 1.6.1 Bài toán sinh mẫu 28 1.6.2 Thuật toán Gibbs giải toán sinh mẫu 29 1.5 1.6 Mơ hình phản hồi thời gian ứng đáp câu hỏi lognormal 33 2.1 Giới thiệu 33 2.2 Mơ hình thời gian phản hồi lognormal IRT - LNIRT 37 2.2.1 Giả thiết mơ hình 37 2.2.2 Mơ hình LNIRT 38 2.2.3 Mơ hình chuẩn 44 Ước lượng tham số 45 2.3.1 Phân bố tiên nghiệm 45 2.3.2 Phân bố hậu nghiệm 46 2.3.3 Giải thuật Gibbs 46 2.3.4 Áp dụng giải thuật Gibbs để ước lượng tham số 47 2.3 MỤC LỤC 2.3.5 Độ phù hợp Nghiên cứu thực nghiệm 48 50 3.1 Mô tả mẫu 51 3.2 Ước lượng tham số 52 3.3 Độ phù hợp mơ hình 55 KẾT LUẬN 59 TÀI LIỆU THAM KHẢO 60 Danh sách hình vẽ [1] 1.1 Đường cong đặc trưng câu hỏi mơ hình tham số 1.2 Vị trí độ khó câu hỏi lực thí sinh trục lực/độ khó tương ứng với xác suất trả lời 0.5 1.3 [1] 12 13 Hàm đặc trưng câu hỏi năm câu hỏi mơ hình tham số.[1] 13 1.4 Hàm đặc trưng ba câu hỏi mơ hình hai tham số 1.5 Hàm đặc trưng câu hỏi mô hình ba tham số.[1] [1] 14 15 [wiki] 1.6 Hàm mật độ xác suất tuân theo phân phối chuẩn 16 1.7 Hàm mật độ xác suất tuân theo phân phối lognormal.wiki 19 1.8 Hàm phân phối xác suất tích lũy tuân theo phân phối lognormal 20 1.9 Minh họa thuật toán Gibbs 31 1.10 Sơ đồ khối giải thuật Gibbs 32 2.1 [wiki] Biểu đồ miêu tả mô hình phân cấp phản hồi thời gian phản hồi (RT) câu hỏi kiểm tra cáp tiếp cận thứ ba.[6] [6] 2.2 Ví dụ hai phép tính số học yêu cầu cường độ thời gian khác 2.3 Ảnh hưởng tham số phân biệt phân bố thời gian phản hồi 36 39 (phần trên) phân bố phản hồi (phần dưới) Bên trái hình với tham số phân biệt có giá trị nhỏ, phần bên phải có tham số phân biệt có giá trị lớn Diện tích phần trùng hai phân bố lớn giá trị tham số phân biệt lớn hơn.[4] 3.1 43 Biểu đồ phân tán với trung bình phương sai thời gian phản hồi tính theo giây cho 48 câu (ảnh trên) 2000 thí sinh mẫu (ảnh dưới).[4] 3.2 Phân bố thời gian phản hồi theo đơn vị giây câu hỏi (hình trên; N=760) câu hỏi 13 (hình dưới; N=490).[4] 3.3 53 54 Ước lượng cường độ thời gian (βi ) tham số độ phân biệt (αi ) mơ hình lơ-ga-rít chuẩn mơ hình chuẩn cho hai trường hợp khơng có ràng bc có ràng buộc αi [4] 54 DANH SÁCH HÌNH VẼ 3.4 Phân bố tham số tốc độ (τi ) ước lượng mơ hình lơ-ga-rít chuẩn mơ hình chuẩn cho hai trường hợp tham số αi khơng có ràng buộc có ràng buộc.[4] 3.5 55 Tổng quan độ phù hợp mô hình lơ-ga-rít chuẩn mơ hình chuẩn cho hai trường hợp tham số αi khơng có ràng buộc có ràng buộc Càng phù hợp đường cong gần với đường thẳng đơn vị y=x.[4] 3.6 56 Độ phù hợp mơ hình lơ-ga-rít chuẩn cho câu hỏi tốt câu hỏi tệ với hai trường hợp tham số αi khơng có ràng buộc có ràng buộc Càng phù hợp đường cong gần với đường thẳng đơn vị y=x[4] 56 Danh sách bảng 1.1 1.2 Định nghĩa giá trị tuân theo phân bố chuẩn: X ∼ N (µ, σ ).[wiki] 16 Định nghĩa giá trị tuân theo phân bố lognormal ln(X) ∼ N (µ, σ ) [wiki] 19 3.1 Số lượng câu hỏi thí sinh mẫu.[4] 52 3.2 Số thí sinh câu hỏi mẫu [4] 52 3.3 Tỷ lệ quan sát tỷ lệ kỳ vọng thí sinh có thời gian phản hồi nhỏ phân vị 10 phân bố hậu nghiệm trường hợp câu hỏi.[4] 3.4 57 Tỷ lệ quan sát tỷ lệ kỳ vọng thí sinh có thời gian phản hồi nhỏ phân vị 10 phân bố hậu nghiệm trường hợp câu hỏi.[4] 58 Danh mục ký hiệu chữ viết tắt Ω Không gian mẫu X, Y, Z Biến ngẫu nhiên F (x), FX (x) Hàm phân phối tích lũy, hàm phân phối tích lũy biến ngẫu nhiên X p(x), pX (x) Hàm mật độ xác suất, hàm mật độ xác suất biến ngẫu nhiên X X∈F Biến ngẫu nhiên X có hàm phân phối tích lũy F C(FX ) Tập hàm phân phối tích lũy liên tục E, EX Kì vọng (giá trị trung bình), giá trị kì vọng biến ngẫu nhiên X Var, VarX Phương sai, phương sai biến ngẫu nhiên X ϕ(t), ϕX (t) Hàm đặc trưng, hàm đặc trưng biến ngẫu nhiên X X∼Y Biến ngẫu nhiên X tương đương với biến ngẫu nhiên Y Φ(x) Hàm phân phối chuẩn tắc φ(x) Hàm mật độ chuẩn tắc N (µ, σ ) Phân phối chuẩn N (0, 1) Phân phối chuẩn tắc exp(a) Hàm e mũ Tham số độ phân biệt câu hỏi mơ hình IRT bi Tham số độ khó câu hỏi mơ hình IRT ci Tham số xác suất trả lời ngẫu nhiên câu hỏi mô hình IRT αi Tham số độ dao động thời gian câu hỏi mơ hình LNIRT βi Tham số cường độ thời gian câu hỏi mơ hình LNIRT exp(a) Hàm e mũ DANH SÁCH BẢNG CTT Lý thuyết trắc nghiệm cổ điển - Classical Test Theory CH Câu hỏi TS Thí sinh IRT Lý thuyết ứng đáp câu hỏi - Item Response Theory ICC Đường cong đặc trưng câu hỏi - Item Characteristic Curve LNIRT Lý thuyết ứng đáp câu hỏi lô-ga-rit chuẩn - Lognormal Item Response Theory MCMC Xích Markov Monte Carlo - Monte Carlo Markov Chain RA Độ xác phản hồi - Response Accuracy RT Thời gian phản hồi - Response Time Chương Kiến thức chuẩn bị 1.1 Mô hình IRT Lý thuyết Ứng đáp Câu hỏi (Item Response Theory - IRT) lý thuyết khoa học đo lường giáo dục, đời từ nửa sau kỷ 20 phát triển mạnh mẽ Trước đó, Lý thuyết Trắc nghiệm cổ điển (Clasical Test Theory – CTT), đời từ khoảng cuối kỷ 19 hoàn thiện vào khoảng thập niên 1970, có nhiều đóng góp quan trọng cho hoạt động đánh giá giáo dục, thể số hạn chế Các nhà tâm trắc học (psychometricians) cố gắng xây dựng lý thuyết đại cho khắc phục hạn chế Lý thuyết trắc nghiệm đại xây dựng dựa mơ hình tốn học, địi hỏi nhiều tính tốn, nhờ tiến vượt bậc cơng nghệ tính tốn máy tính điện tử vào cuối kỷ 20 – đầu kỷ 21 nên phát triển nhanh chóng đạt thành tựu quan trọng Để đánh giá đối tượng CTT tiếp cận cấp độ đề kiểm tra, lý thuyết trắc nghiệm đại IRT tiếp cận cấp độ câu hỏi, lý thuyết thường gọi Lý thuyết Ứng đáp Câu hỏi Ta quy ước gọi người có thuộc tính cần đo lường thí sinh (person) đơn vị công cụ để đo lường (test) câu hỏi (item) Để đơn giản hóa mơ hình nghiên cứu ta có giả thiết sau: (i) Năng lực tiềm ẩn (latent trait) cần đo có chiều (unidimensionality), ta đo chiều lực (ii) Các câu hỏi độc lập địa phương (local independence) , nghĩa việc trả lời câu hỏi không ảnh hưởng đến câu hỏi khác 10 Chương Kiến thức chuẩn bị Khi thỏa mãn hai giả thiết nêu khơng gian lực tiềm ẩn đầy đủ chứa lực Khi ấy, người ta giả định có hàm đặc trưng câu hỏi (Item Characteristic Function) phản ánh mối quan hệ biến không quan sát (năng lực TS) biến quan sát (việc trả lời CH) Đồ thị biểu diễn hàm gọi đường cong đặc trưng câu hỏi (Item Characteristic Curve) Đối với cặp thí sinh- câu hỏi(TS – CH), cần xây dựng thang chung để biểu diễn mối tương tác chúng Trước hết giả sử ta biểu diễn lực tiềm ẩn TS biến liên tục θ dọc theo trục, từ −∞ đến +∞ Khi xét phân bố lực tập hợp TS đó, ta gán giá trị trung bình phân bố lực tập hợp TS không (0), làm gốc thang đo lực, độ lệch tiêu chuẩn phân bố lực Tiếp đến, chọn thuộc tính CH để đối sánh với lực: tham số biểu diễn thuộc tính quan trọng độ khó b CH Cũng theo cách tương tự biểu diễn độ khó CH biến liên tục dọc theo trục, từ −∞ đến +∞ Khi xét phân bố độ khó tập hợp CH đó, ta chọn giá trị trung bình phân bố độ khó khơng (0), làm gốc thang đo độ khó, độ lệch tiêu chuẩn phân bố độ khó CH Chúng ta bắt đầu cách xây dựng hàm đáp ứng CH cho CH nhị phân, tức CH mà câu trả lời có mức: (sai) (đúng) Giả thiết sau George Rasch, nhà toán học Đan Mạch, đưa làm sở để xây dựng mơ hình hàm đáp ứng CH tham số: Một người có lực cao người khác xác suất để người trả lời câu hỏi phải lớn xác suất người sau; tương tự vậy, câu hỏi khó câu hỏi khác có nghĩa xác suất để người trả lời câu hỏi phải bé xác suất để trả lời câu hỏi sau(Rasch,1960) Với giả thiết nêu trên, thấy xác suất để TS trả lời CH phụ thuộc vào tương quan lực TS độ khó CH Chọn Θ để biểu diễn lực TS, β để biểu diễn độ khó CH Gọi P xác suất trả lời CH, xác suất phụ thuộc vào tương quan Θ β theo cách đó, ta biểu diễn f (P ) = Θ β (1.1) f hàm xác suất trả lời Lấy logarit tự nhiên phương trình 1.1:   Θ ln f (P ) = ln = ln Θ − ln β = θ − b β 11 (1.2) Chương Kiến thức chuẩn bị Để đơn giản, xét mơ hình trắc nghiệm nhị phân, Rasch chọn hàm f mức thua (odds) O, khả thực (likelyhood ratio), tức P O= , biểu diễn tỉ số khả trả lời khả trả lời sai Như vậy: (1 − P ) ln với ln P = θ − b 1−P (1.3) P gọi logit (log odds unit) Từ 1−P P = eθ−b 1−P (1.4) Như vậy, ta có: P = (1 − P )eθ−b P = eθ−b − P eθ−b P + P eθ−b = eθ−b P (1 + eθ−b ) = eθ−b eθ−b P = + eθ−b biểu thức P (Xij , θj , bi ) = eθj −bi + eθj −bi (1.5) với θj lực thí sinh thứ j; bi độ khó câu hỏi thứ i; Xij câu trả lời thí sinh thứ j với câu hỏi thứ i hàm đặc trưng mơ hình IRT tham số (IRT PL) hay cịn gọi mơ hình Rasch Biểu đồ Hình 1.1 mô ta đường cong đặc trưng câu hỏi mơ hình IRT tham số Về mặt ý Hình 1.1: Đường cong đặc trưng câu hỏi mơ hình tham số [1] nghĩa, mẫu số phương trình nhằm mục đích đảm bảo hàm số khơng nhỏ không lớn Phần thú vị phương trình 1.5 tử 12 Chương Kiến thức chuẩn bị số exp(θj − bi ), ta thấy mơ hình tham số logistic dự đoán xác suất trả lời câu hỏi dựa vào mối tương quan lực thí sinh θj tham số câu hỏi bi Tham số bi gọi tham số địa phương tham số độ khó câu hỏi Trong Hình 1.1, ta xác định trục ngang trục lực θi , trục độ khó bi IRT quy đổi lực thí sinh với độ khó câu hỏi Ví dụ 1.1.1 Một thí sinh tìm vị trí bi trục lực/độ khó tương ứng với điểm xác suất dự đoán trả lời Pij (θj − bi ) 0.5 Điều thể Hình 1.2 Câu hỏi có đường cong đặc trưng hình cho ta thấy để có xác suất trả lời câu hỏi 0.5 lực thí sinh hiểu độ khó câu hỏi Hình 1.2: Vị trí độ khó câu hỏi lực thí sinh trục lực/độ khó tương ứng với xác suất trả lời 0.5 [1] Hình 1.3 cho ta thấy hàm đặc trưng câu hỏi có độ khó khác (-2.2; -1.5; 0.0; 1.0 2.0) có độ dốc khác trải dài khoảng xác định lực thí sinh Năm đường cong chạy song song khơng cắt Hình 1.3: Hàm đặc trưng câu hỏi năm câu hỏi mơ hình tham số.[1] 13 Chương Kiến thức chuẩn bị Mô hình IRT hai tham số Mơ hình IRT tham số Birnbaum mở rộng cách gán cho câu hỏi đề thi trắc nghiệm ứng với mộ độ phân biệt a khác Mơ hình gọi mơ hình IRT hai tham số có hàm đặc trưng câu hỏi sau P (Xij ; θj , bi , ) = eai (θj −bi ) + eai (θj −bi ) (1.6) Độ phân biệt câu hỏi đặc trưng cho khả phân loại thí sinh Thơng thường độ phân biệt câu hỏi có giá trị dương Trong trường hợp câu hỏi sai mắc lỗi thiết kế độ phân biệt mang giá trị âm Câu hỏi có độ phân biệt dương lớn chênh lệch xác suất trả lời sinh có lực cao lực thấp lớn Nói cách khác, câu hỏi có độ phân biệt cao phân loại thí sinh tốt câu hỏi có độ phân biệt thấp Ví dụ 1.1.2 Trong Hình 1.3 đường cong đặc trưng câu hỏi song song với không bào cắt nhau; câu hỏi có tham số độ khó khác có đường cong đặc trưng di chuyển bên trái phải hình dạng chúng khơng đổi Ta thấy biểu đồ khác hẳng Hình 1.4 Hai câu hỏi có độ khó -1.0 Giống mộ hình tham số, xác suất câu trả lời 0.5 cho ta độ khó câu hỏi Tuy nhiên, đường cong (đường 1) dốc hẳn đường cịn lại (đường 2) Đó câu hỏi có tham số phân biệt lớn Tham số phân biệt gọi tham số độ dốc (slope parameter), giống độ khó câu hỏi bi gọi tham số vị trí Độ dốc mơ hình hai tham số b a/4 Đường cong lại (đường 3) đường cong thứ có độ dốc đường chạy phía bên phải nhiều Do đó, câu hỏi đường có độ phân biệt với câu hỏi đường hai có độ khó lớn Hình 1.4: Hàm đặc trưng ba câu hỏi mô hình hai tham số.[1] 14 Chương Kiến thức chuẩn bị Mơ hình IRT ba tham số Thực tế cho thấy, trình kiểm tra trắc nghiệm khách quan nhiều lựa chọn, thí sinh ln dự đốn câu trả lời (theo cách chọn ngẫu nhiên phương án theo cách loại suy dựa kinh nghiệm thân) Trong lí thuyết trắc nghiệm cổ điển, người ta giảm việc dự đốn thí sinh trả lời câu hỏi cách đưa vào điểm may rủi Tuy nhiên, cách làm có nhược điểm xem câu hỏi có độ may rủi Điều trái với thực tiễn thí sinh thường dự đốn để trả lời câu hỏi gặp câu hỏi khó gặp câu hỏi dễ Vì vậy, Birnbaum đề xuất thêm tham số cj ∈ (0, 1) vào mơ hình IRT hai tham số để đo lường mức độ dự đốn thí sinh trả lời câu hỏi trắc nghiệm câu hỏi Mơ hình với tham số đo lường mức độ dự đốn thí sinh gọi mơ hình IRT ba tham số có hàm đặc trưng câu hỏi sau: P (Xij ; θj , bi , , ci ) = ci + (1 − ci ) eai (θj −bi ) + eai (θj −bi ) (1.7) Ví dụ 1.1.3 Hàm đặc trưng câu hỏi có mơ hình ba tham số Hình 1.5 Hình 1.5 biểu diễn hàm đặc trưng câu hỏi tham số a = 1.4, b = c = 0.3 Năng lực thấp đồ thị −4 cịn thấp đến −∞, dường đường cong có đường tiệm cận 0.2 Giống mơ hình tham số hai tham số, đường cong chuyển dần từ lồi đến lõm điểm θ = b, xác suất để trả lời câu hỏi θ = b = lúc khơng cịn 0.5 mà c + (1 − c)/2 = 0.2 + 0.4 = 0.6 Hơn nữa, độ dốc điểm b lúc (1 − c)/4 thay a/4 Hình 1.5: Hàm đặc trưng câu hỏi mơ hình ba tham số.[1] 1.2 Phân phối chuẩn Phân phối chuẩn (normal distribution), gọi phân phối Gauss, phân phối xác suất quan trọng nhiều lĩnh vực Nó họ phân phối có dạng tổng 15 Chương Kiến thức chuẩn bị quát giống nhau, khác tham số giá trị trung bình (µ) phương sai (σ ) Phân phối chuẩn tắc (standard normal distribution) phân phối chuẩn với giá trị trung bình phương sai (đường cong màu đỏ Hình 1.6) Phân phối chuẩn cịn gọi đường cong chng (bell curve) đồ thị mật độ xác suất có dạng chng Ta khảo sát phân phối chuẩn cho biến ngẫu nhiên nhiều biến ngẫu nhiêu; hay nói cách khác ta khảo sát phân phối cho biến ngẫu nhiên chiều biến ngẫu nhiên nhiều chiều Biến chiều (Univariate) Biến ngẫu nhiên X tuân theo phân phối chuẩn X ∼ N (µ, σ ) với tham số kỳ vọng µ phương sai σ , ta có thơng số bảng 1.1 Định nghĩa PDF-f (x) CDF - F (x; µ, σ ) Kỳ vọng - E[X] Phương sai - V ar(X) Giá trị   (x − µ)2 √ exp − 2πσ 2  2σ x−µ +Φ σ µ σ2 Bảng 1.1: Định nghĩa giá trị tuân theo phân bố chuẩn: X ∼ N (µ, σ ).[wiki]  x−µ phân phối chuẩn tính tốn từ trước Φ σ Biểu đồ hàm mật độ xác suất tuân theo phân phối chuẩn có dạng Hình 1.6  sau: Hình 1.6: Hàm mật độ xác suất tuân theo phân phối chuẩn [wiki] Nhận xét: Phương sai σ lớn mức độ phân tán xác suất rộng, 16 Chương Kiến thức chuẩn bị đỉnh thấp trải rộng màu đỏ với µ = σ = thể phân phối  Đường  x - hàm Gauss (Gauss function) Phân phối chuẩn tắc f (x) = √ exp − 2π thường dùng để tính phân phối chuẩn khác qua phép biến đổi tuyến tính Thường phân phối chuẩn tính tốn theo phép biến đổi tuyến tính tức dựa vào phân phối chuẩn dễ tính tính từ trước (như phân phối chuẩn tắc) để ước lượng cho phân phối cần tính Giờ ta tìm cách biểu diễn phân phối chuẩn qua phân phối chuẩn tắc Giả sử Y = aX + b Y phân phối chuẩn có luật phân phối là: Y ∼ N (aµ + b, a2 σ ) X −µ Ta có Z − score phân phối chuẩn Z = σ µ Nếu đặt a = b = − Ta biểu diễn Z tuyến tính theo X với dạng: σ σ Z = aX + b Như vậy, Z tuần theo phân phối chuẩn: Z ∼ N (aµ + b, a2 σ )   µ ∼N µ − , 2σ σ σ σ ∼ N (0, 1) Như Z tuân theo phân phối chuẩn tắc nên ta biến đổi ngược lại để thu phép biểu diễn phân phối chuẩn qua phân phối Z FX (x) = P (X ≤ x)   X −µ x−µ =P ≤ σ σ   x−µ =P Z≤ σ   x−µ =Φ σ   x−µ Phân phối tích lũy chuẩn tắc Φ tra cứu từ bảng tính có sẵn nên σ ta hồn tồn tích phân phối chuẩn khác qua Biến đa chiều (Multivariate) Đây tổng quát hoá phân phối chuẩn biến ngẫu nhiên chiều sử dụng cho hợp nhiều biến ngẫu nhiên - véc-tơ ngẫu nhiên Giả sử véc-tơ ngẫu nhiên 17 Chương Kiến thức chuẩn bị có số chiều k:X = [X1 , X2 , , Xk ]T Lúc phân phối chuẩn c tham s húa bi: ã Vecto k vng: = E[X] = [E[X1 ], E[X2 ], , E[Xk ]]T P • Ma trận hiệp phương sai: = E[(X − µ)(X − µ)T ] = [Cov(Xi , Xj ), ≤ i, j ≤ k] Phân phối kí hiệu X ∼ Nk (µ, Σ) giản lược k X ∼ N (µ, Σ) có hàm mật độ xác suất   | −1 exp − (x − µ) Σ (x − µ) f (x) = p det(2πΣ)  µX Ví dụ với trường hợp có biến ngẫu nhiên x, y (k=2) ta có véc-to kỳ vọng µ = µ Y   σX ρσX σY ma trận hiệp phương sai Σ = Hàm mật độ xác suất lúc có ρσX σY σY2 dạng  f (x) = 1.3 2πρX ρY p − ρ2  exp −   (x − µx )2 (y − µy )2 2(x − µx )(y − µy ) + − 2(1 − ρ2 ) σX σY2 σX σY (1.8) Phân phối lognormal Phân phối xác suất loga chuẩn hay phân phối lognormal (Lognormal distribution) phân phối thống kê giá trị logarit từ phân phối chuẩn có liên quan Phân phối lognormal chuyển hóa thành phân phối chuẩn ngược lại cách sử dụng tính toán logarit liên quan Cụ thể, biến ngẫu nhiên X có phân bố lognormal, Y = ln(X) có phân bố chuẩn Hoặc ngược lại, biến Y có phân bố chuẩn hàm mũ Y X = exp(Y ) có phân bố lognormal Cho Z biến chuẩn tắc, µ σ > hai số thực phân bố biến ngẫu nhiên X = eµ+σZ gọi phân bố lognormal với tham số µ σ Như vậy, tham số µ σ giá trị kỳ vọng (hay trung bình) độ lệch chuẩn logarit biến tự nhiên kỳ vọng độ lệch chuẩn biến X Mối quan hệ với hàm số logarit hay hàm số mũ Với hai số dương a, b 6= 1, loga (X) tuân theo phân bố chuẩn logb (X) Tương tự, với < a 6= 1, eY tuân theo phân bố lognormal aY Thơng thường, tham số µ∗ = eµ σ ∗ = eσ thường hay sử dụng Với tham số ta lý giải trực tiếp: µ∗ trung bình phân bố σ ∗ hữu ích cho việc xác định khoảng phân tán 18 ...ĐẠI HỌC QUỐC GIA HÀ NỘI ĐẠI HỌC KHOA HỌC TỰ NHIÊN —————————————– Nguyễn Phương Ly TÌM HIỂU VỀ CÁC PHƯƠNG PHÁP TẠO CHỈ SỐ THỐNG KÊ VÀ ỨNG DỤNG Chuyên ngành: Lý thuyết xác suất thống kê toán học. .. seminar Xác suất thống kê, Đại học Khoa học tự nhiên góp ý nhiều q trình em hoàn thành luận văn Em xin bày tỏ lịng biết ơn thầy cán trường Đại học khoa học tự nhiên quan tâm giúp đỡ trình học tập nghiên... dụng mơ hình phản hồi thời gian lognormal cho phân tích liệu thi thích ứng Mỹ xếp mẫu, ước lượng tham số xem xét độ phù hợp mơ hình Luận văn hồn thành trường Đại học Khoa học tự nhiên - Đại học

Ngày đăng: 22/02/2023, 17:30

Xem thêm:

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w