1. Trang chủ
  2. » Khoa Học Tự Nhiên

Xác suất từ cơ bản đến nâng cao

53 53 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 53
Dung lượng 1,6 MB

Nội dung

Tập hợp các kiến thức nền tảng cho môn xác suất và thống kê đầy đủ và chi . Mean, variance, standard , Zscore, covariance, pearson correlaton, quartile, box ,Tứ phân vị, Độ trải giữa, Hồi quy tuyến tính, kiểm định thống kế, ước lượng độ tin cậy,Xác suất hậu nghiệm, bayes, phân phối poission, định lý giới hạn trung tâm, phân phối siêu hình học

LÝ THUYẾT XÁC SUẤT Mô tả liệu thống kê 1.1 Các khái niệm 1.1.1 Quần thể Quá trình thống kê bắt đầu ta nhận định nhóm đối tượng ta muốn nghiên cứu tìm hiểu Ta gọi nhóm đối tượng quần thể 1.1.2 Mẫu Trong hầu hết trường hợp, quần thể có số lượng lớn ta mong muốn, hiển nhiên khơng có cách để ta nghiên cứu tồn quần thể (ví ta cố gắng lấy ý kiến toàn cư dân trưởng thành Mỹ án tử hình) Một cách tiếp cận thực tế kiểm tra thu thập liệu từ nhóm quần thể, mà gọi mẫu 1.1.3 Thống kê mô tả Là phương pháp sử dụng để mơ tả đặc tính liệu thu thập từ nghiên cứu thực nghiệm qua cách thức khác nhau, cung cấp tóm tắt đơn giản mẫu thước đo 1.1.4 Thống kê suy luận Là trình suy luận suy đặc điểm phân phối việc phân tích liệu Phân tích thống kê suy luận suy tính chất tổng thể: điều bao gồm giả thuyết thử nghiệm ước tính phát sinh Tổng thể giả định lớn so với tạo liệu quan sát, nói cách khác, liệu quan sát giả định lấy mẫu từ tổng thể lớn 1.2 Qualitiative data (Dữ liệu định tính) Dữ liệu định tính tập thông tin đo lường số Nó thường chứa từ ngữ, mơ tả đối tượng Kết q trình phân tích liệu định tính có dạng từ khóa đánh dấu, thông tin phân tách định nghĩa phác họa Lấy ví dụ, nghiên cứu nhận thức phụ huynh hệ thống giáo dục cho họ Thông tin kết thu từ họ dạng mơ tả bạn cần thực q trình phân tích để tìm liệu họ có hài lịng, khơng hài lịng hay cần cải thiện mặt Điểm mạnh • • • Giúp hiểu rõ – Dữ liệu định tính giúp hiểu rõ góc nhìn nhu cầu ứng viên Cung cấp lời giải thích – Dữ liệu định tính với liệu định lượng giải thích kết khảo sát đo lường độ xác thơng tin định lượng Định danh tốt cho mẫu hành vi – Dữ liệu định tính cung cấp thơng tin chi tiết qua chứng tỏ hữu dụng việc định danh mẫu hành vi Điểm yếu • • • 1.1.5 Khó thu thập – Xét theo chủ đề tự nhiên, phần nhỏ đại diện cho phần lớn Tốn nhiều thời gian – Dữ liệu định tính tốn thời gian cần hiểu lượng lớn thông tin Khả sai số - Phân tích dễ mang tính chủ quan; sai số người đánh giá hay gặp phải Nominal (Dữ liệu định danh) Là loại thang đo dùng cho đặc điểm thuộc tính, dùng để phân loại đối tượng Khi thống kê người ta thường sử dụng mã số để qui ước, số khơng có quan hệ khơng ý nghĩa tốn học Trong thang đo số dùng để phân loại đối tượng, chúng không mang ý nghĩa khác Về thực chất thang đo danh nghĩa phân loại đặt tên cho biểu ấn định cho chúng ký số tương ứng Ví dụ: Giới tính: 1: nữ; 2: nam 1.1.6 Ordinal (Dữ liệu thứ bậc) Là loại thang đo dùng cho đặc điểm thuộc tính, giá trị xếp theo trật tự tăng giảm dần có mối quan hệ thứ bậc Thực chất thang đo thứ bậc thang đo định danh giá trị xếp theo thứ bậc Lúc số thang đo danh nghĩa xếp theo quy ước thứ bậc hay kém, ta khoảng cách chúng Điều có nghĩa thang đo thứ bậc thang đo định danh điều ngược lại chưa Ví dụ: Học lực: Yếu, Trung bình Khá Giỏi Xuất sắc 1.3 Quantitative data (Dữ liệu định lượng) Dữ liệu định lượng tập số có từ nhóm người liên quan tới phân tích thống kê Lấy ví dụ bạn thực khảo sát độ hài lòng từ ứng viên hỏi xem họ đánh thang điểm từ tới Bạn thu thập đánh giá theo dạng số, bạn sử dụng kỹ thuật thống kê để đưa kết luận độ hài lòng ứng viên Điểm mạnh • • • • Cụ thể - Dữ liệu định lượng rõ ràng cụ thể với khảo sát tiến hành Độ tin cậy cao – Nếu thu thập cách hợp lý, liệu định lượng thường xác có độ tin cậy cao Dễ dàng giao tiếp – Dữ liệu định lượng thường dễ dàng cho giao tiếp mơ tả đồ thị, biểu đồ… Có hỗ trợ sẵn – Rất nhiều tập liệu lớn có sẵn phân tích để kiểm tra độ liên quan tới khảo sát Điểm yếu • • • Số lựa chọn bị giới hạn – Những người trả lời thường phải chọn từ số lượng giới hạn lựa chọn Độ phức tạp cao – Dữ liệu định lượng cần trình phức tạp để có mẫu xác Cần chun nghiệp – Phân tích liệu định lượng cần kỹ chuyên nghiệp phân tích thống kê 1.1.7 Interval (Dữ liệu khoảng cách) Là loại thang đo dùng cho đặc điểm số lượng, thang đo thứ bậc có khoảng cách liên tục Thơng thường thang đo khoảng có dạng dãy chữ số liên tục đặn từ đến 5, từ đến hay từ đến 10 Dãy số có cực đầu thể trạng thái đối nghịch Dữ liệu khoảng cách làm phép tính tốn cộng trừ có ý nghĩa Đây dạng đặc biệt thang đo thứ bậc cho biết khoảng cách thứ bậc Ví dụ: 1: hồn tồn khơng đồng ý; 2: khơng đồng ý; 3: bình thường; 4: đồng ý; 5: hoàn toàn đồng ý Thang đo tỉ lệ có đầy đủ đặc tính thang đo khoảng cách 1.1.8 Ratio (Dữ liệu tỉ lệ) Là loại thang đo dùng cho đặc tính số lượng Thang đo tỉ lệ có đầy đủ đặc tính thang đo khoảng cách Ngồi cho phép lấy tỉ lệ so sánh hai giá trị biến số Ta thực phép tốn chia để tính tỉ lệ nhằm mục đích so sánh Ví dụ: người 50 tuổi có tuổi lớn gấp đơi người 25 tuổi Ví dụ: Số tuổi, số tiền 1.1.9 So sánh interval ratio Trong thang đo khoảng cách so sánh mặt tỉ lệ giá trị khơng có ý nghĩa Thang đo tỉ lệ có đầy đủ đặc tính thang đo khoảng cách 1.1.10 Continuous (liên tục) discrete (rời rạc) Biến liên tục (continuous variable) biến số nhận giá trị khoảng định, tức biến thiên mà khơng bị gián đoạn Ví dụ: Nhiệt độ ngày biến ngẫu nhiên liên tục, liệt kê hết tất giá trị có thể, thường nói giá trị nhỏ giá trị lớn nhất: chẳng hạn nhiệt độ khoảng 20 độ C đến 30 độ C; X đơn vị độ C, X nằm khoảng (20; 30) Ngoài ra, biến chiều cao, cân nặng… coi biến liên tục Biến rời rạc (discrete variable) biến số nhận giá trị nguyên Ví dụ: Số con, số người gia đình, số lần xét nghiệm, số cơng nhân doanh nghiệp, số sản phẩm sản xuất ngày phân xưởng may 1.4 Các số liệu thống kê 1.1.11 Mean (trung bình) Mean trung bình số học tính đơn giản tổng tất giá trị liệu chia cho tổng số liệu Mean cịn có tên gọi khác giá trị kỳ vọng Giá trị trung bình quần thể: Giá trị trung bình mẫu: , N số liệu quần thể n cỡ mẫu 1.1.12 Median (trung vị) Median giá trị vị trí dãy liệu (sau xếp), điều có nghĩa nửa quần thể mẫu có giá trị nhỏ số trung vị, nửa cịn lại có giá trị lớn số trung vị Để tìm số trung vị danh sách hữu hạn số, ta xếp tăng dần tất quan sát, lấy giá trị nằm danh sách Nếu số quan sát chẵn, người ta thường lấy trung bình hai giá trị nằm 1.1.13 Mode Mode liệu có tần suất xuất nhiều nhất, khơng có liệu xuất lặp lại khơng có mode Khác với giá trị trung bình, mode khơng thiết phải Mode đặc biệt hữu dụng giá trị quan sát khơng có thứ tự dễ thấy, giá trị trung bình trung vị khơng thể xác định 1.1.14 Variance (Phương sai) Phương sai biến ngẫu nhiên độ đo phân tán thống kê biến đó, hàm ý giá trị biến thường cách giá trị kỳ vọng bao xa Phương sai quần thể: , N tổng số liệu quần thể Phương sai mẫu: , n độ lớn mẫu 1.1.15 Standard deviation (độ lệch chuẩn) Độ lệch chuẩn đại lượng thống kê mô tả dùng để đo mức độ phân tán tập liệu lập thành bảng tần số Có thể tính độ lệch chuẩn cách lấy bậc hai phương sai Một ý nhỏ đơn vị phương sai giá trị trung bình khơng giống nhau, nên dẫn đến việc khai phương sai để định nghĩa độ lệch chuẩn Khi hai tập liệu có giá trị trung bình, tập có độ lệch chuẩn lớn tập có liệu biến thiên nhiều Trong trường hợp hai tập liệu có giá trị trung bình khơng nhau, việc so sánh độ lệch chuẩn chúng khơng có ý nghĩa Độ lệch chuẩn cịn sử dụng tính sai số chuẩn Khi lấy độ lệch chuẩn chia cho bậc hai số lượng quan sát tập liệu, có giá trị sai số chuẩn 1.1.16 Z-score Z Score biện pháp thống kê định lượng khoảng cách (đo độ lệch chuẩn) từ điểm liệu đến giá trị trung bình tập hợp liệu z-score quần thể: z-score mẫu: Đối với điểm liệu mức trung bình, điểm Z âm Thường liệu usual (nếu |z|2) (theo nguyên tắc 68-95-99.7) 1.5 Các hệ số biến 1.1.17 Covariance (Hiệp phương sai) Covariance thể mối quan hệ hai biến với nhau, đồng biến (positive covariance) nghịch biến (negative covariance) Định nghĩa : Cho biến ngẫu nhiên X, Y với kì vọng μX μY covariance X, Y tính cơng thức: Cov(X,Y)=E((X−μX)(Y−μY)) số tính chất covariance: Cov(aX+b,cY+d)=acCov(X,Y) với a, b, c, d cho trước Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y) Cov(X,X)=Var(X) Cov(X,Y)=E(XY)−μXμY Var(X,Y)=Var(X)+Var(Y)+2Cov(X,Y) Nếu X, Y độc lập Cov(X,Y)=0 1.1.18 Pearson Correlation (Hệ số tương quan Pearson) Hệ số tương quan phép đo thống kê thay đổi giá trị biến thể thay đổi biến khác Để thể mối quan hệ biến “mạnh” hay “yếu”, sử dụng correlation thay cho covariance.Với hệ số tương quan mang giá trị dương, giá trị hai biến tăng giảm Với hệ số tương quan mang giá trị âm, giá trị tăng giá trị giảm Hệ số tương quan biểu diễn giá trị khoảng [-1 , 1] Hệ số tương quan mang giá trị +1 thể mối tương quan dương: Sự thay đổi giá trị biến làm biến lại thay đổi theo hướng tương tự Hệ số tương quan mang giá trị -1 thể mối tương quan âm: Sự thay đổi giá trị biến làm biến lại thay đổi theo hướng ngược lại Mức độ tương quan thấp thể giá trị thập phân khác Giá trị tương quan nghĩa khơng có mối quan hệ rõ ràng dao động hai biến Công thức: • N: Số lượng cặp giá trị • : Tổng tích cặp giá trị • : Tổng giá trị x • : Tổng giá trị y • : Tổng giá trị bình phương x • : Tổng giá trị bình phương y số tính chất correlation: Correlation Covariance chuẩn hóa hai biến X, Y Correlation thể tỉ lệ, khơng có đơn vị đo −1≤ r ≤ r =−1 y=ax + b a < r = y = ax + b a > 1.6 Độ phân tán liệu 1.1.19 Range (Biên độ) Range phạm vi chênh lệch giá trị lớn giá trị nhỏ tập liệu, từ giúp bạn có kết luận tổng quan độ trải rộng liệu Cơng thức tính: Range = max value - value 1.1.20 Quartile (Tứ phân vị) Tứ phân vị đại lượng mô tả phân bố phân tán tập liệu Tứ phân vị gồm giá trị: Q1, Q2 Q3 chia tập hợp liệu (đã xếp theo trật tự từ bé đến lớn) thành phần có số lượng quan sát 1.1.21 Interquartile range IQR (Độ trải giữa) IQR thước đo phân tán liệu, thuật ngữ định nghĩa chênh lệch giá trị cao giá trị thấp tứ phân vị, chứa 50% giá trị liệu Cơng thức tính: IQR = Q3 – Q1 1.1.22 Chuẩn lọc liệu Các liệu nằm đoạn [Q1 – 1.5 IQR, Q3 + 1.5 IQR] xếp vào outliers 1.1.23 Xây dựng box plot (biểu đồ hộp) Box plot bao gồm tham số đặc trưng dứ liệu: giá trị nhỏ nhất, giá trị lớn tứ phân vị cách trực quan, dễ hiểu, từ giúp bạn có nhìn tổng quan phân bố liệu Từ đây, ta có tham số \lambdaλ biến ngẫu nhiên XX tn theo phân phối Poa-xơng X∼Poi(λ) có đặc tính: 1.1.54 Phân phối hình học - Geometric distribution Là phân phối xác suất xuất lần kiện A phép thử Béc-nu-li Phân phối hình học kí hiệu (p)X∼Geo(p), tham số p xác suất xuất kiện A phép thử 1.1.55 Phân phối nhị thức âm - Negative Binominal distribution Là phân phối xác suất xuất lần thứ r kiện A phép thử Béc-nu-li Như phân phối tổng quát phân phối hình học phân phối hình học phân phối nhị thức âm với r=1 Ta kí hiệu phân phối X∼NegBin(r, p) với tham số r số lần xuất A với p xác suất xuất A phép thử 3.7 Phân phối biến liên tục 1.1.56 Phân phối - Continuous Uniform distribution Tương tự trường hợp biến rời rạc với phân phối liên tục, giá trị biến ngẫu nhiên miền xác định cho xác suất Biến ngẫu nhiên X tuân theo phân phối liên tục X∼Unif(a,b) với tham số a,b∈R;a Trong thực tế bạn tính tốn giá trị thống kê, bạn cần tham số Vì vậy, bạn cần biết thêm cách thức để ước lượng tham số quần thể thừ thống kê mẫu bạn phải lấy mẫu để đảm bảo q trình ước lượng tối ưu 1.1.61 Các cách lấy mẫu Mẫu ngẫu nhiên đơn giản: đối tượng có hội lựa chọn (có thể cho máy tính chạy ngẫu nhiên danh sách gồm n phần tử, sau vấn cá nhân có số thứ tự tương ứng với dãy số đó) Mẫu phân cụm (cluster): Chia quần thể thành cụm nhỏ (ví dụ xã, vùng miền, ), sau chọn ngẫu nhiên số cụm chọn tất cá thể cụm vào mẫu Mẫu phân tầng (stratified): Chia quần thể thành nhiều tổ theo đặc trưng nhiều đặc trưng (ví dụ theo quy mơ, giới tính, ) tùy vào mục đích nghiên cứu bạn, sau dùng cách chọn mẫu ngẫu nhiên đơn giản chọn tổ số lượng cá thể vào mẫu (chú ý số cá thể chọn phần tuân theo tỷ lệ số đơn vị tổ chiếm tổng thể, khơng tuân theo tỷ lệ) => Chú ý thực tế có nhiều cách chọn mẫu khác nhau, với ưu nhược điểm khác chắn phân tích liệu phương pháp phân tích mẫu có sai số định Vì bạn cần nhớ quy tắc: mẫu lớn tốt 1.1.62 Mẫu ngẫu nhiên Mẫu ngẫu nhiên tập mẫu độc lập có thống kê xác suất (I.I.D - Independent, Identically Distributed) Ví dụ ta cần thống kê mức độ xinh gái ảnh hưởng tới trí thơng minh chị em Thì ta coi độ xinh gái biến ngẫu nhiên Lúc ta lấy mẫu n người người có độ xinh gái Xi tương ứng Khi ta coi Xi độc lập đơi với chúng có phân phối Xi xác suất Tập mẫu mẫu ngẫu nhiên X=[X1,X2,…,Xn ] kích thước n Như gọi pX(x) hàm trọng lượng xác suất đồng thời hàm mật độ xác suất đồng thời Xi liên tục ta có: Xi rời rạc fX(x) Và: 4.2 Đặc trưng mẫu 1.1.63 Trung bình mẫu Trung bình mẫu (Mean) hay cịn gọi kỳ vọng mẫu (Expectation) mẫu ngẫu nhiên giá trị trung bình mẫu đó: Rõ ràng biến ngẫu nhiên ta tính đặc trưng biến ngẫu nhiên như: Như ta thấy giá trị kỳ vọng biến ngẫu nhiên trung bình ln số kỳ vọng mẫu ngẫu nhiên Tức ta lấy mẫu ngẫu nhiên từ tập mẫu tập mẫu ngẫu nhiên ln có giá trị trung bình Nói cách khác trung bình mẫu khơng lệch (unbiased) 1.1.64 Phương sai mẫu Phương sai mẫu giá trị trung bình phương sai mẫu ngẫu nhiên: Kỳ vọng biến ngẫu nhiên là: Như khơng cịn với phương sai X nữa, nên người ta thương lấy dạng phương sai khác cho kỳ vọng Khái niệm gọi phương sai hiệu chỉnh, kí hiệu : Chú ý nhiều tài liệu người ta coi phương sai hiệu chỉnh phương sai mẫu Giá trị kỳ vọng biến ngẫu nhiên phương sai hiệu chỉnh số phương sai mẫu ngẫu nhiên Tức ta lấy mẫu ngẫu nhiên từ tập mẫu tập mẫu ngẫu nhiên ln có giá trị kỳ vọng phương sai Nói cách khác phương sai hiệu chỉnh mẫu không lệch (unbiased) 4.3 Ước lượng điểm phân phối mẫu 1.1.65 Định lý giới hạn trung tâm Nếu quần thể gốc có phân phối chuẩn số lượng phần tử mẫu không bé 30 giá trị trung bình mẫu có phân phối: Trong • • : Giá trị trung bình quần thể gốc : Phương sai quần thể gốc Nếu số lượng phần tử mẫu lớn giá trị trung bình mẫu gần với giá trị trung bình quần thể với độ lệch chuẩn nhỏ 1.1.66 Phân phối xác suất mẫu Xác suất mẫu xấp xỉ phân phối chuẩn np >= 15 n(1-p) >=15, cụ thể: 4.4 Khoảng tin cậy cho phân phối mẫu 1.1.67 Khoảng tin cậy cho giá trị trung bình mẫu Khi biết độ lệch chuẩn quần thể : Trong đó: • • z: Phân phối z n: Số phần tử mẫu (n > 30) • • : Độ lệch chuẩn quần thể Khoảng tin cậy: Khi độ lệch chuẩn quần thể: Trong đó: • • • t: Phân phối t, gồm input khoảng tin cậy phía () bậc tự n – n: Số phần tử mẫu s: Độ lệch chuẩn mẫu 1.1.68 Khoảng tin cậy cho xác suất mẫu Trong đó: • : Xác suất mẫu • Điều kiện áp dụng: 1.1.69 Chọn cỡ mẫu đủ lớn Chọn cỡ mẫu cho ước lượng giá trị trung bình: (đã biết độ lệch chuẩn, E biên sai cho phép – phương sai chấp nhận được) (chưa biết độ lệch chuẩn, S sd mẫu) Ước lượng mẫu cho ước lượng xác suất: Nếu chưa biết, lấy 0.5 Kiểm định giả thuyết 5.1 Giả thuyết Trong thống kê, giả thuyết không (tiếng Anh: null hypothesis) tham số khái niệm sử dụng kiểm định giả thuyết thống kê Giả thuyết không, hay ký hiệu Ho, thường đặt với mục tiêu xem liệu thu thập nghiên cứu thực nghiệm có mâu thuẫn với giả thuyết không Kiểm định giả thuyết thống kê thử xem nhận định liệu thu thập khơng khác giả thuyết khơng có xác suất sai bao nhiêu, hay diễn đạt theo thuật ngữ thống kê xác suất bác bỏ giả thuyết khơng Chính mà có tên gọi giả thuyết không Dùng đồng thời với giả thuyết không giả thuyết đối (hay giả thuyết thay - Ha) Nếu xác suất giả thuyết không bị bác bỏ mức đủ cao, giả thuyết đối sử dụng để thay Nếu bạn chưa thể bác bỏ Ho khoảng tin cậy chứa giá trị tham số Ho ngược lại Nếu bạn bác bỏ Ho khoảng tin cậy khơng chứa giá trị tham số Ho ngược lại 5.2 Các bước giải toán kiểm định Bước 1: Xác định giả thuyết cần kiểm định cho xác suất hay giá trị trung bình Bước 2: Xây dựng cặp giả thuyết xung khắc Ho, Ha Bước 3: Kiểm tra điều kiện thực kiểm định Bước 4: Xác định mức ý nghĩa kiểm định Bước 5: Tính giá trị thống kê Bước 6: Vẽ dạng phân bố mẫu Bước 7: Xác định vị trí giá trị thống kê giá trị tới hạn đồ thị phân bố mẫu Bước 8: Kết luận việc bác bỏ hay chưa bác bỏ Ho Bước 9: Kết luận giả thuyết thống kê cần kiểm định 5.3 Kiểm định xác suất Tính giá trị kiểm định: 5.4 Kiểm định giá trị trung bình 1.1.70 Đã biết độ lệch chuẩn 1.1.71 Chưa biết độ lệch chuẩn 5.5 Sai lầm Sai lầm loại 1: sai lầm việc bác bỏ Ho Ho Sai lầm loại 2: sai lầm việc chưa thể bác bỏ Ho Ho sai Khả xảy sai lầm loại tăng khả xảy sai lầm loại giảm ngược lại 5.6 Kiểm thử Chi-square 1.1.72 Kiểm định Chi-square biến phân loại Để kiểm định mối liên kết quan hệ độc lập/phục thuộc hai biến phân loại, sử dụng kiểm định Chi-square tính độc lập với bước thực sau: B1: Xây dựng bảng chiều, từ tính tốn tần suất quan sát B2: Xây dựng bảng hai chiều cho tuần suất độc lập mong đợi B3: Lấy hiệu bảng này, sau tính tổng giá trị theo công thức sau: B4: Sử dụng Chi-square distribution để tính tốn giá trị xác suất kỳ vọng (p-value) cho giả thuyết không (giả thuyết cho biến độc lập): với x tính trên, k gọi bậc tự phân phối với: k = (số row-1 )*( số col1), k lớn đồ thị có độ dốc thoải đỉnh thấp Chi-square distribution trả giá trị không âm Nếu p-value bé giá trị mà kỳ vọng, ta bác bỏ giả thuyết khơng khẳng định giả thuyết biến có quan hệ độc lập khơng xác 1.1.73 Cramér’s V Kết hợp với việc sử dụng Chi-square, sử dụng thêm Cramér’s V để đánh giá tính độc liên kết biến: Cramér’s có thang đo [0, 1] Cramér’s V tăng lên có chênh lệch lớn hàng cột bảng hai chiều 1.1.74 Kiểm thử Chi-square cho biến Chúng ta sử dụng kiểm định Chi-square để kiểm tra xem phân phối biến có độc lập với phân phối lý thuyết hay khơng Khi đó, k = n -1 với n số lượng phân loại biến Phương pháp gọi kiểm thử Chi-square độ phù hợp (goodness of fit) – kiểm thử Chi-square cho biến: 1.1.75 Ba điều kiện tiên để sử dụng Chi-square tes • Dữ liệu phải đảm bảo tính ngẫu nhiên: Được lấy mẫu ngẫu nhiên hay trích xuất ngẫu nhiên từ quần thể • Các điểm liệu phải đảm bảo tính – khơng có mẫu xuất phân loại lúc • Tần suất liệu mong đợi vị trí bảng chiều phải lớn Nếu liệu không đạt điều kiện thứ 3, kiểm định Fisher’s Exact sử dụng phương án thay 5.7 Kiểm định giả thuyết hồi quy tuyến tính Thực kiểm tra thống kê xem liệu bạn có dùng mơ hình xây dựng từ mẫu để dự đốn cho quần thể: hay không Cụ thể bạn kiểm định giả thuyết cho hệ số gócBeta: Bước 1: Xây dựng cặp giả thuyếtnHo, Ha (tùy theo thông tin bạn có tương quan) Bước 2: Tính giá trị thống kê kiểm định: , với Beta0 giá trị trong: Bước 3: Tìm P-value tương ứng với bậc tự (n-2) Bước 4: Đưa kết luận Trong đó:  Se(b): Sai số chuẩn hệ số hồi quy b

Ngày đăng: 18/08/2021, 10:06

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w