1. Trang chủ
  2. » Công Nghệ Thông Tin

Bài giảng Tin học ứng dụng: Chương 3 - Trần Trung Hiếu

31 2 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 31
Dung lượng 864,1 KB

Nội dung

Bài giảng "Tin học ứng dụng - Chương 3: Các thống kê cơ bản, tương quan và hồi quy" cung cấp cho người học các bước thực hiện, phân tích kết quả trong thống kê mô tả (Desriptive Statistics) và tổ chức đồ (Histogram), tương quan và hồi qui. Mời các bạn cùng tham khảo nội dung chi tiết.

Bài giảng tin ứng dụng Gv: Trần Trung Hiếu Bộ môn CNPM – Khoa CNTT Email: tthieu@hua.edu.vn Website: http://fita.hua.edu.vn/tthieu Chương III: Các thống kê bản, tương quan & hồi quy I Thống kê mô tả (Desriptive Statistics) a Các bước thực b Phân tích kết II Tổ chức đồ (Histogram) a Các bước thực b Phân tích kết III Tương quan hồi qui a Tính hệ số tương quan b Hồi quy tuyến tính c Hồi quy phi tuyến Giới thiệu phân phối chuẩn Phân phối chuẩn, gọi phân phối Gauss, phân phối xác suất quan trọng nhiều lĩnh vực Nó họ phân phối có dạng tổng quát giống nhau, khác tham số vị trí (giá trị trung bình μ) tỉ lệ (phương sai σ2) Định nghĩa: Biến ngẫu nhiên X có phân phối chuẩn với tham số m (kỳ vọng), σ2 (phương sai) có hàm mật độ: Đồ thị hàm mật độ phân phối chuẩn Đồ thị hàm phân bố phân phối chuẩn I Thống kê mơ tả (Descriptive Statistics) Ví dụ – trang 23 Liên hệ xác suất thống kê thuật ngữ Excel sử dụng thống kê mô tả »      Thống kê mô tả cho phép tính số đặc trưng mẫu, giá trị thống kê mẫu trung bình, độ lệch chuẩn, sai số chuẩn, trung vị, mode…Số liệu tính tốn bố trí theo cột theo dịng Mean (trung bình hay kỳ vọng): đặc trưng cho giá trị trung bình DLNN Standard Deviation (độ lệch chuẩn), Sample Variance (phương sai mẫu): đặc trưng cho độ phân tán giá trị DLNN xung quanh giá trị trung bình Standard Error (sai số chuẩn): Sai số trung bình Median (trung vị): cho giá trị điểm dãy số, xác suất giá trị Me đại lượng ngẫu nhiên X cho P(XMe) Mode: giá trị biến ngẫu nhiên ứng với xác suất cực đại hay giá trị có tần suất xuất mẫu lớn I Thống kê mô tả (Descriptive Statistics) Liên hệ xác suất thống kê thuật ngữ Excel sử dụng thống kê mô tả (tiếp)  Kurtosis (độ nhọn): xác suất, người ta chứng minh DLNN X có phân phối chuẩn độ nhọn Ở đây, độ nhọn đánh giá đường mật độ phân phối dãy số liệu có nhọn hay tù đường mật độ chuẩn tắc (dương nhọn hơn, âm tù hơn) Nếu khoảng [-2,2] coi số liệu xấp xỉ chuẩn  Skewness (Độ lệch): Trong xác suất gọi hệ số bất đối xứng đánh giá phân phối giá trị có cân đối giá trị trung bình hay khơng, giá trị X đối xứng qua kỳ vọng Skewness=0  biểu đường phân phối lệch trái hay lệch phải (âm lệch trái, dương lệch phải) Nếu khoảng [-2,2] coi số liệu cân đối phân phối chuẩn  Confidence Level (Nửa độ dài khoảng tin cậy): » » » Ví dụ: Confidence level = 95% Trong xác suất tương đương tốn tìm giá trị α cho P(mα Regression 18 Xuất hộp thoại Miền liệu biến phụ thuộc Y Miền liệu biến X Có để nhãn đầu dịng khơng? Độ tin cậy (bằng 1-α, với α mức xác suất) Hệ số tự b = tích vào Hiện đồ thị phần dư Hiện phần dư hay sai lệch y thực nghiêm y theo hồi quy Hiện đồ thị đường dự báo 19 Kết 20 Phân tích kết Nếu hệ số tương quan bội (Multiple R) xấp xỉ >= 0.75 mơ hình qui hoạch tuyến tính thích hợp  Ví dụ: Multiple R = 0.8589 -> mơ hình tuyến tính coi thích hợp Hệ số tương quan (R Square) cho biết biến động y x1, x2, x3 … gây nên Hệ số Adjusted R Square không sát R Square → tất biến đưa vào cần thiết  R Square =0.7377 cho biết 73.77% biến động y x1, x2, x3 gây nên  Adjusted R Square = 66.62% khơng sát R Square 21 Phân tích kết F thực nghiệm = 10.31281 với xác xuất 0.00158 nhỏ xác xuất ý nghĩa 0.05 nên phương trình hồi quy tuyến tính chấp nhận Dựa vào hệ số ta viết đường hồi quy dự báo y = -4.06364 + 0.1116x1 + 0.075684x2 + 0.02011x3 Hệ số x1 khơng đáng tin cậy P-value = 0.093621 > 0.05 (mức ý nghĩa chọn) -> cần tiến hành lọc bớt biến x1 để đường hồi quy với hệ số có ý nghĩa 22 Hồi quy phi tuyến Các dạng hồi quy phi tuyến hàm mũ, hàm logarit, hàm đa thức, hàm bậc hai … Có hai cách:  Thông qua cách biến đổi đưa dạng hồi quy tuyến tính bội  Vẽ đồ thị tìm đường ngoại suy 23 6.1 Cách 1 Thông qua biến đổi ta đưa dạng hồi quy tuyến tính bội hàm mũ, hàm logarit, hàm đa thức, hàm bậc hai … Ví dụ Nghiên cứu dân số, x năm, y dân số Tìm đường hồi quy phi tuyến dạng đa thức bậc hai: Y = ax2 + bx + c Khi ta thêm cột X2 = X2 sau thực tìm đường hồi quy bội tuyến tính với biến độc lập X, X2 hàm Y 24 Làm tương tự mục 25 Phân tích kết Phân tích kết phương trình: Y = 0.397435 X2 + 8.228951 X + 12.96242 26 6.2 Cách Vẽ đồ thị XY (Scatter) biểu diễn tương quan y x, đồ thị dạng điểm, sau tìm đường ngoại suy phương trình hồi quy Sinh viên xem lại phần đồ thị Sau vẽ xong đồ thị dạng XY bạn vào Menu Chart>Add Trendline… 27 Ví dụ 28 Hộp thoại Add Trendline Tuyến tính Ln(x) Đa thức Hàm mũ ax Hàm ex Trung bình động 29 Hộp thoại Option Đặt tên cho đường ngoại suy Dự báo Hiện phương trình đồ thị Hiện giá trị hệ số tương quan đồ thị Tăng x Giảm x Cắt trục y 30 Kết 31 ... số ta viết đường hồi quy dự báo y = -4 .0 636 4 + 0.1116x1 + 0.075684x2 + 0.02011x3 Hệ số x1 khơng đáng tin cậy P-value = 0.0 936 21 > 0.05 (mức ý nghĩa chọn) -> cần tiến hành lọc bớt biến x1 để đường... Excel cho phép tính hệ số tương quan đơn biến Cách thực hiện: Vào Tools-> Data Analysis-> Correlation khai báo mục a - - - Input range: miền liệu kể nhãn (nên có) Grouped by: số liệu nhóm theo... xứng, nhô cao giữa-> dạng đường cong chuông) Nếu có kết luận liệu tn theo luật chuẩn Hình ảnh tổ chức đồ Histogram 120.00% 100.00% Frequency 80.00% 60.00% 40.00% 20.00% 0.00% 10 15 20 25 30 35

Ngày đăng: 08/05/2021, 16:49