Hồi qui liệu KHAI PHÁ DỮ LIỆU (DATA MINING)

24 4 0
Hồi qui liệu KHAI PHÁ DỮ LIỆU (DATA MINING)

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Khoa Khoa Học & Kỹ Thuật Máy Tính Trường Đại Học Bách Khoa Tp Hồ Chí Minh Chương 3: Hồi qui liệu KHAI PHÁ DỮ LIỆU (DATA MINING) Nội dung  3.1 Tổng quan hồi qui  3.2 Hồi qui tuyến tính  3.3 Hồi qui phi tuyến  3.4 Ứng dụng  3.5 Các vấn đề với hồi qui  3.6 Tóm tắt Tài liệu tham khảo [1] Jiawei Han, Micheline Kamber, “Data Mining: Concepts and Techniques”, Second Edition, Morgan Kaufmann Publishers, 2006  6.11 Prediction (pp 354 -> pp 359)  6.12 Accuracy and Error Measures (pp 359 -> pp.363) 6.13 Evaluating the Accuracy of Classifier, Predictor (pp 363 -> 366)  3.0 Tình Ngày mai giá cổ phiếu STB bao nhiêu??? 3.0 Tình y Y1 y=x+1 Y1’ X1 Mơ hình phân bố liệu y theo x??? x 3.1 Tổng quan hồi qui  Định nghĩa - Hồi qui (regression)  J Han et al (2001, 2006): Hồi qui kỹ thuật thống kê cho phép dự đoán trị (số) liên tục  Wiki (2009): Hồi qui (Phân tích hồi qui – regression analysis) kỹ thuật thống kê cho phép ước lượng mối liên kết biến  R D Snee (1977): Hồi qui (Phân tích hồi qui) kỹ thuật thống kê lĩnh vực phân tích liệu xây dựng mơ hình từ thực nghiệm, cho phép mơ hình hồi qui vừa khám phá dùng cho mục đích dự báo (prediction), điều khiển (control), hay học (learn) chế tạo liệu 3.1 Tổng quan hồi qui  Mơ hình hồi qui (regression model): mơ hình mơ tả mối liên kết (relationship) tập biến dự báo (predictor variables/independent variables) hay nhiều đáp ứng (responses/dependent variables)  Phân loại  Hồi qui tuyến tính (linear) phi tuyến (nonlinear)  Hồi qui đơn biến (single) đa biến (multiple) 3.1 Tổng quan hồi qui  Phương trình hồi qui: Y = f(X, β)  X: biến dự báo (predictor/independent variables)  Y: đáp ứng (responses/dependent variables)  β: hệ số hồi qui (regression coefficients) X dùng để giải thích biến đổi đáp ứng Y Y dùng đề mô tả tượng (phenomenon) quan tâm/giải thích Quan hệ Y X diễn tả phụ thuộc hàm Y X β mô tả ảnh hưởng X Y 3.1 Tổng quan hồi qui  Phân   loại Hồi qui tuyến tính (linear) phi tuyến (nonlinear)  Linear in parameters: kết hợp tuyến tính thông số tạo nên Y  Nonlinear in parameters: kết hợp phi tuyến thông số tạo nên Y Hồi qui đơn biến (single) đa biến (multiple)  Single: X = (X1)  Multiple: X = (X1, X2, …, Xk) 3.2 Hồi qui tuyến tính  Hồi qui tuyến tính đơn biến  Hồi qui tuyến tính đa biến 3.2.1 Hồi qui tuyến tính đơn biến 1 Cho N đối tượng quan sát, mơ hình hồi qui tuyến tính đơn biến cho dạng sau: 3.2.1 Hồi qui tuyến tính đơn biến •Y= •Dấu β0 + β1*X1 → Y = 0.636 + 2.018*X β1 cho biết ảnh hưởng X Y 3.2.1 Hồi qui tuyến tính đơn biến  Ước lượng thơng số để đạt mơ hình hồi qui tuyến tính đơn biến 3.2.1 Hồi qui tuyến tính đơn biến (example) 3.2.2 Hồi qui tuyến tính đa biến  Hồi qui tuyến tính đa biến: phân tích mối quan hệ biến phụ thuộc (response/dependent variable) hai hay nhiều biến độc lập (independent variables) yi = b0 + b1xi1 + b2xi2 + … + bkxik i = n với n số đối tượng quan sát k = số biến độc lập (số thuộc tính/tiêu chí/yếu tố…) Y = biến phụ thuộc X = biến độc lập b0 k = trị hệ số hồi qui 3.2.2 Hồi qui tuyến tính đa biến Trị ước lượng Y Trị ước lượng thông số b yˆ  b0  b1 x1  b2 x2  K  bk xk  T bX X 1  Y1  1 Y  Y   2, X   M  M    Y  n 1  1 T X Y x1,1 x1,2 K x2,1 x2,2 K M M xn ,1 xn ,2 K x1,k  b0  b  x2, k  , b   1  M M    xn ,k  bk  3.2.2 Hồi qui tuyến tính đa biến Example: a sales manager of Tackey Toys, needs to predict sales of Tackey products in selected market area He believes that advertising expenditures and the population in each market area can be used to predict sales He gathered sample of toy sales, advertising expenditures and the population as below Find the linear multiple regression equation which the best fit to the data 3.2.2 Hồi qui tuyến tính đa biến Market Area Advertising Expenditures (Thousands of Dollars) x1 Population (Thousands) x2 Toy sales (Thousands of Dollars) y A 1.0 200 100 B 5.0 700 300 C 8.0 800 400 D 6.0 400 200 E 3.0 100 100 F 10.0 600 400 3.2.2 Hồi qui tuyến tính đa biến yˆ  6.3972  20.4921x1  0.2805 x2 3.3 Hồi qui phi tuyến  Y = f(X, β)  Y hàm phi tuyến cho việc kết hợp thông số β  Ví dụ: hàm mũ, hàm logarit, hàm Gauss, …  Biến đổi sang hàm tuyến tính 20 3.4 Ứng dụng   Quá trình khai phá liệu  Giai đoạn tiền xử lý liệu  Giai đoạn khai phá liệu  Khai phá liệu có tính mơ tả  Khai phá liệu có tính dự báo Các lĩnh vực ứng dụng: sinh học (biology), nông nghiệp (agriculture), xã hội (social issues), kinh tế (economy), kinh doanh (business), … 3.5 Các vấn đề với hồi qui  Các giả định (assumptions) kèm với toán hồi qui  Lượng liệu xử lý  Đánh giá mơ hình hồi qui  Các kỹ thuật tiên tiến cho hồi qui:  Artificial Neural Network (ANN)  Support Vector Machine (SVM) 2 3.6 Tóm tắt   Hồi qui  Kỹ thuật thống kê, áp dụng cho thuộc tính liên tục (continuous attributes/features)  Có lịch sử phát triển lâu đời  Đơn giản hữu dụng, ứng dụng rộng rãi  Cho thấy đóng góp đáng kể lĩnh vực thống kê lĩnh vực khai phá liệu Các dạng mơ hình hồi qui: tuyến tính/phi tuyến, đơn biến/đa biến, đối xứng/bất đối xứng Hỏi & Đáp …

Ngày đăng: 11/10/2022, 01:02

Hình ảnh liên quan

Mơ hình phân bố dữ liệu củ ay theo x??? - Hồi qui liệu KHAI PHÁ DỮ LIỆU (DATA MINING)

h.

ình phân bố dữ liệu củ ay theo x??? Xem tại trang 5 của tài liệu.
 Mơ hình hồi qui (regression model): mơ hình mơ tả mối liên kết - Hồi qui liệu KHAI PHÁ DỮ LIỆU (DATA MINING)

h.

ình hồi qui (regression model): mơ hình mơ tả mối liên kết Xem tại trang 7 của tài liệu.
Ch oN đối tượng đã được quan sát, mơ hình hồi qui tuyến tính đơn biến được cho dưới dạng sau: - Hồi qui liệu KHAI PHÁ DỮ LIỆU (DATA MINING)

h.

oN đối tượng đã được quan sát, mơ hình hồi qui tuyến tính đơn biến được cho dưới dạng sau: Xem tại trang 11 của tài liệu.
 Ước lượng bộ thơng số để đạt được mơ hình hồi qui tuyến tính đơn biến - Hồi qui liệu KHAI PHÁ DỮ LIỆU (DATA MINING)

c.

lượng bộ thơng số để đạt được mơ hình hồi qui tuyến tính đơn biến Xem tại trang 13 của tài liệu.
3.5. Các vấn đề với hồi qui - Hồi qui liệu KHAI PHÁ DỮ LIỆU (DATA MINING)

3.5..

Các vấn đề với hồi qui Xem tại trang 22 của tài liệu.
 Đánh giá mơ hình hồi qui. - Hồi qui liệu KHAI PHÁ DỮ LIỆU (DATA MINING)

nh.

giá mơ hình hồi qui Xem tại trang 22 của tài liệu.
 Các dạng mơ hình hồi qui: tuyến tính/phi tuyến, đơn biến/đa biến, đối xứng/bất đối xứng - Hồi qui liệu KHAI PHÁ DỮ LIỆU (DATA MINING)

c.

dạng mơ hình hồi qui: tuyến tính/phi tuyến, đơn biến/đa biến, đối xứng/bất đối xứng Xem tại trang 23 của tài liệu.

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan