1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Tài liệu Chương 3: Hồi qui dữ liệu doc

52 304 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 52
Dung lượng 735,35 KB

Nội dung

1 1 Ch Ch ươ ươ ng ng 3: 3: Hồi Hồi qui qui dữ dữ liệu liệu Họckỳ 1 – 2011-2012 Khoa Khoa Khoa Khoa Học Học & & Kỹ Kỹ Thuật Thuật Máy Máy Tính Tính Tr Tr ư ư ờng ờng Đ Đ ại ại Học Học Bách Bách Khoa Khoa Tp Tp . . Hồ Hồ Chí Chí Minh Minh Cao Cao Học Học Ngành Ngành Khoa Khoa Học Học Máy Máy Tính Tính Giáo Giáo trình trình đ đ iện iện tử tử Biên Biên soạn soạn bởi bởi : TS. : TS. Võ Võ Thị Thị Ngọc Ngọc Châu Châu ( ( chauvtn@cse.hcmut.edu.vn chauvtn@cse.hcmut.edu.vn ) ) 2 2 Tài liệuthamkhảo  [1] Jiawei Han, Micheline Kamber, “Data Mining: Concepts and Techniques”, Second Edition, Morgan Kaufmann Publishers, 2006.  [2] David Hand, Heikki Mannila, Padhraic Smyth, “Principles of Data Mining”, MIT Press, 2001.  [3] David L. Olson, Dursun Delen, “Advanced Data Mining Techniques”, Springer-Verlag, 2008.  [4] Graham J. Williams, Simeon J. Simoff, “Data Mining: Theory, Methodology, Techniques, and Applications”, Springer-Verlag, 2006.  [5] Hillol Kargupta, Jiawei Han, Philip S. Yu, Rajeev Motwani, and Vipin Kumar, “Next Generation of Data Mining”, Taylor & Francis Group, LLC, 2009.  [6] Daniel T. Larose, “Data mining methods and models”, John Wiley & Sons, Inc, 2006.  [7] Ian H.Witten, Eibe Frank, “Data mining : practical machine learning tools and techniques”, Second Edition, Elsevier Inc, 2005.  [8] Florent Messeglia, Pascal Poncelet & Maguelonne Teisseire, “Successes and new directions in data mining”, IGI Global, 2008.  [9] Oded Maimon, Lior Rokach, “Data Mining and Knowledge Discovery Handbook”, Second Edition, Springer Science + Business Media, LLC 2005, 2010. 3 3 Nộidung  Chương 1: Tổng quan về khai phá dữ liệu  Chương 2: Các vấn đề tiềnxử lý dữ liệu  Chương 3: Hồiqui dữ liệu  Chương 4: Phân loạidữ liệu  Chương 5: Gom cụmdữ liệu  Chương 6: Luậtkếthợp  Chương 7: Khai phá dữ liệuvàcôngnghệ cơ sở dữ liệu  Chương 8: Ứng dụng khai phá dữ liệu  Chương 9: Các đề tài nghiên cứutrongkhaiphádữ liệu  Chương 10: Ôn tập 4 4 Chương 3: Hồiqui dữ liệu  3.1. Tổng quan về hồiqui  3.2. Hồiqui tuyếntính  3.3. Hồiqui phi tuyến  3.4. Ứng dụng  3.5. Các vấn đề vớihồiqui  3.6. Tóm tắt 5 5 3.0. Tình huống 1 Ngày mai giá cổ phiếu STB sẽ là bao nhiêu??? 6 6 3.0. Tình huống 2 x y y = x + 1 X1 Y1 Y1’ Mô hình phân bố dữ liệucủa y theo x??? 7 7 3.0. Tình huống 3 Bàitoánphântíchgiỏ hàng thị trường (market basket analysis) Æ sự kếthợpgiữacácmặthàng? 8 8 3.0. Tình huống 4  Khảosátcácyếutố tác động đếnxuhướng sử dụng quảng cáo trựctuyếntạiViệtNam  Sự giảitrícảmnhận (+0.209)  Chấtlượng thông tin (+0.261)  Chấtlượng thông tin cảmnhận (+0.199)  Sự khó chịucảmnhận (-0.175)  Sự tin cậycảmnhận  Thái độ về tính riêng tư  Sự tương tác (+0.373)  Chuẩnchủ quan (+0.254)  Nhậnthứckiểm soát hành vi (+0.377) 9 9 3.0. Tình huống …  Hồi qui (regression)  Khai phá dữ liệucótínhdự báo (Predictive data mining)  Tình huống ???  Khai phá dữ liệucótínhmôtả (Descriptive data mining)  Tình huống ??? 10 10 3.1. Tổng quan về hồiqui  Định nghĩa-Hồi qui (regression)  J. Han et al (2001, 2006): Hồiqui làkỹ thuậtthống kê cho phép dựđoán các trị (số) liên tục.  Wiki (2009): Hồi qui (Phân tích hồiqui –regression analysis) là kỹ thuậtthống kê cho phép ướclượng các mốiliênkếtgiữacácbiến  R. D. Snee (1977): Hồi qui (Phân tích hồiqui) làkỹ thuậtthống kê trong lĩnh vựcphântíchdữ liệuvà xây dựng các mô hình từ thựcnghiệm, cho phép mô hình hồiqui vừa được khám phá được dùng cho mục đích dự báo (prediction), điềukhiển (control), hay học (learn) cơ chếđãtạoradữ liệu. R. D. Snee, Validation of Regression Models: Methods and Examples, Technometrics, Vol. 19, No. 4. (Nov., 1977), pp. 415-428. [...]... 3.2 Hồi qui tuyến tính Hồi qui tuyến tính đơn biến Đường hồi qui (regression line) Hồi qui tuyến tính đa biến Mặt phẳng hồi qui (regression plane) 18 18 3.2.1 Hồi qui tuyến tính đơn biến Cho N đối tượng đã được quan sát, mô hình hồi qui tuyến tính đơn biến được cho dưới dạng sau với εi dùng giữ phần biến thiên của đáp ứng Y không được giải thích từ X: -Dạng đường thẳng -Dạng parabola 19 19 3.2.1 Hồi qui. .. của X đối với Y 12 12 3.1 Tổng quan về hồi qui Phân loại Hồi qui tuyến tính (linear) và phi tuyến (nonlinear) Hồi qui đơn biến (single) và đa biến (multiple) Hồi qui có thông số (parametric), phi thông số (nonparametric), và thông số kết hợp (semiparametric) Hồi qui đối xứng (symmetric) và bất đối xứng (asymmetric) 13 13 3.1 Tổng quan về hồi qui Phân loại Hồi qui tuyến tính (linear) và phi tuyến (nonlinear)... quan về hồi qui Phân loại Hồi qui đơn biến (single) và đa biến (multiple) Single: X = (X1) Multiple: X = (X1, X2, …, Xk) ˆ y = 6 3 9 7 2 + 2 0 4 9 2 1 x 1 + 0 2 8 0 5 x 2 ˆ y = 26.89 + 4.06 x 15 [Chapter 6 Regression and Correlation.ppt] 15 3.1 Tổng quan về hồi qui Phân loại Hồi qui có thông số (parametric), phi thông số (nonparametric), và thông số kết hợp (semiparametric) Parametric: mô hình hồi qui. .. 26 3.3 Hồi qui phi tuyến Y = f(X, β) Y là hàm phi tuyến cho việc kết hợp các thông số β Ví dụ: hàm mũ, hàm logarit, hàm Gauss, … Xác định bộ thông số β tối ưu: các giải thuật tối ưu hóa Tối ưu hóa cục bộ Tối ưu hóa toàn cục cho tổng thặng bình phương (sum of squared residuals) 27 27 3.4 Ứng dụng Quá trình khai phá dữ liệu Giai đoạn tiền xử lý dữ liệu Giai đoạn khai phá dữ liệu Khai phá dữ liệu có... phá dữ liệu có tính dự báo Các lĩnh vực ứng dụng: sinh học (biology), nông nghiệp (agriculture), xã hội (social issues), kinh tế (economy), kinh doanh (business), … P Giudici, Applied Data Mining – Statistical Methods for Business and Industry, John Wiley & Sons Ltd, 2003 28 28 3.5 Các vấn đề với hồi qui Các giả định (assumptions) đi kèm với bài toán hồi qui Lượng dữ liệu được xử lý Đánh giá mô hình hồi. .. Industry, John Wiley & Sons Ltd, 2003 16 16 3.1 Tổng quan về hồi qui Phân loại Hồi qui đối xứng (symmetric) và bất đối xứng (asymmetric) Symmetric: mô hình hồi qui có tính mô tả (descriptive) (eg log-linear models) The objective of the analysis is descriptive – to describe the associative structure among the variables Asymmetric: mô hình hồi qui có tính dự báo (predictive) (eg linear regression models,... 2.018*X •Dấu của β1 cho biết sự ảnh hưởng của X đối với Y 20 20 3.2.1 Hồi qui tuyến tính đơn biến Ước lượng bộ thông số β ( ) để đạt được mô hình hồi qui tuyến tính đơn biến Thặng (residual) xi, yi: trị của x, y từ tập dữ liệu huấn luyện Tổng thặng bình phương (sum of squared residuals) tối thiểu hóa x, y: trị trung bình từ tập dữ liệu huấn luyện ŷi: trị ước lượng với bộ thông số β Trị ước lượng... được ứng dụng rộng rãi Cho thấy sự đóng góp đáng kể của lĩnh vực thống kê trong lĩnh vực khai phá dữ liệu Các dạng mô hình hồi qui: tuyến tính/phi tuyến, đơn biến/đa biến, có thông số/phi thông số/thông số kết hợp, đối xứng/bất đối xứng 30 30 Hỏi & Đáp … 31 31 Chương 3: Hồi qui dữ liệu Phần 2 32 32 Nội dung Generalized linear models [2], section 11.3, pp 384-390 Logistic regression [2], section 10.7,... mô hình hồi qui Các kỹ thuật tiên tiến cho hồi qui: Artificial Neural Network (ANN) Support Vector Machine (SVM) 29 29 3.6 Tóm tắt Hồi qui Kỹ thuật thống kê, được áp dụng cho các thuộc tính liên tục (continuous attributes/features) Có lịch sử phát triển lâu đời Đơn giản nhưng rất hữu dụng, được ứng dụng rộng rãi Cho thấy sự đóng góp đáng kể của lĩnh vực thống kê trong lĩnh vực khai phá dữ liệu Các dạng... về hồi qui Mô hình hồi qui (regression model): mô hình mô tả mối liên kết (relationship) giữa một tập các biến dự báo (predictor variables/independent variables) và một hay nhiều đáp ứng (responses/dependent variables) Y = f(X, β) X: các biến dự báo (predictor/independent variables) Y: các đáp ứng (responses/dependent variables) β: các hệ số hồi qui (regression coefficients) 11 11 3.1 Tổng quan về hồi . 2010. 3 3 Nộidung  Chương 1: Tổng quan về khai phá dữ liệu  Chương 2: Các vấn đề tiềnxử lý dữ liệu  Chương 3: Hồiqui dữ liệu  Chương 4: Phân loạidữ liệu  Chương. nghiên cứutrongkhaiph dữ liệu  Chương 10: Ôn tập 4 4 Chương 3: Hồiqui dữ liệu  3.1. Tổng quan về hồiqui  3.2. Hồiqui tuyếntính  3.3. Hồiqui phi tuyến  3.4.

Ngày đăng: 14/02/2014, 19:20

HÌNH ẢNH LIÊN QUAN

Mơ hình phân bố dữ liệu củ ay theo x??? - Tài liệu Chương 3: Hồi qui dữ liệu doc
h ình phân bố dữ liệu củ ay theo x??? (Trang 6)
‡ Mơ hình hồi qui (regression model): mơ hình mơ - Tài liệu Chương 3: Hồi qui dữ liệu doc
h ình hồi qui (regression model): mơ hình mơ (Trang 11)
‡ Parametric: mơ hình hồi qui với hữu hạn thơng số - Tài liệu Chương 3: Hồi qui dữ liệu doc
arametric mơ hình hồi qui với hữu hạn thơng số (Trang 16)
‡ Symmetric: mơ hình hồi qui cĩ tính mơ tả (descriptive) (eg. log-linear models) - Tài liệu Chương 3: Hồi qui dữ liệu doc
ymmetric mơ hình hồi qui cĩ tính mơ tả (descriptive) (eg. log-linear models) (Trang 17)
Ch oN đối tượng đã được quan sát, mơ hình hồi qui tuyến - Tài liệu Chương 3: Hồi qui dữ liệu doc
h oN đối tượng đã được quan sát, mơ hình hồi qui tuyến (Trang 19)
hình hồi qui tuyến tính đơn biến - Tài liệu Chương 3: Hồi qui dữ liệu doc
hình h ồi qui tuyến tính đơn biến (Trang 21)
‡ Đánh giá mơ hình hồi qui. - Tài liệu Chương 3: Hồi qui dữ liệu doc
nh giá mơ hình hồi qui (Trang 29)
‡ Các dạng mơ hình hồi qui: tuyến tính/phi tuyến, đơn biến/đa biến, cĩ thơng số/phi thơng số/thơng số kết hợp,  đối xứng/bất đối xứng - Tài liệu Chương 3: Hồi qui dữ liệu doc
c dạng mơ hình hồi qui: tuyến tính/phi tuyến, đơn biến/đa biến, cĩ thơng số/phi thơng số/thơng số kết hợp, đối xứng/bất đối xứng (Trang 30)

TỪ KHÓA LIÊN QUAN