1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Phân tích số liệu matrix algebra and random vectors

80 0 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 80
Dung lượng 1,51 MB

Nội dung

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI VIỆN TOÁN ỨNG DỤNG VÀ TIN HỌC Phân tích số liệu MATRIX ALGEBRA AND RANDOM VECTORS Giảng viên: ThS Lê Xuân Lý Sinh viên thực hiện: Vũ Đức Minh - 20206251 Hoàng Tiến Đạt - 20206231 Dương Văn Khoa - 20206244 Phạm Chí Công - 20206273 Vũ Thành Đạt - 20206275 Nguyễn Đắc Long - 20206291 Trịnh Văn Cường - 20206229 Phạm Văn Thái - 20206303 Trần Tuấn Kiệt - 20206290 Lớp: MI2 - 01 - K65 HÀ NỘI, 02/2023 Lời mở đầu Phân tích số liệu mơn học quan trọng sinh viên theo chuyên ngành Hệ thống thông tin quản lý, đăc biệt với định hướng Khoa học liệu kinh tế quản lý Qua trình học tập, nhóm em cảm thấy mơn học trừu tượng khó hiểu tự học đặc biệt sinh viên chưa có tảng thống kê vững kinh nghiệm dự án thực tế Nhưng nhờ có hướng dẫn, giảng dạy thầy giảng đường thông qua trao đổi trực tiếp, thầy giúp chúng em làm rõ nội dung nắm bắt tinh thần môn học Những kiến thức thầy truyền tải khơng dừng lại lý thuyết mà cịn nhiều phần mở rộng, thực tế, phân tích, trao đổi phản biện Nhóm em xin chân thành cảm ơn thầy suốt kỳ học vừa qua, giúp đỡ, chia sẻ tận tình thầy để nhóm em làm tốt phần báo cáo Hà Nội, tháng năm 2023 Thay mặt nhóm báo cáo Vũ Đức Minh ĐÁNH GIÁ CÁC THÀNH VIÊN Đánh giá cuối kỳ • Đánh giá chung: Cả nhóm tham gia làm báo cáo chung, hoàn thành phần việc giao Theo đánh giá trưởng nhóm, nhóm tích cực +1.5 điểm • Bảng phân chia cơng việc: Cơng việc Lập kế hoạch Soạn chương 1.1 Soạn chương 1.2 Soạn chương 2, Soạn chương Soạn chương 5.1, 5.2 Soạn chương 5.3, 5.4 Soạn chương Soạn chương Soạn chương Sinh viên thực Vũ Đức Minh Trịnh Văn Cường Hoàng Tiến Đạt Vũ Thành Đạt Nguyến Đắc Long Phạm Chí Cơng Phạm Văn Thái Dương Văn Khoa Trần Tuấn Kiệt Vũ Đức Minh Đánh giá Tích cực Tích cực Tích cực Tích cực Tích cực Tích cực Tích cực Tích cực Tích cực Tích cực Đánh giá kỳ • Đánh giá chung: Tất thành viên nhóm tham gia làm slide thuyết trình phần giao Theo đánh giá trưởng nhóm nhóm tích cực +1.5 điểm • Bảng phân chia công việc: Công việc kỳ phân chia bảng phân chia công việc cuối kỳ Mục lục Chương Khái niệm vector ma trận 1.1 Vector 1.2 1 1.1.1 Định nghĩa 1.1.2 Các phép toán vector 1.1.3 Không gian vector Ma trận 1.2.1 Định nghĩa 1.2.2 Các phép toán ma trận 1.2.3 Định thức ma trận 1.2.4 Hạng ma trận 1.2.5 Trị riêng vector riêng 10 Chương Ma trận đối xứng xác định 11 2.1 Ma trận đối xứng 11 2.2 Ma trận đơn vị 11 2.3 Ma trận nghịch đảo 12 2.4 Ma trận đường chéo ma trận tam giác 12 2.5 Ma trận đối xứng xác định dương 13 2.6 Ma trận đối xứng xác định âm 14 2.7 Ma trận trực giao 15 Chương Ma trận bậc hai 3.1 Định nghĩa 16 16 3.2 Tính chất: 16 Chương Vector ngẫu nhiên, ma trận ngẫu nhiên 4.1 21 Lý thuyết 21 4.2 Ví dụ 22 Chương Vector trung bình ma trận hiệp phương sai 24 5.1 Lý thuyết mở đầu 24 5.2 Chia khối ma trận hiệp phương sai 28 5.3 Vector trung bình ma trận hiệp phương sai cho tổ hợp tuyến tính biến ngẫu nhiên 30 5.4 Chia khối vector trung bình mẫu ma trận hiệp phương sai mẫu 34 Chương Bất đẳng thức ma trận Maximum 36 6.1 Bất đẳng thức Cauchy-Schwatz 36 6.2 Bất đẳng thức Cauchy-Schwatz mở rộng 37 6.3 Bổ đề Maximum 38 6.4 Maximum dạng toàn phương hình cầu đơn vị 39 Chương Mở rộng ứng dụng ma trận 41 7.1 Khái niệm ảnh số 41 7.2 Ma trận Kernel phép tích chập hai chiều 43 7.3 Xử lý ảnh 47 7.3.1 Xử lý ảnh nhiễu muối tiêu 47 7.3.2 Tìm biên vật thể 49 Chương Bài tập 8.1 52 Bài tập thực hành công cụ 52 8.1.1 Làm quen với phân tích liệu phân tích đa biến 52 8.1.2 Các cơng cụ hỗ trợ Data Analysis 54 8.1.3 Bài tập vận dụng thực hành 67 Kết luận 73 Chương Kết luận 73 Tài liệu tham khảo 75 Chương Khái niệm vector ma trận 1.1 1.1.1 Vector Định nghĩa Bộ n số thực x1 , x2 , , xn gọi vector n chiều,thường biểu diễn dạng :  x=   x1      x   2              xT = x1 , x2 , , xn xn Ký hiệu T biểu thị phép chuyển vị Ví dụ :  x=         3       −2  T   Dạng chuyển vị :x = 3, 0, −2 • Về mặt hình học, vector gồm n phần tử coi điểm khơng gian n chiều • Vector có đặc tính chiều dài hướng   6   Ví dụ, Trong khơng gian R2 , điểm A(6, 8), xét vector x =   tia OA độ dài |x| = 1.1.2 √ 62 + 82 = 10 Các phép toán vector Cho x, y vector n chiều :  x=    x1      x   2  ,y           = xn   y1      y   2   .         yn • Cộng trừ vector:  x±y =  x1   x         ± y1    ± y2         xn ± y n Ví dụ :     3 2    x=  ,y =   có hướng theo     5 3 + 2 =  x+y =     0+1 • Nhân vector x với c ∈ R :   cx =  cx1       cx   2             cxn c > : vector giữ nguyên hướng c < : vector đổi hướng ngược lại −1 c = L−1 : nhận vector đơn vị x = |x| Ví dụ :     5 10    2×  =  • Nhân vơ hướng vector(Inner dot): x′ y = y ′ x = n X xi yi = x1 y1 + x2 y2 + + xn yn i=1 Như ta có: ′ xx= n X x2i i=1 Từ ta có chiều dài vector x ký hiệu Lx tính theo công thức: v u n √ uX ′ Lx = x x = t x2i i=1 • Góc vector xác định : cos (θ) = x′ y Lx Ly • Phép nhân có hướng: x × y = ⃗n|x||y|sin(θ) ⃗n trực giao với x,y, có hướng xác định theo quy tắc bàn tay phải Tính chất: • Gọi y vectơ y Ly vectơ đơn vị hay chuẩn • Nếu x′ y = y ′ x = x y gọi trực giao (orthogonal) • Nếu ta "chiếu" x lên y ta thu vectơ, ký hiệu xy chiều dài vectơ xác định theo phương trình: Lxy = Lx cos (θ) = 1.1.3 x′ y Ly Không gian vector Tập hợp V ̸= ∅ gọi khơng gian vector Rn trang bị hai phép tốn gồm : • Phép cộng vector • Phép nhân vector với vô hướng   Cho V không gian vector S = x1 , x2 , , xn họ vector V Tập hợp tất tổ hợp tuyến tính vector S gọi bao tuyến tính S Ký hiệu : span(S ) Nếu span(S )=V , S coi hệ sinh không gian vector V Hệ vector x1 , x2 , , xn gọi độc lập tuyến tính hệ thức c1 x + c2 x + + cn x n = xảy c1 = c2 = = cn =  Hệ vector S = v1 , v2 , ,  gọi phụ thuộc tuyến tính   khơng độc lập tuyến tính Hệ vector S = v1 , v2 , , V coi sở V hệ sinh độc lập tuyến tính 1.2 Ma trận 1.2.1 Định nghĩa Ma trận mảng hình chữ nhật bao gồm số thực Ma trận A có m hàng, n cột với m, n ∈ N∗ :   a11   a  21       Am×n =  a12 · · · a1n a22 · · · a2n am1 am2 · · · amn            Tương tự vector,phép toán chuyển vị AT ma trận thay đổi cột thành hàng, để cột A trở thành hàng A ’, cột thứ hai trở thành hàng thứ hai, v.v Ví dụ :  A2×3 = 1    3 A3×2 =     1   3    2   4    Bảng 8.2: Các hàm thống kê phổ biến AVERAGE() COUNT() COUNTA() Countblank() COUNTIF() SUM() SUMIF() RANK() ROW() COLUMN() MIN(), MAX() FREQUENCY() VAR() Tính giá trị trung bình Đếm cỡ mẫu Hàm đếm tất có chứa liệu Hàm đếm tất ô rỗng Hàm đếm liệu Excel theo điều kiện Hàm tính tổng Excel Hàm tính tổng theo điều kiện Hàm xếp hạng Excel Hàm tìm vị trí dịng Excel Hàm tìm vị trí cột Excel Hàm tìm giá trị nhỏ nhất, giá trị nhỏ Dùng để lập bảng tần số Phương sai mẫu 61 Bảng 8.3: Các hàm tương quan hồi quy phổ biến BETADIST() Trả hàm phân bố lũy tích beta EXPONDIST() Trả phân bố hàm mũ GAMMADIST() Trả phân bố gamma HYPGEOMDIST() Trả phân bố siêu bội NEGBINOMDIST() Trả phân bố nhị thức âm POISSON() Trả phân bố Poisson TDIST() Trả phân bố t Student Ước tính độ lệch tiêu chuẩn dựa STDEV() mẫu Tính tốn độ lệch tiêu chuẩn dựa STDEVP() toàn tổng thể CHITEST() Kiểm tra tính độc lập Kết hợp hai hay nhiều chuỗi văn CONCATENATE() thành chuỗi Trả khoảng tin cậy trung bình CONFIDENCE() tổng thể CORREL() Tính hệ số tương quan COVAR() Tính hiệp phương sai LINEST() Tìm đường thẳng hồi quy Trả sai số chuẩn y x STEYX() hồi quy Tính ma trận hiệp phương sai ma trận hệ số tương quan với Excel: Để minh hoạt cho tốn tìm ma trận hiệp phương sai ma trận hệ số tương quan, ta sử dụng liệu gồm giá đóng cửa có hiệu chỉnh mã chứng khốn FAANG năm hình dưới: Chúng ta thấy mã cổ phiếu tăng trưởng đặn ổn định, nhiên vào cuối tuần tháng 10/2021 xảy cố nghiêm 62 Hình 8.2: Giá cổ phiếu công ti Big Tech trọng làm kết nối Facebook mạng xã hội con, điều dẫn đến giá mã FB sụt giảm đáng kể vào đầu tuần kế Trước hết ta cần tính thay đổi giá đóng cửa mã qua ngày Bằng cách lấy (giá đóng cửa phiên sau - giá đóng cửa phiên trước)/giá đóng cửa phiên trước, ta thu kết hình Hình 8.3: Sự thay đổi giá cổ phiếu Các kỳ vọng độ lệch chuẩn liệu bảng thay đổi giá cổ phiếu tính hàm Average() hàm STDEV() bảng 8.2 bảng 8.3 63 Đến có nhiều cách để tìm ma trận hiệp phương sai ma trận hệ số tương quan: Cách 1: sử dụng cơng cụ tích hợp Data Analysis (b1 ) Bật tiện tích bổ trợ Analysis ToolPak có sẵn tất phiên Excel 2019 đến 2003 (b2 ) Trong tab Data > Chọn Data Analysis > Chọn Regression, hộp thoại Regression, chọn vùng liệu thay đổi mã (b3 ) Chạy ta kết quả: Hình 8.4: Ma trận hiệp phương sai ma trận hệ số tương quan Nhìn vào ma trận hệ số tương quan, ta thấy NFLX có độ tương quan thấp với cổ phiếu lại, điều lĩnh vực kinh doanh Netflix chủ yếu phim ảnh, khác với cơng ty cịn lại hoạt động chủ yếu nhờ kinh doanh, mạng xã hội Ngoài hệ số tương quan cổ phiếu AMZN AAPL mạnh 0.657145, nghĩa cổ phiếu có mối quan hệ chặt chẽ tương quan thuận, di chuyển Nói tóm lại, hiệp phương sai cho bạn biết hai biến số tăng giảm, tương quan cho thấy thay đổi biến ảnh hưởng đến thay đổi biến Cách 2: Dựa hàm COVAR, CORREI có sẵn Excel, ta viết hàm tính hiệp phương sai hệ số tương quan theo hàng cột Cách 64 phù hợp với liệu nhỏ Cách 3: Sử dụng hàm COVAR, CORREI kết hợp với hàm OFFSET Cách sử dụng hàm COVAR, CORREI mà không cần phần mềm tự động Data Analysis, đồng thời khắc phục nhược điểm Cách Tuy nhiên phương pháp phức tạp cần hiểu chất hàm OFFSET, câu lệnh tương đối phức tạp Cách 4: Sử dụng tính chất ma trận hiệp phương sai ma trận hệ số tương quan Các yêu cầu hiểu chất lý thuyết ma trận hiệp phương sai ma trận hệ số tương quan Thông qua vector giá trị trung bình, ma trận V , ta thu ma trận cần tìm Phần lý thuyết trình bày cụ thể chương ?? [?] 65 Bảng tóm tắt: C2,3: Hàm CORREL() ρ = (V )−1 Tính tốn thủ cơng Dữ liệu liệt kê C2,3: Hàm COVAR() ρ Σ C1: Data Analysis Tính thành phần Cách 1: Data Analysis : P = [σij ]p×p ma trận hiệp phương sai ρ ma trận hệ số tương quan √ √ (V )−1 P √ V = diag( σ11 , σ22 , , σpp ) 1 (V )−1 ma trận nghịch đảo V 66 8.1.3 Bài tập vận dụng thực hành Exercises 2.2 Cho ma trận  −1    A= B= ,        −3  −2 −2         ,    C=         −4       Thực phép nhân sau 5A BA A′ B′ C ′ B AB có xác định hay khơng? LỜI GIẢI     −5 15   5A =   20 10 , BA =         −16  −9 −1 −6  ′    ,    A′ B ′ =     −16 −9   −1 −6 ,  CB= 12 −7 , ∄AB Exercises 2.5   Kiểm tra ma trận Q =    13 12 13 − 12 13 13    có ma trận trực giao hay không.? LỜI GIẢI Để kiểm tra ma trận Q có trực giao, ta kiểm tra Q có nghịch đảo chuyển 67 vị có hay không Xét hiệu  Q − (Q−1 )′ =     13 12 13 − 12 13 13    −    −65 119 156 119 − 156 119 −65 119    ̸= Vậy Q không ma trận trực giao Exercises 2.6    −2  Cho A =   −2   A có la ma trận đối xứng ? Chỉ A ma trận xác định dương LỜI GIẢI Dễ thấy A = A′ nên A ma trận đối xứng, Det(A) = 9.6 − = 50 > Mặt khác ma trận A có định thức dương nên ma trận xác định dương Exercises 2.24 Cho X ma trận hiệp phương sai  Σ=         0  0       Tìm Σ−1 Các giá trị riêng vector riêng Σ Các giá trị riêng vector riêng Σ−1 LỜI GIẢI 68  Σ−1 =         0      0   Σ ma trận đường chéo nên giá trị riêng giá trị đường chéo λ1 = 4, λ2 = 9, λ3 = vector riêng vector cột tương ứng:            0  ,                        ,            Tương tự Σ−1 có giá trị riêng λ1 = 14 , λ2 = 19 , λ3 = vector riêng là:         0      ,           ,                        Exercises 2.25  Cho X ma trận hiệp phương sai Σ =         25 −2   −2      Chỉ ρ V 1/2 Thực phép nhân ma trận để V 1/2 ρV 1/2 = Σ LỜI GIẢI Ta tìm vector phương sai công thức σii =  =σ=               69 √ Σii thu ma trận Nhân σ với chuyển vị ta được:   σσ ′ =        25 10 15      10 15   Chia Σ cho σσ ′ theo số ta thu ma trận ρ  ρ = Σ/σσ ′ =     −1    15  −1 15 1 6                        Với ma trận V ta có:  V √  σ11   √ = σ22    √ 0 σ33 =  0  0        V ρV =         −1 5 0     −1   0   15  15        0   0 Exercises 2.26 Sử dụng Σ Exercise 2.25 Tìm ρ13 Tìm hệ số tương quan X1 12 X2 + 12 X3 LỜI GIẢI 70        =         25 −2  −2 4       =Σ ρ13 = √   Ta có vector X1 =        σ13 = σ11 σ13 15 25   −2    ,    X 2 + 12 X3 =               Hệ số tương quan cần tìm có giá trị là: 1 Correl(X1 , X2 + X3 ) = −0.63703 2 Exercises 2.41 Cho vector ngẫu nhiên X′ = [X1 , X2 , X3 , X4 ] với vector giá trị trung bình µ′X = [3, 2, −2, 0] ma trận hiệp phương sai  Σx = Let             0  0 0 0 0            A=         −1 1 −2 1  −3       Tìm E(AX) Tìm Cov(AX) Những cặp biến số có hiệp phương sai 0? LỜI GIẢI 71     E(AX) = AµX =        −1 1 0 −2 1 −3                     −2           =         Ma trận hiệp phương sai AX là:   CovAX = AΣX A′ =        0   18   0 36    Do σij = ∀i ̸= j nên tất cặp biến số có hiệp phương sai 72 Chương Kết luận Báo cáo đạt mục tiêu đề Báo cáo nghiên cứu tìm hiểu ma trận vector ngẫu nhiên số khái niệm liên quan Kết báo cáo Trình bày khái niệm ma trận vector đại số tuyến tính Trình bày ma trận vector ngẫu nhiên thống kê đa biến toán liên quan Kỹ đạt Bước đầu biết tìm kiếm, đọc, dịch tài liệu chuyên ngành liên quan đến nội dung báo cáo Biết tổng hợp kiến thức học kiến thức tài liệu tham khảo để viết báo cáo Chế báo cáo LATEX Biết thực hành thống kê phần mềm Microsoft Excel 73 Hướng phát triển báo cáo tương lai Mở rộng ứng dụng khái niệm đại số tuyến tính vector, ma trận sang lĩnh vực thống kê, đặc biệt thống kê đa biến Xây dựng phương pháp giải toán thống kê thực tế phần mềm chuyên dụng R, Python, VBA 74 Tài liệu tham khảo Tiếng Việt [1] Giải tích ma trận - GS.TS Phạm Hoàng Hà PGS.TS Nguyễn Văn Thịnh [2] Xác suất thống kê - TS Đào Hữu Nam [3] Đại số tuyến tính ứng dụng - GS.TS Phạm Hoàng Hà TS Lê Hồng Trang Tiếng Anh [4] Matrix Analysis and Applied Linear Algebra - Carl D Meyer [5] Linear Algebra and Its Applications - Gilbert Strang [6] Random Matrices: Theory and Applications - Mehta Madan Lal 75

Ngày đăng: 13/04/2023, 06:34

w