Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 31 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
31
Dung lượng
1,28 MB
Nội dung
BỘ CÔNG THƯƠNG TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP THỰC PHẨM THÀNH PHỐ HỒ CHÍ MINH KHOA CƠNG NGHỆ THỰC PHẨM BỘ MƠN QUẢN LÝ CHẤT LƯỢNG VÀ AN TỒN THỰC PHẨM TIỂU LUẬN MÔN ĐÁNH GIÁ CẢM QUAN THỰC PHẨM ĐỀ TÀI: ỨNGDỤNG CỦA PCA (PRINCIPAL COMPONENT ANALYSIS) TRONGPHÂNTÍCHMƠTẢĐỊNHLƯỢNG GVHD: Nguyễn Thị Quỳnh Trang SVTH: Thành phố Hồ Chí Minh Mục lục Bảng phân cơng việc Mục lục 1.Giới thiệu: 1.1 Phântíchmơ tả: 1.2 Phântíchmơtảđịnhlượng (QDA): 1.3 Định nghĩa vấn đề cho liệu đa biến (Problem definition for multivariate data) 1.4 Giải thích hình học phântích thành phần (Geometric interpretation of principal component analysis) Phương pháp phântích thành phần – Principal Component Annalysis (PCA): 12 2.1 Khái niệm: 12 2.2 Đặc tính PCA: 13 2.3 Mục tiêu PCA: 13 2.4 Thuật toán PCA .14 2.4.1 Tiền xử lí 14 2.4.2 Xây dựng không gian 15 2.4.3 Chuyển liệu từ không gian ban đầu vào không gian .15 2.5 Mã nguồn MATLAB .15 2.6 Cơ sở toán học PCA: 17 2.7 Các bước để phântích thành phần 18 2.8 Toán (Background Mathematics) 18 2.8.1 Thống kê(Statistics) 18 2.8.2 Độ lệch chuẩn(Standard Deviation) 18 2.8.3 Phương sai (variance) .20 2.8.4 Hiệp phương sai (covariance) 20 2.8.5 Các ma trận hiệp phương sai(The covariance matrix) 21 2.8.6 Đại số ma trận(Matrix Algebra) 22 2.8.7 Vector riêng(Eigenvectors) .23 2.8.8 Giá trị riêng(Eigenvalues): .24 2.9 Phương pháp(Method) 24 2.9.1 Bước 1: Nhận số liệu (Get some data) 24 2.9.2 Bước 2: Trừ trung bình (Subtract the mean) .24 2.9.3 Bước 3: Tính tốn ma trận hiệp phương sai(Calculate the covariance matrix) 25 2.9.4 Bước 4: Tính vector riêng giá trị riêng ma trận hiệp phương sai (Calculate the eigenvectors and eigenvalues of the covariance matrix) 25 2.9.5 Bước 5: Lựa chọn thành phần hình thành vector đặc trưng (Choosing components and forming a feature vector) 26 2.9.6 Bước : Phát sinh tập liệu .27 2.9.7 Lấy liệu cũ trở lại 28 2.10 Các ứngdụngphântích thành phần (Applications of principal component analysis ) 30 2.10.1 Tổng quan liệu (Overview (plots) of any data table ) 30 2.10.2 Giảm biến đa chiều (Dimensionality reduction) 30 2.10.3 Mơ hình tương đồng (Similarity models ) .31 2.11 Ví dụ: 31 2.11.1 PCA nghiên cứu đánh giá cảm quan thực phẩm lên men: 31 2.11.2 PCA đánh giá tính chất cảm quan cà phê Buôn Mê Thuộc: .32 2.12 Hạn chế PCA: 32 Tài liệu tham khảo 33 - Application of principal component analysis (PCA) as a sensory assessment tool for fermented food products _J Food Sci Technol Jun 2012 .33 1.Giới thiệu: 1.1 Phântíchmơ tả: Trong đánh giá cảm quan, phântíchmơtả phương pháp tinh tế Phép thử cho phép nhà khoa học cảm quan môtả sản phẩm cách trọn vẹn, giúp nhận biết thành phần thơng số q trình chế biến xác định tính chất cảm quan liên quan tới thị hiếu người tiêu dùng Thơng thường, phântíchmơtả cho mơtả khách quan tính chất cảm quan nhận biết sản phẩm Đặc diểm phântíchmơtảmơtả chi tiết đặc điểm tính chất cảm quan sản phẩm so sánh sản phẩm với Ví dụ: vẻ bề ngồi, màu sắc, vị, cấu trúc sản phẩm miêu tả cách cụ thể chi tiết Ngồi đặc tính cảm quan địnhlượng theo tỉ lệ cường độ 1.2 Phântíchmơtảđịnhlượng (QDA): Phântíchmôtảđịnhlượng (Quantitative Descriptive Analysis - QDA) phát triển năm 1970 để hiệu chỉnh vài vấn đề nhận biết liên quan với phântíchmơtả mùi (Stone, Sidel, Oliver, Woolsey Singleton, 1947; Stone Sidel, 1933) Phântíchmơtảđịnhlượng phép thử sử dụng phổ biến phép thử môtả Kết thực nghiệm không tạo từ khâu thảo luận thống nhất, trường hội đồng thành viên chủ lực, thang không cấu trúc sử dụng để môtả cường độ tiêu Stone (1974) lựa chọn thang đồ thị đường thẳng, đường thẳng kéo dài vượt qua điểm đầu mút có từ mô tả, họ nhận thấy loại thang điểm có thề giảm xu hướng người thử sử dụngphần thang nhằm tránh cho điểm cao thấp Quyết định họ dựa phần nghiên cứu Aderson (1970) phép đo hàm lượng đánh giá tâm lý Rất nhiều người ủng hộ QDA kỹ thuật xem xét lại cách rộng rãi (Stone, Sidel, Oliver, Woolsey Singleton, 1947; Zook Wessman, 1977; Stone, Sidel Bloomquist, 1980; Power, 1988; Einstein, 1991; Meigaard, Civille Car, 1991; Heymann, Holt Cliff, 1993; Stone Sidel, 1930 1.3 Định nghĩa vấn đề cho liệu đa biến (Problem definition for multivariate data) Điểm khởi đầu tất phântích liệu đa biến ma trận liệu (một bảng liệu) ký hiệu N X.Hàng bảng gọi "đối tượng" Những thường tương ứng với mẫu hóa học địa chất Các cột K gọi "biến" bao gồm phép đo thực đối tượng Hình đưa nhìn tổng quan mục tiêu khác người ta có để phântích ma trận liệu Đây xác định vấn đề bàn tay tất số họ phải xem xét lúc Hình 2: Tổng quan đồ họa ma trận vectơ sử dụngPCA Nhiều người số mục tiêu PCA có liên quan với việc tìm kiếm mối quan hệ đối tượng Một người quan tâm, ví dụ, việc tìm kiếm lớp đối tượng tương tự Các thành phần lớp biết trước, tìm thấy cách thăm dò liệu có sẵn Liên quan với điều phát giá trị ngoại lai, giá trị ngoại lai khơng thuộc lớp tiếng Mục đích khác giảm liệu Điều hữu ích lượng lớn liệu xấp xỉ mơ hình cấu trúc phức tạp vừa phải Nhìn chung, hầu hết ma trận liệu đơn giản hóa PCA Một bảng lớn số điều khó khăn cho tâm trí người để hiểu PCA sử dụng với lựa chọn tập hợp đối tượng biến để xây dựngmơ hệ thống vật lý hay hóa học ứng xử mơ hình sử dụng để dự đoán liệu đo cho hệ thống PCA sử dụng để liên tục unmixing hỗn hợp tổng Chi nhánh thường gọi độ phân giải đường cong PCA ước tính cấu trúc tương quan biến Tầm quan trọng biến mơ hình máy tính định kích thước biến lại Điều thường sử dụng để lựa chọn biến Hình cung cấp lời giải thích đồ họa PCA cơng cụ để tách cấu trúc liệu hệ thống từ tiếng ồn Hình 4a b thuộc tính chiếu PCA Với cách giải thích đầy đủ, dự tiết lộ đặc điểm trận đấu bên phía tập hợp liệu đa biến định Hình có chứa (3 x 4) minh họa số nhỏ sử dụng ví dụ 1.4 Giải thích hình học phântích thành phần (Geometric interpretation of principal component analysis) Chiếu X xuống chiều không gian phương tiện ma trận chiếu P 'cung cấp cho đối tượng tọa độ mặt phẳng này, T Các cột T, t alpha, gọi vectơ điểm hàng P', p’alpha, gọi vectơ tải Sau bao gồm hệ số định hướng (hyper) máy bay PC Các vectơ t alpha p alpha trực giao, tức pi’pj = and ti’tj = 0, for i# j Độ lệch dự đoán tọa độ ban đầu gọi số dư Chúng thu thập ma trận E PCA dạng ma trận mơ hình phương tối thiểu: model: Ở có nghĩa vector cách rõ ràng việc xây dựngmơ hình, điều khơng bắt buộc Các liệu chiếu siêu phẳng qua gốc Hình cho đại diện đồ họa công thức Các kích thước vecto t alpha p alpha PCchiều không xác định số nhân giống,c, tp=(tc)(p/c) Vì cần thiết để giữ chặt giải pháp cách Điều thường thực cách bình thường vector p alpha, với chiều dài 1.0 Ngồi ra, hữu ích để hạn chế yếu tố lớn tích cực Bằng cách này, mơ hồ để c = - lấy Một mũi tên thường sử dụng FA phải có chiều dài p, bậc hai eigenvalue tương ứng tôi, Điều làm cho yếu tố p, tương ứng trực tiếp đến hệ số tương quan vectơ điểm t, chuẩn hóa với chiều dài 1.0 Đó học để làm so sánh với giá trị phân hủy (SVD) xây dựng: Trong trường hợp này, V 'là giống hệt với P' U có chứa vectơ cột làm T, bình thường với chiều dài D ma trận đường chéo có chứa độ dài vectơ cột T Những yếu tố đường chéo D bậc hai giá trị riêng X'X Trong tài liệu thống kê, PCA có hai nghĩa khác Theo truyền thống, PCA xem mở rộng X nhiều thành phần (N, K) Điều tương ứng với biểu X biến trực giao mới, tức là, chuyển đổi sang hệ thống phối hợp Một thảo luận đề cập đến PCA xấp xỉ ma trận X mơ hình với số lượng tương đối nhỏ cột T P Khả định cụ cắt số lượng thành phần cung cấp công cụ linh hoạt để phântích liệu phụ thuộc vào vấn đề: số đóng góp vấn đề sử dụng phong phú sở vật chất PCA Một giả định việc sử dụng sở vật chất.PCA số điểm tải vector tương ứng với giá trị riêng lớn chứa thông tin hữu ích liên quan đến vấn đề cụ thể, người lại chủ yếu bao gồm tiếng ồn đó, vectơ thường viết theo thứ tự giảm dần giá trị riêng Thường mơ hình máy tính thu được quay ma trận xoay R để làm cho điểm số tải dễ dàng để giải thích Điều tương đương Sau mơ hình máy tính phát triển cho "ma trận huấn luyện", đối tượng biến trang bị cho mơ hình cho điểm, t, cho đối tượng mới, tải trọng, p, cho biến số mới, tương ứng Ngoài ra, phương sai e dư, thu cho mục trang bị, cung cấp biện pháp giống mục "Dữ liệu huấn luyện" Nếu sai dư lớn tìm thấy giai đoạn đào tạo, kết luận đối tượng (hoặc biến) không thuộc dân số đào tạo Kiểm định giả thuyết áp dụng cho tình trạng Các dư cách khác hiểu khoảng cách lại liên quan đến mơ hình phù hợp với PC Các công thức cho đối tượng x sau: nhân với tải trọng từ khâu đào tạo Những điểm số t ước tính: t= xP X dự vào chiều khơng gian phát triển giai đoạn đào tạo Tính số dư vector e: Ở I nhận dạng ma trận kích thước K tính điểm t mới, tải trọng p, tương đương với hồi quy tuyến tính tính trực giao vectơ Figs 10 11 cho thấy kết PCA ma trận hình http://www.imedea.uibcsic.es/master/cambioglobal/Modulo_V_cod101615/Theory/lit_support/p ca_wold.pdf Hướng dẫn thiết kế để cung cấp cho người đọc hiểu biết thành phần Phương pháp phântích thành phần – Principal Component Annalysis (PCA): 2.1 Khái niệm: Principal component analysis (PCA) is a statistical procedure that uses an orthogonal transformation to convert a set of observations of possibly correlated variables into a set of values of linearly uncorrelated variables called principal components The number of principal components is less than or equal to the number of original variables This transformation is defined in such a way that the first principal component has the largest possible variance (that is, accounts for as much of the variability in the data as possible), and each succeeding component in turn has the highest variance possible under the constraint that it is orthogonal to (i.e., uncorrelated with) the preceding components The principal components are orthogonal because they are the eigenvectors of the covariance matrix, which is symmetric PCA is sensitive to the relative scaling of the original variables Phântích thành phần ( PCA ) thủ tục thống kê có sử dụng chuyển đổi trực giao để chuyển đổi tập hợp quan sát biến thể tương quan vào tập hợp giá trị tuyến tính tương quan biến gọi thành phần chủ yếu Số lượng thành phần chủ yếu nhỏ số lượng biến ban đầu Sự biến đổi định nghĩa cách mà thành phần chủ yếu lớn sai (có nghĩa là, chiếm nhiều biến đổi liệu tốt), thành phần có phương sai cao chế trực giao với (tức là, không tương quan với) thành phần trước Các thành phần chủ yếu trực giao họ vector riêng ma trận hiệp phương sai, mà đối xứng PCA nhạy cảm để mở rộng quy mô tương đối biến ban đầu 10 bạn thấy số textbooks.Also, biểu tượng n sử dụng để số phần tử tập hợp X Có số điều mà tính tốn tập hợp liệu Ví dụ, tính tốn giá trị trung bình mẫu Tơi giả sử người đọc hiểu trung bình mẫu là, cung cấp cho công thức: Chú ý biểu tượng để giá trị trung bình tập X Tất cơng thức nói "Bạn cộng tất số sau chia cho có bao nhiêu" khơng may, trung bình khơng cho nhiều liệu ngoại trừ cho loại điểm trung bình Ví dụ, hai kiện có xác trung bình (10), rõ ràng khác nhau: Vì vậy, khác hai này? Nó trải dài liệu khác Độ lệch chuẩn (SD) tập hợp liệu biện pháp lây lan liệu Làm để tính tốn nó? Định nghĩa tiếng Anh SD là: "Khoảng cách trung bình từ có nghĩa liệu thiết lập để điểm " Các cách để tính tốn để tính tốn bình phương khoảng cách từ điểm liệu trung bình bộ, thêm tất lên, phân chia n-1, lấy bậc hai Như công thức: Sự khác biệt mẫu số Nó thảo luận khác biệt mẫu quần thể Vì vậy, cho liệu hai chúng tơi đặt trên, tính tốn độ lệch chuẩn bảng 2.1 Và vậy, dự kiến, tập có độ lệch chuẩn lớn nhiều thực tế liệu nhiều lan từ trung bình Cũng ví dụ khác, liệu thiết lập: [ 10 10 10 10] Cũng có nghĩa 10, độ lệch chuẩn 0, tất số giống Không số họ chệch khỏi giá trị trung bình 2.8.3 Phương sai (variance) 17 Phương sai thước đo lây lan liệu tập hợp liệu Trong thực tế, gần giống hệt với độ lệch chuẩn Công thức là: Bạn nhận thấy điều đơn giản độ lệch chuẩn bình phương, biểu tượng s2 công thức (khơng có bậc cơng thức cho đúng) s2 biểu tượng thông thường cho phương sai mẫu Cả hai phép đo biện pháp lây lan liệu Độ lệch chuẩn biện pháp phổ biến nhất, sai sử dụng Lý giới thiệu sai độ lệch tiêu chuẩn để cung cấp tảng vững mà từ phần tiếp theo, phương sai, khởi động từ 2.8.4 Hiệp phương sai (covariance) Hai biện pháp cuối cùng, chúng tơi xem xét hồn tồn chiều Bộ liệu là: chiều cao tất người phòng, nhãn hiệu cho kỳ thi cuối COMP101 vv Tuy nhiên, nhiều liệu có nhiều chiều, mục đích phântích thống kê liệu thường để xem có mối quan hệ kích thước Ví dụ, có đặt chiều cao tất học sinh lớp học, nhãn hiệu mà họ nhận giấy cho liệu chúng tơi Sau chúng tơi thực phântích thống kê để xem chiều cao học sinh có tác dụng nhãn hiệu họ Độ lệch chuẩn phương sai hoạt động chiều, bạn tính tốn độ lệch chuẩn cho kích thước tập liệu độc lập kích thước khác Tuy nhiên, hữu ích để có biện pháp tương tự để tìm kích thước thay đổi từ giá trị trung bình với việc tương tác lẫn Hiệp phương sai biện pháp Hiệp phương sai đo chiều Nếu bạn tính tốn phương sai chiều thân bạn có phương sai Vì vậy, bạn có liệu chiều (x, y, z), sau bạn đo hiệp phương sai x kích thước y, x z kích thước, kích thước y z Đo hiệp phương sai giữa, x x, y, y, z z, cung cấp cho bạn phương sai x, y, z kích thước tương ứng Công thức cho hiệp phương sai tương tự công thức cho Công thức cho viết này: đơn giản mở rộng hạn vng để hiển thị hai phần Vì vậy, cho kiến thức,, công thức cho phương sai: Hình 2.1: Đồ thị liệu cho thấy mối quan hệ tích cực hiệp phương sai số nghiên cứu chống lại dấu hiệu nhận Nó giống hệt ngoại trừ tập thứ hai khung, X "được thay Y ' Điều cho biết, tiếng Anh, "Đối với mục liệu, nhân khác biệt x, giá trị giá trị trung bình x mức chênh lệch giá trị y trung bình y Thêm tất chúng, chia cho (n-1) " Làm để làm việc này? Cho phép sử dụng số liệu ví dụ Hãy tưởng tượng vào giới thu thập số liệu chiều, nói rằng, hỏi loạt sinh viên tổng số mà họ dành học COSC241, nhãn hiệu mà họ nhận Vì vậy, chúng tơi có hai chiều, kích thước H, học, thứ hai kích thước M, dấu hiệu 18 nhận Hình 2.2 chứa liệu tơi tưởng tượng, tính cov (H, M) hiệp phương sai học tập thực Mark nhận Vì vậy, nói với chúng ta? Giá trị xác khơng quan trọng dấu hiệu (tức Tích cực hay tiêu cực) Nếu giá trị tích cực, đây, sau cho biết hai chiều tăng togheter ý nghĩa rằng, nói chung, số lượng học tăng lên, làm điểm cuối Nếu giá trị tiêu cực, sau chiều hướng tăng, giảm khác Nếu kết thúc với hiệp biến tiêu cực đây, sau mà nói điều ngược lại, số lượng học tăng điểm cuối giảm Trong trường hợp cuối cùng, hiệp phương sai số khơng, hai chiều độc lập với kết other.The đánh dấu cho gia tăng số học tăng dễ dàng nhìn thấy cách vẽ đồ thị liệu, Hình 2.1.3 Tuy nhiên, sang trọng việc để hình dung liệu có chiều Do giá trị phương sai tính toán chiều tập hợp liệu, kỹ thuật thường sử dụng để tìm mối quan hệ kích thước liệu chiều cao mà hình dung khó khăn Bạn hỏi "là cov (X, Y) cov (Y, X)"? Vâng, nhìn nhanh chóng giống hệt khác biệt cov (X, Y) cov (Y, X) thay Và kể từ nhân giao hốn, có nghĩa khơng quan trọng mà đường xung quanh nhân hai số, tơi ln nhận số, hai phương trình cho câu trả lời tương tự 2.8.5 Các ma trận hiệp phương sai(The covariance matrix) Nhớ lại hiệp phương sai mà đo chiều Nếu có tập hợp liệu với chiều, có nhiều phương sai đo lường tính tốn Ví dụ, từ tập hợp liệu chiều (chiều x, y, z), bạn tính tốn cov (x, y), cov (x, z) cov (y, z) Trong thực tế, tập liệu n-chiều, bạn tính tốn tập hợp liệu chiều, bạn tính tốn 19 Một cách hữu ích để có tất giá trị phương sai có tất kích thước khác để tính tốn tất chúng đặt chúng ma trận Tôi giả định hướng dẫn mà bạn quen thuộc với ma trận, làm họ xác định Vì vậy, định nghĩa cho ma trận hiệp phương sai cho tập hợp liệu có kích thước n là: n hàng n cột, x chiều Tất công thức nhìn xấu xí nói bạn có liệu n-chiều, sau ma trận có n hàng cột (như hình vng) mục ma trận kết việc tính tốn phương sai hai chiều riêng biệt Ví dụ mục hàng 2, cột 3, giá trị phương sai tính tốn chiều thứ chiều thứ Một ví dụ Chúng tơi tạo nên ma trận hiệp phương sai cho ảo chiều liệu, sử dụng kích thước thông thường x, y z.Then, ma trận hiệp phương sai có hàng cột, giá trị này: Một số điểm cần lưu ý: Xuống đường chéo chính, bạn thấy giá trị phương sai kích thước Đây phương sai cho khơng gian Điểm khác kể từ cov (a, b) = cov (b, a), ma trận đối xứng đường chéo 2.8.6 Đại số ma trận(Matrix Algebra) Phần phục vụ để cung cấp tảng cho đại số ma trận yêu cầu PCA Cụ thể tơi nhìn vector riêng giá trị riêng ma trận cho trước Một lần nữa, giả định kiến thức ma trận 20 2.8.7 Vector riêng(Eigenvectors) Như bạn biết, bạn nhân hai ma trận với nhau, miễn chúng có kích cỡ tương thích Vector riêng trường hợp đặc biệt Hãy xem xét hai phép nhân ma trận vector hình 2.2 Trong ví dụ đầu tiên, vectơ kết bội số gốc vector, trong ví dụ thứ hai, ví dụ xác lần vector bắt đầu với Tại điều này? Vâng, vector vector không gian chiều Các vector (từ ví dụ nhân thứ hai) đại diện cho mũi tên từ nguồn gốc, (0,0), đến điểm (3,2) Các ma trận khác, hình vng, dùng ma trận biến đổi Nếu bạn nhân ma trận bên trái vector, câu trả lời vector chuyển đổi từ position.It gốc chất biến đổi mà vector riêng phát sinh từ Hãy tưởng tượng ma trận biến đổi đó, nhân với bên trái, phản ánh vectơ dòng y = x Sau đó, bạn thấy có vector mà nằm đường y = x phản ánh thân Vector (và bội số nó, khơng quan trọng vector bao lâu), vector riêng mà tính chuyển đổi matrix.What làm vector riêng có? Trước tiên, bạn nên biết vector riêng tìm thấy cho ma trận vng Và, khơng phải tất ma trận vng có eigen n x n Matrix mà khơng có vector riêng, có n họ Cho ma trận 3x3, có vector riêng Một lô vector riêng mở rộng vector số lượng trước tơi nhân nó, tơi nhận nhiều kết quả, hình 2.3 Điều bạn có quy mơ vector số tiền, tất bạn làm làm cho khơng thay đổi hướng Cuối cùng, tất vector riêng ma trận tức perdendicular vng góc với nhau, khơng có vấn đề kích thước mà bạn có Bằng cách này, từ khác cho vng góc, buổi nói chuyện tốn học, trực giao Điều quan trọng có nghĩa bạn thể liệu vector riêng vng góc, thay thể chúng điều kiện x trục y Chúng làm điều sau phầnPCA Một điều quan trọng cần biết nhà tốn học tìm vector riêng, họ muốn tìm vector riêng có chiều dài xác Điều vì, bạn biết, độ dài vector khơng ảnh hưởng cho dù vector riêng hay khơng, hướng Vì vậy, để giữ vector riêng tiêu chuẩn, tìm thấy vector riêng thường quy mơ để làm cho có chiều dài 1, tất vector riêng có độ dài Dưới biểu tình từ ví dụ vector riêng, độ dài vectơ 21 chúng tơi chia vector ban đầu tác giả nhiều để làm cho có chiều dài 2.8.8 Giá trị riêng(Eigenvalues): Giá trị riêng có liên quan chặt chẽ với vector riêng, thực tế, thấy eigenvalue hình 2.2 Chú ý, ví dụ, số tiền mà vector ban đầu thu nhỏ sau nhân với ma trận vuông giống khơng? Trong ví dụ này, giá trị 4 eigenvalue kết hợp với eigenvector Khơng có vấn đề nhiều eigenvector chúng tơi trước nhân ma trận vuông, luôn nhận lần vector thu nhỏ kết (như hình 2.3) Vì vậy, bạn thấy vector riêng trị riêng theo cặp bạn có thư viện lập trình ưa thích bạn để tính tốn eigenvectorsfor bạn, bạn thường nhận giá trị riêng tốt Cuối đến với thành phần Analysis (PCA) Nó gì? Đó cách để xác định mẫu liệu, thể liệu theo cách để làm bật tương đồng khác biệt họ Kể từ mẫu liệu khó khăn để tìm thấy liệu chiều cao, nơi mà sang trọng đại diện đồ họa có sẵn, PCA cơng cụ mạnh mẽ để phântích liệu 2.9 Phương pháp(Method) 2.9.1 Bước 1: Nhận số liệu (Get some data) Trong ví dụ đơn giản tơi, tơi sử dụng liệu thực hiện-up riêng tơi Nó có kích thước, lý tơi chọn để tơi cung cấp cho âm mưu liệu để hiển thị phântíchPCA thực liệu step.The tơi sử dụng tìm thấy hình 3.1, với lơ liệu 2.9.2 Bước 2: Trừ trung bình (Subtract the mean) Đối với PCA để làm việc cách, bạn phải trừ giá trị trung bình từ kích thước liệu Giá trị trung bình trừ mức trung bình chiều Vì vậy, tất giá trị x có trung bình giá trị x tất điểm liệu) trừ, tất giá trị y có Điều tạo tập hợp liệu có có nghĩa là số không 22 (giá trị trừ chúng 2.9.3 Bước 3: Tính tốn ma trận hiệp phương sai(Calculate the covariance matrix) Điều thực xác theo cách thảo luận phần 2.1.4 Do liệu chiều, ma trận hiệp phương sai 2x2 Khơng có bất ngờ đây, tơi cung cấp cho bạn kết Vì vậy, kể từ yếu tố phi chéo ma trận hiệp phương sai tích cực, nên hy vọng x tăng biến y 2.9.4 Bước 4: Tính vector riêng giá trị riêng ma trận hiệp phương sai (Calculate the eigenvectors and eigenvalues of the covariance matrix) Từ ma trận hiệp phương sai hình vng, tính tốn vector riêng trị riêng cho ma trận Đây quan trọng, chúng cho chúng tơi biết thơng tin hữu ích liệu Tôi cho bạn thấy lý sớm Trong đó, vector riêng trị riêng: Điều quan trọng phải nhận thấy vector riêng hai đơn vị vector riêng tức độ dài họ hai Điều quan trọng cho PCA, may mắn thay, hầu hết tốn gói, hỏi cho vector riêng, cung cấp cho bạn vector riêng 23 Vì vậy, họ muốn nói gì? Nếu bạn nhìn vào bảng liệu hình 3.2 sau bạn thấy liệu có mơ hình mạnh mẽ Đúng dự đốn từ ma trận hiệp phương sai, họ hai biến thực tế tăng với Ngày đầu liệu tơi có âm mưu vector riêng tốt Họ xuất đường đứt đoạn đường chéo cốt truyện Như nêu phần eigenvector, chúng vuông góc với Nhưng, quan trọng hơn, họ cung cấp cho ta thông tin mẫu liệu Xem cách vector riêng điểm thơng qua, giống vẽ dòng phù hợp nhất? Eigenvector cho thấy cách hai tập hợp liệu có liên quan dòng Các eigenvector thứ hai cho khác, quan trọng hơn, mơ hình liệu, mà tất điểm theo đường chính, để bên dòng số lượng Vì vậy, q trình cách lấy vector riêng ma trận hiệp phương sai, chúng tơi trích xuất dòng đặc trưng cho liệu Phần lại bước liên quan đến việc chuyển đổi liệu để thể điều khoản dòng 2.9.5 Bước 5: Lựa chọn thành phần hình thành vector đặc trưng (Choosing components and forming a feature vector) Đây nơi mà khái niệm nén liệu giảm chiều vào Nếu bạn nhìn vào vector riêng trị riêng từ phần trước, bạn Có nghĩa liệu điều chỉnh với vector riêng overlayed Hình 3.2 : Một biểu đồ liệu bình thường ( nghĩa trừ ) với vector riêng ma trận hiệp phương sai chồng chập lên Sẽ nhận thấy giá trị riêng giá trị hồn tồn khác Trong thực tế , vector riêng với eigenvalue cao thành phần nguyên tắc liệu Trong ví dụ chúng tơi, vector riêng với larges eigenvalue người xuống liệu Nó mối quan hệ quan trọng kích thước liệu Nói chung, tìm thấy từ vector riêng ma trận hiệp phương sai, bước lệnh cho họ eigenvalue, cao đến thấp Này cung cấp cho bạn thành phần theo thứ tự quan trọng Bây giờ, bạn thích, bạn định bỏ qua thành phần có ý nghĩa Bạn số thông tin, giá trị riêng nhỏ, bạn không nhiều Nếu bạn bỏ số thành phần, liệu cuối có kích thước nhỏ so với gốc Để xác, bạn ban đầu có n chiều liệu bạn, bạn tính giá trị riêng vector riêng n, sau bạn chọn p vector riêng đầu tiên, sau tập liệu cuối có kích thước p Những cần phải làm bạn cần phải tạo vector đặc trưng, mà tên ưa thích cho ma trận vectơ Đây là, xây dựng cách tham gia vector riêng mà bạn muốn giữ lại từ danh sách vector riêng, tạo thành ma trận với vector riêng cột Tính vectoe = (eig1 eig2 eig3 eign) 24 Được thiết lập ví dụ liệu, thực tế chúng tơi có vector riêng , có hai lựa chọn Chúng ta thành lập vector đặc trưng với hai vector riêng: Hay, chọn để bỏ qua thành phần nhỏ hơn, đáng kể có cột nhất: Chúng ta thấy kết số phần 2.9.6 Bước : Phát sinh tập liệu Này bước cuối PCA, dễ Một lựa chọn thành phần (vector riêng) mà muốn giữ lại liệu chúng tơi hình thành vector đặc trưng, cần lấy transpose vector nhân bên trái tập liệu ban đầu , hốn liệu cuối = tính hàng vector x hàng liệu điều chỉnh Nơi vector tính hàng ma trận với vector riêng cột xuyên đặt để vector riêng hàng, với vector riêng đáng kể đầu trang, liệu liên tiếp điều chỉnh liệu có nghĩa điều chỉnh hoán, tức Các mục liệu cột , hàng giữ chiều riêng biệt Tôi xin lỗi transpose đột ngột tất liệu bối rối cho bạn, phương trình từ dễ dàng lấy transpose vector đặc trưng liệu đầu tiên, có biểu tượng T nhỏ phía tên họ từ Dữ liệu cuối tập hợp liệu cuối cùng, với mục liệu cột, kích thước dọc theo hàng Điều cho chúng ta? Nó cung cấp cho liệu ban đầu vectơ chọn Tập liệu ban đầu chúng tơi có hai trục x y, liệu chúng tơi điều kiện họ Nó thể liệu điều khoản hai trục mà bạn thích Nếu trục vng góc, sau biểu hiệu Đây lý điều quan trọng vector riêng ln vng góc với Chúng thay đổi liệu từ trục x y, họ có điều khoản vector riêng Trong trường hợp tập liệu làm giảm chiều, tức Chúng để lại số vector riêng ra, liệu nhiệm kỳ vectơ chúng tơi định giữ lại Để hiển thị liệu chúng tôi, thực việc chuyển đổi cuối với vectơ tính Tơi lấy transpose kết trường hợp để mang lại liệu định dạng bảng giống tốt đẹp Tôi vẽ điểm cuối để thể cách chúng liên quan đến thành phầnTrong trường hợp giữ hai vector riêng cho việc chuyển đổi, nhận liệu tìm thấy hình 3.3 Về liệu ban đầu, xoay để vector riêng trụ Điều dễ hiểu khơng có thơng tin phân hủy Việc chuyển đổi khác mà chúng tơi làm với tham gia vector riêng với eigenvalue lớn Các bảng liệu tìm thấy hình 3.4 Theo dự kiến, có chiều Nếu bạn so sánh tập liệu xác cột người Vì vậy, bạn âm mưu liệu này, chiều, điểm dòng cách xác vị trí x điểm cốt truyện hình 3.3 Chúng tơi vứt bỏ cách hiệu trục khác cả, mà eigenvector khác Vì chúng tơi thực đây? Về bản, chuyển liệu để biểu diễn dạng mơ hình chúng, nơi mà mơ hình dòng mơtả gần với mối quan hệ liệu Điều hữu ích chúng tơi phân loại liệu điểm kết hợp đóng góp người dòng Ban đầu 25 chúng tơi có x đơn giản trục y Điều tốt, x y giá trị điểm liệu không thực cho chúng tơi biết xác cách điểm có liên quan đến phần lại liệu Bây giờ, giá trị điểm liệu cho chúng tơi biết xác nơi (ie Trên / dưới) đường xu hướng điểm liệu nằm Trong trường hợp transformatin sử dụng hai vector riêng, đơn giản thay đổi liệu để điều khoản vector riêng thay trục thơng thường Nhưng phân hủy đơn eigenvector loại bỏ đóng góp vector riêng nhỏ để lại cho với liệu mặt khác 2.9.7 Lấy liệu cũ trở lại Mong muốn có trở lại liệu ban đầu rõ ràng mối quan tâm lớn bạn sử dụngPCA biến đổi cho nén liệu (ví dụ số để thấy phần tiếp theo) Nội dung lấy http://www.vision.auc.dk/sig/Teaching/Flerdim/Current/hotelling.html 26 Vì vậy, làm để có liệu ban đầu trở lại? Trước làm điều đó, nhớ tất vector riêng biến đổi chúng tôi, chúng tơi có xác liệu ban đầu trở lại Nếu giảm số lượng vector riêng việc chuyển đổi cuối cùng, sau liệu lấy số thơng tin Nhớ lại thức chuyển đổi là: mà quay lại đó, để có liệu ban đầu, Tuy nhiên, thực tất vector riêng vector tính chúng tơi, nghịch đảo vector đặc trưng thực transpose vector.This tính chúng tơi phần tử ma trận tất vector riêng đơn vị thiết lập liệu Điều làm cho chuyến trở liệu dễ dàng hơn, phương trình trở thành Nhưng, để có liệu gốc thực tế trở lại, cần phải thêm vào bình liệu gốc (nhớ chúng tơi trừ lúc đầu) Vì vậy, cho đầy đủ, Cơng thức áp dụng bạn khơng có tất vector riêng vector đặc trưng Vì vậy, bạn bỏ số vector riêng, phương trình làm cho xác chuyển đổi Tơi không thực liệu tái tạo cách sử dụng vector tính đầy đủ, kết xác liệu, chúng tơi bắt đầu với Tuy nhiên, tơi làm điều với tính giảm bạn cách thơng tin bị Hình 3.5 cho thấy âm mưu so sánh 27 Nó vào lơ liệu gốc hình 3.1 bạn thấy nào, biến thể theo nguyên tắc eigenvector (xem Hình 3.2 cho eigenvector chồng chập lên liệu có nghĩa điều chỉnh) giữ lại, biến thể thành phần khác (các vector riêng khác mà chúng tơi rời ra) có 2.10 Các ứngdụngphântích thành phần (Applications of principal component analysis ) Overview (plots) of any data table (tổng quan liệu) Dimensionality reduction (giảm biến đa chiều) Similarity models( mơ hình tương đồng) PCA áp dụng cho liệu ma trận Nó giới thiệu bước khởi đầu phép phântích đa biến đề có nhìn cấu trúc liệu, để xác định bên ngoài, phác họa loại, Tuy nhiên, mục tiêu phân loại có liên quan tập hợp biến số khác( vd: hiệu chuẩn (calibration)), có phầnmở rộng PCA hiệu cho vấn đề Dưới quan điểm đảng phái (partisan) PCA trình bày Nó phản ánh kinh nghiệm mà rojections coi bao gồm phạm vi lớn đáng ngạc nhiên công thức vấn đề khoa học tiêu biểu 2.10.1 Tổng quan liệu (Overview (plots) of any data table ) Lô điểm hai ba vectơ điểm đầu tiên, t alpha cho thấy nhóm, giá trị ngoại lai mẫu mạnh khác liệu Điều nhìn thấy âm mưu điểm liệu người Thụy Điển Nhiều ứngdụng khác tìm thấy vấn đề 2.10.2 Giảm biến đa chiều (Dimensionality reduction) Như Frank Kowalski, hai nhóm ứngdụngPCA FA nhìn thấy hóa phântích (analytical chemistry), đặt tên theo việc khai thác yếu tố – giá trị tiềm ẩn (the lantent varia) – bles - độ phân giải quang phổ hỗn hợp đa thành phần (multicomponent mixtures.) Trong hiệu suất cao phântích sắc ký lỏng hai chiều(high performance liquid chromatographic analysis), tóm lại cách để tìm số nhỏ loại mẫu Vài vectơ điểm đầu tiên, t alpha, xem biến tiềm ẩn mà hầu hết thông tin liệu Điều gần sử dụng để tìm đặc tính amino 28 acids, dung mơi chất xúc tác, sau sử dụngmôtảđịnhlượng lựa chọn thực thể Ví dụ Lơ vectơ điểm PC thứ hai bảng với 20 thuộc tính cho 20 amino acids thơng thường "tự nhiên" Nhóm mối quan hệ thuộc tính lý hóa axit amin nucleotide mà sử dụng codon thứ hai tổng hợp acid amin ((adenosine, uracil cytosine) axit amin mã hóa guanine (G) dường khơng tham gia vào mối quan hệ vec tơ điểm PC số lượngmôtả thay đổi cấu gia đình peptide tạo thành sở cho cấu trúc mối quan hệ hoạt động cho peptide 2.10.3 Mơ hình tương đồng (Similarity models ) Wold cho thấy mô hình máy tính có tài sản xấp xỉ cho bảng liệu tài sản xấp xỉ cho bảng liệu liệu khoảng thời gian hạn chế; mơ hình máy tính xem mở rộng bảng liệu Taylor Các địa điểm gần giống đối tượng, điều khoản cần thiết việc mở rộng để đạt tốt lành xấp xỉ định điều kiện tiên cho cách giải thích PCA vài giả thuyết khác liên tục trình tạo liệu, tìm thấy để giữ nhiều trường hợp Điều giải thích, phần, tiện ích thiết thực PCA Do đó, phương pháp nhận dạng mẫu dựa mơ hình máy tính riêng biệt, cho loại đối tượng Các đối tượng phân loại theo để phù hợp họ thiếu phù hợp với mô hình lớp học, cung cấp phân loại theo xác suất Đây sở cho phương pháp Simca (Soft Independent Modelng Class Analogies) Nếu muốn phân biệt cách tối ưu hai lớp Thụy Điển, mơ hình máy tính trang bị cho lớp Kết cho thấy thực có giống lớp học (mơ hình hai ba thành phầnmơtả đầy đủ liệu) lớp học tách tốt (mẫu phù hợp với "lớp lưu trữ" xấu ngược lại); 2.11 Ví dụ: 2.11.1 PCA nghiên cứu đánh giá cảm quan thực phẩm lên men: Phương pháp phântíchmơtảđịnhlượng (QDA) sử dụng để mơtả thuộc tính cảm quan sản phẩm lên men nghiên cứu.Và PCA (kỹ thuật thống kê đa biến phân tích) dùng để áp dụng cho liệu QDA thu từ nghiên cứu để giảm tập hợp biến phụ thuộc đến nhỏ biến tiềm ẩn dựa mơ hình tương quan biến ban đầu; phântích biến thể thể chất cảm giác tính chất thực phẩm lên men sau lên men Hoạt động PCA làm cho phân biệt mẫu thực phẩm để xác định biến quan trọng ma trận liệu đa biến Trong nghiên cứu viên ban hội thẩm lựa chọn đào tạo để đánh giá thuộc tính khác đặc biệt màu sắc hình dạng, kết cấu thể, hương vị, chấp nhận chung tính axit 29 sản phẩm thực phẩm lên men sữa đơng sữa bò sữa đậu nành sữa đông, idli, dưa bắp cải kem probiotic Dữ liệu thu thập từ viên ban hội thẩm sau ghi qua thang đánh giá hưởng thụ Các liệu thuộc tính khác nêu xếp tăng dần theo thứ tự giảm dần đưa vào phần mềm SPSS 16 chế độ xem liệu Sau đó, liệu giảm cách phântích liệu biến độc lập phụ thuộc lựa chọn số hai chiều mẫu phântích thu Phântích thành phần (PCA) xác định sáu thành phần quan trọng, chiếm 90% phương sai liệu thuộc tính cảm quan Chất lượng sản phẩm tổng thể mơ hình hóa chức thành phần chủ yếu sử dụng nhiều hồi quy bình phương nhỏ (R2 = 0,8) Kết từ PCAphântích thống kê phântích phương sai (ANOVA) Những phát chứng minh tính hữu ích phântíchmơtảđịnhlượng để xác định đo lường thuộc tính sản phẩm thực phẩm lên men quan trọng cho chấp nhận người tiêu dùng 2.11.2 PCA đánh giá tính chất cảm quan cà phê Bn Mê Thuộc: Trong nghiên cứu phương pháp phântích thành phầnPCA sử đụng để xử lí số liệu cho kỹ thuật phântíchmơtảđịnhlượng QDA PCAdung để loại bỏ thuật ngữ đóng góp vào việc phân biệt sản phẩm cách xóa bỏ thuật ngữ loại chúng xuất gần hình ảnh phântíchPCA Từ 24 thuật ngữ đề nghị để môtả tính chất cảm quan cà phê sở kết nghiên cứu kết đánh giá sơ hội đồng (18 thuật ngữ mùi, thuật ngữ vị, thuật ngữ khác) rút gọn 14 thuật ngữ (11 thuật ngữ mùi, thuật ngữ vị) Sau kiểm tra lại mức độ xác việc sử dụng thuật ngữ rút gọn so với danh mục sơ ban đầu cách tiến hành đánh giá tính chất cảm quan sản phẩm cà phê sử dụngPCA để phântích kết đánh giá Dựa hình ảnh thu từ phương pháp PCA kết 14 thuật ngữ sử dụng để đánh giá tính chất cảm quan cà phê 2.12 Hạn chế PCA: Chỉ làm việc với liệu numeric, Nhạy cảm với điểm outlier/extreme, Không phù hợp với mơ hình phi tuyến, PCA hồn toàn dựa biến đổi tuyến 30 Tài liệu tham khảo - A tutorial on Principal Components Analysis_Lindsay I Smith_February 26, 2002 - Phântích thành phần chính_Thư viện bách khoa toàn thư: http://translate.googleusercontent.com/translate_c? depth=1&hl=vi&prev=search&rurl=translate.google.com.vn&sl=en&u=http://en.wikipedia.org/wiki/ Principal_component_analysis&usg=ALkJrhhL4BsfjQZv5lMbU9sN0rEqlrh4Ew#Applications - Application of principal component analysis (PCA) as a sensory assessment tool for fermented food products _J Food Sci Technol Jun 2012 http://translate.google.com/translate?hl=vi&sl=en&tl=vi&u=http%3A%2F %2Fwww.ncbi.nlm.nih.gov%2Fpmc%2Farticles%2FPMC3614048%2F&anno=2&sandbox=1 - Principal Component Analysis _SVANTE WOLD * Research Group for Chemometrics, Institute of Chemistry, Umei University, S 901 87 Urned (Sweden) KIM ESBENSEN and PAUL GELADI Norwegian Computing Center, P.B 335 Blindern, N 0314 Oslo (Norway) and Research Group for Chemometrics, Institute of Chemistry, Umed University, S 901 87 Umeci (Sweden) - Principal Component Analysis_ I.T Jolliffe Second Edition With 28 Illustrations - Giáo trình đánh giá cảm quan thực phẩm_Đại học Công Nghiệp Thực Phẩm, Tp.HCM 31 ... miêu tả cách cụ thể chi tiết Ngồi đặc tính cảm quan định lượng theo tỉ lệ cường độ 1.2 Phân tích mơ tả định lượng (QDA): Phân tích mơ tả định lượng (Quantitative Descriptive Analysis - QDA) phát... 1.1 Phân tích mơ tả: 1.2 Phân tích mơ tả định lượng (QDA): 1.3 Định nghĩa vấn đề cho liệu đa biến (Problem definition for multivariate data) 1.4 Giải thích hình học phân tích. .. biết liên quan với phân tích mơ tả mùi (Stone, Sidel, Oliver, Woolsey Singleton, 1947; Stone Sidel, 1933) Phân tích mơ tả định lượng phép thử sử dụng phổ biến phép thử mô tả Kết thực nghiệm không