bộ giáo dục đào tạo Tr-ờng đại học vinh lê thị thùy Dung ứng dụng phần mềm Maple vào phân tích hồi quy chuyên ngành: xác suất thống kê toán học Mà số: 60.46.15 luận văn thạc sĩ toán học Vinh 2009 giáo dục đào tạo Tr-ờng đại học vinh lê thị thùy Dung ứng dụng phần mềm Maple vào phân tích hồi quy chuyên ngành: xác suất thống kê toán học Mà số: 60.46.15 luận văn thạc sĩ toán học Ngi hng dn khoa hc: TS NGUYỄN TRUNG HỊA Vinh 2009 Mơc lơc Trang Lời mở đầu Ch-ơng Các kiÕn thøc c¬ së 1.1 1.1.1 1.1.2 1.2 1.2.1 1.2.2 Biến ngẫu nhiên mẫu ngẫu nhiên Biến ngẫu nhiên hàm phân phối Mẫu ngẫu nhiên mẫu quan sát Thống kê số thống kê đặc tr-ng mẫu ngẫu nhiên Thèng kª Thèng kª trung b×nh mÉu 1.2.3 1.2.4 1.3 1.3.1 1.3.2 Ph-¬ng sai mÉu S vµ S *2 Thống kê tần suÊt mÉu Các mô hình hồi quy ph-ơng pháp bình ph-ơng bé Các mô hình hồi quy Các giả thiết cổ điển mô hình hồi quy 1.3.3 -íc l-ỵng tham sè håi quy tun tính đơn ph-ơng pháp bình ph-ơng bé 1.3.4 -íc l-ỵng tham sè håi quy tun tính bội ph-ơng pháp bình ph-ơng bé 10 1.3.5 Định lý Gauss-Markov 12 1.4 -íc l-ỵng khoảng tin cậy kiểm định giả thuyết hÖ sè håi quy 14 1.4.1 1.4.2 1.4.3 1.5 1.5.1 1.5.2 1.5.3 1.6 1.6.1 1.6.2 Khoảng tin cậy hÖ sè håi quy 14 Kiểm định giả thuyết hệ số hồi quy 15 Đánh giá chất l-ợng mô hình 16 Håi quy phi tuyÕn 22 Mét sè d¹ng phi tuyÕn 22 Mô hình hồi quy đa thøc 22 Mô hình hồi quy phi tuyến tổng quát 23 Phân tích ph-ơng sai đơn biến (ANOVA) 25 Bài toán 25 Mô hình 25 Ch-ơng Giới thiệu gói thống kê Maple 28 2.1 Giíi thiƯu Maple quy định chung 28 2.1.1 Giíi thiƯu vỊ Maple 28 2.1.2 Giao diện môi tr-ờng tính toán 28 2.1.3 Văn (Text) 29 2.1.4 Lệnh kết Maple 29 2.1.5 Những thao tác 30 2.2 Gãi thống kê lệnh hồi quy 31 2.2.1 Gãi thèng kª 31 2.2.2 Các lệnh thống kê 34 2.3 Dạng đầu vào tùy chọn lệnh hồi quy 36 2.3.1 Dạng đầu vµo 36 2.3.2 C¸c tïy chän 37 2.3.3 Đọc viết liệu từ tệp văn 39 2.4 H×nh ảnh liệu phân tích 41 Ch-¬ng øng dơng Maple vào phân tích hồi quy 44 3.1 XÊp xØ hµm y aebx 44 3.2 Xấp xỉ hàm dạng y f ( x1, x2 , , xn ; a1, a2 , , am ) 45 3.3 XÊp xØ hµm tuyÕn tÝnh 47 3.4 XÊp xØ hµm y=a+b.ln(x) 49 3.5 XÊp xØ hµm phi tuyÕn 50 3.6 XÊp xØ hµm phi tuyÕn (d¹ng ma trËn) 52 3.7 Tạo bảng ANOVA nhân tố 54 3.8 XÊp xỉ hàm đa thức 56 3.9 XÊp xØ hµm y = axb 57 3.10 VÝ dô thùc tÕ 58 KÕt luËn 61 Tµi liƯu tham kh¶o 62 Lời mở đầu Trong nghiên cøu cịng nh- cc sèng hµng ngµy, viƯc thu tập thông tin xử lý thông tin cần thiết, trình phân tích số liệu khâu quan trọng Có nhiều ph-ơng pháp phân tích số liệu phải kể đến ph-ơng pháp phân tích hồi quy Phân tích hồi quy nghiªn cøu sù phơ thc cđa mét biÕn (biÕn phơ thuộc) vào hay nhiều biến khác (biến độc lập) với ý t-ởng -ớc l-ợng giá trị trung bình hay dự đoán giá trị biến phụ thuộc sở giá trị đà biết biến độc lập Từ thập kỷ 80, máy tính đà đ-ợc sử dụng ngày rộng rÃi, trợ giúp ng-ời nhiều lĩnh vực khác có nhiều phần mềm Thống kê đà đ-ợc xây dựng cho máy vi tính có ứng dụng rộng khắp hầu hết lĩnh vực nghiên cứu khoa học, có phần mềm phân tích sè liÖu nh-: SAS, SPSS, Stata, Mlwin, S-Plus, Maple, Maple l phần mềm tính toán hÃng Maple Soft Cho đến Maple đà đ-ợc phát triển qua nhiều phiên khác ngày hoàn thiện Maple môi tr-ờng tính toán phong phú, hỗ trợ cho hầu hết lĩnh vực toán học (Giải tích số, Đồ thị, Đại số hình thức, ) cho phép ng-ời sử dụng giải toán từ Số học túy đến Lý thuyết t-ơng đối Với phần mỊm Maple chóng ta cã thĨ: thùc hiƯn c¸c tÝnh toán với khối l-ợng lớn, với thời gian nhanh độ xác cao Sử dụng gói chuyên dụng Maple để giải toán cụ thể nh-: vẽ đồ thị (gói Plot), Hình học giải tích (gói Geometry), Đại số tuyến tính (gói linalg), Thống kê (gói Statistics) Thiết kế đối t-ợng chiều Trên sở đó, đ-ợc h-ớng dẫn Thầy giáo TS Nguyễn Trung Hòa, tác giả đà lựa chọn đề tài nghiên cứu ứng dụng phần mềm Maple vào phân tích hồi quy Dựa hỗ trợ gói Thống kê (Statistics), luận văn sâu khai thác, phân tích ý nghĩa, cách sử dụng câu lệnh Maple mảng phân tích hồi quy Nội dung luận văn bao gồm: Ch-ơng 1: Khái quát toàn kiến thức sở có liên quan nh-: biến ngẫu nhiên, mẫu ngẫu nhiên, thống kê số thống kê đặc tr-ng mẫu ngẫu nhiên, tiệp theo luận văn nhắc lại mô hình hồi quy, -ớc l-ợng tham số ph-ơng pháp bình ph-ơng bé nhất, kiểm định giả thuyết hệ số hồi quy Ch-ơng 2: Giới thiệu sơ l-ợc Maple, gói Thống kê câu lệnh hồi quy, để liệu đ-ợc minh họa cụ thể, luận văn giới thiệu thêm phần đồ họa đọc liệu từ tệp văn Ch-ơng 3: Nghiên cứu sâu câu lệnh xấp xỉ hàm mô hình hồi quy, sau câu lệnh có ví dụ minh họa Trong trình học tập làm luận văn, tác giả nhận đ-ợc h-ớng dẫn tận tình Thầy giáo TS Nguyễn Trung Hòa thầy cô tổ Xác suất Thống kê - Toán ứng dụng, khoa Đào tạo Sau đại học Tr-ờng Đại học Vinh, bạn đồng nghiệp, học viên cao học khóa 15 đà nhiệt tình giúp đỡ đóng góp nhiều ý kiến quý báu Xin chân thành cảm ơn! Vinh, tháng 01 năm 2010 Tác giả Ch-ơng Các kiến thức sở 1.1 Biến ngẫu nhiên mẫu ngẫu nhiên 1.1.1 Biến ngẫu nhiên hàm phân phối Định nghĩa 1: Giả sử (, F , P) không gian xác suất B -đại số Borel đ-ờng thẳng thực Khi ¸nh x¹ X : (, ) tháa m·n X 1 B : : X B F , B B đ-ợc gọi biến ngẫu nhiên Để dễ hình dung thực tế, ta hiểu đại l-ợng (hay biến) nhận giá trị với xác suất t-ơng ứng gọi đại l-ợng ngẫu nhiên hay biến ngẫu nhiên Các biến ngẫu nhiên đ-ợc ký hiệu X , Y , Z hc X1 , X , , X n ; Y1 , Y2 , , Yn ; giá trị có chúng đ-ợc ký hiệu x, y x1, x2 , , xn ; y1, y2 , , yn ; Nếu tập giá trị mà biến ngẫu nhiên nhận đ-ợc tập gồm số hữu hạn điểm vô hạn đếm đ-ợc Khi biến ngẫu nhiên gọi biến ngẫu nhiên rời rạc Nếu tập giá trị mà biến ngẫu nhiên lấp đầy khoảng đó, biến ngẫu nhiên gọi biến ngẫu nhiên liên tục Định nghĩa 2: Hàm phân phối xác suất biến ngẫu nhiên X, ký hiệu F(x), xác suất để biến ngẫu nhiên X nhận giá trị nhỏ x, với x số thực bÊt kú F ( x) P( X x) 1.1.2 Mẫu ngẫu nhiên mẫu quan sát * Khái niệm mẫu ngẫu nhiên Định nghĩa: Mẫu ngẫu nhiên kích thước n biến ngẫu nhiên X tập hợp n biến ngẫu nhiên X1 , X , , X n ; ®éc lËp, cã phân phối xác suất với X kí hiệu lµ: W ( X1 , X , , X n ) ; Biến ngẫu nhiên X gọi biến ngẫu nhiên gốc Các biến ngẫu nhiên X i gọi X MÉu quan s¸t MÉu quan s¸t w ( x1, x2 , , xn ) lµ mét thĨ hiƯn thĨ cđa mÉu ngÉu nhiªn W ( X1 , X , , X n ) , tập hợp số liệu quan sát cụ thể, gọi tắt số liệu thực nghiệm Bảng phân phối tần số thực nghiệm: k x1 x2 xi xk n n1 n2 ni nk xi giá trị phân biệt thứ i quan sát ni số lượng quan sát nhận giá trị tương ứng xi Bảng gọi bảng mẫu thu gọn Bảng phân phèi tÇn sè ghÐp líp: k y1 y2 yi yk n n1 n2 ni nk ®ã: „ yi 1 yi h (kh«ng ®ỉi) ni số giá trị quan sát thuộc nưa kho¶ng [ yi 1 h / 2; yi h / 2] MÉu ngÉu nhiªn hai chiỊu Định nghĩa Mẫu ngẫu nhiên hai chiều kích th-ớc n tập hợp n biến ngẫu nhiên độc lập ( X1,Y1 ),( X ,Y2 ), ,( X n ,Yn ) đ-ợc thành lập từ biến ngẫu nhiên hai chiỊu ( X ,Y ) vµ cã cïng quy lt phân phối xác suất với ( X ,Y ) Mẫu ngẫu nhiên hai chiều đ-ợc ký hiệu là: W [( X1,Y1 ),( X ,Y2 ), ,( X n ,Yn )] ViÖc thùc hiÖn mét phÐp thử mẫu ngẫu nhiên W thực phép thử thành phần mẫu Giả sử thành phần ( X i ,Yi ) nhận giá trị ( xi , yi ) (i 1, n) ta thu đ-ợc mẫu cụ thể là: w [( x1, y1 ),( x2 , y2 ), ,( xn , yn )] Các giá trị X i (i 1, n) đ-ợc gọi thành phần X i mẫu, giá trị Yi (i 1, n) đ-ợc gọi thành phần Yi mẫu (Cịng gièng nh- mÉu ngÉu nhiªn mét chiỊu X i Yi đ-ợc đo thang khác tùy thuộc vào dấu hiệu nghiên cứu ( X ,Y ) định tính hay định l-ợng) 1.2 Thống kê số thống kê đặc trng mẫu ngẫu nhiên 1.2.1 Thống kê Thống kê hàm G f ( X1 , X , , X n ) biến ngẫu nhiên Một thống kê biến ngẫu nhiên Giá trị cụ thể hàm G tương ứng với tập giá trị quan s¸t w ( x1, x2 , , xn ) lµ sè Gqs f ( x1 , x2 , , xn ) , nã lµ mét thĨ hiƯn thống kê G , thu từ mẫu quan sát (số liệu) biến ngẫu nhiên gốc X gọi giá trị quan sát thống kê G 1.2.2 Thống kê trung bình mẫu Giả sử W ( X1 , X , , X n ) mẫu ngẫu nhiên, trung bình mẫu mẫu ngẫu nhiên W thống kê X n Xi n i X i biến ngẫu nhiên gốc X nên chúng có kỳ vọng phương sai với X , thống kê trung bình mẫu X biến ngẫu nhiên có kỳ vọng phương sai mẫu tương ứng là: 1 n n EX E X i EX i n , n n i 1 n i 1 DX D n Xi i 1 n n n DX i i 1 2 n n2 n Víi mÉu quan s¸t w ( x1, x2 , , xn ) vµ nÕu: xi x1 x2 x3 xk ni n1 n2 n3 nk bảng thu gọn trung bình mẫu quan sát tính theo công thức: X qs x k ni xi n i Trung bình mẫu quan sát số cụ thể, thể trung bình mẫu 1.2.3 Phơng sai mẫu S S *2 : - Phơng sai mẫu S Là thống kê trường hợp kỳ vọng X chưa biết xác ®Þnh bëi: S2 n ( X i X )2 n i 1 S biến ngẫu nhiên Nếu biến ngẫu nhiên gốc X có phương sai phương sai mÉu S cã kú väng E ( S ) với mẫu quan sát tương ứng w ( x1, x2 , , xn ) vµ chúng thu gọn dạng: xi x1 x2 x3 xk ni n1 n2 n3 nk th× giá trị quan sát phương sai mẫu tính bëi: S2 k ni ( xi x )2 n i 1 - Ph−¬ng sai S*2 Là thống kê trường hợp kỳ vọng X đà biết xác định bëi: S *2 n ( X i )2 n i1 48 tÝnh tổng k phần dư b×nh phương nhỏ Phần dư thứ i gi¸ trị y-f(x1,x2,…,xn) điểm liệu thứ i Trong c©u lệnh đầu, tham số falg danh s¸ch Vector hàm thành phần dạng đại số Mỗi thành phần hàm đại số mũ độc lập với c¸c biến x1,x2,…,xn Tham số X ma trận cã chứa c¸c gi¸ trị c¸c biến độc lập Hàng i ma trận chứa c¸c n gi¸ trị cho liệu thứ i, cột j chứa tất c¸c gi¸ trị biến đơn xj Nếu cã biến độc lập, X cã thể Vector ma trận cét Tham số Y Vector chứa k gi¸ trị biến phụ thuộc y Tham s v l danh sách tên bin c lp dïng falg Nếu cã biến độc lập, v l tên n Th t ca tên danh sách phi m bo trình t xác vi gi¸ trị c¸c biến độc lập c¸c cột X Trong c©u lệnh thứ hai,tham số fop danh s¸ch Vector hàm thành phần dạng to¸n tử Thành phần thứ j thủ tục cã n tham số đầu vào đại diện cho n biến độc lập x1,x2,…,xn trả lại gi¸ trị đơn fj(x1,x2,…,xn) Tham số X Y, m« tả dạng đầu vào dạng đại số Trọng số đố với c¸c điểm liệu cã thể cung cấp th«ng qua việc lựa chọn weights Tïy chọn Đối số options cã thể chứa nhiều tùy chn d-ới output = tên hoc chuỗi -Xác nh hình thc gii.Tùy chn output có th c xem nh l mt giá tr có tên solutionmodule, hoc mt nhng tên sau ây (hoc mt danh sách tên ny): AtkinsonTstatistic, confidenceintervals, CookDstatistic, degreesoffreedom, leverages, externallystandardizedresiduals, internallystandardizedresiduals, 49 leastsquaresfunction, parametervalues, parametervector, residuals, residualmeansquare, residualstandarddeviation, standarderrors, residualsumofsquares, variancecovariancematrix weights = Vector - Cung cấp trọng số cho liệu điểm VÝ dơ > > Sư dơng chọn output = solutionmodule để xem tồn kết > > 3.4 XÊp xØ hàm y = a + b.ln(x) Có ph¸p: LogarithmicFit(X,Y,v) Tham số: X - Vector; giá trị biến độc lập Y - Vector; giá trị biến phụ thuộc v - Tên; (tùy chn) tên bin c lp Mô tả Lệnh LogarithmicFit xÊp xØ hàm dạng y = a +b.ln (x) n s liu ph-ơng pháp bình ph-ơng bé nhÊt Cho k điểm liệu, điểm cặp gi¸ trị số (x, y), lệnh LogarithmicFit t×m a b tÝnh tổng b×nh phương k số dư lµ nhỏ Số dư thứ i gi¸ trị y-a-b.ln (x) điểm thứ i liệu 50 Tham số X vector chứa k gi¸ trị c¸c biến độc lập X, tham số Y Vector chứa k gi¸ trị biến phụ thuộc Tham số v tªn biến tuỳ ý NÕu tham số v cung cấp, th× lệnh LogarithmicFit trả hàm logarit biến v vi giá tr ca a v b đà c tính Nu không, mt Vector cha giá tr ca a b trả lại VÝ dô > XÊp xỉ hàm logarit với liệu đà cho > Dùng tuỳ chọn weights để x¸c định trọng số mi im d liu Vì tham s v không c cho trước, Vector chứa c¸c dạng tham số tÝnh bị trả lại > 3.5 XÊp xØ hàm phi tun Có ph¸p NonlinearFit (falg, X, Y, v, option) NonlinearFit (fop, X, Y, option) Tham sè falg - đại s; mô hình hm dng i s X - Vector ma trận; gi¸ trị c¸c biến độc lập Y - Vector; gi¸ trị biến phụ thuộc v - tên hoc danh sách (tên); tên ca bin độc lập dạng hàm fop - thủ tục; kiểu hm dng toán t 51 option - phng trình dạng option=value option mét c¸c initialvalues, output, parameternames, parameterranges wieght; x¸c định tïy chọn cho lệnh NonlinearFit M« tả Lệnh NonlinearFit xÊp xØ với dạng hàm phi tuyến tham số d liu bng ph-ơng pháp bình phng nh nht Nu hm l tuyn tính ta nên s dng lnh LinearFit Xét mô hình y=f(x1,x2,,xn;a1, a2,, am); ó y biến phụ thuộc, f dạng hàm n biến độc lập x1,x2,…,xn, m tham số a1, a2,…, am Cho k điểm liệu, điểm liệu (n +1) c¸c gi¸ trị bng s vi (x1,x2,,xn,y), lnh NonlinearFit tìm giá tr tham số tÝnh tổng k số dư trung b×nh tối thiểu Phần dư thứ i c¸c gi¸ trị y-f(x1,x2,…,xn;a1, a2,…, am) đ¸nh gi¸ điểm liệu thứ i Trong c©u lệnh đầu, tham số falg biểu thức đại số mũ với c¸c biến độc lập x1,x2,…,xn, c¸c tham số a1, a2,…, am Tham số X ma trận chứa c¸c gi¸ trị c¸c biến độc lập Hàng i ma trận chứa n gi¸ trị liệu thứ i, cột j chứa tất c¸c gi¸ trị biến xj Nếu cã biến độc lập, X cã thể Vector ma trận k cột Tham số Y Vector chứa k gi¸ trị biến phụ thuc Tham s v l danh sách tên biến độc lập dïng falg Nếu cã mt bin c lp, v l mt bin đơn Th t ca tên danh sách phi có trình t xác vi th t giá tr biến độc lập cã c¸c cột X Trong c©u lệnh thứ 2, tham số fop thủ tục cã n tham số đầu vào đại diện cho c¸c biến độc lập x1,x2,…,xn, theo sau m tham số đầu vào đại diện cho c¸c tham số a1, a2,…, am trở c¸c gi¸ trị đơn 52 f(x1,x2,…,xn;a1,a2,…,am) Tham số X Y m« tả dạng đầu vào cã dạng đại số Trọng số đố với c¸c điểm liệu cã thể cung cấp th«ng qua việc lựa chọn weights Tïy chän Đối số options cã thể chứa nhiều c¸c tùy chn di ây initialvalues =tập hợp, danh sách (equation), danh s¸ch (realcons) Vector (realcons) - Cung cấp c¸c gi¸ trị ban đầu cho c¸c tham số weight = tên hoc chuỗi - Ch nh hình thức giải C¸c tïy chọn output cã thể mt giá tr tên solutionmodule, hoc mt nhng tên sau đ©y: degreesoffreedom, leastsquaresfunction, residuals, parametervalues, residualmeansquare, residualstandarddeviation, residualsumofsquares, parametervector parameternames = danh sách (tên) - xác nh tên c¸c tham số theo thứ tự Điều x¸c định thứ tự c¸c gi¸ trị Vector parameterranges = danh sách (tên = phm vi), danh s¸ch (nhiỊu) - X¸c định phạm vi cho phÐp cho tham số VÝ dô > > weights = Vector - Cung cấp số liệu cho c¸c điểm liệu 53 3.6 XÊp xØ hàm phi tuyÕn (d¹ng ma trËn) Có ph¸p NonlinearFit (m, f, XY, option) Tham sè m - s lng tham s ca mô hình f - thủ tục; kiểu hàm ma trận h×nh thức XY - Ma trận; gi¸ trị biến độc lập biến phụ thuộc Options - cã dạng phương tr×nh option=value option initialvalues, modelfunctiongradient parameterranges; x¸c định tïy chọn cho lệnh NonlinearFit Mô tả Lệnh NonlinearFit xấp xỉ hm phi tuyn tham số liệu phương ph¸p bình phng bé Nu mô hình l hm tuyn tính ta nên s dng lnh LinearFit Tham số f thủ tục đại diện cho kiểu hàm Thủ tục cã dạng proc(p,v, i) với p Vector tham số đầu vào cã số chiều m giữ gi¸ trị cho c¸c dạng tham số, v ma trận cã cïng cì ma trËn XY, i số nguyªn từ đến k Tham số XY ma trận chứa c¸c gi¸ trị biến độc lập n cột u tiên v theo sau l bin ph thuc ct cui Dòng th i Ma trËn chứa n gi¸ trị độc lập gi¸ trị phụ thuộc điểm liệu thứ i Không ging nh cú pháp ca lnh NonlinearFit, cú pháp dạng ma trËn kh«ng chấp nhận tïy chọn weight Thay vào đã, cột trọng số cã thể c thêm vo ma trn d liu XY v thủ tục f điều chỉnh để tÝnh c¸c phần dư với trọng số cấp 54 Tïy chän §èi sè Option cã thể chứa hay nhiều tïy chọn biểu thị đ©y initialvalues = Vector (realcons) - Cung cấp c¸c gi¸ trị ban đầu cho c¸c tham số modelfunctiongradient = danh s¸ch (thđ tơc) X¸c nh dc ca dạng hm nh l danh sách ca th tc.Th tc th j tính dạng hàm với c¸c tham số thứ j, im d liu a vo Các hình thc ca mi thủ tục tương tự bắt buộc phn d, c mô t output = tên hoc chuỗi - Ch nh hình thc c¸c giải ph¸p C¸c tïy chọn output cã thể l mt giá tr có tên solutionmodule, hoc mt tên sau ây: degreesoffreedom, parametervalues, residuals, parametervector, residualmeansquare, residualstandarddeviation, residualsumofsquares parameterranges = [Vector, Vector] - X¸c định phạm vi cho phÐp cho tham số hai Vector cã chiều m, chóng chứa cận cận ca tham s 3.7 Tạo bảng ANOVA nhân tè Có ph¸p OneWayANOVA (X) Tham sè X - Danh sách (Vector), hoc ma trn, quan sát Mô tả LÖnh OneWayANOVA tạo ma trận biểu thị bng phân tích ph-ơng sai chuẩn chiều Bảng ANOVA đ-ợc tạo thành cách phân tích tất quan s¸t gióp đỡ việc x¸c định ảnh hưởng yu t có k không 55 Tham số X danh s¸ch c¸c Vecto, vecto chứa c¸c quan s¸t cho nhãm đơn Nếu nhãm cã chứa cïng số quan s¸t, th× X cã thể ma trận, cột chứa c¸c quan s¸t cho nhãm Lệnh OneWayANOVA ®-a ma trËn với hàng cột Hàng đầu tiªn chứa phương sai c¸c nhãm, hàng thø hai chứa phương sai c¸c nhãm hàng thứ ba chứa tổng số c¸c phương sai Cột đầu tiªn bảng ANOVA chứa bậc tự cho nguồn phương sai, cột thứ hai chứa tổng b×nh phương cột thứ ba chứa b×nh phương trung b×nh Hai cột cuối cïng hiển thị thng kê F (t l bình phng trung bình) v p giá tr gi thuyt H0 s khác biệt c¸c nhãm VÝ dơ Xem xÐt ba nhãm quan sát > Tạo bảng ANOVA chiều > Khi tất nhóm có số l-ợng nhau, quan sát đ-ợc đặt ma trËn > 56 3.8 XÊp xØ hàm ®a thøc Có ph¸p PolynomialFit (d, X, Y, v, options) Tham sè d - bậc hàm đa thức X - Vector; gi¸ trị c¸c biến độc lập Y - Vector; gi¸ tr ca bin ph thuc v - Tên; (tùy chn) tên bin c lp Options - có dạng option=value option output, svdtolerance weights xác ịnh tùy chn cho lnh PolynomialFit Mô tả Lệnh PolynomialFit xÊp xØ hàm đa thức b»ng ph-¬ng pháp bình ph-ơng bé nht Xét dng a thc p(x) với biến độc lập x phụ thuộc vào biến y Cho k điểm liệu Mỗi điểm cặp gi¸ trị số cho (x, y), lệnh tìm thy h s ca p(x) bng cách tính tng ca k bình phng s d l nh nht phần dư thứ i gi¸ trị y - p (x) điểm liệu thứ i Tham số d bậc p(x) Tham số X Vector chứa k gi¸ trị biÕn độc lập x, tham số Y Vector chứa k gi¸ trị biến phụ thuộc y Lệnh PolynomialFit ®-a vecto cã chiều (d+1) chứa hệ số đa thức kết với xÊp xØ tốt nhất, cã bậc từ thấp đến cao Nếu tham số v c cung cp, a thc vi tên bin trả lại Trọng số cho c¸c điểm liệu cã thể cung cấp th«ng qua lựa chọn weight Tïy chän Đối số Option chứa hay nhiu tùy chn di ây 57 output = tên hoc chuỗi- Xác nh hình thc gii tùy chn output có th mang giá tr có tên solutionmodule, hoc mt nhng tên sau ây: AtkinsonTstatistic, confidenceintervals, CookDstatistic, degreesoffreedom, externallystandardizedresiduals, internallystandardizedresiduals, leverages, leastsquaresfunction, parametervalues, residualmeansquare, residuals, residualstandarddeviation, standarderrors, variancecovariancematrix, parametervector, residualsumofsquares weights = Vector - Cung cấp trọng số cho điểm liệu VÝ dơ > > Sư dơng tïy chän output=solutionmodule để xem tồn kết > > 3.9 XÊp xØ hµm y = axb Có ph¸p PowerFit (X, Y, v) Tham sè X - Vector; gi¸ trị c¸c biến độc lập Y - Vector; giá tr ca bin ph thuc v - Tên; (tùy chn)tên bin c lp Mô tả Lnh PowerFit xÊp xØ hàm dạng y = axb liệu bng cách xét xấp xỉ bình phng ti thiu dùng để chuyển đổi sang dạng hàm ln(y)=A+b.ln(x), 58 với A ln(a) Hàm hàm tuyến tÝnh tham số A b Cho k điểm liệu, điểm cặp gi¸ trị số (x, y), lệnh PowerFit t×m A b Phần dư thứ i gi¸ trị ln(y)- A - b.ln(x) điểm liệu thứ i Tham số X Vector chứa k gi¸ trị biến độc lập x, tham số Y Vector chứa k gi¸ trị biến phụ thuộc y Đầu vào X Y phải gi¸ trị số Tham số v tªn biến tïy chọn Nếu tham số v cung cp, lnh PowerFit s đ-a dng hm vi biến v với c¸c gi¸ trị tÝnh a v b Nu không, mt Vector cha giá trị a b ®-a VÝ dơ > Xấp xỉ hàm mũ với số liệu đà cho > > Sử dụng tïy chọn trọng số weight hiÖn thị mt trng lng cho mi im d liu Vì tham số v kh«ng cung cấp, Vector chứa c¸c dạng tham số tÝnh bị trả lại > 3.10 VÝ dơ thùc tÕ Víi d÷ liƯu bảng điểm thi trắc nghiệm môn tr-ờng Ngô Quyền gồm có ghi cột chứa tên học sinh, giới tính, điểm thi trắc nghiệm môn toán, vật lý, hóa học, anh văn, văn, lịch sử Bài toán đặt đọc liệu từ file điểm trắc nghiệm, tìm dạng hàm xấp xỉ để thấy rõ đ-ợc mối phụ thuộc điểm toán lý, đánh giá xem hàm xấp xỉ tốt hàm đà tìm đ-ợc 59 Đầu tiên ta phải l-u file thunghiemdiem,xls d-ới dạng file bangdiem.txt > Đọc liệu từ tệp > Dùng hàm col gói đại số để tách cột Với điểm Toán cột thứ 3, điểm Vật lý cột thứ > > Vẽ đồ thị đám mây > Tìm hàm phù hợp với liƯu > > > > > Khi ®ã ta cã thể biểu diễn biểu đồ đ-ờng phù hợp chúng đồ thị > > 60 > > > > > Ta cã thÓ kiÓm tra xem hàm xấp xỉ tốt với liệu đà cho cách kiểm tra bình ph-ơng trung bình thặng d- nh- sau > > > > Ta dƠ dµng nhËn thÊy hµm Exponential lµ hµm xÊp xØ tốt với bình ph-ơng trung bình thặng d- nhỏ 61 Kết luận Kết nghiên cứu, thực đề tài luận văn đà giải đ-ợc số vấn đề sau: - Trình bày khái niệm biến ngẫu nhiên mẫu ngẫu nhiên, kiến thức sở phần thống kê bao gồm -ớc l-ợng khoảng tin cậy, kiểm định giả thuyết, đặc biệt nêu đ-ợc mô hình hồi quy ph-ơng pháp bình ph-ơng bé - Giới thiệu phần mềm Maple cách khái quát thông qua tìm hiểu câu lệnh gói Thống kê - Luận văn sâu tìm hiểu chi tiết câu lệnh tìm hàm xấp xỉ liệu với ví dụ minh họa Tuy nhiên, Maple phần mềm có ứng dơng réng cho c¸c lÜnh vùc tÝnh to¸n nãi chung, toán học nói riêng Ngay gói Thống kê có nhiều mảng mà tác giả ch-a có thời gian nghiên cứu đ-ợc nh-: - Tính xác suất biến ngẫu nhiên, xử lý liệu, mô phỏng, -ớc l-ợng, kiểm định giả thuyết, làm trơn liệu - Còn số vấn đề lập trình Maple ch-a đ-ợc đề cập đến Hy vọng vấn đề đề tài mở cho nghiên cứu Vì lực thân điều kiện khách quan nên luận văn chắn không tránh khỏi hạn chế Tác giả mong nhận đ-ợc bảo thầy cô đóng góp bạn đồng nghiệp 62 Tài liệu tham khảo [1] Hồ Đăng Phúc (2009), Bài giảng Thống kê Toán học, Viện Toán [2] Phạm Huy Điển, Đinh Thế Lục, Tạ Duy Ph-ơng (1998), H-ớng dẫn thực hành tính toán ch-ơng trình Maple V, NXB Giáo dục [3] Nguyễn Văn Quảng (2007), Giáo trình Xác suất Thống kê, NXB ĐHQG Hà Nội [4] Trần Văn Bốn (1993), Giáo trình Thống kê Toán học, NXB Thống kê [5] Gilberto E Urroz (2000), Maple V in Probability and Statistics, In Brief Introduction ... nghiên cứu ứng dụng phần mềm Maple vào phân tích hồi quy 2 Dựa hỗ trợ gói Thống kê (Statistics), luận văn sâu khai thác, phân tích ý nghĩa, cách sử dụng câu lệnh Maple mảng phân tích hồi quy Nội... xử lý thông tin cần thiết, trình phân tích số liệu khâu quan trọng Có nhiều ph-ơng pháp phân tích số liệu phải kể đến ph-ơng pháp phân tích hồi quy Phân tích hồi quy nghiên cứu phụ thc cđa mét... mẫu ngẫunhiên từ phân phối Beta Tạo đồ thị hình hộp biểu đồ thị đồ thị > > Sử dụng đồ thị xác suất phân phối mẫu phân phối ban đầu > 44 Ch-ơng ứng dụng Maple vào phân tích hồi quy Chúng ta đÃ