Luận văn thạc sĩ giảng dạy phân tích thống kê với sự hỗ trợ của một số phần mềm tin học

95 998 0
Luận văn thạc sĩ giảng dạy phân tích thống kê với sự hỗ trợ của một số phần mềm tin học

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC GIÁO DỤC ---------- NGUYỄN PHƢƠNG THẢO GIẢNG DẠY PHÂN TÍCH THỐNG KÊ VỚI SỰ HỖ TRỢ CỦA MỘT SỐ PHẦN MỀM TIN HỌC LUẬN VĂN THẠC SĨ SƢ PHẠM TOÁN HỌC Chuyên ngành: LÍ LUẬN VÀ PHƢƠNG PHÁP DẠY HỌC (BỘ MÔN TOÁN HỌC) Mã số : 60 14 10 Ngƣời hƣớng dẫn khoa học: TS. NGUYỄN THỊ HỒNG MINH HÀ NỘI - 2010 LỜI CẢM ƠN Lời đầu tiên trong luận văn này, tác giả xin bày tỏ lòng biết ơn sâu sắc tới TS. Nguyễn Thị Hồng Minh - người đã trực tiếp động viên, hướng dẫn và tận tình chỉ bảo tác giả trong quá trình nghiên cứu, thực hiện đề tài. Xin trân trọng cảm ơn Ban chủ nhiệm Khoa Sư phạm (nay là Ban giám hiệu trường ĐH Giáo dục) - Đại học Quốc gia Hà Nội và các thầy giáo, cô giáo đã nhiệt tình giảng dạy, tạo điều kiện giúp đỡ tác giả trong suốt quá trình học tập, nghiên cứu. Đặc biệt, tác giả xin chân thành cảm ơn Ban Giám hiệu, Ban chủ nhiệm khoa Khoa học Cơ bản, Ban chủ nhiệm và tập thể sinh viên khoa Kế toán Kiểm toán, khoa Quản lí kinh doanh, Trường Đại học Công nghiệp Hà Nội đã tạo điều kiện giúp đỡ tác giả thực hiện các thực nghiệm sư phạm. Tác giả xin chân thành cảm ơn gia đình và các bạn đồng nghiệp đã quan tâm, động viên, tạo mọi điều kiện thuận lợi để tác giả hoàn thành luận văn này. Mặc dù rất cố gắng song luận văn không tránh khỏi những sai sót và hạn chế, tác giả mong nhận được sự chỉ dẫn, đóng góp ý kiến của các thầy cô giáo và các bạn đồng nghiệp để luận văn được hoàn thiện hơn. Xin chân thành cảm ơn! Hà Nội, tháng 10 năm 2010 Tác giả Nguyễn Phương Thảo DANH MỤC CÁC CHỮ VIẾT TẮT GV : Giáo viên SV : Sinh viên ĐH : Đại học CĐ : Cao đẳng XSTK : Xác suất thống kê GD - ĐT : Giáo dục - Đào tạo CNTT : Công nghệ thông tin MTĐT : Máy tính điện tử ICT : Công nghệ thông tin và truyền thông MỤC LỤC Trang MỞ ĐẦU ………………………………………………………………... 1 1. Lý do chọn đề tài ……………………………………………………… 1 2. Lịch sử nghiên cứu ……………………………………………………. 2 3. Mục tiêu nghiên cứu …………………………………………………... 5 4. Phạm vi nghiên cứu …………………………………………………… 5 5. Mẫu khảo sát ………………………………………………………….. 5 6. Câu hỏi nghiên cứu …………………………………………………… 5 7. Giả thuyết khoa học …………………………………………………... 5 8. Phương pháp chứng minh luận điểm …………………………………. 5 9. Đóng góp của luận văn ……………………………………………….. 5 10. Cấu trúc của luận văn ………………………………………………... 6 Chƣơng 1: Cơ sở lí luận và thực tiễn ………………………………….. 7 1.1 Cơ sở lí luận …………………………………………………….. 7 1.1.1 Vai trò của công nghệ thông tin trong dạy học …………………. 7 1.1.2 Khai thác sử dụng CNTT trong dạy học Toán .............................. 9 1.1.3 Tổ chức dạy học Toán trong môi trường CNTT và truyền thông.. 13 1.2 Cơ sở thực tiễn .............................................................................. 22 1.2.1 Nội dung giảng dạy thống kê ở ĐH Công nghiệp Hà nội ............. 23 1.2.2 Những khó khăn trong giảng dạy, học tập thống kê ...................... 28 1.3 Giới thiệu một số phần mềm hỗ trợ giảng dạy phân tích thống kê 29 1.3.1 Phần mềm EXCEL ........................................................................ 29 1.3.2 Phần mềm MINITAB .................................................................... 30 1.3.3 Phần mềm STATA ........................................................................ 32 Chƣơng 2: Một số giáo án giảng dạy thống kê với sự hỗ trợ của các phần mềm EXCEL, MINITAB và STATA ............................................ 34 2.1 Giảng dạy bài “Ước lượng khoảng tin cậy cho kỳ vọng của biến ngẫu nhiên” với sự hỗ trợ của phần mềm MINITAB .................... 34 2.1.1 Đề cương bài giảng ....................................................................... 34 2.1.2 Giáo án .......................................................................................... 41 2.2 Giảng dạy bài “Ước lượng khoảng tin cậy cho xác xuất và phương sai của biến ngẫu nhiên” với sự hỗ trợ của phần mềm EXCEL .......................................................................................... 44 2.2.1 Đề cương bài giảng ....................................................................... 44 2.2.2 Giáo án .......................................................................................... 51 2.3 Sử dụng STATA giảng dạy bài “Phân tích tương quan” .............. 54 2.3.1 Đề cương bài giảng ....................................................................... 54 2.3.2 Giáo án .......................................................................................... 74 Chƣơng 3: Thực nghiệm sƣ phạm .......................................................... 77 3.1 Mục đích, kế hoạch và tổ chức thực nghiệm sư phạm .................. 77 3.1.1 Mục đích của thực nghiệm sư phạm .............................................. 77 3.1.2 Kế hoạch thực nghiệm sư phạm .................................................... 77 3.1.3 Tổ chức thực nghiệm sư phạm ...................................................... 78 3.2 Nội dung thực nghiệm ................................................................... 79 3.2.1 Đề cương, giáo án thực nghiệm ..................................................... 79 3.2.2 Phân tích kết quả thực nghiệm ...................................................... 79 KẾT LUẬN – KHUYẾN NGHỊ .............................................................. 87 DANH MỤC TÀI LIỆU THAM KHẢO ................................................ 89 MỞ ĐẦU 1. Lí do chọn đề tài Ngày nay, xác suất thống kê (Probability theory) được ứng dụng rộng rãi trong hầu hết các lĩnh vực kinh tế và xã hội. Ở nước ta, các trường Đại học, Cao đẳng và Trung học chuyên nghiệp thuộc khối các ngành khoa học, kinh tế, kỹ thuật, v.v.. đều đã đưa môn học này vào chương trình giảng dạy. Hơn nữa, xác suất thống kê trở thành một trong những môn thi đầu vào của một số bậc đào tạo sau đại học. Mặc dù vậy, khả năng học tập và ứng dụng xác suất thống kê (đặc biệt là nội dung phân tích thống kê) của sinh viên nhìn chung còn rất yếu. Sinh viên chưa có thói quen sử dụng thống kê như một công cụ khoa học hữu ích trong việc giải và nghiên cứu các bài toán thực tế hay sử dụng nó nhằm tìm kiếm các quy luật ẩn chứa đằng sau các hiện tượng ngẫu nhiên. Nhận thức rõ thực tế và phân tích sâu hơn đặc thù môn học, chúng tôi cho rằng điểm yếu kể trên bắt nguồn từ hai nguyên nhân. Thứ nhất, nội dung kiến thức của học phần còn mang tính hàn lâm, hệ thống ví dụ và bài tập còn mang tính chất mô hình lý thuyết, khô khan đối với sinh viên. Thứ hai, việc thiết lập được mô hình toán học không phải là khó nhưng đó thường là những mô hình có quy mô tương đối lớn (những bài toán có thể lên tới hàng trăm biến số, số lượng phép tính có thể lên tới hàng nghìn), việc giải chúng bằng tay là cực kỳ khó khăn. Điều này gây ra tâm lý e ngại trong việc học tập học phần xác suất thống kê trong đại bộ phận sinh viên các trường đại học nói chung và sinh viên Đại học Công nghiệp Hà Nội nơi tác giả trực tiếp giảng dạy nói riêng. Trong hoàn cảnh đó, việc tìm hiểu, nghiên cứu và đưa vào ứng dụng các phần mềm tin học song song với quá trình dạy học lý thuyết học phần này 1 có thể là một giải pháp tốt. Qua tìm hiểu và nghiên cứu, chúng tôi thấy có rất nhiều phần mềm giải toán thống kê như Excel (của Microsoft), Minitab, SAS, SPSS, Stata, Statistica, S – Plus, R, Gauss, … Trong số đó, Excel và Minitab là những phần mềm có nhiều ưu điểm vượt trội. Excel là phần mềm đã được sử dụng rộng rãi, phổ biến còn Minitab là phần mềm được thiết kế để phục vụ việc giảng dạy môn thống kê, sau đó được phát triển thành công cụ phân tích và trình bày dữ liệu rất hữu hiệu. Hy vọng rằng, với việc nghiên cứu và thực hiện đề tài “Giảng dạy phân tích thống kê với sự hỗ trợ của một số phần mềm tin học”, tác giả sẽ góp phần giúp các bạn sinh viên và những người quan tâm đến thống kê giảm bớt khó khăn khi tiếp cận với môn học này. Và xa hơn nữa là giúp các bạn trở thành những cử nhân biết làm thống kê, biết dùng thống kê một cách thành thạo để phục vụ cho công việc của mình. 2. Lịch sử nghiên cứu Xác suất thống kê là lĩnh vực khoa học tương đối trẻ trung, ra đời vào khoảng năm 1654 bắt đầu từ những “trao đổi” của hai nhà toán học lớn là Pascal và Fermat xung quanh các trò chơi có tính chất may rủi (gambling). Sau đó, Christiaan Huygens đã xuất bản một cuốn sách về chủ đề này vào năm 1657. Nhưng ngay từ đầu, nhiều nhà toán học đã dự đoán rằng “đây sẽ là đối tượng quan trọng nhất của tri thức loài người”. Ban đầu, lý thuyết xác suất xem xét các sự kiện một cách rời rạc (discrete events) và chủ yếu dùng phương pháp tổ hợp (combinatorial). Sau đó, xem xét phân tích các ràng buộc và kết hợp của các biến liên tục (continuous variables) vào lý thuyết. Đỉnh điểm trong lý thuyết xác suất hiện đại, do Andrey Nikolaevich Kolmogorov đặt nền móng. Kolmogorov kết hợp các khái niệm về không gian mẫu (sample space) được giới thiệu bởi Richard 2 von Mises, và lý thuyết đo lường (measure theory), trình bày hệ thống tiên đề (axiom system) của ông cho lý thuyết xác suất vào năm 1933 [1]. Ở nước ta, lý thuyết xác suất thống kê cũng được chú trọng trong học tập, giảng dạy và nghiên cứu [2-5,12-14]. Ứng dụng trong thời kỳ kháng chiến chống Pháp, cố GS. Tạ Quang Bửu, lúc đó là Thứ trưởng Bộ Quốc phòng, đã xem việc nghiên cứu và ứng dụng lý thuyết xác suất và thống kê là một yêu cầu bức thiết. Ông viết “Thuật thống kê phải được phổ biến. Khoa học thống kê phải được nghiên cứu. Các cán bộ cao cấp phải biết dùng thống kê, cán bộ trung cấp phải biết làm thống kê ...”. Về vấn đề phân tích và xử lý số liệu thống kê, hiện nay có một số bộ chương trình thông dụng trên thế giới, đó là EXCEL, MINITAB, SAS, SPSS và STATA. Các chương trình này không những được họ giảng dạy trong các trường đại học mà còn là những công cụ không thể thiếu đối với các nhà thống kê và các nghiên cứu quan sát thống kê ở nhiều lĩnh vực khác nhau. Mỗi bộ chương trình đều có đặc trưng riêng với những điểm mạnh và yếu của nó. SAS (Statistical Analysis Software) được hình thành bởi Anthony J. Barr năm 1966 [6], là bộ chương trình mà nhiều người sử dụng có trình độ cao ưa thích bởi sức mạnh và khả năng lập trình. Do SAS là một bộ chương trình mạnh như vậy nên khó học nhất. Để sử dụng SAS, ta phải viết chương trình để thao tác dữ liệu và thực hiện các phân tích dữ liệu của mình. Nếu chương trình mắc lỗi, cái khó là phải biết tìm lỗi ở đâu và cách sửa thế nào. SPSS (Statistical Package for the Social Sciences) được phát hành phiên bản đầu tiên vào năm 1968 sau khi được phát triển bởi Norman H. Nie và C. Hadlai Hull [7]. SPSS là một bộ chương trình mà nhiều người sử dụng ưa thích do nó rất dễ sử dụng. SPSS có một giao diện giữa người và máy cho 3 phép sử dụng các menu thả xuống để chọn các lệnh thực hiện. Khi thực hiện một phân tích chỉ đơn giản chọn thủ tục cần thiết và chọn các biến phân tích và bấm OK là có kết quả ngay trên màn hình để xem xét. SPSS cũng có một ngôn ngữ cú pháp có thể học bằng cách dán cú pháp lệnh vào cửa sổ cú pháp từ một lệnh vừa chọn và thực hiện, nhưng nói chung khá phức tạp. STATA là tên kết hợp bởi "statistics" and "data”, là một gói phần mềm thống kê được tạo ra năm 1985 của StataCorp. STATA là một bộ chương trình mà nhiều người mới bắt đầu sử dụng ưa thích vì nó dễ học và có nhiều khả năng. STATA sử dụng các lệnh trực tiếp, có thể vào mỗi lệnh ở một thời điểm để thực hiện hoặc có thể soạn thảo thành một chương trình bao gồm nhiều lệnh cho một nhiệm vụ và thực hiện cùng một lúc. MINITAB là phần mềm thống kê ứng dụng được phát triển ở Đại học Pennsylvania bởi Barbara F. Ryan, Thomas A. Ryan, Jr. và Brian L. Joiner năm 1972. Từ thành công của phần mềm này, những người phát triển phần mềm đã sáng lập ra công ty Minitab Inc. vào năm 1983. Ngày nay, Minitab được sử dụng rộng rãi trong phân tích thống kê nhằm tiết kiệm thời gian tính toán. Theo số liệu của công ty, Minitab được sử dụng tại hơn 4.000 trường đại học, cao đẳng trên thế giới và trở thành phần mềm hàng đầu được ứng dụng trong việc giảng dạy. MICROSOFT EXCEL có các công cụ toán học rất mạnh để giải các bài toán tối ưu và thống kê toán học (Tập đoàn Microsoft được thành lập năm 1975). Một lợi thế nữa của Excel là chương trình này sẵn có trong hầu hết các máy tính điện tử (MTĐT, Computer), chỉ đòi hỏi những hiểu biết tối thiểu là có thể tính toán trực tiếp ngay tại bảng tính. Nhưng bên cạnh đó cũng tồn tại những bất lợi trong việc sử dụng bảng tính Excel, đó là: hạn chế các câu lệnh VBA (Visual Basic for Applications) trong những tính toán phức tạp (đòi hỏi 4 người dùng thường xuyên phải viết các câu lệnh bằng tay), không thích hợp cho việc tạo ra hàng loạt các báo cáo cho một mẫu. Cùng với việc phát triển của các phần mềm xử lý số liệu thống kê, vấn đề ứng dụng các phần mềm này trong việc giảng dạy thống kê ở nước ta cũng đang được triển khai tích cực ở một số trường như ĐH Quốc gia Hà Nội, ĐH Quốc Gia TP Hồ Chí Minh, ĐH Kinh tế Quốc dân, ĐH Đà Nẵng,… Tuy nhiên mức độ khai thác và sử dụng của sinh viên còn rất hạn chế. 3. Mục tiêu nghiên cứu - Hệ thống hóa nội dung và phân tích những khó khăn khi giảng dạy, học tập học phần xác suất thống kê. - Tìm hiểu những tiện ích của phần mềm Excel, Minitab và Stata để có thể hỗ trợ cho việc giảng dạy phân tích thống kê. - Xây dựng một số giáo án giảng dạy phân tích thống kê cho sinh viên ĐH Công nghiệp Hà Nội khi sử dụng các phần mềm nêu trên. 4. Phạm vi nghiên cứu - Nghiên cứu những nội dung cơ bản của thống kê, đặc biệt là những nội dung cần có công cụ tin học để hỗ trợ trong tính toán và xử lý số liệu. - Nghiên cứu phương pháp sử dụng các phần mềm Excel, Minitab và Stata trong việc giảng dạy các nội dung nói trên. 5. Mẫu khảo sát Sinh viên khoa Kế toán kiểm toán và khoa Quản lí kinh doanh, trường ĐH Công nghiệp Hà Nội. 6. Câu hỏi nghiên cứu Các phần mềm tin học có thể được sử dụng trong giảng dạy phân tích thống kê như thế nào? 5 7. Giả thuyết khoa học Có thể nâng cao hiệu quả của việc giảng dạy phân tích thống kê khi sử dụng các phần mềm tin học như Excel, Minitab và Stata. 8. Phƣơng pháp chứng minh luận điểm - Dựa vào thực trạng của việc dạy và học thống kê khi chưa có sự hỗ trợ của các phần mềm tin học. - Dựa vào hiệu quả mà các phần mềm tin học mang lại khi sử dụng trong giảng dạy phân tích thống kê. 9. Đóng góp của luận văn Ngoài việc hệ thống hóa các nội dung cơ bản của thống kê, tìm hiểu và giới thiệu về các phần mềm thống kê đang được sử dụng trên thế giới, đóng góp chính của luận văn là nghiên cứu những tiện ích của ba phần mềm: Excel, Minitab, Stata có thể ứng dụng trong việc giảng dạy phân tích thống kê; Bên cạnh đó, tác giả cũng đã thiết kế được một số bài giảng mẫu để thử nghiệm và đánh giá hiệu quả của việc sử dụng các phần mềm này trong giảng dạy. 10. Cấu trúc của luận văn Ngoài phần mở đầu, kết luận và khuyến nghị, nội dung chính của luận văn được trình bày trong 3 chương: Chương 1 nêu rõ cơ sở lí luận và thực tiễn; Chương 2: trình bày “Một số giáo án giảng dạy thống kê với sự hỗ trợ của các phần mềm EXCEL, MINITAB và STATA” và Chương 3 kiểm định bằng các “Thực nghiệm sư phạm” 6 CHƢƠNG 1 CƠ SỞ LÍ LUẬN VÀ THỰC TIỄN 1.1. Cơ sở lí luận 1.1.1.Vai trò của công nghệ thông tin trong dạy học Ngày nay, công nghệ thông tin (CNTT) có những bước tiến vượt bậc, thâm nhập vào mọi mặt của đời sống xã hội, mang lại lợi ích to lớn thiết thực trong mọi lĩnh vực. Riêng trong ngành giáo dục, có thể thấy những tiến bộ của công nghệ thông tin đã làm thay đổi quan niệm dạy học và có những ảnh hưởng tích cực trong việc nâng cao hiệu quả giáo dục và đào tạo. Sự ra đời của Intemet đã thực sự mở ra một kỷ nguyên ứng dụng công nghệ thông tin và truyền thông trong mọi lĩnh vực của đời sống xã hội, kinh tế, văn hóa. Trong khung cảnh đó giáo dục được coi là “mảnh đất mầu mỡ” để cho các ứng dụng của CNTT phát triển, điều đó sẽ tạo ra những thay đổi sâu sắc trong công nghệ đào tạo và giáo dục. Những công nghệ tiên tiến như đa phương tiện, truyền thông băng rộng, CD-ROM, DVD và Intemet đã mang đến những biến đổi có tính cách mạng trên quy mô toàn cầu trong lĩnh vực giáo dục, đào tạo, do đó sẽ dẫn đến những thay đổi trong phương pháp dạy và học. Việc ứng dụng công nghệ thông tin trong ngành giáo dục đã được Đảng, Nhà nước và Bộ Giáo dục và Đào tạo đặc biệt quan tâm, đơn cử[1518]: - Chỉ thị số 58 của Bộ Chính trị, ký ngày 17/10/2000, về đẩy mạnh ứng dụng và phát triển công nghệ thông tin phục vụ sự nghiệp công nghiệp hoá, hiện đại hoá: "Đẩy mạnh ứng dụng công nghệ thông tin trong công tác giáo dục và đào tạo ở các cấp học, bậc học, ngành học. Phát triển các hình thức đào tạo từ xa phục vụ cho nhu cầu học tập của toàn xã hội. Đặc biệt tập trung phát triển mạng máy tính phục vụ cho giáo dục và đào tạo, kết nối 7 Intemet tới tất cả các cơ sở giáo dục và đào tạo". - Quyết định của thủ tướng Chính phủ Số 47/2001/QĐ-TTg phê duyệt "Quy hoạch mạng lưới trường đại học, cao đẳng giai đoạn 20012010" ngày 04 tháng 4 năm 2001: "Tăng cường năng lực và nâng cao chất lượng hoạt động thư viện; hình thành hệ thống thư viện điện tử kết nối giữa các trường từng bước kết nối và hệ thống thư viện của các trường đại học, thư viện quốc gia của các nước trong khu vực và trên thế giới. Mở cổng kết nôi Intemet trực tuyến cho hệ thống giáo dục đại học” - Chỉ thị số 29 của Bộ trưởng Bộ Giáo dục và Đào tạo ký ngày 30/7/2001 về việc tăng cường giảng dạy, đào tạo và ứng dụng công nghệ thông tin trong ngành giáo dục: "Đối với giáo dục và đào tạo, công nghệ thông tin có tác động mạnh mẽ, làm thay đổi nội dung, phương pháp. phương thức dạy và học. CNTT là phương tiện để tiên tới một “xã hội học tập”. Mặt khác giáo dục và đào tạo đóng vai trò quan trọng bậc nhất thúc đẩy sự phát triển của CNTT thông qua việc cung cấp nguồn nhân làm cho CNTT” - Chỉ thị số 40/CT-TW của Ban chấp hành TW Đảng ra ngày 15/6/2004 về việc xây dựng, nâng cao chất lượng đội ngũ nhà giáo và cán bộ quản lí giáo dục: “Tích cực áp dụng một cách sáng tạo các phương pháp tiên tiến, hiện đại, ứng dụng công nghệ thông tin vào hoạt động dạy và học”. Đối với môn toán nói riêng, là một bộ môn vốn dĩ có mối liên hệ mật thiết với tin học, toán học chứa đựng nhiều yếu tố để phục vụ nhiệm vụ giáo dục tin học, ngược lại tin học sẽ là một công cụ đắc lực cho quá trình dạy học toán. Với sự hỗ trợ của Máy tính điện tử đặc biệt là của Intemet và các phần mềm dạy học, quá trình dạy học toán sẽ có những nét mới, chẳng hạn: - Giáo viên không còn là kho kiến thức duy nhất. Giáo viên phải 8 thêm một chức năng là tư vấn cho học sinh khai thác một cách tối ưu các nguồn tài nguyên tri thức trên mạng hoặc giới thiệu các CD-ROM. - Tiến trình lên lớp không còn máy móc theo sách giáo khoa hay như nội dung các bài giảng truyền thống mà có thể tiến hành theo phương thức linh hoạt. Phát triển cao các hình thức tương tác giao tiếp: học sinh giáo viên, học sinh - học sinh, học sinh - máy tính,... trong đó chú trọng đến quá trình tìm lời giải, khuyến kích học sinh trao đổi, tranh luận,... từ đó phát triển các năng lực tư duy ở học sinh. Như vậy với mục tiêu nâng cao chất lượng đào tạo, đổi mới phương pháp giảng dạy thì một trong các biện pháp khả thi là biết kết hợp các phương pháp dạy học truyền thống và không truyền thống trong đó có sử dụng CNTT như một yếu tố không thể tách rời. Có thể nói, CNTT đang dần trở thành công cụ đắc lực hỗ trợ đổi mới phương pháp giảng dạy, học tập và quản lý, góp phần nâng cao hiệu quả và chất lượng giáo dục. Tuy nhiên, làm thế nào để việc ứng dụng CNTT đạt hiệu quả cao nhất cho từng nội dung giảng dạy và cho từng đối tượng vẫn luôn là vấn đề được ngành giáo dục đặc biệt quan tâm. 1.1.2. Khai thác sử dụng CNTT trong dạy học Toán Cùng với sự phát triển như vũ bão của CNTT và truyền thông, việc nghiên cứu và triển khai các thế mạnh của CNTT nhằm hỗ trợ quá trình dạy học toán được nhiều quốc gia và các nhà giáo dục quan tâm. Trong tài liệu The free NCET (1995) leanet (Mathematics ang ITapupil’s entitlement) [8] đã mô tả 6 hướng cơ bản trong việc sử dụng CNTT nhằm cung cấp các điều kiện cho người học toán, cụ thể: - Học tập dựa trên thông tin ngược: Máy tính có khả năng cung cấp nhanh và chính xác các thông tin phản hồi dưới góc độ khách quan. Từ 9 những thông tin phản hồi như vậy cho phép người học đưa ra sự ước đoán của mình và từ đó có thể thử nghiệm, thay đổi những ý tưởng của người học. - Khả năng quan sát các mô hình: Với khả năng và tốc độ xử lý của MTĐT giúp người học đưa ra nhiều ví dụ khi khám phá các vấn đề trong toán học. MTĐT sẽ trợ giúp người học quan sát, xử lý các mô hình, từ đó đưa ra lời chứng minh trong trường hợp tổng quát. - Phát hiện các mối quan hệ trong toán học: MTĐT cho phép tính toán biểu bảng, xử lý đồ hoạ để theo sát sự thay đổi trong công th ức một cách chính xác và liên kết chúng với nhau. Việc cho thay đổi một vài thành phần và qua các thành phần còn lại đã giúp người học phát hiện ra mối tương quan giữa các đại lượng. - Thao tác với các hình động: Người học có thể sử dụng MTĐT để biểu diễn các biểu đồ một cách sinh động. Việc đó đã giúp cho người học hình dung ra các hình trong hình học một cách tổng quát từ hình ảnh của máy tính. - Khai thác tìm kiếm thông tin: MTĐT cho phép người sử dụng làm việc trực tiếp với các dữ liệu thực, từ đó hình dung ra sự đa dạng của nó và sử dụng để phân tích hay làm sáng tỏ một vấn đề toán học. - Dạy học với máy tính: Khi người học thiết kế thuật toán để sử dụng MTĐT nhằm tìm ra kết quả thì người học phải hoàn thành dãy các chỉ thị mệnh lệnh một cách rõ ràng, chính xác. Họ đã sắp đặt các suy nghĩ của mình cũng như các ý tưởng một cách rõ ràng. - Sử dùng đồ hoạ với máy tính: Đồ thị trên máy tính là nét mới trong các lớp dạy học toán. Kenneth Ruthven bắt đầu lựa chọn, nghiên cứu và phát triển dự án sử dụng đồ hoạ máy tính từ năm 1986 [9]. Tuy nhiên, khái niệm, ý định về một môi trường mà trong đó người sử dụng có thể thay đổi 10 kích thước to nhỏ, điều tra, tìm hiểu sự giao nhau và độ dốc địa phương đã được phát triển ít lâu bởi David Tall [10]. Một vài nghiên cứu đã chỉ ra rằng nếu giáo viên có sử dụng đồ hoạ MTĐT trong quá trình giảng bài thì họ có thể đưa ra các câu hỏi với yêu cầu cao hơn so với lớp không sử dụng. Mặt khác, sử dụng đồ hoạ cho phép ta phân tích các mối liên kết giữa đại số, hình học. Ý tưởng trên về sử dụng đồ hoạ máy tính cho học sinh từ 11 đến 16 tuổi được trình bày trong Open Calculalor Challenge [11]. Theo Colette, một nhà nghiên cứu về dạy học môn toán người Pháp, thì MTĐT có khả năng tạo ra môi trường giải quyết vấn đề (problem solving environments) cho học sinh và môi trường đó có vai trò to lớn trong việc kích thích c á c hoạt động tìm tòi khám phá và từ đó hình thành kiến thức mới. Theo học thuyết kiến tạo (cosntructivist hypothesis) thì kiến thức học sinh được tạo nên khi hoạt động trong môi trường toán học, MTĐT có khả năng rất tốt trong việc tạo ra môi trường đó. Trong môi trường máy tính, học sinh tiếp thu được bằng chính hoạt động, thực hành của mình (learning by doing). Toán học là một môn khoa học trừu tượng, do đó khai thác v à sử dụng phần mềm trên MTĐT trong dạy và học toán có những đặc thù riêng. Ngoài mục tiêu trợ giúp học sinh chiếm lĩnh kiến thức thì vấn đề phát triển tư duy suy luận lôgic, óc tưởng tượng sáng tạo toán học và đặc biệt là khả năng tự tìm tòi để chiếm lĩnh kiến thức là một mục tiêu rất quan trọng. Sản phẩm của môi trường học tập với sự hỗ trợ của công nghệ thông tin là những học sinh có năng lực tư duy sáng tạo toán học, có năng lực giải quyết các vấn đề và năng lực tự học một cách sáng tạo. Như vậy, việc tổ chức dạy - học với sự hỗ trợ của MTĐT và các phần mềm toán học nhằm xây dựng một môi trường dạy - học với 3 đặc tính cơ bản sau: 11 - Tạo ra một môi trường học tập hoàn toàn mới mà trong môi trường này tính chủ động, sáng tạo của học sinh được phát triển tốt nhất. Người học có điều kiện phát huy khả năng phân tích, suy đoán và xử lý thông tin một cách có hiệu quả. - Cung cấp một môi trường cho phép đa dạng hoá mối quan hệ tương tác hai chiều giữa thầy và trò. - Tạo ra một môi trường dạy và học linh hoạt, có tính mở. Trong các hình thức tổ chức dạy - học có sự hỗ trợ của CNTT thì vai trò của người thầy đặc biệt quan trọng. Nó đòi hỏi cao hơn ở người thầy khả năng tổ chức so với hình thức dạy học truyền thống. Về một góc độ nào đó, năng lực của người thầy thể hiện qua hệ thống định hướng giúp học sinh phát hiện và giải quyết vấn đề thông qua hệ thống các câu hỏi. Hệ thống các câu hỏi của người thầy phải đáp ứng được các yêu cầu sau: - Các câu hỏi phải mang tính gợi mở, định hướng giúp cho học sinh con đường xử lý thông tin để đi đến kiến thức mới. - Các câu hỏi phải trợ giúp học sinh củng cố kiến thức mới và tăng cường khả năng vận dụng kiến thức trong thực hành. - Các câu hỏi phải có tính mở để khuyến khích học sinh phát huy tính sáng tạo, khả năng phân tích tổng hợp, khái quát hoá các tri thức đã được trang bị để giải quyết vấn đề. Điều khác biệt so với các hình thức dạy học truyền thống là quá trình truyền đạt, phân tích, xử lý thông tin và kiểm tra đánh giá kết quả được giáo viên, học sinh thực hiện có sự trợ giúp của các phần mềm và MTĐT. 1.1.3. Tổ chức dạy học toán trong môi trường công nghệ thông tin và truyền thông (Information and communication technologies-ICT) a. Sử dụng phương tiện ICT trong các giờ lên lớp với số đông học sinh 12 Hình thức này được áp dụng với quy mô số học sinh từ 40 đến 60. Ngoài các phương tiện dạy học thông thường của một lớp học truyền thống như bảng đen, phấn trắng, thước kẻ... lớp học được trang bị thêm máy tính, máy chiếu Project hoặc máy chiếu Overhead. Trong giờ học, cả lớp quan sát kết quả xử lý của máy tính trên màn hình lớn (Hình 1.1). Hình 1.1. Hình thức tổ chức dạy - học có sự hỗ trợ của ICT Hình thức này có những đặc điểm sau: - Giáo viên trực tiếp lên lớp khai thác các tính năng của ICT để trình bày kiến thức một cách sinh động. Một số trường hợp, giáo viên có thể chuẩn bị sẵn hình vẽ, bảng biểu,... để rút ngắn thời gian thao tác với máy tính. - Học sinh quan sát và phán đoán theo sự định hướng của giáo viên. Học sinh ít được trực tiếp thao tác với máy tính. Ví dụ trong dạy học định lý, mô hình tổ chức lớp học như sau (Hình 1.2): 13 Hình 1.2. Hướng dẫn tổ chức dạy - học có sự hỗ trợ của ICT Như vậy, lớp học thường diễn ra theo xu hướng sau: - Từng học sinh làm việc gần như "độc lập" với nhau, cùng tập trung vào quan sát, xử lý những thông tin trên màn hình. - Những học sinh khá, giỏi chưa được phát huy tối đa khả năng của bản thân vì cả lớp cùng được giao một nhiệm vụ cụ thể như nhau. - Trong lớp học giữa các học sinh sẽ có sự ganh đua với nhau, do vậy để dễ so sánh, phân loại. Giáo viên thường có xu hướng tập trung vào giảng dạy về kỹ năng thực hành, gợi lại kiến thức cũ và hệ thống lại kiến thức của học sinh. b. Tổ chức hoạt động học “cộng tác” theo nhóm nhỏ Học sinh được chia thành các nhóm nhỏ không quá 7 học sinh. Trang thiết bị tối thiểu mỗi nhóm có một máy tính. Nếu các máy tính được nối mạng thì tốt hơn vì các nhóm có thể chia sẻ thông tin với nhau. Hình thức này có những đặc điểm sau: - Giáo viên giao nhiệm vụ cho các nhóm thông qua các định hướng gợi mở hoặc các phiếu học tập. - Mỗi nhóm học sinh sử dụng chung một máy tính, có trách nhiệm cộng tác, chia sẻ những ý tưởng của bản thân để hoàn thành nhiệm vụ của nhóm cũng như của mỗi bản thân. Kết quả của nhóm chỉ thực sự có hiệu quả khi toàn bộ các thành viên trong nhóm hoàn thành mục tiêu học tập. Như vậy mỗi thành viên đều nhận thức được rằng: Không phải mỗi học sinh 14 làm được gì đó mà là cả nhóm đã học được điều gì. Như vậy ba yếu tố cơ bản của hình thức này là: Sự thành công của toàn nhóm, trách nhiệm của mỗi cá nhân trong nhóm và điều quan trọng là mọi thành viên trong nhóm đều có cơ hội thành công bình đẳng như nhau. Hình thức làm việc “cộng tác” theo nhóm nhỏ có những ưu điểm sau: - Học sinh có nhiều cơ hội để thể hiện, trao đổi những suy nghĩ của bản thân. Thay vì chỉ một mình giáo viên thao tác, trình bày. Ở hình thức này, mỗi học sinh trong nhóm đều có thể trực tiếp làm việc với các đối tượng hình học và cả nhóm luôn sẵn sàng đón nhận những nhận định, phán đoán của mỗi thành viên. - Mỗi cá nhân ngoài điều kiện làm việc trực tiếp với phần mềm, còn có khả năng nhận được sự hỗ trợ không chỉ ở một mình giáo viên mà của cả nhóm, qua đó làm tăng hiệu quả học tập của cả học sinh được giúp đỡ và những học sinh đi giúp đỡ các bạn. Chính vì vậy khả năng thành công của mỗi cá nhân đều tăng. - Những học sinh học kém sẽ có khả năng, cơ hội bày tỏ và học hỏi nhiều hơn ở chính các thành viên trong nhóm. Ví dụ, có thể tổ chức học tập theo mô hình sau (Hình 1.3): Hình 1.3. Mô hình “cộng tác” trong môi trường ICT Hình thức học "cộng tác" chỉ thực sự phát huy tác dụng nếu ta đảm bảo được các yếu tố quan trọng sau: - Thiết lập sự phụ thuộc tích cực giữa các thành viên trong nhóm. 15 - Giáo viên hình thành và phát triển được kỹ năng hợp tác của mỗi học sinh. - Khẳng định rõ ràng trách nhiệm của từng cá nhân trong nhóm. - Tạo được môi trường tương tác giữa các thành viên trong nhóm. - Hình thành kỹ năng giao tiếp, ứng xử cho học sinh trong học tập. Hình thức phân chia nhóm: Tuỳ từng nội dung mà ta có thể chia nhóm ngẫu nhiên hay chia nhóm theo trình độ người học. Ví dụ: Khi làm việc với nội dung mới có thể sử dụng nhóm ngẫu nhiên để học sinh giỏi, khá có thể kèm cặp, giúp đỡ học sinh yếu. Nếu là giờ luyện tập, rèn luyện kỹ năng thì có thể phân chia theo trình độ học sinh để giao nhiệm vụ phù hợp nhằm phát huy được tối đa khả năng của người học. c. Hình thức học sinh làm việc độc lập tại lớp - Mỗi học sinh được sử dụng một máy tính. Lớp học được tổ chức tại phòng máy tính của trường. - Nhiệm vụ của cả lớp được phân thành các nhiệm vụ nhỏ để giao cho các cá nhân (do vậy học sinh đều ý thức được rằng, tuy hoạt động độc lập nhưng thành công của bản thân chính là thành công của cả lớp và ngược lại). Hình thức này có các đặc điểm chính sau: - Học sinh có điều kiện phát huy hết khả năng của bản thân. - Trong một thời điểm có thể giải quyết nhiều bài toán khác nhau. - Phù hợp với việc nhận thức chênh lệch trong một lớp. Tuỳ mức độ khả năng của bản thân mà học sinh được khuyến khích đảm nhận những nhiệm vụ vừa sức. - Đòi hỏi trình độ phân tích, tổng hợp vấn đề của giáo viên ở mức cao (vì nếu không giờ học phân tán, không hướng học sinh được đến những nội dung kiến thức cần nắm sau mỗi giờ học) 16 Hình thức này có thể áp dụng mô hình làm việc đơn tuyến hoặc đa tuyến như sơ đồ sau (Hình 1.4): Hình 1.4. Mô hình đơn tuyến và mô hình đa tuyến trong môi trường ICT Trong mô hình làm việc đa tuyến, giáo viên đóng vai trò điều khiển "từ xa" bằng cách nêu nhiệm vụ chung của cả lớp. Học sinh trao đổi, phân chia bài 17 toán thành các bài toán con (quá trình này có thể độc lập hoặc diễn ra dưới sự tham mưu của giáo viên). Mỗi cá nhân căn cứ vào khả năng của mình nhận thi công một mô đun. Trong quá trình làm việc, có thể có sự trao đổi giữa các học sinh. Kết quả của học sinh này có thể được học sinh khác sử dụng. Thậm chí, một thành viên có thể yêu cầu một thành viên khác điều chỉnh kết quả theo hướng có lợi cho việc kế thừa (inheritance) cho các thành viên khác. d. Sử dụng phương tiện ICT dạy một nội dung ngắn Quỹ thời gian sử dụng phương tiện ICT chỉ khoảng 1 đến 3 phút nhằm mục đích nêu ra tình huống có vấn vấn đề, gợi mở, kiểm chứng những suy đoán nhận định trong quá trình đi tìm lời giải hoặc minh hoạ kết quả lời giải. Hình thức này thường được sử dụng trong hình thức tổ chức lớp học với số đông. Giáo viên cho một vài học sinh trực tiếp thao tác với máy tính. Hình thức này tận dụng được thời gian lên lớp và phù hợp hơn cả là các tiết học nội dung bài mới. e. Sử dụng phương tiện ICT để dạy học trọn vẹn một phần của bài học Với mục đích sử dụng phần mềm để giải quyết trọn vẹn một nội dung cụ thể trong tiết học nên quỹ thời gian sử dụng phương tiện có thể kéo dài từ 5 đến 10 phút. Qua việc thao tác với phần mềm, học sinh phát hiện và giải quyết trọn vẹn một vấn đề, ví dụ dạy học khái niệm mới. Hình thức này có thể sử dụng trong cả hình thức tổ chức lớp số đông hoặc học tập theo nhóm. Hoạt động sử dụng, khai thác phần mềm được tiến hành đan xen với các hoạt động khác nên giờ học rất sinh động phù hợp với tâm sinh lý của lứa tuổi học sinh. g. Sử dụng phương tiện ICT dạy trọn vẹn một tiết học Trong hình thức này bài giảng được thiết kế thành một hệ thống liên kết chặt chẽ phối hợp đan xen các hoạt động của thầy và trò để đạt được mục 18 đích của giờ giảng. Điều đặc biệt là bài giảng được thiết kế sao cho khai thác tối đa sự hỗ trợ của ICT. Với hình thức này, có thể thời lượng sử dụng bảng đen sẽ không như các giờ học khác vì nội dung kiến thức được thiết kế sẵn trong các Slide và giáo viên chiếu lên màn hình thay cho viết bảng (giáo án điện tử). Giáo án điện tử được biên soạn dưới hình thức các Slide bao gồm các đơn vị tri thức, các bài tập từ đơn giản đến phức tạp, tạo điều kiện cho việc lĩnh hội tri thức. Từ chiến lược sư phạm, ta cấu trúc hoá các đơn vị tri thức trong giáo án. Các nội dung trình bày bao gồm các sự kiện sẽ nảy sinh trong quá trình tương tác. Các tác động này thực hiện theo những lược đồ nhất định. Việc phân tích, đánh giá các đáp ứng của người học thường dựa trên các yêu cầu đã chuẩn bị sẵn. Số lượng cũng như nội dung của mỗi Slide được xác định sao cho thể hiện được tốt nhất nội dung bài giảng cũng như ý đồ sư phạm. Lượng thông tin của mỗi Slide cũng không hạn chế, với sự hỗ trợ của các phần mềm công cụ thì nội dung không chỉ là dạng text (văn bản) mà còn là âm thanh, hình vẽ, ảnh động, thậm chí cả video. Giáo án điện tử cho phép ta trình diễn một cách trực quan sinh động các nội dung, ví dụ như khảo sát hàm số, dựng hình, quỹ tích mà nếu không sử dụng máy vi tính thì khó mô tả được. Với chức năng siêu liên kết (Hyperlink) cho phép ta kết nối các Slide của bài giảng thành một hệ thống. Từ một vị trí ta có thể truy nhập đến bất kỳ một nội dung (một Slide) nào khác trong bài giảng. Mặt khác, ta có thể kết nối hàng loạt các bài giảng với nhau thành một hệ thống hoàn chỉnh để giảng dạy một vấn đề. Vì giáo án điện tử tích hợp sẵn một khối lượng kiến thức được liên kết sẵn cho phép người giáo viên ôn tập đến phần nào, giáo viên kích chuột vào tên mục để chuyển đến slide nội dung của mục đó. Với giáo án điện tử này, tiến trình lên lớp rất linh hoạt, tiến trình ôn tập có thể rẽ nhánh, triển khai đi sâu vào những nội dung chi tiết, quay lui chuyển về những nội dung đã 19 trình bày... Hơn nữa, khối lượng kiến thức được ôn tập lại trong một tiết rất lớn và giáo viên tiết kiệm được thời gian để viết kẻ, vẽ lên bảng. Nhờ sự hỗ trợ của máy tính và giáo án điện tử, giờ ôn tập chương không còn là cảnh giáo viên liệt kê lại nội dung đã học mà nó là quá trình làm việc tích cực của trò dưới sự dẫn dắt của thầy. Việc làm việc với "cây" kiến thức góp phần phát triển tư duy lôgic, biện chứng cho học sinh. Tuy nhiên giáo án điện tử được thiết kế theo một kịch bản của người giáo viên dự định trước nên việc đưa ra các tình huống là hữu hạn, các giải pháp đáp ứng yêu cầu l à cố định, trong khi thực tế rất đa dạng và phong phú. Vậy giáo viên cần phối hợp với các phương pháp, hình thức dạy học khác để phát huy tối đa tính tích cực, chủ động của người học nhằm nâng cao chất lượng dạy học. Quy trình thiết kế một giáo án điện tử (Hình 1.5): Hình 1.5. Quy trình thiết kế một giáo án điện tử h. Sử dụng ICT trong kiểm tra, đánh giá Hoạt động chính của nội dung này là sử dụng MTĐT trợ giúp học sinh giải bài tập, kiểm tra nhận thức của bản thân, cụ thể: + Giao cho cho mỗi nhóm học sinh hoặc mỗi học sinh một máy tính. Học sinh tự sử dụng phần mềm để tìm tòi cách giải quyết vấn đề và hoàn thành nhiệm vụ được giao (giải được bài tập hoặc hoàn thành phiếu 20 học tập của cá nhân, của nhóm). + Kiểm tra nhận thức học sinh bằng ngân hàng điện tử: Toàn bộ câu hỏi và đáp án được thiết kế nạp sẵn trong máy. Mỗi học sinh được máy phát ngẫu nhiên một phiếu kiểm tra. Học sinh sẽ chọn phương án trả lời bằng cách sử dụng chuột hoặc bàn phím đánh dấu câu trả lời mà học sinh cho là đúng. Kết quả chấm điểm được máy tính tự động cập nhật và thông báo kết quả ra màn hình. i. Trợ giúp học sinh tự học Trong điều kiện nhiều học sinh có điều kiện trang bị máy tính tại nhà riêng thì đây là một hình thức cần được khuyến khích và khai thác sử dụng vì thời lượng học sinh tự học ở ngoài phạm vi lớp học là rất lớn. Mặt khác nó không trói buộc học sinh về mặt thời gian, địa điểm, cụ thể: + Giáo viên ra nhiệm vụ, học sinh sử dụng phần mềm độc lập tìm tòi và đưa ra cách giải quyết vấn đề. Giáo viên kiểm tra, nhận định lại kết quả. + Giáo viên thiết kế nhiệm vụ học tập ghi trong các tệp tin (file). Học sinh mở tệp tin, theo hướng dẫn và tiếp tục hoàn thành nhiệm vụ. Giáo viên có thể có thiết kế nhiệm vụ theo từng liều (được ghi trong các tệp tin khác nhau) để học sinh có thể tự học theo chu trình rẽ nhánh. + Sử dụng các bài giảng "gia sư điện tử". Toàn bộ nội dung kiến thức, ví dụ minh hoạ và bài tập được thiết kế dưới dạng Website. Học sinh lần lượt kích chọn những nội dung cần học và tìm hiểu nội dung đó qua các ví dụ kèm theo. Kết thúc mỗi mục có bài tập cho học sinh tự kiểm tra đánh giá nhận thức của mình. Sau khi giải song bài tập hoặc có khó khăn, học sinh có thể mở lời giải hoặc hướng dẫn để tham khảo. Như vậy hiệu quả của quá trình này phụ thuộc hoàn toàn vào tính chủ động, tích cực và sự hướng đích rất cao của học sinh. 21 * Nhận định Việc khai thác có hiệu quả sự hỗ trợ của ICT sẽ tác động một cách tích cực tới hoạt động dạy và học bởi các yếu tố sau: + Tính linh động, mềm dẻo: Người học bị thu hút bởi những thông tin và quá trình xử lý thông tin trên máy tính, từ đó truy tìm nguyên nhân vấn đề. + Tính hệ thống: Người học có thể điều chỉnh nhận thức của mình trong hệ thống kiến thức để nắm được vấn đề, điều hoà mâu thuẫn giữa sự hoang mang bối rối trước vấn đề mới và tính tò mò ham muốn tìm hiểu, khám phá. + Tính kết hợp: người học được làm việc trong nhóm nên khai thác được những ưu điểm và động viên sự đóng góp tối đa của từng cá nhân. + Tính mục đích: người học cố gắng, tích cực tập trung cao độ vào các hoạt động nhằm tìm hiểu, khám phá, nhận thức cho được đối tượng. + Tính đàm thoại: học là một hoạt động xã hội, quá trình đối thoại giữa người học với nhau sẽ hỗ trợ đắc lực cho việc nắm bắt được kiến thức không chỉ trong mà cả ngoài trường học. + Tính ngữ cảnh: hoạt động học được đặt ở vị trí có ý nghĩa đặc biệt trong các hoạt động của thế giới thực hoặc đóng vai trò môi trường cơ sở, do đó tạo ra một ngữ cảnh mang tính tích cực, thúc đẩy việc học của sinh viên. + Tính phản ảnh: với sự hỗ trợ của các công cụ, người học kết nối lại những gì họ được học và thu nhận những phản ánh trong các quá trình từ máy tính để đi đến những quyết định đúng đắn. Vấn đề sử dụng ICT trong nhà trường đã được khẳng định trong Chỉ thị 58- CT/TW ngày 17- 10-2000 của Bộ Chính trị Ban chấp hành Trung ương Đảng Cộng sản Việt nam, Chỉ thị 29-2001/CT-BGD&ĐT của Bộ 22 trưởng Bộ Giáo dục và Đào tạo, và rất nhiều văn bản khác của Chính phủ, của Bộ Giáo dục và Đào tạo. Điều đó chứng tỏ tính cấp thiết và hiệu quả của việc đưa ICT vào nhà trường. 1.2. Cơ sở thực tiễn 1.2.1. Nội dung giảng dạy thống kê ở ĐH Công Nghiệp Hà Nội Thống kê toán học là bộ môn toán học nghiên cứu qui luật của các hiện tượng ngẫu nhiên có tính chất số lớn trên cơ sở thu thập và xử lí các số liệu thống kê, các kết quả quan sát. Như vậy, nội dung chủ yếu của thống kê toán là xây dựng các phương pháp thu thập và xử lí các số liệu thống kê nhằm rút ra các kết luận khoa học và thực tiễn [2-4]. Các phương pháp thống kê toán học là công cụ để giải quyết nhiều vấn đề khoa học và thực tiễn nảy sinh trong các lĩnh vực khác nhau của tự nhiên và kinh tế - xã hội. Phân tích thống kê là một khâu quan trọng không thể thiếu được trong các công trình nghiên cứu khoa học, nhất là khoa học thực nghiệm. Một công trình nghiên cứu khoa học, cho dù có tốn kém và quan trọng cỡ nào, nếu không được phân tích đúng phương pháp sẽ không bao giờ có cơ hội được xuất hiện trong các tập san khoa học. Ngày nay, chỉ cần nhìn qua tất cả các tập san nghiên cứu khoa học trên thế giới, hầu như bất cứ bài báo nào cũng có phần “Statistical Analysis” (Phân tích thống kê), nơi mà tác giả phải mô tả cẩn thận phương pháp phân tích, tính toán như thế nào, và giải thích tại sao sử dụng những phương pháp đó để hàm ý tăng trọng lượng khoa học cho những phát biểu trong bài báo. Các tạp san có uy tín càng cao yêu cầu về phân tích thống kê càng nặng. Không có phần phân tích thống kê, bài báo không thể xem là một “bài báo khoa học”. Không có phân tích thống kê, công trình nghiên cứu chưa được xem là hoàn tất. Sau đây là nội dung của học phần này tại ĐH Công Nghiệp Hà Nội: 23 a. Đề cương chi tiết học phần 1. Tên học phần: LÍ THUYẾT THỐNG KÊ 2. Số đơn vị học trình: 2 đvht 3. Trình độ: Cho sinh viên CĐ, ĐH năm thứ nhất 4. Phân bổ thời gian: - Lý thuyết: 20 tiết - Bài tập : 10 tiết 5. Điều kiện tiên quyết: SV đã học xong học phần Lí thuyết xác suất 6. Mục tiêu học phần: Sinh viên nắm được các kiến thức cơ bản về thống kê để phục vụ cho các học phần khác và ứng dụng để giải quyết các bài toán thực tế. 7. Mô tả vắn tắt nội dung học phần: Trang bị cho sinh viên các kiến thức cơ bản về thống kê, bao gồm: Lý thuyết mẫu, ước lượng, kiểm định giả thuyết thống kê, tương quan và hồi quy. 8. Nhiệm vụ của sinh viên: - Dự lớp nghe giảng lý thuyết và tham gia thảo luận - Đọc trước tài liệu khi GV yêu cầu - Giải các bài tập luyện tập 24 9. Tài liệu học tập: - Giáo trình chính: Đào Hữu Hồ, Xác suất thống kê, NXB ĐHQGHN, 2007 - Sách tham khảo: Nguyễn Cao Văn – Trần Thái Ninh, Giáo trình lí thuyết xác suất và thống kê toán, NXB Thống kê, 2004 10. Tiêu chuẩn đánh giá sinh viên: - Kiểm tra giữa học phần: 30% - Thi kết thúc học phần: 70% 11. Thang điểm: 10 12. Nội dung chi tiết học phần: Chương 1: Lý thuyết mẫu: 6 TIẾT (5 LT/ 1 BT) 1.1 Cơ sở lí thuyết mẫu 1.1.1 Tổng thể 1.1.2 Mẫu ngẫu nhiên 1.2 Các đặc trưng của mẫu ngẫu nhiên 1.2.1 Trung bình mẫu ngẫu nhiên 25 1.2.2 Phương sai mẫu ngẫu nhiên 1.2.3 Phương sai điều chỉnh mẫu ngẫu nhiên 1.2.4 Độ lệch tiêu chuẩn 1.2.5 Độ lệch tiêu chuẩn điều chỉnh mẫu ngẫu nhiên Chương 2: Ước lượng các tham số: 8 TIẾT (5 LT/ 3 BT) 2.1 Phương pháp ước lượng điểm (phương pháp hàm ước lượng) 2.1.1 Mô tả phương pháp 2.1.2 Các tiêu chuẩn lựa chọn hàm ước lượng 2.2 Ước lượng tham số bằng khoảng tin cậy 2.2.1 Các bước chung 2.2.2 Ước lượng khoảng tin cậy cho kỳ vọng 2.2.3 Ước lượng khoảng tin cậy cho xác suất p 2.2.4 Ước lượng khoảng tin cậy cho phương sai 2.2.5 Xác định kích thước mẫu (tham khảo) Chương 3: Kiểm định giả thuyết thống kê: 8 TIẾT (5 LT/ 3 BT) 3.1 Các khái niệm 3.2 Kiểm định giả thuyết về giá trị trung bình 26 3.3 Kiểm định giả thuyết về tỷ lệ 3.4 Kiểm định giả thuyết về hai kỳ vọng của hai biến ngẫu nhiên 3.5 Kiểm định giả thuyết về sự bằng nhau của hai tỷ lệ 3.6 Kiểm định giả thuyết về phương sai của biến ngẫu nhiên Chương 4: Phân tích tương quan và hồi qui: 8 TIẾT (5 LT/ 3 BT) 4.1 Đặt vấn đề 4.2 Phân tích tương quan 4.3 Phân tích hồi qui (Nguồn: Bộ môn Toán, khoa Khoa học cơ bản, ĐH Công nghiệp HN, 2008) b. Các bài toán cơ bản của thống kê * Bài toán ước lượng tham số Ước lượng tham số là một trong những bài toán cơ bản của thống kê toán học. Khi nghiên cứu đặc tính X của của mỗi cá thể của tổng thể, nếu xác định được qui luật xác suất của X thì việc đưa ra các đánh giá cũng như các dự báo về sự biến động của tổng thể liên quan đến đặc tính này sẽ chính xác và khách quan. Tuy nhiên không phải lúc nào chúng ta cũng xác định được qui luật xác suất của X. Trong một số trường hợp, ta chỉ biết được dạng toán học của hàm phân phối hoặc hàm mật độ của biến định lượng X mà chưa biết các tham số có mặt trong chúng. Vì vậy để xác định qui luật xác suất của X trước hết phải đưa ra những đánh giá về các tham số này. Bài toán ước lượng tham số sẽ giúp ta giải quyết vấn đề trên. * Bài toán kiểm định giả thuyết Việc xác định qui luật xác suất của các biến có mặt trong tổng thể là một điều cần thiết trong xử lí số liệu. Bài toán ước lượng tham số mới giải 27 quyết việc ước lượng tham số có mặt trong phân phối xác suất của tổng thể. Trong bài toán kiểm định giả thuyết, chúng ta sẽ xây dựng các qui tắc đánh giá giả thuyết về các tham số, giả thuyết về các qui luật xác suất dựa trên mẫu ngẫu nhiên. Qua các qui tắc kiểm định, người học có thể biết được cách xây dựng các giả thuyết và đối thuyết trong từng trường hợp cụ thể. Bài toán kiểm định giả thuyết thống kê là một bài toán lớn và quan trọng của thống kê toán học. * Bài toán phân tích tương quan và hồi qui Trong các bài toán thực tiễn, việc giải quyết một vấn đề cụ thể đôi khi người ta phải nghiên cứu, phân tích nhiều chỉ tiêu, mỗi chỉ tiêu có thể được coi là một biến ngẫu nhiên. Phân tích mối quan hệ phụ thuộc giữa các chỉ tiêu đó là một phương pháp hữu hiệu giúp chúng ta có thể làm rõ hơn bản chất của hiện tượng hay sự việc cần nghiên cứu để tìm ra quy luật, dự đoán được xu thế biến động của nó. Nội dung của bài toán phân tích tương quan và hồi qui là nhằm trả lời các câu hỏi liên quan đến mức độ phụ thuộc giữa các biến ngẫu nhiên và xây dựng biểu thức của hàm mô tả mối phụ thuộc nói trên. 1.2.2. Những khó khăn trong giảng dạy, học tập thống kê a. Đối với người dạy Tuy không nặng về kiến thức lí thuyết hay tư duy trừu tượng, nhưng khó khăn lớn nhất đối với GV khi giảng dạy thống kê là làm sao cung cấp đầy đủ hệ thống công thức khá phức tạp mà không gây nhàm chán cho người học. Tiếp đó là phải làm sao hướng dẫn người học áp dụng thực hành xử lí số liệu thống kê bằng rất nhiều tính toán phức tạp, dễ nhầm lẫn. Nếu không có những công cụ xử lí và lưu trữ số liệu hiệu quả thì những tính toán sai sẽ không làm sáng tỏ được vấn đề cần ước lượng hay kiểm định. Hơn nữa thời gian lên lớp lại hạn chế, nếu chỉ tính toán bằng tay (cả khi có sự hỗ trợ của máy tính điện 28 tử thông thường) thì GV không đủ thời gian để giải thích minh họa các kết quả thu được. Những khó khăn này có thể được khắc phục hiệu quả nếu GV sử dụng các phần mềm hỗ trợ giảng dạy thống kê như là một công cụ dạy học trên lớp để giảm bớt khối lượng công việc và tạo hứng thú cho người học. b. Đối với người học Đối với người học nói chung và sinh viên khối ngành kinh tế nói riêng thì thống kê là một môn học khó. Trước hết vì trong thống kê có nhiều kí hiệu phức tạp, khối lượng tính toán lớn. Tâm lí chung của sinh viên là thường ngại học công thức vì dài và khó nhớ, nếu thuộc công thức rồi thì ngại thực hành vì phải tính toán nhiều. Đặc biệt nếu không có công cụ hỗ trợ thì nhiều khi các bạn sinh viên thường mải miết tính toán mà quên đi cái bản chất nằm sau những số liệu đó, dẫn đến không nhận thức được kết quả thu được phản ánh điều gì mà người làm thống kê cần quan tâm. Hơn nữa trong khoa Kinh tế thuộc ĐH Công Nghiệp Hà Nội thì đại đa số là sinh viên theo học ngành Kế toán, Tài chính ngân hàng, công việc của các bạn cũng đòi hỏi phải làm việc với rất nhiều số liệu. Việc trau dồi kĩ năng sử dụng một số phần mềm thống kê ngay từ khi còn ở trường Đại học cũng là một yếu tố thuận lợi hỗ trợ cho công việc sau này. Vì những lí do nêu trên tôi cho rằng sử dụng các phần mềm tin học trong giảng dạy thống kê là một vấn đề rất cần thiết đối với cả người dạy cũng như người học. 1.3 Giới thiệu một số phần mềm hỗ trợ giảng dạy phân tích thống kê 1.3.1. Phần mềm EXCEL EXCEL là phần mềm thông dụng để quản lý thông tin. Bảng tính Excel cũng như các chương trình quản lý cơ sở dữ liệu khác của Microsoft như MS Access, đều thích hợp cho việc vào số liệu từ các phiếu điều tra và cũng cho 29 phép kết chuyển số liệu sang các phần mềm xử lý khác trong đó có SPSS hay STATA. Một số lợi thế của bảng tính Excel là chương trình này sẵn có trong hầu hết các máy tính điện tử, đòi hỏi những hiểu biết tối thiểu và có thể tính toán trực tiếp ngay tại bảng tính (Hình 1.6). Hình 1.6. Một ví dụ của bảng tính Excel Tuy nhiên, một trong những hạn chế của định dạng cơ sở dữ liệu là ta phải thực hiện việc truy nhập dữ liệu một cách thủ công nên mất nhiều thời gian cũng như khả năng để xảy ra nhầm lẫn khá cao. Hay nói cách khác là nguy cơ tiềm ẩn của sai số phi thống kê cao. Ngoài ra, bảng tính Excel còn hạn chế các lệnh VBA trong những tính toán phức tạp; Không thích hợp trong việc tạo ra hàng loạt các báo cáo cho một mẫu. 1.3.2. Phần mềm MINITAB Minitab là một phần mềm máy tính giúp hiểu biết thêm về thống kê và tiết kiệm thời gian tính toán. Phần mềm này ban đầu được thiết kế để phục vụ việc giảng dạy môn thống kê, sau đó đã được phát triển thành công cụ phân tích và trình bày dữ liệu rất hữu hiệu. 30 Để có thể sử dụng Minitab trong môi trường máy tính cá nhân (Personal computer) người sử dụng cần làm quen với hệ điều hành, cầu trúc thư mục, ổ đĩa cứng và ổ đĩa mềm. Giao diện Minitab cho phép gõ các câu lệnh trong cửa sổ thao tác (Session Window) và thực thi chương trình bằng cách chọn lệnh từ thanh menu và điền đầy đủ yêu cầu vào các hộp hội thoại. Các câu lệnh và kết quả sẽ được thể hiện ở cửa sổ thao tác. Ngoài ra bạn có thể copy, edit và thực thi các lệnh đã có sẵn (Hình 1.7). Hình 1.7. Một ví dụ của chương trình Minitab Sau khi cài đặt, để vào Minitab for Windows ta click chuột theo đường dẫn: Start/Program/MINITAB 13 for Windows/MINITAB. Màn hình chính của Minitab gồm các phần: Menu Bar, Standard Toolbar, Project Manager Toolbar, Title Session Window, Data Window, Status Bar. Minitab làm việc với từng project, trong project sẽ có các cửa sổ: Data: Trình bày dữ liệu bảng tính dưới dạng hàng và cột, cho phép nhập liệu và làm việc với các dữ liệu này. Mỗi bảng tính (worksheet) có một cửa sổ dữ liệu (data window) riêng. Session: Trình bày kết quả phân tích dạng chữ. Có thể nhập lệnh vào trong session window. 31 Graph: Trình bày các đồ thị từ lệnh được yêu cầu, mỗi đồ thị sẽ được hiển thị trên một cửa sổ, trong một project hiển thị được tối đa 15 đồ thị. Info: trình bày tóm tắt về mỗi bảng tính History: Trình bày các câu lệnh đã thực hiện, không trình bày kết quả. Tóm lại, Minitab vận hành như một hộp đen, nhận dữ liệu đầu vào, phân tích, xử lí theo yêu cầu của người sử dụng sau đó hiển thị kết quả thông qua các cửa sổ đề cập ở trên. Dữ liệu đầu vào có thể nhận được thông qua nhập liệu trực tiếp hoặc lấy file dữ liệu của Minitab hay các ứng dụng bảng tính khác như Excel, Lotus. Kết quả phân tích của Minitab sẽ là các kết quả bằng số, bằng chữ và hình ảnh đồ thị. 1.3.3. Phần mềm STATA STATA là phần mềm thống kê sử dụng để quản lí, phân tích số liệu và vẽ đồ thị. STATA cho phép lưu trữ thông tin về các đặc điểm của đối tượng nghiên cứu. Điểm mạnh của phần mềm thống kê STATA là có cú pháp rõ ràng do đó dễ lập trình và sửa lỗi. STATA được khởi động tương tự như các chương trình tin học ứng dụng khác, bằng cách kích vào biểu tượng của tệp wstata.exe hoặc chọn STATR/PROGRAM/STATA. Chương trình được thoát ra bằng lệnh exit. Sau khi STATA được khởi động, giao diện STATA sẽ hiện lên bao gồm thanh thực đơn (menu bar) ở trên cùng, dưới đó là thanh công cụ (tool bar) và các cửa sổ (windows) (Hình 1.8). 32 Hình 1.8. Một ví dụ của chương trình Stata Các cửa sổ của STATA: Results: Hiển thị các lệnh và kết quả Graph: Hiển thị đồ thị Viewer: Hiển thị cửa sổ trợ giúp (help) và hiển thị nội dung các file văn bản (text) Command: Dùng để gõ các câu lệnh Review: Hiển thị các lệnh đã thực hiện Variables: Hiển thị danh sách các biến của tệp số liệu Data editor: Hiển thị và sửa chữa dữ liệu dưới dạng bảng Do-file editor: Hiển thị cửa sổ để soạn thảo chương trình Sau đây là một số lệnh hay sử dụng trong STATA: Tạo biến mới: gen bienmoi Tạo biến mới bằng với biến khác : gen bienmoi=biencu Mã hóa lại biến mới: recode bienmoi (dieukien1/dieukien2=1) (dieukien3/dieukien4=2)(..) Mô tả biến định tính: tab bien hoặc tab1 bien1 bien2 bien3 33 Mô tả biến định lượng: sum bien1 bien2 bien3 hoặc sum bien1 bien2, detail để có trung vị và các số liệu chi tiết Tạo nhãn : VD: label define gioitinh 1 “nam” 2 “nu” Dán nhãn cho biến: label value bientruoc nhansau 34 CHƢƠNG 2 MỘT SỐ GIÁO ÁN GIẢNG DẠY THỐNG KÊ VỚI SỰ HỖ TRỢ CỦA CÁC PHẦN MỀM EXCEL, MINITAB và STATA 2.1. Giảng dạy bài “Ƣớc lƣợng khoảng tin cậy cho kỳ vọng của biến ngẫu nhiên” với sự hỗ trợ của phần mềm MINITAB 2.1.1. Đề cương bài giảng Ƣớc lƣợng khoảng tin cậy cho kỳ vọng của biến ngẫu nhiên Nội dung: Mục 2.2.1 và 2.2.2 trong đề cương chi tiết học phần Thời gian: 45 phút 1. Bài toán ƣớc lƣợng khoảng Ước lượng điểm dù tốt nhất cũng chỉ cho ta một giá trị trong tập vô hạn nên ta không biết được độ chính xác cũng như xác xuất để ước lượng có độ chính xác, do đó không đánh giá được độ sai lầm khi dùng  thay cho  . Để khác phục các hạn chế đó người ta đưa ra khái niệm ước lượng khoảng tin cậy cho tham số  , theo định nghĩa dựa vào một thống kê   G( X1 , X 2 ,..., X n ) tìm khoảng (b,c) sao cho: P(b    c)    1   (1) Trong đó   1   là xác xuất cho trước gọi là độ tin cậy ước lượng, do đó α là khả năng mắc sai lầm của ước lượng, còn (b,c) gọi là khoảng tin cậy. 2. Các bƣớc chung Để ước lượng một tham số θ, ta thực hiện các bước như sau: a. Chọn một thống kê G  G( X1 , X 2 ,..., X n ) làm hàm ước lượng của θ sao cho G có phân phối được xác định hoàn toàn và không phụ thuộc θ. 35 b. Với độ tin cậy   1   cho trước tìm một cặp 1 , 2 sao cho 1   2   (1 , 2 ,  0) . c. Tìm các phân vị g1 , g 2 thỏa mãn điều kiện: P(G  g1 )  1 và P(G  g1 )  1 (2) Khi đó ta có: P( g1  G( X1 ,..., X n )  g12 )  1  1   2  1   (3) d. Bằng các phép biến đổi tương đương đưa bất đẳng thức (3) về dạng: P(b    c)  1     (4) Khoảng (b,c) tìm được từ (4) là khoảng tin cậy cần tìm. Trong thực tế ta thường cho độ tin cậy   1   khá lớn (1 – α = 0.95, hoặc 0.99, hoặc 0.999). Như vậy nếu γ càng lớn và độ dài khoảng (b,c) càng nhỏ thì ước lượng càng chính xác. Nói chung khoảng tin cậy (b,c) phụ thuộc vào tham số cần ước lượng và hàm ước lượng G  G( X1 , X 2 ,..., X n ) . Ta chỉ xét trường hợp chung: 1   2   2  1  2 3. Ƣớc lƣợng khoảng tin cậy cho kỳ vọng Giả sử đại lượng ngẫu nhiên X có phân phối chuẩn N (a, 2 ) , với a chưa biết. Từ mẫu thống kê (X1, X2,…,Xn) của X và độ tin cậy trước ta cần tìm khoảng tin cậy cho EX = a. a. Trƣờng hợp 1: (Đã biết phương sai    0 ) 2 Chọn thống kê: 36 2   1   cho U X a 0  n (5) do X có phân phối chuẩn N (a, ) nên U có phân phối chuẩn tắc N (0,1). 2 Do 1   2   2  1  từ các phân vị: 2 P(U  u )  2  2 và P(U  u 1  )  1 2 Trong đó u được xác định từ Φ( u ) = 2 2 (6) 2  bằng cách tra bảng của hàm 2 2 x Laplace Φ(x) =  t  1 e 2 dt .  2 0 Thay giá trị của thống kê U tại mẫu thống kê, bất phương trình (6) cho ta khoảng ước lượng cần tìm là: x 0 n  u  a  x  0 2 n  u (7) 2 Hay khoảng tin cậy:     (b, c)   x  0  u , x  0  u  n 2 n 2  (8) VÍ DỤ 1: Gọi X là mức xăng tiêu thụ của một loại taxi (lít/km). Giả sử kiểm tra ngẫu nhiên 8 chiếc xe và thu được các kết quả: 4,9; 4,7; 5,1; 5,4; 4,7; 5,2; 4,8; 5,1 5 Biết rằng mức xăng tiêu thụ có phân phối chuẩn với độ lệch σ = 0,2. Hãy 37 xây dựng khoảng tin cậy 95% cho mức xăng tiêu thụ trung bình của loại taxi trên. Giải: Phương pháp 1: Tính toán bằng tay Phương pháp 2: Sử dụng phần mềm Minitab - Bước 1: Nhập vào cột C1 8 giá trị của mẫu, bao gồm: 4,9; 4,7; 5,1; 5,4; 4,7; 5,2; 4,8; 5,1 - Bước 2: Nhấn: Stat > Basic Statistics > 1-Sample Z Sau đó nhập C1 vào mục Variables và 0.2 vào mục Sigma. - Bước 3: Nhấp chuột vào Option và nhập 95 vào mục Confidence Level - Bước 4: Chọn not equa1 ở mục Alternative. Sau đó chọn OK. Cuối cùng ta có ngay kết quả trên màn hình Minitab như sau: One-Sample Z: C1 The assumed sigma = 0.2 Variable N Mean StDev SE Mean 95.0% CI C1 8 4.9875 0.2532 0.0707 (4.8489,5.1261) Vậy với x  4,9875 và σ = 0,2 ta có khoảng tin cậy 95% cho mức xăng tiêu thụ trung bình là (4.8489, 5.1261). Hay nói cách khác, có 5% chiếc xe có mức tiêu thụ xăng nằm ngoài khoảng này. b. Trƣờng hợp 2 (Chưa biết phương sai σ2 và n ≤30) Do X có phân phối chuẩn nên T có phân phối Student với (n-1) bậc tự do. Do 1   2   2  1  từ các phân vị: 2 38 P(T  t  ( n1, ) 2 )  2 và P(T  t  ( n1,1 ) 2 )  1  2 Do T có phân bố đối xứng và dùng phân vị hai đuôi: P( T  t( n, ) )   Trong đó t(n-1,α) được tra từ bảng, hay dùng hàm trong Excel : t(n,p) = TINV (p,v) Thay giá trị của thống kê T tại mẫu thống kê ta có:   s'  s'  ( a, b)   x   t( n1, ) , x   t( n1, )  n n   (9) VÍ DỤ 2: Cân ngẫu nhiên 25 bao xi măng ta được kết quả sau: X 47 47 49 50 52 52 53 ni 2 3 4 6 5 3 2 Tìm khoảng tin cậy 95% cho trọng lượng trung bình a, biết trọng lượng X của bao xi măng tuân theo phần phối chuẩn N (α,σ2) với σ chưa biết? Giải: Lập bảng tính EXCEL được: 1 A B C D X ni ni.xi ni.xi2 39 2 47 2 94 4418 3 48 3 144 6912 4 49 4 196 9604 5 50 6 300 15000 6 51 5 255 13005 7 52 3 156 8112 8 53 2 106 5618 25 B = 1251 C = 62669 9 x B  50.04 n s '2  2.873333 Tra bảng: s2  C  x 2  2.7584 n s '  1.695091 t(24,0,05) = 2.063898 Vậy khoảng cần tìm là: 1.6951 1.6951   (b, c)   50.04  2.0639,50.04  2.0639   (49.3403,50.7397) 5 5   c. Trƣờng hợp 3 (Chưa biết phương sai σ2 và n>30) T có phân phối Student, (trong bảng phân phối Student chỉ cho đến n=30) vì phân phối Student với n bậc tự do là phân phối tiệm cận chuẩn nên khi n khá lớn (n>30) ta có thể dùng phân phối chuẩn thay cho phân phối Student. Khi đó khoảng ước lượng là: 40   s'  s'  ( a, b)   x   u , x   u  n 2 n 2  Ф (u )  Trong đó: 2 (10)  2 VÍ DỤ 3: Gọi X là mức tiêu thụ xăng của một loại taxi (lít/100km). Người ta kiểm tra 36 chiếc và thu kết quả sau: X 4.5 4.8 5.1 5.3 5.6 5.9 6.2 6.4 ni 3 5 6 7 6 4 3 2 Với độ tin cậy 95%, hãy xác định khoảng ước lượng cho mức hao phí xăng trung bình cho 100 km của loại taxi trên? Giải: T tuân theo phân phối Student t(35). Vì n = 36>30 nên ta dùng phân phối chuẩn. Lập bảng tính EXCEL: A B C D 1 X ni ni.xi ni.xi2 2 4.5 3 13.5 60.75 3 4.8 5 24 115.2 4 5.1 6 30.6 156.06 41 x 5 5.3 7 37.1 196.63 6 5.6 6 33.6 188.16 7 5.8 4 23.6 139.24 8 6.2 3 18.6 115.32 9 6.4 2 12.6 81.92 10 Σ 36 B = 193.8 C = 1053.28 193,8  5,383333 36 s '2  s2  36 0,2775  0,2854 35 1053,28 2  x  0,2775 36 s '  0,5342u  1,96 2 Khoảng ước lượng: 0.5342 0.5342   (b, c)   5.3833  1.96,5.3833  1.96   (5.2088,5.5579) 6 6   Vậy mức tiêu thụ xăng của loại taxi trên nằm trong khoảng từ 5,2008 lít đến 5,5579 lít trên 100 km với độ tin cậy 95%. 2.1.2. Giáo án Giáo án số: 9 Số tiết: 01 Lớp ĐH KT1 ĐH KT2 Khóa 3 Thời gian 11/5/2010 ĐH KT3 ĐHQTKD1 ĐHQTKD2 Khóa 3 Khóa 3 Khóa 3 Khóa 3 11/5/2010 13/5/2010 12/5/2010 12/5/2010 42  Tên bài học: Ƣớc lƣợng khoảng tin cậy cho kỳ vọng của biến ngẫu nhiên  Mục đích: Cung cấp cho sinh viên các kiến thức về phương pháp ước lượng tham số bằng khoảng tin cậy, áp dụng tìm khoảng tin cậy cho kỳ vọng của biến ngẫu nhiên.  Yêu cầu:  Sinh viên nắm được vấn đề của bài toán ước lượng tham số nói chung và công thức ước lượng bằng khoảng tin cậy cho kỳ vọng nói riêng.  Sinh viên thao tác được bằng tay và bước đầu biết cách sử dụng phần mềm EXCEL, MINITAB trong tính toán để xác định khoảng tin cậy cần tìm. I. ỔN ĐỊNH LỚP Thời gian: 1 phút. Nội dung cần nhắc nhở: ……………...………………………………………... II. KIỂM TRA BÀI CŨ Thời gian: 5 phút Dự kiến học sinh kiểm tra: TênSV-Lớp Đánh giá Câu hỏi kiểm tra: Nêu các bước ước lượng điểm cho kỳ vọng của tổng thể, biết mẫu có kích thước n= 25, trường hợp phương sai chưa biết. III. GIẢNG BÀI MỚI Đồ dùng dạy học: Đề cương bài giảng, giáo án, lịch giảng dạy, sách tham khảo, phấn, bảng, micro, máy tính điện tử bỏ túi Fx500, máy tính cá nhân, máy chiếu. Nội dung, phƣơng pháp: 43 Thời TT Nội dung giảng dạy gian Phƣơng pháp thực hiện (phút) 1. 2. Bài toán ƣớc lƣợng khoảng 5 Thuyết trình, vấn đáp gợi mở Giới thiệu nội dung bài giảng, để SV thấy được sự khác đặt vấn đề từ bài toán ước lượng nhau giữa phương pháp ước điểm sang bài toán ước lượng lượng điểm và phương pháp bằng khoảng tin cậy. ước lượng khoảng. Các bƣớc chung trong bài toán 5 Giảng giải, minh họa ƣớc lƣợng khoảng 3. Ƣớc lƣợng khoảng tin cậy cho 20 Thuyết trình, minh họa. kì vọng GV hướng dẫn SV tính toán a. Trường hợp 1: bằng tay và so sánh với việc (Đã biết phương sai    2 sử 2 0) dụng phần mềm MINITAB phục vụ cho tính b. Trường hợp 2 toán. Minh họa bằng các (Chưa biết phương sai σ2 và bảng tính GV đã chuẩn bị trong đề cương bài giảng. n≤30) c. Trường hợp 3 (Chưa biết phương sai σ2 và n>30) IV. TỔNG KẾT BÀI 44 Thời gian: 4 phút - Nội dung phương pháp ước lượng khoảng - Hệ thống công thức áp dụng - Kỹ năng tính toán bằng phần mềm MINITAB và EXCEL V. CÂU HỎI VÀ BÀI TẬP Thời gian: 5 phút Bài tập: Theo dõi số giờ tự học trong ngày của 1000 sinh viên ĐH Công Nghiệp HN ta thu được kết quả sau: Số giờ 1-2 2-3 3-4 4-5 5-6 6-7 7-8 8-9 Số SV 20 100 180 240 260 120 60 20 Hãy ước lượng khoảng tin cậy 95% cho số giờ tự học trung bình/ ngày của sinh viên ĐH Công nghiệp. 2.2. Giảng dạy bài “Ƣớc lƣợng khoảng tin cậy cho xác suất và phƣơng sai của biến ngẫu nhiên” với sự hỗ trợ của phần mềm EXCEL 2.2.1. Đề cương bài giảng Ƣớc lƣợng khoảng tin cậy cho xác xuất và phƣơng sai của biến ngẫu nhiên Nội dung: Mục 2.2.3 và 2.2.4 trong đề cương chi tiết học phần Thời gian: 45 phút 1. Ƣớc lƣợng khoảng tin cậy cho xác xuất p Nếu trong phép lấy mẫu ta chỉ quan tâm đến sự xuất hiện hay không xuất hiện dấu hiệu A với xác xuất P(A) = p chưa biết, khi đó X là đại lượng ngẫu nhiên có phân phối Bernoulli, X ~ B (1,p) và ta cần ước lượng xác suất P(A)=p. Ta có các đặc trưng mẫu tương ứng là: 45 X m  f, n EX  p, DX  p(1  p) n Nếu ta chọn thống kê: Z f p n f (1  f ) khi n khá lớn Z   L N (0.1). Khi đó với kích thước mẫu n đủ lớn, n thỏa mãn : nf > 10 và n(1-f) > 10 có thể áp dụng các công thức ước lượng khoảng tin cậy cho xác suất p với độ tin cậy γ = 1 – α chưa biết phương sai :  (b, c)   f  u 2  f (1  f ) ; f  u n 2 trong đó u được xác định từ Ф (u )  2 2  2 f (1  f )   n  (11) . VÍ DỤ 1 : Tại vùng rừng nguyên sinh, người ta đeo vòng cho 1000 con chim. Sau một thời gian bắt lại 200 con thì có 40 con có đeo vòng. Thử ước lượng số chim trong vùng với độ tin cậy 99% ? Giải : Trên tập mẫu 200 chim ta có tần suất mẫu của chim đeo vòng là f  40  0,2 . Kiểm tra (6-25) : 200 nf = 200.0,2 = 40 > 10, n(1-f) = 200.0,8 = 160>10 46 Chọn thống kê : Z f p 200 f (1  f ) Z có phân phối tiệm cận chuẩn. Với γ = 1 – α = 0,99 ta có : Ф (u )  2  2 = 0,45 = Ф(2,575) Theo công thức (6): 0,2.0,8 0,2.0,8  p  0,2  2,575 200 200 0,2  2,575 Hay: 0,1271 < p < 0,2729 Từ đó số chim của vùng sẽ nằm trong khoảng:  1000 1000   0,2729 ; 0,1271   (3445;7880)   2. Ƣớc lƣợng khoảng tin cậy cho phƣơng sai Giả sử đại lượng ngẫu nhiên X có phân phối chuẩn N (a,σ2), với σ2 chưa biết. Từ mẫu thống kê (x1, x2, …,xn) của X và độ tin cậy γ cho trước ta tìm khoảng tin cậy cho DX = σ2. a. Trƣờng hợp 1 : (đã biết kỳ vọng a = a0) Chọn thống kê:   2 1  2 Nó có phân phối k  n .( X i 1 i i  a0 )2  2 với n bậc tự do. 47 Do 1   2   2  P(  2   2 1  từ các phân vị: 2   ( n, ) 2 trong đó 2  ( n, ) 2 và 2  ( n ,1 ) 2  2 và P(    2 2  ( n ,1 ) 2  1  nhận được bằng tra bảng phân vị 2 2. Hay dùng hàm Excel: (2n, p )  CHIINV ( p, n) Do dùng bảng phân vị đuôi phải P(   ( n, ) )   nên: 2  2 1 k p     2  ni .( xi  a0 ) 2   2  n,  n,1 2  i1 2 2    1  Hay khoảng tin cậy cần tìm là: k  k 2 2    ni ( xi  a0 )  ni ( xi  a0 )   (b, c)   i1 ; i1 2 2       ( n, ) ( n ,1 )   2 2   (12) VÍ DỤ 2: Chất lượng thảm bê tông nhựa cho mặt đường bộ với độ dầy cho trước phụ thuôc vào sự đồng đều của phần mặt thảm. Nếu bình phương trung bình độ dầy mặt thảm sai lệch không quá 5% độ dày quy quy định là mặt thảm đạt chất lượng. Với độ tin cậy 95% hay kiểm tra mặt thảm của một đoạn đường có thiết kế lớp thảm dầy 10cm với kết quả kiểm tra thu được cho bảng trên sau: 48 X 8,9 9,1 9,3 9,5 9,7 9,9 10,1 10,3 10,5 ni 1 2 3 5 6 4 4 3 2 Giải: Ta thấy kỳ vọng a = 10 là độ dày thiết kế đã cho, chon thống kê:   2 có phân phối 1  2 9  n .( X i i 1 i  10)2 2 .  (30) Với   0.05,  2  0.025,1   2  0.975 . Lập bảng tính trong EXCEL: X ni xi – a ni.(xi – a)2 8.9 1 -1.1 1.21 9.1 2 -0.9 1.62 9.3 3 -0.7 1.45 9.5 5 -0.5 1.25 9.7 6 -0.3 0.54 9.9 4 -0.1 0.04 10.1 4 0.1 0.04 10.3 3 0.3 0.27 49 10.5 2 Σ 30 0.5 0.5 C = 6.94 2 (30,0.975)  16,7908 2 (30,0.025)  46,9792 b C 2 b  0,1477  C 2  0,4133  ( n ,1 ) 2 ( n, ) 2 Vậy khoảng ước lượng cho phương sai: (b,c) = (0.1477,0.4133) hay độ lệch bình phương trung bình lớp thảm từ 0,14 đến 0,41 cm nhỏ hơn 5% cho phép nên coi lớp thảm đạt chất lượng. Để tra bảng phân phối có giá trị α = 0,025 ta được 2 ta dóng hàng có giá trị bằng 30 và cột (30,0.025) 2 2 (30,0.025)  47,0 . Tương tự (30,0.975)  16,8 . b. Trƣờng hợp 2: (Chưa biết kỳ vọng EX = a) Ta thay a = X và chọn thống kê:   2 (n  1) S '2  2  1  2 k  n .( X i 1 i i  X )2 nó có phân phối  2 với n – 1 bậc tự do. Thực hiện tương tự như các trường hợp trên ta thu được khoảng ước lượng:   '2 '2 ( n  1) s ( n  1) s   (b, c)   2 ; 2       ( n1, ) ( n1,1 )   2 2  50 Chú ý: Nếu không biết luật phân phối của đại lượng ngẫu nhiên, nhưng với kích thước mẫu n lớn (n>30) khi đó đại lượng ngẫu nhiên có phân phối tiệm cận chuẩn. Để ước lượng khoảng tin cậy của các đại lượng thống kê ta xem như đại lượng ngẫu nhiên có phân phối chuẩn và áp dụng các công thức đã cho để tính. VÍ DỤ 3: Giả sử độ dày của bản kim loại tuân theo luật phân phối chuẩn. Đo 40 bản kim loại ta thu được số liệu sau: X 3,8 3,9 4,0 4,1 4,2 4,3 4,4 4,5 ni 1 2 6 10 12 5 3 1 Hãy xác định: a. Khoảng tin cậy 90% cho độ dày trung bình của bản? b. Khoảng tin cậy 95% cho phương sai của độ dày? Giải: Lập bảng tính: X ni ni.xi ni.xi2 3.8 1 3.8 14.44 3.9 2 7.8 30.42 4 6 24 96 4.1 10 41 168.1 4.2 12 50.4 211.68 51 x 4.3 5 21.5 92.45 4.4 3 13.2 58.08 4.5 1 4.5 20,25 Σ n = 40 B = 166.2 C = 691.42 B  4,155 n s2  C  x 2  0,0215 n s '2  u  1,6448 Ф (u )  0,45 s’ = 0,1484 n 2 s  0,22026 n 1 2 2 Khoảng tin cậy cho kỳ vọng: (a,b) = (4.1164,4.1936) Tra bảng: 2 (0.025;39)  58,12005 2 (0.975;39)  23,6543 Khoảng ước lượng cho phương sai:  39.0,0220 39.0,0220  (c, d )   ;   (4,1164;4,1936)  58,1200 23,6543  2.2.2. Giáo án Giáo án số: 10 Số tiết: 01 Lớp ĐH KT1 ĐH KT2 Khóa 3 Thời gian 11/5/2010 ĐH KT3 ĐHQTKD1 ĐHQTKD2 Khóa 3 Khóa 3 Khóa 3 Khóa 3 11/5/2010 13/5/2010 12/5/2010 12/5/2010 52  Tên bài học: Ƣớc lƣợng khoảng tin cậy cho xác xuất và phƣơng sai của biến ngẫu nhiên  Mục đích: Cung cấp cho sinh viên các công thức và kỹ năng xác định khoảng tin cậy cho xác suất và phương sai.  Yêu cầu:  Sinh viên nắm được công thức ước lượng bằng khoảng tin cậy đối xứng cho xác suất và phương sai trong các trường hợp.  Sinh viên thao tác được bằng tay và bước đầu biết cách sử dụng phần mềm EXCEL trong tính toán để xác định khoảng tin cậy cần tìm I. ỔN ĐỊNH LỚP Thời gian: 1 phút. Nội dung cần nhắc nhở: ……………...………………………………………... II. KIỂM TRA BÀI CŨ Thời gian: 5 phút Dự kiến học sinh kiểm tra: TênSV-Lớp Đánh giá Câu hỏi kiểm tra: Nêu các bước ước lượng khoảng cho kỳ vọng của tổng thể, biết mẫu có kích thước n= 35, trường hợp phương sai chưa biết. III. GIẢNG BÀI MỚI Đồ dùng dạy học: Đề cương bài giảng, giáo án, lịch giảng dạy, sách tham khảo, phấn, bảng, micro, máy tính điện tử bỏ túi Fx500, máy tính cá nhân, máy chiếu. Nội dung, phƣơng pháp: 53 Thời TT Nội dung giảng dạy gian Phƣơng pháp thực hiện (phút) 1. Ƣớc lƣợng khoảng tin cậy cho 10 Thuyết trình, vấn đáp gợi mở xác suất p 2. Ƣớc lƣợng khoảng tin cậy cho Thuyết trình, minh họa. phƣơng sai 10 a. Trường hợp 1: GV hướng dẫn SV tính toán bằng tay và so sánh với việc (Đã biết kỳ vọng EX = a0) sử dụng một số hàm và lập bảng tính EXCEL phục vụ b. Trường hợp 2: 10 cho tính toán. Minh họa bằng các bảng tính GV đã chuẩn (Chưa biết kỳ vọng EX = a) bị trong đề cương bài giảng. IV. TỔNG KẾT BÀI Thời gian: 4 phút - Hệ thống công thức áp dụng - Kỹ năng tính toán bằng phần mềm EXCEL V. CÂU HỎI VÀ BÀI TẬP Thời gian: 5 phút Bài tập: Theo dõi số giờ tự học trong ngày của 1000 sinh viên ĐH Công Nghiệp HN ta thu được kết quả sau: 54 Số giờ 1-2 2-3 3-4 4-5 5-6 6-7 7-8 8-9 Số SV 20 100 180 240 260 120 60 20 Hãy ước lượng khoảng tin cậy 98% cho độ lệch trung bình của số giờ tự học của sinh viên ĐH Công nghiệp. 2.3 Sử dụng STATA giảng dạy bài “Phân tích tƣơng quan” 2.3.1. Đề cương bài giảng Phân tích tƣơng quan Nội dung: Mục 4.2 trong đề cương chi tiết học phần Thời gian: 90 phút I. Phân tích tƣơng quan bảng số liệu định lƣợng Chúng ta tiến hành phân tích tương quan chủ yếu dựa trên cơ sở phân tích hai đặc trưng cơ bản là hệ số tương quan (trường hợp hai biến ngẫu nhiên) và hệ số tương quan riêng phần (trường hợp nhiều hơn hai biến ngẫu nhiên). I.1. Phân tích hệ số tương quan Giả sử X và Y là hai biến ngẫu nhiên có Var(X) > 0 và Var(Y) > 0. Hệ số tương quan của hai biến ngẫu nhiên là X và Y, ký hiệu là ρxy và được xác định như sau:  xy  E ( X  EX )(Y  YE ) Var( X ) Var(Y ) Như chúng ta đã biết có thể dùng ρxy để đo mức độ phụ thuộc tuyến tính giữa hai biến ngẫu nhiên.  càng lớn thì sự phụ thuộc tuyến tính càng rõ. Trường hợp đặc biệt ρxy = 0 thì ta nói giữa X và Y không có sự tương quan với nhau. Nếu X và Y độc lập với nhau thì ρxy = 0, điều ngược lại chưa chắc đã đúng. Tuy nhiên đối với biến ngẫu nhiên có phân phối chuẩn thì sự độc lập 55 và không tương quan là tương đương nhau. Trong trường hợp tổng quát cần phân biệt hai khái niệm độc lập và không tương quan giữa hai biến ngẫu nhiên. Định nghĩa. Giả sử ta có {(Xi, Yi)} i = 1, n là một mẫu ngẫu nhiên hai chiều thu được khi quan sát vecto ngẫu nhiên (X, Y) thì hệ số tương quan mẫu rxy của X và Y được xác định như sau:  ( X  X )(Y  Y ) i i i rxy  n (X  X )  (Y  Y ) 2 i i i n  2 i n XY  XY X 2  ( X ) 2 Y 2  (Y ) 2 XY  XY (1) MS X MSY  Trong đó: X   ; X X    2 i i X n Y   ; Y 2 i i n  Y   2 i i Y n 2 i i n XY  XY  i i i n VÍ DỤ 1: Chúng ta xét tệp số liệu có tên là XSTK10_1.dta về một số chỉ tiêu phát triển kinh tế Việt Nam trong thời kỳ 1980 – 1996 (đơn vị tính 1000 tỷ đồng VN năm 1989). Nội dung của tập số liệu đó như sau: Bảng2.1 56  Contains data from C: \ WINSTATA/XSTK10_1.DTA obs: 17 vars: 6 size: 476 (85.9% of memory free) 11 Aug 2009 19:02 1. nam float %9 . 0g Năm thống kê 2. gdp float %9 . 2g Tong gia tri san pham trong nuoc 3. ex float %9 . 2g Tong gia tri hang hoa xuat khau 4. im float %9 . 2g Tong gia tri hang hoa nhap khau 5. gip float %9 . 2g Tong gia tri h.hoa cong nghiep 6. gap float %9 . 0g Tong gia tri h.hoa cong nghiep Sorted by:  list nam gdp ex im gip gap 1. 1980 16.80 .30 6.80 6.80 9.7 2. 1981 17.20 .40 6.90 6.90 10.1 3. 1982 18.70 .50 7.50 7.50 11.2 4. 1983 20.10 .60 8.50 8.50 11.5 5. 1984 21.80 .60 9.60 9.60 12.2 6. 1985 23.00 .70 10.50 10.50 12.5 7. 1986 23.80 .80 11.20 11.20 13.1 8. 1987 24.70 .90 12.30 12.30 13.1 9. 1988 25.90 1.00 14.00 14.00 13.7 57 10. 1989 28.00 1.90 13.60 13.60 14.7 11. 1990 19.50 2.40 14.00 14.00 14.9 12. 1991 31.30 2.10 15.50 15.50 15.4 13. 1992 34.00 2.60 18.10 18.10 16.6 14. 1993 36.70 3.00 20.40 20.40 17.6 15. 1994 40.00 4.10 23.20 23.20 18.6 16. 1995 43.80 5.37 26.50 26.50 19.4 17. 1996 47.90 7.10 30.23 30.23 20.35 Kí hiệu Y = (gdp) và X = (gap), để tính hệ số tương quan (mẫu) rxy ta lập bảng tính toán sau đây: STT yi xi yi2 xi2 xi yi 1 16.8 9.70 282.24 94.0900 162.9600 2 17.2 10.10 295.84 102.0100 173.7200 3 18.7 11.20 349.69 125.4400 209.4400 4 20.1 11.50 404.01 132.2500 231.1500 5 21.8 12.20 475.24 148.8400 265.9600 6 23.0 12.50 529.00 156.2500 287.5000 7 23.8 13.10 566.44 171.6100 311.7800 8 24.7 13.10 610.09 176.6100 323.5700 9 25.9 13.70 670.81 187.6900 354.8300 58 10 28.0 14.70 784.00 216.0900 411.6000 11 29.5 14.90 870.25 222.0100 439.5500 12 31.3 15.40 979.69 237.1600 482.0200 13 34.0 16.60 1156.00 275.5600 564.4000 14 36.7 17.60 1346.89 309.7600 645.9200 15 40.0 18.60 1600.00 345.9600 744.0000 16 43.8 19.40 1918.44 376.3600 849.7200 17 47.9 20.35 2294.41 4144.1225 974.7650 ∑ 483.2 244.65 15133.04 36686.8125 7432.8850 Từ kết quả trên thu được: X  14,3912 , X  216,8713 2 Y  28,4235 , Y  890,1788 , XY  437,2285 2 Áp dụng công thức (1) ta được: 437,2285  14,3912.28,4235 216,8713  14,39122 890,1788  28,42352 rxy   28,180  0,9942 3,1248.9,07 Trường hợp nếu chúng ta cần xét p biến ngẫu nhiên X1, X2,…,Xp (p>2) ta ký hiệu rx y  rij , khi đó ta có tập hợp {rij}; i, j  1, p là ma trận hệ số i j tương quan của p biến ngẫu nhiên nói trên. Dễ dàng thấy rằng {rij} là ma trận đối xứng và các phần tử trên đường chéo là rij=1. Với số liệu đã cho ở bảng 10.1 STATA cho ta ma trận hệ số tương quan của các biến gdp, ex, im, gip, 59 gap như sau: Bảng 2.2  corr gdp ex im gip gap (obs = 17) gdp ex im gip Gdp 1.000 ex 0.9653 1.000 im 0.8926 0.9605 1.000 gip 0.9942 0.9720 0.9244 1.000 gap 0.9942 0.9375 0.8508 0.9815 gap 1.0000 Qua bảng hệ số tương quan trên ta thấy các chỉ tiêu (biến ngẫu nhiên) nói trên có sự tương quan với nhau rất mạnh, hầu hết hệ số tương quan giữa các cặp đều lớn hơn 0,9. Điều đó chứng tỏ rất có khả năng giữa chúng tồn tại mối quan hệ phụ thuộc tuyến tính. a. Khoảng tin cậy cho hệ số tương quan ρxy Fisher đã chứng minh rằng ngay với những giá trị n (kích thước mẫu) không lớn lắm, ta có thống kê Z sau đây: 1 1  rxy Z  ln 2 1  rxy 60 Cũng có phân phối xấp xỉ chuẩn với 1 1   XY  XY 1 E ( Z )  ln  và Var( Z )  2 1   XY 2(n  1) n3 Từ đây ta có khoảng tin cậy (1-α) của 1 1   XY là: ln 2 1   XY  rXY 1 rXY 1  ;Z   u  Z  2(n  1)  u 2  2 2(n  1) n3 n3  Tra bảng các giá trị của hàm 1 1  ta sẽ suy ra khoảng tin cập cho ln 2 1  hệ số tương quan ρxy. b. Kiểm định giả thuyết về giá trị của ρ Xét cặp giả thuyết: H 0 : (  XY  0 ) H1 : (  XY  0 ) Sử dụng thống kê Z nêu trên ta thấy nếu H0 đúng thì:  0  1 1  0 U   Z  ln   n3 2 1   2( n  1)   0 sẽ có phân phối xấp xỉ chuẩn N(0,2). Do đó miền bác bỏ để kiểm định cặp giả thiết trên là:    0  1 1  0 w   U   Z  ln  n  3; U  u  2  2 1   2( n  1)   0   Trường hợp đặc biệt ta giả thiết X và Y đều tuân theo quy luật phân 61 phối chuẩn. Xét cặp giả thuyết H 0 : (  XY  0 ) H1 : (  XY  0 ) Với kích thước mẫu bất kỳ ta luôn có: T  rxy n2 1  rxy2 tuân theo quy luật phân phối Student với bậc tự do (n-2). Vậy miền bác bỏ để kiểm định cặp giả thuyết trên là:   n2  ( n  2)  w   t  rxy ; t  t 2  2 1  r   xy   I.2. Phân tích hệ số tương quan riêng phần Xét tập hợp biến ngẫu nhiên X1, X2,…,Xp. Hệ số tương qan riêng phần của X1 và X2 khi X3 cố định kí hiệu là r1,2,3. Khi đó ta có công thức xác định r1,2,3 như sau: r12,3  r12  r13 r23 (1  r132 )(1  r232 ) Tổng quát ta có hệ số tương quan riêng phần của Xi và Xj khi cố định Xk là rij,k: rij ,k  rij  rik rjk (1  rik2 )(1  rjk2 ) (2) Hệ số tương quan riêng phần giữa X1 và X2 khi cố định X3, X4 là: 62 r12,34  r12,3  r14,3 r24,3 2 2 (1  r14,3 )(1  r24,3 ) Tương tự ta sẽ có công thức xác định hệ số tương quan riêng phần giữa X1 với X2 khi côs định X3, X4,…Xp là: r12,34... p  r12,34...( p1)  r1 p ,34...( p 1) r2 p ,34...( p 1) (1  r12p ,34...( p 1) )(1  r22p ,34...( p 1) ) Trên thực tế khi cần nghiên cứu một tập biến ngẫu nhiên X1, X2,…Xp thì chúng ta thường quan tâm đến hệ số tương quan riêng phần của một biến nào đó (thông thường là biến mà chúng ta đang muốn quan tâm phân tích, giải thích sự biến động của nó) với tất cả các biến còn lại. Ví dụ đó là biến X1 chẳng hạn thì đơn giản chúng ta chỉ cần viết: r12,…(Hệ số tương quan riêng phần của X1, X2 khi X3, X4,…,Xp cố định). … r1p,…(Hệ số tương quan riêng phần của X1, Xp khi X2, X3,…,Xp-1 cố định). VÍ DỤ 2: Căn cứ vào ma trận hệ số tương quan (bảng 10.3) chúng ta sẽ tính hệ số tương quan riêng phần của X1 = (gdp) với X2 = (ex) và X3 = (im). Theo công thức (2) ta có: r12,3   r12  r13 r23 0,9653  0,8926.0,9605  (1  r132 )(1  r232 ) (1  0,89262 )(1  0,96052 ) 0,1079577  0,8605 0,1254624 63 r13,2   r13  r12 r32 0,8926  0,9653.0,9605  (1  r122 )(1  r322 ) (1  0,96532 )(1  0,96052 ) 0,03457  0,4757 0,07267 Với Stata chúng ta có thể dễ dàng tính được các hệ số tương quan riêng phần bằng lệnh pcorr sau đây: pcorr x1 x2 x3…xp Ở đây có nghĩa là tính hệ số tương quan riêng phần của x1, với lần lượt các biến x2, x3…xp khi cố định các biến còn lại. Theo như ký hiệu ở trên thì ta sẽ có tất cả các r1i,… với i  2, p . Sau đây là kết quả chạy bằng Stata cho tệp số liệu XSTK10_1.  pcorr gdp ex im (obs = 17) Partial correlation of gdp with Variable Corr. Sig. ex 0.8610 0.000 im -0.4771 0.062  pcorr gdp ex im gip gap (obs = 17) Partial correlation of gdp with 64 Variable Corr. Sig. ex 0.7958 0.001 im -0.5830 0.029 gip 0.8024 0.001 gap 0.8514 0.000 Theo kết quả nêu trên ta thấy nếu cố định một chỉ tiêu ví dụ (im) chẳng hạn thì hệ số tương quan riêng phần của gdp với ex là 0.8610, còn khi cố định (ex) thì hệ số tương quan riêng phần của gdp với im lại là một số âm: -0.4771 (ở đây có một chút sai số so với tính tay vì làm tròn số). Ta cũng thấy hệ số tương quan riêng phần của gdp với ex khi cố định tất cả các chỉ tiêu là 0,7958. Dễ dàng nhận thấy rằng nếu cố định các chỉ tiêu còn lại thì hệ số tương quan riêng phần của gdp với gap là cao nhất và cũng rất lớn: 0,8514. Kết hợp với phương pháp hồi quy sẽ nghiên cứu ở tiết học sau, chúng ta còn có thể rút ra được nhiều nhận xét, kết luận khác. II. Phân tích tƣơng quan bảng số liệu định tính II.1. Bảng ngẫu nhiên hai chiều Bảng này chủ yếu dùng cho trường hợp các chỉ tiêu định tính được “đo” bằng thang đo phân loại. Như các bạn đã biết trong chương VII chuhngs ta đã xét bài toán kiểm định sự độc lập của hai dấu hiệu (chỉ tiêu định tính) A và B. Tuy nhiên nếu A và B không độc lập với nhau thì tiêu chhuẩn χ2 không cho chúng ta biết mức độ tương quan giữa A và B. Với những bảng ngẫu nhiên hai chiều cấp (2x2) dạng: A B b1 b2 65 ∑ a1 n1 n2 (n1+n2) a2 n3 n4 (n3+n4) ∑ (n1+n3) (n2+n4) n1+n2+n3+n4=n Chúng ta có thể đo mối tương quan giữa A và B bằng các hệ số Q và F được xác định như sau: Q Hệ số Q: Hệ số F: F  n1n4  n2 n3 n1n4  n2 n3 (3) n1n4  n2 n3 (n1  n2 )(n1  n3 )(n2  n4 )(n3  n4 ) VÍ DỤ 3: Trên cơ sở bảng số liệu điều tra về thái độ của sinh viên đối với việc chấp hành nội quy thi (tệp số liệu XSTK10_2) chúng ta có bảng ngẫu nhiên hai chiều sau đây: Bảng 2.3a  Tab thaido gioitinh Sinh vien nam hay nu Chap hành noi quy thi 0 1 Total 0 40 40 80 1 20 0 20 Total 60 40 100 66 Bảng 2.3b  Tab thaido vung Nong thon hay thanh thi Chap hành noi quy thi nt tt Total 0 43 37 80 1 8 12 20 Total 51 49 100 Trong đó A: (thaido) có hai giá trị a1 = 0 là không vi phạm, a2 = 1 là có vi phạm, B = (gioitinh) có hai giá trị b1 = 0 là nữ, b2 = 1 là nam và C = (vung) có hai loại: nt là nông thôn, tt là thành thị. Như vậy là riêng đối với chỉ tiêu C chúng ta không “đo” bằng thang đo phân loại mà vẫn giữ nguyên các ký hiệu phân loại. Phân tích bảng 2.3a ta có: Q F 40.0  40.20  1 40.0  40.20 40.0  40.20  0,4 80.60.20.40 Nhận xét: Ta nhận thấy giá trị của Q và F được tính như trên cùng một bảng số liệu lại rất khác nhau: Giá trị Q lớn hơn hai lần giá trị của F (về giá trị tuyệt đối). Do đâu mà như vậy? Trước hết ta thấy rằng các hệ số Q và F đo các mặt khác nhau của mối liên hệ trong bảng bốn ô (bảng ngẫu nhiên 2 chiều cấp (2 x 2)). Trong ví dụ này hệ số Q  1 ví tất cả các trường hợp vi phạm nội quy thi trong suốt quá trình khảo sát (điều tra) đều là của sinh viên nam. Song sẽ hoàn toàn không đúng nếu giải thích Q có nghĩa là hầu như tất cả sinh viên nam đều vi phạm nội quy thi. 67 Hệ số F cho phép pnản ánh mức độ liên hệ qua lại hai chiều giữa các dấu hiệu nghiên cứu, trong lúc đó hệ số Q chỉ phản ánh mối liên hệ một chiều. Giá trị của các hệ số chỉ trùng nhau khi mối liên hệ qua lại hai chiều hoàn toàn. Nếu n1 = n4 = 0 thì F = -1. Nếu n2 = n3 = 0 thì F = +1. Chúng ta có thể dễ dàng kiểm tra ý nghĩa của F thông qua tiêu chuẩn χ2 vì χ2 = nF2. Đối với bảng ngẫu nhiên hai chiều cấp (p x q). Giả sử chúng ta đã tính được giá trị của tiêu chuẩn χ2 (tức là giá trị χ2qs) và đã kết luận được hai dấu hiệu A và B không độc lập với nhau. Khi đó, chúng ta có thể đo mối liên hệ (mức độ tương quan) giữa hai dấu hiệu đó bằng hệ số liên hợp Pearson (P): 2 P n  2 0≤P≤1 (4) VÍ DỤ 4: Nghiên cứu tình trạng hôn nhân trước ngày cưới của 542 cặp vợ chồng ta có bảng số liệu sau: Tình trạng hôn Chưa kết hôn nhân của vợ lần nào Ly hôn Góa ∑ Tình trạng hôn nhân của chồng Chưa kết hôn lần nào 180 34 36 250 Ly hôn 58 76 54 188 Góa 43 34 27 104 68 ∑ Ta tính được 281 144 117 2  qs2  11,96; 0,05 (4)  9,5 → Bác bỏ tính độc lập giữa tình trạng hôn nhân của vợ (A) và tình trạng hôn nhân của chồng (B) trước ngày cưới. 2 11,96 Vậy: P    0,147 2 n 542  11,96 P = 0 khi χ2 = 0, tức là khi có sự độc lập hoàn toàn giữa các dấu hiệu. Nhược điểm của hệ số P là giá trị cực đậi của nó phụ thuộc vào quy mô của bảng ngẫu nhiên hai chiều. Do đó nẩy sinh những khó khăn nhất định cho việc giải thích và về thực chất nên coi P như một chỉ số bằng số chứ không phải như một độ đo. Để khắc phục nhược điểm trên ta có hệ số Krsamer (K): 1  2 2 K    n.min( p  1, q  1)  Hệ số K bao giờ cũng có thể đạt +1 không phụ thuộc vào dạng của bảng ngẫu nhiên hai chiều. Theo ví dụ 4 ta có: 1  2 11,96 K    0,105 542.min(2,2)   Như vậy, ta có thể nói rằng tình trạng hôn nhân của vợ chồng trước khi cưới có phụ thuộc vào nhau nhưng mức độ phụ thuộc đó không lớn lắm. Có lẽ đó chỉ là yếu tố mang tính chất tham khảo chứ không mang tính chất quyết định. 69 542 II.2. Các độ đo sự tƣơng quan ở cấp đo theo thang thứ bậc Trước hết, ta xét một ví dụ. Cho tệp số liệu tên gọi là XSTK10_3 với nội dung như sau: Bảng 2.4 Contains data from: C \ WINSTATA\ XSTK10_3.dta obs: 10 vars: 2 17 Aug 2009 15:26 size: 60 (86.% of memory free) 1. diem 1 byte %8 . 0g Diem cua giam khao nguoi Canada 2. diem 2 byte %8 . 0g Diem cua giam khao nguoi Nhat Sorted by: diem1 95 90 86 84 75 70 62 60 57 50 diem2 62 63 83 80 55 60 45 72 62 70 Trong đó A = (diem1), B = (diem2) là các điểm do hai giám khảo người Canada và Nhật chấm cho một vận động viên trong một cuộc thi quốc tế về trượt băng nghệ thuật. Các giá trị A và B được đo theo thang đo thứ bậc. Bây giờ ta sẽ xếp hạng cho các giá trị của A và B. Trước hết, ta xếp các giá trị của A theo thứ tự (tăng hoặc giảm dẫn, sau đó ta gán các hạng cho các giá trị đo đúng bằng số thứ tự đã sắp xếp. A=(diem1) 95 90 86 84 75 70 62 60 57 50 Hạng (i) 1 2 3 4 5 6 7 8 9 10 Làm tương tự như đối với A ta có các dạng của B như sau: 70 B=(diem2) 93 92 93 80 72 70 62 60 55 45 Hạng (k) 1 2 3 4 5 6 7 8 9 10 Tiếp theo ta sắp xếp các hạng của A và B theo đúng thứ tự các giá trị của A và B đã cho ở bảng 10.4. Hạng A:i 1 2 3 4 5 6 7 8 9 10 Hạng B: ki 2 1 3 4 9 8 10 5 7 6 Như vậy là tương ứng với mỗi cặp giá trị (ai, bi) của (A, B) ta có một cặp hạng tương ứng là (i, ki). + Hệ số tương quan hạng rs của Spearman cho hai dấu hiệu A và B được đo cùng thang đo thứ bậc xác định như sau: rs  1  6 di2 i n(n 2  1) (5) Trong đó di = i – ki là hiệu giữa hai giá trị hạng của cặp hạng (i, ki) (i = 1, n ), n là số cặp hạng. Ký hiệu ρs là hệ số tương quan hạng Spearman của tổng thể thì để kiểm định cặp giả thuyết: H0: (ρs = 0), H1 : (ρs ≠ 0) ta sử dụng tiêu chuẩn rs2 (n  2) T 1  rs2 Nếu H0 đúng thì T có phân phối Student với (n-2) bậc tự do. Do đó, ta có miền bác bỏ để kiểm định cặp giả thuyết trên là: 71   rs2 n  2  ( n  2)  w   t  ; t  t  2  2 1  r   s   VÍ DỤ 5: Sử dụng số liệu đã cho ở bảng 2.4 ta tính hệ số tương quan hạng giữa hai dãy điểm số đã cho của hai giám khảo người Canada và Nhật. Theo cách xếp hạng trên ta được:  d  1  1  16  4  9  9  4  16  60 2 i i rs  1  6 di2 i n(n  1) 2  1 6.60  0,6364 10(102  1) Để kiểm định xem cách cho điểm của hai giám khảo nói trên có độc lập với nhau hay không ta tính: rs2 (n  2) 0,63642.8 tqs    2,356 1  rs2 1  0,63642 8 8 Với α = 0,05 tra bảng ta được t0,025  2,306, tqs  t0,025 . Ta có thể bác bỏ giả thuyết H0: (ρ0 = 0). Tuy nhiên, ta thấy giá trị quan sát tqs chênh lệch so với giá trị tới hạn quá ít và nếu chọn mức ý nghĩa là 0,01 thì giá trị tới hạn 8 t8  t0,005  3,335 thì tqs € Wα, tức là ta không có cơ sở bác bỏ giả thuyết H0. 2 Trong những trường hợp như vậy ta có thể phân tích them bằng hệ số tương quan hạng Kendall. + Hệ số tương quan hạng Kendall ký hiệu là τ và được xác định bằng công thức sau:  S n(n  1) 2 (6) 72 Việc tính giá trị của S được minh họa qua ví dụ cụ thể sau đây. Trên cơ sở số liệu đã xếp hạng về điểm số của hai giám khảo người Canada và Nhật trong ví dụ 5 ta lập bảng tính S như sau: Hạng của A Hạng của B Si+ Si- Si+ Si- 1 2 8 1 7 2 1 8 0 8 3 3 7 0 7 4 4 6 0 6 5 9 1 4 -3 6 8 1 3 -2 7 10 0 3 -3 8 5 2 0 2 9 7 0 1 -1 10 6 - - S = ∑( Si+ - Si-) = 21 Cách tính Si+ và Si- như sau. Trước hết, lấy giá trị đầu tiên của cột hạng của B (tức là k1) và đếm số hạng có giá trị lớn hơn k1 đó chính là Si+ , số hạng còn lại có giá trị nhỏ hơn k1 là Si-. Tiếp tục như vậy cho đến giá trị kn-1 thì kết thúc. Tổng quát ta có thể mô tả cách tính Si+ và Si- như sau: Si+ = số hạng kj (j>i) thỏa mãn: kj > ki Si- = số hạng kj (j>i) thỏa mãn: kj < ki Cuối cùng là S   ( Si Si ) . (S còn được gọi là số điểm Kendall –   i 73 Kendall’s store) Ký hiệu ρk là hệ số tương quan hạng Kendall của tổng thể thì để kiểm định cặp giả thuyết: H 0 : ( K  0); H1 : ( K  0) ta sử dụng miền bác bỏ sau đây:    w   U        ; U  u 2  4n  10   9n(n  1) Với số liệu đã tính ở trên ta có:  S 21   0,467 n(n  1) / 2 10(10  1) / 2 và U  0,467  1,88 qs 40  10 90.9 Với α = 0,05 ta có u0,025 = 1,96 → Uqs € Wα. Vậy không có cơ sở bác bỏ thuyết H0: (ρk = 0). Có nghĩa là có thể coi điểm của hai giám khảo người Canada và Nhật là độc lập với nhau với mức ý nghĩa 5%. Sau đây là kết quả chạy bằng Stata đối với ví dụ 5. * spearman diem 1 diem2 Number of obs= 10 Spearman’s rho= 0.6364 Test of Ho: diem1 and diem2 independent Pr > t = 0.0479 74 * Ktau diem1 diem2 Number of obs= 10 Kendall’s tau-a= 0.4667 Kendall’s tau-b= 0.4667 Kendall’s score= 21 SE of score= 11.180 Test of Ho: diem1 and diem2 independent Pr > z = 0.0736 (continuity corrected) 2.3.2. Giáo án Giáo án số: 24-25 Số tiết: 02 Lớp ĐH KT1 ĐH KT2 Khóa 3 Thời gian 20/6/2010 ĐH KT3 ĐHQTKD1 ĐHQTKD2 Khóa 3 Khóa 3 Khóa 3 Khóa 3 20/6/2010 22/6/2010 21/6/2010 21/6/2010  Tên bài học: Phân tích tƣơng quan  Mục đích: Cung cấp cho sinh viên những hiểu biết về bài toán phân tích tương quan và ý nghĩa của phân tích tương quan tương trong việc đo mức độ phụ thuộc giữa các biến ngẫu nhiên.  Yêu cầu:  Sinh viên nắm được công thức và phương pháp phân tích tương quan trong bảng định lượng và định tính 75  SV thành thạo kỹ năng tính toán bằng tay và bước đầu biết cách sử dụng phần mềm STATA trong tính toán để giải quyết nhanh hơn bài toán phân tích tương quan. I. ỔN ĐỊNH LỚP Thời gian: 1 phút. Nội dung cần nhắc nhở: ……………...………………………………………... II. KIỂM TRA BÀI CŨ Thời gian: 0 phút Dự kiến học sinh kiểm tra: TênSV-Lớp Đánh giá III. GIẢNG BÀI MỚI Đồ dùng dạy học: Đề cương bài giảng, giáo án, lịch giảng dạy, sách tham khảo, phấn, bảng, micro, máy tính điện tử bỏ túi Fx500, máy tính cá nhân, máy chiếu. Nội dung, phƣơng pháp: Thời TT Nội dung giảng dạy gian Phƣơng pháp thực hiện (phút) I. Phân tích tƣơng quan bảng số liệu định lƣợng 10 Thuyết trình, vấn đáp gợi mở I.1. Phân tích hệ số tương quan a. Khoảng tin cậy cho hệ số 5 tương quan ρxy 76 Thuyết trình, minh họa. GV hướng dẫn SV tính toán 5 b. Kiểm định giả thuyết về giá sử dụng các hàm và bảng trị của ρ I.2. Phân tích hệ số tương quan 15 chuẩn bị trong đề cương bài Phân tích tƣơng quan bảng số liệu định tính II.1. II.2. tính trong STATA. Minh họa bằng các kết quả GV đã riêng phần II. bằng tay và so sánh với việc giảng. 15 15 Bảng ngẫu nhiên hai chiều Các độ đo sự tương quan ở cấp 15 đo theo thang thứ bậc IV. TỔNG KẾT BÀI Thời gian: 4 phút - Hệ thống công thức áp dụng - Kỹ năng tính toán bằng phần mềm STATA V. CÂU HỎI VÀ BÀI TẬP Thời gian: 5 phút Bài tập: BT 6,7 Chương II 77 CHƢƠNG 3 THỰC NGHIỆM SƢ PHẠM 3.1. Mục đích, kế hoạch và tổ chức thực nghiệm sƣ phạm 3.1.1. Mục đích của thực nghiệm sư phạm Mục đích của thực nghiệm sư phạm là thăm dò tính khả thi và tính hiệu quả của việc vận dụng phương pháp giảng dạy thống kê có sự hỗ trợ của các phần mềm tin học nêu trên so với phương pháp truyền thống. 3.1.2. Kế hoạch thực nghiệm sư phạm a) Kế hoạch thực nghiệm - Dự kiến đối tượng học sinh, xây dựng lịch giảng dạy, đăng kí đồ dùng và phương tiện dạy học. - Biên soạn đề cương bài giảng - Thiết kế giáo án lên lớp và thông qua tổ trưởng tổ chuyên môn - Tiến hành lên lớp theo đề cương và giáo án đã soạn tại các lớp thực nghiệm và lớp đối chứng - Đánh giá kết quả của đợt thực nghiệm * Thời gian thực nghiệm sư phạm: Từ ngày 10/5/2010 đến 30/6/2010. * Địa điểm thực nghiệm: Khoa Kế toán Kiểm toán và khoa Quản lí kinh doanh, trường Đại học Công nghiệp Hà Nội b) Đối tượng thực nghiệm: Chúng tôi chọn đối tượng thực nghiệm và đối tượng đối chứng là sinh viên Đại học năm thứ nhất của khoa Kế toán Kiểm toán và khoa Quản lí kinh doanh thuộc trường ĐH Công Nghiệp Hà Nội. Trong đó hai lớp ĐH KT1, ĐH QTKD1 là các lớp thực nghiệm và hai lớp ĐH KT2 và ĐH QTKD2 là các lớp đối chứng. Để đảm bảo tính phổ biến của mẫu, các lớp được chọn đều là SV thuộc khối ngành Kinh tế với điểm đầu vào và chương trình học tương đồng 78 với nhau. Tổng số SV ở các lớp thực nghiệm là 177, tổng số SV ở các lớp đối chứng là 180. 3.1.3. Tổ chức thực nghiệm sư phạm - Biên soạn tài liệu thực nghiệm, hồ sơ bài giảng theo hướng vận dụng một số phần mềm tin học vào giảng dạy học phần Phân tích thống kê. - Hướng dẫn sử dụng tài liệu và hồ sơ cho các giáo viên tham gia thực nghiệm. Được sự giúp đỡ của Ban chủ nhiệm khoa và các đồng nghiệp tại Bộ môn Toán, khoa Khoa học cơ bản, trường ĐH Công nghiệp HN, đầu tháng 5/ 2010 tác giả đã tiến hành hướng dẫn các giáo viên tham gia thực nghiệm sử dụng đề cương và giáo án đã được soạn để thực hiện các bước lên lớp đối với các bài dạy thuộc nội dung đã nêu ở chương 2 của luận văn. Thực nghiệm sư phạm được tổ chức vào các ngày 11, 12 tháng 5 và 20, 21 tháng 6 tại lớp thực nghiệm và lớp đối chứng. Lớp thực nghiệm và lớp đối chứng do cùng một giáo viên dạy theo giáo án do chúng tôi thiết kế và cả giáo án bình thường do giáo viên tự soạn ở lớp đối chứng. Để lựa chọn mẫu thực nghiệm chúng tôi tiến hành theo các bước sau: - Trao đổi với giáo viên bộ môn, giáo viên chủ nhiệm lớp để xin ý kiến và nắm bắt tình hình chung của SV. - Xem xét kết quả học tập bộ môn Toán nói chung và học phần Xác suất, Thống kê nói riêng của sinh viên toàn khóa. - Trao đổi với SV để tìm hiểu những khó khăn cũng như mức độ hào hứng với môn học. - Dự giờ của các giáo viên dạy cùng bộ môn, mời các giáo viên trong tổ dự giờ dạy thực nghiệm sau đó lấy nhận xét. - Sau mỗi tiết học chúng tôi trao đổi với giáo viên và SV để rút kinh nghiệm. Có sự điều chỉnh cho phù hợp với hồ sơ bài giảng do chúng tôi soạn thảo, hoặc điều chỉnh, bổ sung nhằm nâng cao tính khả thi ở lần thực nghiệm sau. 79 - Đánh giá chất lượng, hiệu quả và tính khả thi của việc vận dụng các phần mềm tin học trong giảng dạy thống kê ở trường ĐH Công nghiệp HN. 3.2. Nội dung thực nghiệm 3.2.1. Đề cương, giáo án thực nghiệm Nội dung thực nghiệm là dạy học một số tiết thuộc chương II và chương IV của học phần Lí thuyết thống kê. Theo đề cương chi tiết, học phần này SV ngành Kinh tế học trong 30 tiết. Các bài giảng được đưa vào thử nghiệm theo hướng vận dụng các phần mềm EXCEL, MINITAB, STATA nằm ở tiết thứ 9, 10, 24 và 25. Chúng tôi tiến hành dạy thử 3 giáo án (2 giáo án dạy trong 1 tiết và 1 giáo án dạy trong 2 tiết liền nhau theo thời khóa biểu của SV). Đề cương bài giảng và các giáo án này đã được trình bày ở chương 2 của luận văn. Bao gồm: - Giáo án 1: “Ước lượng khoảng tin cậy cho kỳ vọng của biến ngẫu nhiên” (Tiết thứ 9) - Giáo án 2: “Ước lượng khoảng tin cậy cho xác xuất và phương sai của biến ngẫu nhiên” (Tiết thứ 10) - Giáo án 3: “Phân tích tương quan” (Tiết thứ 24 và 25) Tất cả các bài giảng này đều được thực hiện ở cả hai lớp thực nghiệm là ĐH KT1 K3 và ĐH QTKD1 K3 với tổng số SV là 177. 3.2.2. Phân tích kết quả thực nghiệm 3.2.3.1. Cơ sở để đánh giá kết quả của thực nghiệm sư phạm Chúng tôi căn cứ vào các nhận xét, ý kiến đóng góp của giáo viên tham gia thực nghiệm sư phạm, ý kiến nhận xét của SV để đo mức độ hiểu bài, sự hứng thú đối với bài giảng. Đặc biệt là để kiểm chứng hiệu quả của các phần mềm tin học trong việc giảm bớt những khó khăn cho cả người học, người dạy khi học tập học phần này. Sau đây là các kết quả đạt được: a) Kết quả điều tra sinh viên 80 Để tìm hiểu về mức độ hiểu bài và sự hứng thú với bài giảng có sử dụng các phương tiện nghe nhìn và các phần mềm Tin học so với phương pháp dạy học truyền thống tại các lớp đối chứng, chúng tôi đã yêu cầu SV ở các lớp thực nghiệm trả lời các câu hỏi trong phiếu điều tra sau: 81 PHIẾU NHẬN XÉT VỀ BÀI GIẢNG DÀNH CHO SINH VIÊN 1. Qua bài giảng này, anh/chị hãy tự đánh giá lượng kiến thức mình tiếp nhận được?  Trên 70%  Từ 50% đến 70%  Dưới 50% 2. Phương pháp giảng dạy Thống kê với sự hỗ trợ của các phần mềm tin học như EXCEL, MINITAB hay STATA có làm anh/chị hào hứng hơn với bài giảng?  Hào hứng hơn  Mức độ như cũ  Nhàm chán hơn 3. Kỹ năng sử dụng máy vi tính và bước đầu làm quen với phần mềm thống kê trong bài giảng này với anh chị là…  Vừa sức  Quá khó  Quá dễ 4. Anh/chị đánh giá thế nào về hiệu quả của các phần mềm thống kê được giới thiệu trong bài giảng so với việc tính toán bằng tay?  Rất hiệu quả vì tiết kiệm đáng kể thời gian tính toán, ít nhầm lẫn  Hiệu quả không đáng kể  Không hiệu quả bằng tính toán bằng tay 5. Anh/chị có dự định tìm hiểu thêm về những tiện ích mà các phần mềm như EXCEL. MINITAB, STATA mang lại?  Sẽ tìm hiểu ngay  Sẽ tìm hiểu khi cần thiết  Không cần tìm hiểu vì có thể thực hiện tính toán bằng tay 82 Chúng tôi đã phát phiếu nhận xét tới 177 SV tại các lớp thực nghiệm, kết quả điều tra được thống kê như sau: Bảng 3.1 Kết quả Câu Lựa chọn 1 Lựa chọn 2 Lựa chọn 3 Số lượng % Số lượng % Số lượng % Câu 1 124 70.0 51 28.8 2 0.2 Câu 2 111 62.7 59 33.3 7 4 Câu 3 154 87 12 6.7 11 6.3 Câu 4 167 94.3 2 0.2 8 4.5 Câu 5 135 76.3 25 14.1 17 9.6 b) Đánh giá của giáo viên Để thu thập ý kiến nhận xét của giáo viên về bài giảng thực nghiệm có sử dụng các phần mềm thống kê, chúng tôi đã thiết kế phiếu nhận xét như sau và gửi cho giáo viên. 83 PHIẾU NHẬN XÉT GIỜ GIẢNG 1. Theo thầy (cô) bài giảng thực nghiệm có đảm bảo yêu cầu về kiến thức không?  Có  Không  Ý kiến khác: ........................................................................... 2. Bài giảng thực nghiệm có lôi cuốn SV hơn bài giảng mà thầy và trò phải dành nhiều thời gian tính toán bằng tay không?  Có  Không  Ý kiến khác: ........................................................................... 3. Bài giảng thực nghiệm có khắc phục được những khó khăn trong việc giảng dạy thống kê không?  Có  Không  Ý kiến khác: .......................................................................... 4. Việc tìm hiểu và ứng dụng các phần mềm thống kê như EXCEL, MINITAB, STATA có cần thiết với thầy (cô) không?  Có  Không  Ý kiến khác: .......................................................................... 5. Theo thầy (cô), việc sử dụng các phần mềm trên để hỗ trợ cho bài giảng phân tích thống kê có phù hợp với bộ môn toán và nên triển khai áp dụng rộng rãi không?  Có  Không  Ý kiến khác: .......................................................................... 84 Chúng tôi đã hỏi ý kiến 9 giáo viên tham gia dự giờ và thu được kết quả như sau: Số Số ngƣời ngƣời trả lời trả lời có không Câu 1 9 0 0 Câu 2 7 0 2 Câu 3 8 1 0 Câu 4 8 0 1 Câu 5 9 0 0 Câu hỏi Số ngƣời có ý kiến Ý kiến khác khác Đôi khi SV không theo dõi kịp thao tác trên máy tính của GV Có lẽ GV chỉ cần thành thạo một phần mềm là đủ. 3.2.3.2. Phân tích kết quả của thực nghiêm sư phạm Từ kết quả điều tra SV và các nhận xét, đánh giá của GV, chúng tôi (những GV tham gia thực nghiệm và những GV tham dự giờ giảng) đã cùng thảo luận nghiêm túc và thống nhất với các nhận định sau đây: Thứ nhất, vấn đề ứng dụng CNTT nói chung và các phần mềm tin học nói riêng vào bài giảng phân tích thống kê là đúng hướng và rất cần thiết. Trong các tiết giảng không sử dụng các phần mềm, giáo viên và SV phải tính toán mất nhiều thời gian mà đôi khi vẫn nhầm lẫn hoặc gặp sai số, ảnh hưởng đến sự phân bổ thời gian cũng như gây ra sự nhàm chán cho người học. Thứ hai, việc sử dụng các phần mềm tin học như EXCEL, MINITAB và STATA để hỗ trợ cho bài giảng và giúp SV tự học tốt hơn là hoàn toàn khả thi bởi vì chỉ cần được hướng dẫn một số kỹ năng cơ bản là GV và SV có thể ứng dụng được. Hơn nữa, các bạn SV lại rất nhanh nhạy khi tiếp cận với những tiện ích mà máy vi tính đem lại nên các bạn có thể học và làm chủ một 85 hoặc hai phần mềm thống kê để phục vụ cho học tập cũng như công việc sau này. Tuy nhiên chúng tôi cũng tranh luận khá nhiều xung quanh vấn đề sử dụng phần mềm nào cho bài giảng nào, bởi vì thực tế cả ba phần mềm được giới thiệu đều có các công cụ để làm thống kê nói chung và mỗi phần mềm khi nghiên cứu kỹ cũng có những điểm mạnh và điểm yếu riêng. Cuối cùng nhiều ý kiến cho rằng EXCEL là phần mềm thông dụng nhất, và SV cũng đã được học EXCEL ở bộ môn Tin học, nên bước đầu có thể triển khai rộng rãi để GV và SV cùng ứng dụng vào dạy và học phân tích thống kê. Hai phần mềm MINITAB và STATA các GV cũng cần có thời gian tìm hiểu kỹ hơn để giới thiệu với những SV thực sự quan tâm. 86 KẾT LUẬN VÀ KHUYẾN NGHỊ * Kết luận: Sau một thời gian nghiên cứu, thử nghiệm, với sự hướng dẫn tận tình của TS. Nguyễn Thị Hồng Minh và sự hỗ trợ của nhiều đồng nghiệp, luận văn hoàn thành đã thu được các kết quả chính sau đây: - Phân tích được những khó khăn khi giảng dạy và học tập thống kê theo phương pháp truyền thống và đề xuất một biện pháp sư phạm nhằm tạo ra môi trường học tập năng động, sáng tạo, hiệu quả hơn cho cả người dạy và người học. - Làm rõ được cơ sở lí luận và thực tiễn của việc giảng dạy phân tích thống kê theo hướng ứng dụng các phần mềm Excel, Minitab, Stata. - Thiết kế tương đối hoàn chỉnh một số hồ sơ bài giảng (bao gồm đề cương bài giảng và giáo án lên lớp) trong học phần phân tích thông kê theo định hướng nói trên. - Bước đầu khẳng định được hiệu quả và tính khả thi của đề tài thông qua việc dạy thực nghiệm và phân tích kết quả thực nghiệm với các giáo án đã soạn. * Một số khuyến nghị: - Đối với giáo viên trực tiếp giảng dạy thống kê: Luận văn này là một gợi ý để các giáo viên đang gặp khó khăn trong giảng dạy thống kê có thể xem xét khả năng ứng dụng tin học nói chung và phần mềm thống kê nói riêng trong dạy học. Mỗi giáo viên có thể chỉ cần lựa chọn cho mình một phần mềm và sử dụng nó như một công cụ đắc lực hỗ trợ giảng dạy và công tác kiểm tra đánh giá. Sự cố gắng này có thể đem lại những bài giảng hấp dẫn hơn và góp phần tạo cho SV thói quen học lí thuyết đi đôi với thực hành và ứng dụng nhiều hơn. 87 - Đối với các cấp quản lí chuyên môn: Các nhà quản lí chuyên môn (Tổ trưởng, Trưởng bộ môn, Trưởng khoa, …) có thể hỗ trợ giáo viên bằng nhiều biện pháp như: + Đề xuất với Ban giám hiệu trang bị giảng đường với đầy đủ phương tiện cần thiết cho việc sử dụng các phần mềm tin học trong giảng dạy. + Liên hệ cộng tác với các trung tâm, các viện nghiên cứu để tổ chức các lớp học, hội thảo chuyên đề tạo điều kiện để giáo viên thường xuyên được cập nhật các phần mềm mới phục vụ công tác chuyên môn. + Tạo điều kiện về mặt thời gian và chi phí để giáo viên chủ động hơn trong việc nghiên cứu, ứng dụng CNTT trong công việc của đơn vị. * Đối với các cơ sở nghiên cứu khoa học Giáo dục: Các cơ sở nghiên cứu giáo dục có thể xem xét mở rộng hướng nghiên cứu của đề tài cho việc dạy học thống kê ở các cơ sở đào tạo khác với đối tượng sinh viên thuộc tất cả các khối, ngành. 88 DANH MỤC TÀI LIỆU THAM KHẢO [1]. http://en.wikipedia.org/wiki/Probability_theory [2]. Đào Hữu Hồ, Nguyễn Văn Hữu, Hoàng Hữu Mai, "Thống kê toán học”, NXB ĐH&THCN, 1984 [3]. Đào Hữu Hồ, Nguyễn Thị Hồng Minh, "Xử lý số liệu thống kê bằng toán học trên máy tính”. NXB Đại học Quốc gia Hà Nội, 2000 [4]. Đặng Hùng Thắng, "Thống kê và ứng dụng", NXB Giáo dục, 1999 [5]. Nguyễn Văn Hữu, Đào Hữu Hồ, Hoàng Hữu Nhƣ, "Thống kê toán học" NXB Đại học Quốc gia, 2004 [6]. Barr, Anthony J., Goodnight, James H. “SAS, Statistical Analysis System, Student Supply Store”, North Carolina State University, 1971 [7]. N. H Nie, D. H Bent, and C. H Hull, “Statistical package for the social sciences”, vol. 675, McGraw-Hill New York, 1975. [8]. Sue Johnston Wilder and David Pimm, “The free NCET leaflet, Mathematics ang IT”. Apupil's entitlement, 1995 [9]. K. Ruthven, “The influence of graphic calculator use on translation from graphic to symbolic forms”. Educational Studies in Mathematics 21, no. 5: 431–450. (1990) [10]. D. Tall and S. Vinner, “Concept image and concept definition in mathematics with particular reference to limits and continuity”. Educational studies in mathematics 12, no. 2: 151–169, 1981. [11]. Graham, A, "The Open Calculator Challenge". Micromath, the association of teachers of mathematics, Vol 12: pp 14-15, 1996. [12]. http://depocen.org [13]. Nguyễn Cao Văn, Trần Thái Ninh, "Giáo trình lý thuyết xác xuất và thống kê toán”, NXB Thống kê, 2005. [14]. Trần Văn Minh, Phí Thị Vân Anh, "Xác suất thống kê và các tính toán trên Excel”. NXB Giao thông vận tải, 2007. 89 [15]. Nguyễn Bá Kim, Vũ Dƣơng Thụy, “Phương pháp dạy học môn Toán”. Nxb Giáo dục, 1992. [16]. Phan Trọng Ngọ, “Dạy học và phương pháp dạy học trong nhà trường”. Nxb Đại học Sư phạm, 2005. [17]. Geoffrey Petty (Dự án Việt - Bỉ dịch). “Thực hành dạy học ngày nay”. Nxb Stanley Thornes. [18]. Quốc hội nƣớc Cộng hoà xã hội chủ nghĩa Việt Nam. “Luật giáo dục năm 2005”. 90 [...]... khoa học Có thể nâng cao hiệu quả của việc giảng dạy phân tích thống kê khi sử dụng các phần mềm tin học như Excel, Minitab và Stata 8 Phƣơng pháp chứng minh luận điểm - Dựa vào thực trạng của việc dạy và học thống kê khi chưa có sự hỗ trợ của các phần mềm tin học - Dựa vào hiệu quả mà các phần mềm tin học mang lại khi sử dụng trong giảng dạy phân tích thống kê 9 Đóng góp của luận văn Ngoài việc hệ thống. .. rằng sử dụng các phần mềm tin học trong giảng dạy thống kê là một vấn đề rất cần thiết đối với cả người dạy cũng như người học 1.3 Giới thiệu một số phần mềm hỗ trợ giảng dạy phân tích thống kê 1.3.1 Phần mềm EXCEL EXCEL là phần mềm thông dụng để quản lý thông tin Bảng tính Excel cũng như các chương trình quản lý cơ sở dữ liệu khác của Microsoft như MS Access, đều thích hợp cho việc vào số liệu từ các... bản của thống kê, tìm hiểu và giới thiệu về các phần mềm thống kê đang được sử dụng trên thế giới, đóng góp chính của luận văn là nghiên cứu những tiện ích của ba phần mềm: Excel, Minitab, Stata có thể ứng dụng trong việc giảng dạy phân tích thống kê; Bên cạnh đó, tác giả cũng đã thiết kế được một số bài giảng mẫu để thử nghiệm và đánh giá hiệu quả của việc sử dụng các phần mềm này trong giảng dạy. .. trúc của luận văn Ngoài phần mở đầu, kết luận và khuyến nghị, nội dung chính của luận văn được trình bày trong 3 chương: Chương 1 nêu rõ cơ sở lí luận và thực tiễn; Chương 2: trình bày Một số giáo án giảng dạy thống kê với sự hỗ trợ của các phần mềm EXCEL, MINITAB và STATA” và Chương 3 kiểm định bằng các “Thực nghiệm sư phạm” 6 CHƢƠNG 1 CƠ SỞ LÍ LUẬN VÀ THỰC TIỄN 1.1 Cơ sở lí luận 1.1.1.Vai trò của. .. vậy, việc tổ chức dạy - học với sự hỗ trợ của MTĐT và các phần mềm toán học nhằm xây dựng một môi trường dạy - học với 3 đặc tính cơ bản sau: 11 - Tạo ra một môi trường học tập hoàn toàn mới mà trong môi trường này tính chủ động, sáng tạo của học sinh được phát triển tốt nhất Người học có điều kiện phát huy khả năng phân tích, suy đoán và xử lý thông tin một cách có hiệu quả - Cung cấp một môi trường... quản lí giáo dục: Tích cực áp dụng một cách sáng tạo các phương pháp tiên tiến, hiện đại, ứng dụng công nghệ thông tin vào hoạt động dạy và học Đối với môn toán nói riêng, là một bộ môn vốn dĩ có mối liên hệ mật thiết với tin học, toán học chứa đựng nhiều yếu tố để phục vụ nhiệm vụ giáo dục tin học, ngược lại tin học sẽ là một công cụ đắc lực cho quá trình dạy học toán Với sự hỗ trợ của Máy tính điện... toán bằng tay (cả khi có sự hỗ trợ của máy tính điện 28 tử thông thường) thì GV không đủ thời gian để giải thích minh họa các kết quả thu được Những khó khăn này có thể được khắc phục hiệu quả nếu GV sử dụng các phần mềm hỗ trợ giảng dạy thống kê như là một công cụ dạy học trên lớp để giảm bớt khối lượng công việc và tạo hứng thú cho người học b Đối với người học Đối với người học nói chung và sinh viên... một môi trường dạy và học linh hoạt, có tính mở Trong các hình thức tổ chức dạy - học có sự hỗ trợ của CNTT thì vai trò của người thầy đặc biệt quan trọng Nó đòi hỏi cao hơn ở người thầy khả năng tổ chức so với hình thức dạy học truyền thống Về một góc độ nào đó, năng lực của người thầy thể hiện qua hệ thống định hướng giúp học sinh phát hiện và giải quyết vấn đề thông qua hệ thống các câu hỏi Hệ thống. .. nội dung của học phần này tại ĐH Công Nghiệp Hà Nội: 23 a Đề cương chi tiết học phần 1 Tên học phần: LÍ THUYẾT THỐNG KÊ 2 Số đơn vị học trình: 2 đvht 3 Trình độ: Cho sinh viên CĐ, ĐH năm thứ nhất 4 Phân bổ thời gian: - Lý thuyết: 20 tiết - Bài tập : 10 tiết 5 Điều kiện tiên quyết: SV đã học xong học phần Lí thuyết xác suất 6 Mục tiêu học phần: Sinh viên nắm được các kiến thức cơ bản về thống kê để phục... biệt so với các hình thức dạy học truyền thống là quá trình truyền đạt, phân tích, xử lý thông tin và kiểm tra đánh giá kết quả được giáo viên, học sinh thực hiện có sự trợ giúp của các phần mềm và MTĐT 1.1.3 Tổ chức dạy học toán trong môi trường công nghệ thông tin và truyền thông (Information and communication technologies-ICT) a Sử dụng phương tiện ICT trong các giờ lên lớp với số đông học sinh ... minh luận điểm - Dựa vào thực trạng việc dạy học thống kê chưa có hỗ trợ phần mềm tin học - Dựa vào hiệu mà phần mềm tin học mang lại sử dụng giảng dạy phân tích thống kê Đóng góp luận văn Ngoài... Nội dung giảng dạy thống kê ĐH Công nghiệp Hà nội 23 1.2.2 Những khó khăn giảng dạy, học tập thống kê 28 1.3 Giới thiệu số phần mềm hỗ trợ giảng dạy phân tích thống kê 29 1.3.1 Phần mềm EXCEL... hỏi nghiên cứu Các phần mềm tin học sử dụng giảng dạy phân tích thống kê nào? Giả thuyết khoa học Có thể nâng cao hiệu việc giảng dạy phân tích thống kê sử dụng phần mềm tin học Excel, Minitab

Ngày đăng: 14/10/2015, 17:11

Từ khóa liên quan

Mục lục

  • DANH MỤC CÁC CHỮ VIẾT TẮT

  • MỤC LỤC

  • MỞ ĐẦU

  • 1.1. Cơ sở lí luận

  • 1.1.1.Vai trò của công nghệ thông tin trong dạy học

  • 1.1.2. Khai thác sử dụng CNTT trong dạy học Toán

  • 1.2. Cơ sở thực tiễn

  • 1.2.1. Nội dung giảng dạy thống kê ở ĐH Công Nghiệp Hà Nội

  • 1.2.2. Những khó khăn trong giảng dạy, học tập thống kê

  • 1.3 Giới thiệu một số phần mềm hỗ trợ giảng dạy phân tích thống kê

  • 1.3.1. Phần mềm EXCEL

  • 1.3.2. Phần mềm MINITAB

  • 1.3.3. Phần mềm STATA

  • 2.1. Giảng dạy bài “Ước lượng khoảng tin cậy cho kỳ vọng của biến ngẫu nhiên” với sự hỗ trợ của phần mềm MINITAB

  • 2.1.1. Đề cương bài giảng

  • 2.1.2. Giáo án

  • 2.2. Giảng dạy bài “Ước lượng khoảng tin cậy cho xác suất và phương sai của biến ngẫu nhiên” với sự hỗ trợ của phần mềm EXCEL

  • 2.2.1. Đề cương bài giảng

  • 2.2.2. Giáo án

  • 2.3 Sử dụng STATA giảng dạy bài “Phân tích tương quan”

Tài liệu cùng người dùng

Tài liệu liên quan