Lời nói đầu Trong thời đại thông tin hiện nay, việc giảng dạy và học tập toán học nói chung cũng như thống kê nói riêng thường được gắn với việc thực hành các phần mềm trên máy tính.. 2
Trang 1MỤC LỤC
Lời nói đầu……… 1
Chương 1 PHẦN MỀM MAPLE……… 5
1.1 Giới thiệu chung về Maple ……… 5
1.2 Giao diện và môi trường làm việc của Maple……… 5
1.2.1 Giao diện và các menu lệnh của Maple………5
1.2.2 Môi trường tính toán và các đối tượng trong trang làm việc…… 6
1.3 Thực hiện các phép tính số học ……… 7
1.3.1 Phép tính số nguyên ……… 7
1.3.2 Tính toán với các số thập phân……… 8
1.4 Vẽ đồ thị và các vấn đề liên quan ……… 8
1.4.1 Vẽ đồ thị trong mặt phẳng……… 8
1.4.2 Vận động của đồ thị ……….9
1.5 Các khái niệm và các hàm cơ bản trong lập trình Maple………… 10
1.5.1 Các khái niệm cơ bản ………10
1.6 Các hàm thường dùng trong Maple ……….13
1.6.1 Ước lượng giá trị ……….13
1.6.2 Tìm giá trị lớn nhất và bé nhất ……….14
1.6.3 Thay thế trong biểu thức: lệnh subs ……….14
1.6.4 Chuyển đổi dạng cấu trúc dữ liệu (lệnh convert) ………15
1.7 Cách tạo lập hàm trong Maple ……….16
1.8 Lập trình trên Maple ………17
1.9 Thiết lập một chu trình (procedure) ………18
Chương 2 CƠ SỞ THỐNG KÊ ………20
2.1 Mẫu ngẫu nhiên ………20
2.2 Hàm phân phối thực nghiệm ………21
2.3 Đa giác tần suất và tổ chức đồ……… 21
2.3.1 Đa giác tần suất ……….21
2.3.2 Tổ chức đồ……… 22
2.4 Các đặc trưng của mẫu ……… 23
2.4.1 Trung bình mẫu ………23
2.4.2 Phương sai mẫu ………24
2.5 Một số quy luật phân phối xác suất thường dùng trong thống kê 24 2.6 Ước lượng các tham số của mẫu ngẫu nhiên ………26
2.6.1 Ước lượng điểm……… 26
2.6.2 Ước lượng khoảng ……….26
2.6.3 Khoảng tin cậy của giá trị trung bình……… 26
2.6.4 Khoảng tin cậy của phương sai khi lấy mẫu từ phân phối chuẩn có phương sai chưa biết ………28
2.7 Kiểm định giả thuyết thống kê ……… 28
Trang 22.7.1 Kiểm định giả thuyết về giá trị trung bình……… 28
2.8 Hồi quy ……….32
2.8.1 Mô hình hồi quy với một biến dự báo ……… 32
2.8.2 Mô hình hồi quy tuyến tính đơn……… 32
2.8.3 Ước lượng các tham số hồi quy bằng phương pháp bình phương bé nhất ……… 33
Chương 3: SỬ DỤNG MAPLE TRONG THỐNG KÊ 34 3.1 Các đặc trưng của mẫu……… 34
3.1.1 Tính kỳ vọng (EX) và phương sai (DX) của biến ngẫu nhiên X ………34
3.1.2 Trung bình mẫu, phương sai mẫu, phương sai mẫu hiệu chỉnh 35 3.2 Ước lượng khoảng……… 36
3.3 Tổ chức đồ ……….38
3.4 Kiểm định giả thuyết ………40
3.5 Hồi quy ……….42
KẾT LUẬN……… 45
TÀI LIỆU THAM KHẢO ……….46
Trang 3Lời nói đầu
Trong thời đại thông tin hiện nay, việc giảng dạy và học tập toán học nói chung cũng như thống kê nói riêng thường được gắn với việc thực hành các phần mềm trên máy tính Hiện nay, theo thống kê chưa đầy đủ, có trên 300 phần mềm về xác suất - thống kê và toán học Việc lựa chọn phần mềm nào để thực hành là một vấn đề không đơn giản vì nó phụ thuộc vào nhiều nhân tố như khả năng mua phần mềm đó để học và thực hành, thời gian thực hành
Dựa vào điều kiện thực tế ở nước ta thì 4 phần mềm thường được sử dụng trong thống kê là MAPLE, MATLAB, SPPS, S-PLUS Một đặc điểm chung của 4 phần mềm trên là chúng có một quá trình phát triển trên 30 năm Trong đó MAPLE, MATLAB là phần mềm chuyên về tính toán kí hiệu Còn SPPS, S-PLUS là các phần mền chuyên về xác suất- thống kê trong đó phải xử lí việc nhập và quản lý các số liệu ở quy mô hàng trăm biến, hàng nghìn quan sát Trong trường hợp như thế MAPLE, MATLAB tỏ ra không thích hợp Tuy nhiên MAPLE khác SPPS, S-PLUS và với nhiều phần mền khác ở chỗ nó còn
Chương 2 : Cơ sở thống kê
Trong chương này, trình bày về lý thuyết mẫu, về các bài toán ước lượng tham số, một số bài toán về kiểm định giả thiết và hồi qui
Chương 3: Ứng dụng phần mềm Maple vào trong thống kê
Trong chương này, xây dựng các thủ tục để tính các đặc trưng của mẫu, tìm khoảng tin cậy, kiểm định giả thuyết
Trang 4Mặc dù đã cố gắng hết sức, do thời gian và kiến thức về lĩnh vực tìm hiểu còn nhiều hạn chế nên khoá luận còn nhiều thiếu xót Vì vậy, tôi rất mong được
sự bổ sung góp ý của các thầy giáo, các bạn để hoàn thiện những thiếu xót của khoá luận
Tôi xin chân thành cảm ơn sự quan tâm của ban chủ nhiệm khoa, các thầy
cô trong khoa Toán đã tạo mọi điều kiện cho tôi thực hiện khoá luận này Đặc biệt, tôi xin gửi lời cảm ơn chân thành nhất tới thầy Nguyễn Trung Dũng đã giúp đỡ và tận tình chỉ bảo tôi trong suốt quá trình thực hiện khoá luận này
Hà Nội, ngày 14 tháng 5 năm 2008 Nguyễn Thị Thu Huyền
Trang 5Chương 1 PHẦN MỀM MAPLE
1.1 Giới thiệu chung về Maple
Maple là một phần mềm của công ty Maplesoft - một bộ phận của công ty
Maple Waterloo có địa chỉ trang Web là: http:// www.maplsoft.com/ Ban đầu,
Maple chỉ là một hệ thống tính toán ký hiệu (Symbolic Computation Sytem) hay
hệ thống đại số máy tính (Computer Algebra System) Phiên bản của Maple được giới thiệu ở đây là phiên bản lần thứ 9.5, gọi tắt là Maple 9.5 Maple 9.5 là môi trường toàn diện để nghiên cứu, giảng dạy và ứng dụng toán học
Maple còn gọi là một ngôn ngữ lập trình, nó được thiết kế đặc biệt để viết các chương trình mẫu về toán học và ứng dụng một cách nhanh chóng
1.2 Giao diện và môi trường làm việc của Maple
1.2.1 Giao diện và các menu lệnh của Maple
File: Chứa các lệnh liên quan tới làm việc với một file cụ thể
New: Tạo một file mới
Open: Mở một file đã có
Save: Ghi các file đang soạn thảo
Save as: Ghi file đang mở sang một file mới và đặt tên cho file mới này Close: Đóng file đang làm việc
Exit: Thoát khỏi Maple
Edit: Menu này chứa các lệnh liên quan tới copy, cắt dán, xoá bỏ…các đoạn khi
đang làm việc với một file
View: Menu này chứa một tập hợp lệnh liên quan tới giao diện làm việc của
Trang 6Windows: Chứa các lệnh về xếp tầng các trang làm việc hoặc đóng các trang
làm việc đã được mở
Chú ý: Các lệnh làm việc của Maple được đưa vào trang làm việc tại dấu
nhắc lệnh thường được biểu thị bằng font chữ màu đỏ Sau mỗi lệnh phải kết thúc bằng dấu chấm phảy “ ; ” thì sau khi thực hiện lệnh kết quả sẽ hiện ra màn hinh, còn nếu thay bằng dấu hai chấm “ : ” thì không hiện kết quả ra màn hình
1.2.2 Môi trường tính toán và các đối tượng trong trang làm việc Cụm xử lý(Execution Group)
Cụm xử lý là thành phần tính toán cơ bản trong trang làm việc.Có thể dễ dàng nhận biết một cụm xử lý bằng ngoăc vuông bên trái của dấu nhắc lệnh
Kí hiệu: [>
Cụm xử lý là nơi dưa lệnh vào để tính toán và nhận lại kết quả do máy đưa ra
Lệnh và kết quả tính toán của Maple
Lệnh của Maple (Maple Input) được đưa vào trang làm việc tại dấu nhắc lệnh Tuỳ theo tên và cú pháp của các câu lệnh Lưu ý lệnh phải được kết thúc bằng dấu chấn phẩy “ ; ”
[> solve(3*x^2-2*x=1,{x});
Muốn cho thực hiện lệnh thì đưa con trỏ về dòng lệnh và nhấn phím
“Enter”
cụm xử lý (nhấn phím “enter”khi con trỏ đang ở dòng lệnh ) thì kết quả tính toán sẽ đươc hiện ra
Ví dụ 1.2 : [> solve(3*x^2-2*x=1,{x});
} 3
1 {
}, 1
Trang 7Đồ thị(Graph)
Maple cho phép vẽ đồ thị ngay trong trang làm việc, đặc tính này được gọi là “đồ hoạ trực tiếp” Dưới đây là một ví dụ về một bản vẽ trực tiếp đồ thị của đường cong
y=sin(x2 x 1 ) cos(x2 x 1 ) trên đoạn [-3,3]
[> with(plots);
[> plot(sin(x^2+x-1)-cos(x^2-x+1),x=-3 3);
1.3 Thực hiện các phép tính số học
1.3.1 Phép tính số nguyên
Khởi động chương trình bằng lệnh [> restart;
Sau dấu nhắc lệnh ta đưa các phép toán cần thực hiện với các số nguyên
Ví dụ 1.3 : Tìm ước chung lớn nhất
Lệnh tổng quát gcd(a,b,ha,hb)
Các tham số a,b:là các số nguyên, da thức nhièu biến trên một trường số,hàm đại số
ha,hb: tuỳ chọn tên của các đại lượng chưa xác định
Tìm ước chung lớn nhất của hai số 9585 và 426852
[> gcd(9585,426852);
639
Ví dụ 1.4 : Tìm nghiệm nguyên của phương trình
Trang 8Lệnh tổng quát isolve(pt,bien)
Các tham số pt: phương trình hoặc hệ phương trình cấn giải
bien: tên các biến sử dụng để biểu diễn nghiệm
Trong trường hợp phương trình hay hệ phương trình không có nghiệm nguyên (hoặc máy không giải được) thì máy sẽ báo null hay không trả lời
Tìm nghiệm nguyên của hệ phương trình 2x+3y-7z=5
x+y=1
[> isolve({2*x+3*y-7*z=5,x+y=1},{t,u,v});
x = -2 - 7 t, y = 3 + 7 t, z = t
1.3.2 Tính toán với các số thập phân
Tính giá trị của biểu thức số học
Trang 9Ta có thể cho nó chuyển động liên tục bằng cách chọn chức năng Animation/Continuous.Muốn dừng lại ta sử dụng Animation/Stop
Trang 10Ví dụ 1.7 Hãy vẽ đồ thị hàm số y=tsin(tx) khi x nhận giá trị trong khoảng
và quan sát sự thay đổi của đồ thị khi t thay đổi trong khoảng 2 2
1.5 Các khái niệm và các hàm cơ bản trong lập trình Maple
1.5.1 Các khái niệm cơ bản
Tên (name) và xâu kí tự : Tên là một sâu hình tự (string of letters) được dùng
như một chỉ mục hay một nhãn để đại diện cho các đối tượng trong maple có thể thay đổi được (như biến, kí hiệu toán học, các biểu thức nói chung, …) mà ta có
thể gán cho nó
Tên là một trong các thành phần không thể thiếu được của maple trong việc tạo ra các biểu thức
Một xâu ký tự bất kỳ (string of letters) có thể không phải là xâu hình tự
và do đó không thể là một tên hợp lệ Maple cho phép tạo ra một tên từ một xâu
ký tự bất kỳ bằng cách cho nó vào trong cặp dấu nháy đơn Ví dụ như xâu ký tự ̀a variable! ̀ là một tên biến hợp lệ, và người ta có thể gắn cho nó giá trị 10 bằng lệnh ̀a variable! ̀ =10
Trang 11Biến trong Maple: Biến trong Maple là những tên được dùng để thay thế
cho một đối tượng nào đó, thông thường là các giá trị cần thay đổi, hoặc các biểu thức tính toán cần cho giá trị ,… có hai loại biến trong maple: Biến lập
Ta xem xét chi tiết bằng cách phân tích một ví dụ cụ thể
Trang 12tất nhiên x không chứa giá trị nào (hay nói đúng hơn là giá trị của x chính là kí hiệu x)
Sau các phép gán, giá trị của z, y, t đều tham chiếu đến biểu thức x2
+5x -12 chúng được xem như là biến có thể lập trình
Trang 13Chú ý : Một lỗi mà nhiều người sử dụng Maple thường mắc phải là:
Dùng biến i làm biến chương trình, rồi sau đó thì lại dùng i như chỉ số của tổng
trong lệnh tính toán tổng sum
Expression: Biểu thức cần ước lượng
[Digits]: Là tham số tuỳ chọn, nhận giá trị là số tự nhiên (số lượng các số
sau dấu chấm thập phân)
Hàm evalf (expression) ước lượng các số với số các chữ số thập phân mặc định
trong biến Digits:
[>evalf(bt1);
2.425197989
Để biết số chữ số thập phân mặc định là bao nhiêu ta dùng lệnh
[>Digits;10
Trang 141.6.2 Tìm giá trị lớn nhất và bé nhất
Lệnh
Max− xác định phần tử lớn nhất của một dãy các biểu thức
Min – xác định phần tử nhỏ nhất của một dãy các biểu thức
Lời gọi
Max (x 1 , x 2 , …) Min (x 1 , x 2 , …) Đối số:
var,var1,var2,…,varn: các kí hiệu cần được thay thế trong biểu thức
repl,repl1,…,repln: các biểu thức sẽ thay thế chỗ của var, var1, …,varn trong
biểu thức expr
Trang 15expression: biểu thức cần được chuyển đổi
resulttype: dạng dữ liệu biểu thức của ta cần chuyển sang
Trang 16Đếm số phần tử của danh sách
[> nops(ds);
10
1.7 Cách tạo lập hàm trong Maple
Dùng chu trình proc()…end để tạo hàm
Mô tả
Cấu trúc proc()…end được dùng để định nghĩa hàm bao gồm các lệnh được xử lý theo bó (batch processing), tức là thực hiện một dãy các lệnh liên tiếp nhau mà không có sự can thiệp trực tiếp của người dùng
Cấu trúc này được sử dụng tiện lợi khi mà ta cần thực hiện những tính toán trong đó không thể thực hiện được bằng cách gọi các hàm lồng nhau hoặc bằng cách dùng toán tử định nghĩa hàm như ở trên, nhất là khi phép tính cần kết hợp kết quả của nhiều hàm để thực hiện một công việc Khi thực hiện một chu trình của Maple, ta chỉ cần lấy (có thể chỉ một phần) kết quả của hàm trước truyền cho hàm tiếp theo, và do đó không thể dùng hàm gọi các hàm lồng nhau hay định nghĩa bằng toán tử định nghĩa hàm đơn giản được
này, ta chỉ đề cập đến những chu trình đơn giản nhất
Sau đây là một chu trình về việc xây dựng một hàm tính giá trị lớn nhất
của ba số thông qua việc sử dụng lệnh điều kiện if then else fi:
[> max3:proc(a,b,c)
print(`Gia tri lon nhat trong ba so la:`);
if a<b then
if b<c then c else b fi;
elif a<c then c else a fi;
end:
[> max3(10,100,-2.34);
Trang 17Gia tri lon nhat trong ba so la:
condition sau từ khoá elif sẽ được kiểm tra, nếu nó đúng thì chuỗi lệnh tương
ứng sau then được thực hiện, cứ tiếp tục cho đến khi các điều kiện condition đều không thoả mãn, thì các biểu thức sau lệnh else sẽ được thực hiện
Lưu ý: Cấu trúc lệnh (tuỳ chọn) elif … then…được lập lại với số lần tuỳ ý Từ
khoá elif là dạng viết tắt của else if
Các biểu thức điều kiện (condition) được sử dụng trong câu lệnh if phải
được tạo thầnh từ các bất đẳng thức, các đẳng thức (các phép toán quan hệ), các biến số, các phép toán logic, các hàm có giá trị trả lại là giá trị logic Nếu trái lại thì sẽ gây ra lỗi
[> gpt:=proc(a,b,c)
local delta,x1,x2;
delta:=b^2-4*a*c;
Trang 18if delta<0 then
print(`phuong trinh vo nghiem`);
elif delta=0 then x1:=-b/(2*a);
print(`pt co nghiem kep`,x1);
1.9 Thiết lập một chu trình (procedure)
Các khái niệm cơ bản cần phải nắm vững để tạo ra một chu trình (procedure) là:
-Cấu trúc proc()…end; cùng với các khai báo trong cấu trúc này (global,
- Các hàm gỡ lỗi và cách bẫy lỗi
Khai báo chu trình
Lời gọi khai báo một chu trình:
Trang 19Parameter_name: là một dãy các kí hiệu, ngăn cách nhau bởi các dấu chấm
phẩy, chứa tên các tham biến truyền cho chu trình
Local_sequence: Là một dãy các tên được khai báo là biến cục bộ trong chu
trình, nó chỉ có giá trị sử dụng trong phạm vi chu trình đang xét (local được sử dụng để khai báo cho các biến chỉ sử dụng bên trong một chu trình)
Global_sequence: Dãy các tên biến toàn cục có giá trị sử dụng ngay cả bên
ngoài chu trình
Option_sequence: Dãy các tuỳ chọn cho một chu trình
Statements_sequence: Dãy các câu lệnh do người lập trình đưa vào
Trang 20Chương 2 CƠ SỞ THỐNG KÊ
Thống kê toán là bộ môn toán học nghiên cứu quy luật của các hiện tượng ngẫu nhiên có tính chất số lớn trên cơ sở thu thập và xử lý các số liệu thống kê các kết quả quan sát Như vậy, nội dung chủ yếu của thống kê toán là xây dựng các phương pháp thu thập và xử lý số liệu thống kê nhằm rút ra các kết luận khoa học và thực tiễn
Các phương pháp thống kê toán là công cụ để giải quyết nhiều vấn đề khoa học và thực tiễn nảy sinh trong các lĩnh vực khác nhau của tự nhiên và kinh tế xã hội
2.1 Mẫu ngẫu nhiên
Tập hợp tất cả các phần tử cần nghiên cứu được gọi là một tổng thể Tập hợp các phần tử lấy ra từ một tổng thể được gọi là mẫu Số phần tử của mẫu được gọi là số lượng của mẫu hay cỡ mẫu
Mẫu ngẫu nhiên là mẫu mà các phần tử được chọn ra một cách ngẫu nhiên Có hai cách lấy mẫu ngẫu nhiên: lấy có lặp và lấy không lặp lại Với cách lấy mẫu không lặp lại, phần tử lấy ra sau khi xác định các đặc trưng được trả lại tập ban đầu Với cách lấy mẫu không lặp lại, phần tử lấy ra sau khi xácđịnh các đặc trưng không được trả lại tập ban đầu
Muốn cho mẫu phản ánh tương đối chính xác tổng thể thì mẫu phải được chọn một cách khách quan
Tiến hành n quan sát độc lập về biến ngẫu nhiên X nào đó Ta gọi X i là việc quan sát lần thứ i về biến ngẫu nhiênX Khi đó (X1,X2, ,X n) được gọi là mẫu ngẫu nhiên, n được gọi là cỡ mẫu Nếu ta gọi x i là kết quả quan sát lần thứ
i Khi đó ( x1, x2, , xn) được gọi mẫu số liệu hay là một giá trị cụ thể mà mẫu
ngẫu nhiên (X1,X2, ,X n) nhận
Trang 212.2 Hàm phân phối thực nghiệm
Giả sử ta có một mẫu số liệu( x1, x2, , xn) được rút ra từ biến ngẫu nhiên
n( ) với x R Trong đó n xlà số các giá trị x icủa mẫu nhỏ hơnx
Định lý 2.1 (Định lý Glivencô)
Giả sử F (x) là hàm phân phối của biến ngẫu nhiên X và F n (x) là hàm
phân phối thực nghiệm nhận được từ mẫu ngẫu nhiên cỡ n Khi đó ta có
P { sup F n(x)F(x) 0 khi n } = 1
x
Như vậy, theo định lý Glivencô hàm phân phối thực nghiệm là một xấp xỉ của hàm phân phối lý thuyết Xấp xỉ đó càng tốt khi cỡ mẫu n càng lớn Hàm phân phối thực nghiệm cho ta hình ảnh về hàm phân phối lý thuyết
2.3 Đa giác tần suất và tổ chức đồ
2.3.1 Đa giác tần suất
Cho mẫu số liệu (x1,x2, x n) quan sát về biến ngẫu nhiênX Khi đó,
1
được gọi là
mẫu thu gọn Để đơn giản về mặt kí hiệu ta viết x i thay cho x (i)
Trang 22Bảng sau gọi là bảng phân bố tần số các giá trị của mẫu:
n n
n n
Từ bảng phân bố này ta xây dựng biểu đồ tần suất như sau:
-Vẽ hệ trục toạ độ Oxy,trục Ox để biểu diễn các giá trị của x i Tại mỗi
điểm x i trên trục Ox ta dựng đoạn thẳng vuông góc với Ox và có độ dài
n
n i
-Tập hợp tất cả các đoạn thẳng dựng trên cho ta biểu đồ tần suất Nối các điểm phía trên của đoạn thẳng liên tiếp đó bằng các đoạn thẳng ta được một
đường gấp khúc, được gọi là đường gấp khúc tần suất (hay đa giác tần suất)
Biểu đồ tần suất thường được sử dụng trong trường hợp X là biến rời rạc
2.3.2 Tổ chức đồ
Giả sử cỡ mẫu là lớn và X là biến ngẫu nhiên liên tục Khi đó, ta ghép các số liệu thành lớp, chẳng hạn k lớp, bởi các điểm cách đều nhau:
k i
a a
a0 1 1 Nếu x i a i hay x i a i1 thì ta xếp ngẫu nhiên vào một trong 2 lớp ở 2 bên số đó Nếu có n số liệu thuộc vào lớp thứ i i thì ta
nói n ( i
n
n i
) là tần số (tần suất) ghép lớp của lớp thứ ivà n số liệu đó được i
thay thế bởi n số liệu có giá trị bằng i
Trang 23Giá trị nhỏ nhất : 39 kg , giá trị lớn nhất : 48 kg Ta ghép các số liệu trên thành 4 lớp với tần số ghép lớp như trong bảng sau:
Tổ chức đồ và đa giác tần suất Đường gấp khúc giới hạn trên các hình chữ nhật được gọi là tổ chức đồ tần suất Đa giác tần suất là tập hợp các đoạn thẳng nối liền các trung điểm đáy trên của các hình chữ nhật đứng kề nhau trong tổ chức đồ Hai đoạn thẳng ngoài nối với một điểm trên trục hoành cách điểm a0(a n) một nửa chiều dài của lớp