1. Trang chủ
  2. » Luận Văn - Báo Cáo

Sử dụng phần mềm r Để giải quyết bài toán thống kê

24 0 0
Tài liệu được quét OCR, nội dung có thể không chính xác
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 24
Dung lượng 2,65 MB

Nội dung

Vì vậy, để đáp ứng yêu cầu của cuộc sống hiện đại thì tư duy thống kê là điều không thê thiếu đối với bất kỳ ai, dù công việc của người đó có liên quan trực tiếp đến các phương pháp thốn

Trang 1

" Á<

TRƯỜNG ĐẠI HỌC NGÂN HÀNG THÀNH PHÔ HỎ CHÍ MINH

KHOA HE THONG THONG TIN QUAN LY

Trang 2

BAO CAO KET QUA LAM VIEC NHOM Mon: LY THUYET XAC SUAT VA THONG KE TOAN

Nhoén/Lép: DI7 Tén Nhom: 17

Họ và tên nhóm trưởng: Bùi Mai Phuong Sé DT: 0362563617 Email:030238220195@st.buh.edu.vn

Nhận xét của GV:

Trang 3

GIANG VIEN NHOM TRUONG

(Ký và ghi rõ họ tên) (Ký và ghi rõ họ tên)

Trang 4

MUC LUC

I Các công thức giải tích tổ hợp, ví dụ minh họa 7

1 Qui tắc nhân 22222222 2222222 12222222Ự 2,22 5H, iu, 7 Vi: Ÿoi -NNra ằ:Ã 7

3

4

3

6

IL Tính xác suất bằng định nghĩa, có ví dụ mình họa il

41 Định nghĩa cô điện cee eee 22 2 2 222222222226 11

2 Công thức cộng xác suất 222222222 222222222 2226 11

4 Công thức xác suất đầy đủ 2.2222, 14

5 Công thức Bayes L LH HT TT TH nh Hà, 15

1 Giới thiệu về phần mềm R 16

1 Sự ra đời của phần mềm R 222222 cee cece cette 1ó

2 Ưu điểm của R 2.222.222 2222222, 22, E nọ 17

II Sử dụng R để phân tích thống kê mô tả 17

1 Thủ công từng thống kê 22222222222222 12222222 17

2 Dung lénh Summary (tenbien) 2.2 22.122 SH 2 2°, 18

Trang 5

TÀI LIỆU THAM KHẢO

Trang 6

LOI MO ĐẦU

Trong cuộc sống hiện nay, có nhiều biến cô sự việc xảy ra ngẫu nhiên theo nhiều chiều hướng mà ta có thê biết trước hoặc không Trong toán học, ta gọi đó bằng một thuật

ngữ là phép thử, cái hay ở đây là chúng ta rất thích đưa ra những dự đoán về những

biến cô xảy ra quanh chúng ta Vây những dự đoán đó là đựa vào phương diện nao dé

giải thích và toán học đã được áp dụng như thế nào để tính toán những dự đoán của

chúng ta Đó là cái hay của phần bài Xác suất mà hôm nay nhóm em sé đi tìm hiểu

Xác suất là một nhánh của toán học liên quan đến các mô tả bằng số về khả năng xảy

ra một sự kiện, hoặc khả năng một mệnh đề là đúng Xác suất của một sự kiện là một

số trong khoảng từ 0 đến I, trong đó, nói một cách đại khái, 0 biểu thị sự bất khả thi

của sự kiện và Ibiễu thị sự chắc chan.(Wikipedia)

Vi dụ: Khi chúng ta gieo xúc sắc: ta dự đoán sẽ là mặt chăn hay lẻ xuất hiện Đó là l biểu hiện của xác suất

Vậy còn Thống kê ở phân 2 là gì?

Ngày nay thống kê đã trở nên một công cụ quan trọng trong công việc của các nhà chuyên môn thuộc nhiều ngành khác nhau: y tế, tâm lý, giáo dục, xã hội học, kỹ thuật, vật lý vv Thống kê cũng là một phần quan trọng trong các hoạt động thường ngày

Vì vậy, để đáp ứng yêu cầu của cuộc sống hiện đại thì tư duy thống kê là điều không thê thiếu đối với bất kỳ ai, dù công việc của người đó có liên quan trực tiếp đến các

phương pháp thống kê hay không

Hiện nay, xác suất thống kê được đưa vào chương trình mới để giảng dạy ở cấp bậc nhỏ hơn Từ đó chúng ta thấy được tầm quan trọng của bộ môn này trong cuộc sống

Đề tài nhóm chúng em tìm hiểu hôm nay chỉ là một nhánh nhỏ của bộ môn, tuy nhiên

qua bài thảo luận này, chúng em mong rằng sẽ hiểu rõ hơn và đúc kết được những nội dung của lý thuyết một cách ngắn gọn, xúc tích

CHƯƠNG 1: XAC SUAT

Trang 7

Qui tắc trên gọi là qui tắc nhân

Đề đi từ thành phố A tới thành phố C phải qua thành phố B Có một trong bốn phương

tiện để đi từ A tới B là: đường bộ, đường sắt, đường không và đường thuỷ Có một trong hai phương tiện đề đi từ B tới C là đường bộ và đường thuỷ Hỏi có bao nhiêu cách đi từ A tới C?

Giải:

Để thực hiện việc di từ A tới C ta phải thực hiện một dãy liên tiếp hai hành động

Hành động thứ nhất: chọn phương tiện di tir A toi C có n1= 4 cách

Hành động thứ hai: chọn phương tiện đi từ B tới C có n2 = 2 cách

Vậy: theo qui tắc nhân, số cách đi từ A tới C là n= 4.2 = 8 cách

2 Qui tắc cộng

Đề hoàn thành công việc người ta có thê chọn một trong k phương án

Phương án thứ nhất: có 1 trong n1 cách thực hiện

Phương án thứ hai: có l trong n2 cách thực hiện

Phương án thứ k: có 1 trong nk cách thực hiện

Gọi n là sô cách hoàn thành công việc nói trên, ta có:

Trang 8

Qui tắc trên gọi là qui tắc cộng

Ví đụ:

Một tổ sinh viên gồm hai sinh viên Hà Nội, ba sinh viên Nam Định và ba sinh viên Thanh Hoá Cần chọn hai sinh viên cùng tỉnh tham gia đội thanh niên xung kích Hỏi

có bao nhiêu cách chọn

Đề chọn hai sinh viên cùng tinh ta có 3 phương án:

Phương án thứ nhất: Chọn hai sinh viên Hà Nội có n1= 1 cach

Phương án thứ hai: Chọn hai sinh viên Nam ðịnh có n2= 3 cách

Phương án thứ ba: Chọn hai sinh viên Thanh Hoá có n3= 3 cách

Theo qui tắc cộng ta có số cách chọn hai sinh viên theo yêu cau:

theo một thứ tự thì ta được I hoán vi clan phần tử đó

Chang han nhu: xếp ba bạn HOÀNG, bạn XUÂN và bạn ĐỊNH vào một bàn học

ngang Ta có một hoán vị HOÀNG-XUÂN-ĐỊNH Và hoán vị ĐỊNH-HOÀNG-

XUÂN là hoán vị khác với hoán vị HOÀNG-XUÂN- ĐỊNH

Tổng quát với tập hợp gồm n phân tử ta có định nghĩa sau:

Giả sử ta có n vị trí đánh số từ 1 tới n Để được I hoán vị của n phần tử đã cho, ta xếp

từng phân tử lần lượt vào các vị trí từ 1 đến n Xếp vào vị trí thứ 1 có n cách Xếp vào

vị trí thứ 2 có n-I cách (vì I phần tử đã xếp vào vị trí thứ I rồi) Cứ như vậy đến hết

Vậy số hoán vị của n pmmtữrdãchơlữ————————————— r đã a

Pn = n(n-1)(n-2) 1= n!

Trang 9

Hành động thứ hai: chon | trong n-1 phần tử dé xếp thứ 2: có n -1 cách

Hành động thứ k: chọn 1 trong n-k+1 phần tir dé xếp cuối: c6 n-k+1 cach

Theo qui tắc nhân: Số cách tạo ra một chính hợp không lặp chập k của n phần tử là :

ÁA =n(n-1)(n~2) (n—k+1)= (+ x1

Vidu:

Từ các chữ số: 1,2,3,4,5,6,7,8,9 Có thé lập được bao nhiêu số có 5 chữ số mà các chữ

Trang 10

Hành động thứ hai: chọn l trong n phân tử xếp thứ 2 có n cách

Hành động thứ k: chon | trong n phan tử xếp thứ k có n cách

Theo qui tắc nhân ta có: A4 =A‘

Trang 11

Cách 2: Ta áp dụng công thức: $# =©'1=0'

6 Tổ hợp

6.1 Định nghĩa:

Tổ chập k của n phần tử (k < n) là một nhóm không phân biệt thứ tự gồm k phân tử

khác nhau chọn từ n phân tử đã cho

Số tổ hợp chập k của n phần tử được ký hiệu là: ”

6.2.Công thức tính

Từ định nghĩa tổ hợp ta thay tổ hợp cũng chính là một chỉnh hợp (không lặp) Nhưng

các chỉnh hợp nếu chi khác nhau về thứ tự sắp xếp của các phần tử được cơi như cùng

Xét một phép thử Fl với n kết quả có thể xảy ra, nghĩa là không gian mẫu Ll có n biến

có sơ cấp, và biến có A II có k phân tử Nếu các biến cố sơ cấp có cùng khả năng

xảy ra thì xác suất của A được định nghĩa là:

2,1, Công thức cộng xác suất cho trường hợp các biến cỗ xung khắc

H _Định ly J Néu Ava B Ola hai biến cô xung khắc nhau thì:

Trang 12

P(A, OA; Q E1A,) = P(A) + P(Ay + + P(A,)

O _Hé qua Néu cac bién co A, Ao, , A, tao nén mét hé day du cac bien co thi

tông xác suất của chúng bằng 1

Ví dụ: Một hộp có 10 sản phẩm (trong đó có 2 phế phẩm) Lấy ngẫu nhiên không hoàn

lại từ hộp ra 6 sản phẩm Tìm xác suất để có không quá l phế phẩm trong 6 sản phâm lây ra

Giải: Gọi A là biến cô “không có phế phẩm nào trong 6 sản phẩm lấy ra”

B là biến cố “có I phế phâm trong 6 sản phẩm lấy ra”

C là biến cố”

Ta thấy: C=AUB

Mà A, B là hai biến cố xung khắc (vì nó không thê đồng thời xảy ra trong phép thử lấy

có không quá I phế phẩm trong 6 sản phẩm lấy ra”

ngẫu nhiên ra 6 sản phẩm từ hộp) Nên:

2.2 Công thức cộng xác suất cho trường hợp các biển cổ tùy ÿ

- Nếu A và B là hai biến cố không xung khắc thì:

một sinh viên của lớp Tính xác suất để chọn được sinh viên học giỏi ít nhất một môn

trong hai môn Toán và Anh văn

Giải: Gọi A là biến cô “chọn được sinh viên học giỏi môn Toán”

B là biến có “chọn được sinh viên học giỏi môn Anh văn”

C là biến cố “chọn được sinh viên học giỏi ít nhất một trong hai môn Toán và

Trang 14

phép thử Đó chính là trường hợp chọn được một sinh viên học giỏi cả hai môn Toán

và Anh văn)

Do đó: P(C)=P(A)+P(B)-P(AB) =?9 + 39 — 19 =0 8 ö đó: P(C)EP(A)IP(B)-P( )= hộ ag

3 Công thức nhân xác suất

3.1 Xác suất điều kiện

Định nghĩa: Xác suất của biến cố A được tính với điều kiện biến có B đã xảy ra được

gọi là xác suất có điều kiện của A, ký hiệu là: P(A/B)

Công thức tính: Để tính xác suất có điều kiện, tùy theo từng trường hợp cụ thể ta có thê dùng định nghĩa cỗ điển hoặc dùng công thức:

PAB OOD (v điêâu kiện

P(B)z0 3.2 Công thức nhân xác suat

Cho hai biến cô A và B của cùng một phép thử và P(A)>0, P(B)>0 Khi đó ta có công thức nhân xác suât đôi với hai biên cô A và B như sau

chung sẽ có k kết quả thuận lợi cho cả A và B cùng đồng thời xảy ra Theo định nghĩa

cô điện của xác suất ta có:

Trang 15

trúng thưởng xe BMW” Bạn được chọn lên rút thăm lần lượt hai nắp khoen, tính xác

suất dé ca hai nắp đều trúng thưởng

Giải: Gọi A la biến có “nắp khoen đâu trúng thưởng”

Ae

B la biến cố “nắp khoen thứ hai trúng thưởng”

C là biến cố “cả 2 nắp đều trúng thưởng”

Khi bạn rút thăm lần đầu thì trong hộp có 20 nắp trong đó có 2 nắp trúng p(A) = 2/20

Khi biến cố A đã xây ra thì còn lại 19 nắp trong đó có 1 nắp trúng thưởng

Do đó: p(B/A) = 1/19

Từ đó ta có: p(C) = p(A) p(B/A) = (2/20).(1/19) = 1/190 = 0.0053

4 Công thức xác suất đầy đủ

Cho không gian mất © và AI, A2, An, B là các biến có

Các biến cô A1, A2, An được gọi là một hệ biến cố đây đủ nêu chúng thỏa mãn 2 điều kiện:

Trang 16

Vay: PBFIO,., P(Ai)P(B/Ai)

Ví dụ: Có 3 lô sản phẩm, tỷ lệ phế phẩm của từng lô tương ứng là: 6%; 2%; 1% Chọn ngẫu nhiên một lô rồi từ lô đã chọn lấy ngẫu

nhiên ra một sản phâm Tìm xác suất để lấy được một phế phâm?

Giải: Gọi B là biến có lấy được một phế phâm AI, À2, À3 tương ứng là các biến cố sản phẩm lấy ra thuộc lô thứ nhất, thứ hai, thứ ba Các biến cố AI, A2, A3 là một hệ biến có đầy đủ Áp dụng công

thức xác suất đầy đủ ta có:

P(B) = P(A1)P(B/A1) + P(A2)P(B/A2) + P(A3)P(B/A3)

P(AI) =P(A2) = P(A3) = ;

P(B/A1) = 0,06; P(B/A2) = 0,02; P(B/A3) = 0,01

- V(B/A1) = 0.0% (0,06 + 0,02 + 0,01) = 0,03

5 Công thức Bayes

Cho không gian m0,0Ó và A1, À2, An, B là các biến có

Các biến cô A1, A2, An được gọi là một hệ biến cố đây đủ nêu chúng thỏa mãn 2 điều kiện:

H AIUA2U UAn=O

H AinAj=Ø với mọi ij và ij€{1,2,.,n}

Và phép thử đã được thực hiện và biến cô B đã xảy ra Khi đó:

010001000)

Thí dụ: Một hộp có 5 sản phẩm hoàn toàn không rõ chất lượng Lấy ngẫu nhiên không

hoàn lại một sản phẩm từ hộp thì được sản phẩm tốt Sau đó chọn

ngẫu nhiên từ hộp một sản phâm nữa Tìm xác suất để sản phâm lấy

ra từ hộp lần thứ hai là sản phẩm tốt?

Trang 18

các biến cố AO, AI AS có khả năng xảy ra như nhau.Tức: P(A0)EP(A1)= =P(AS)=} B là biến cố sản phẩm lấy ra từ hộp lần đầu là

sản phẩm tốt Áp dụng công thức xác suất đây đủ, ta có:

Tính tương tự ta được: P(A3/B) as P(AA/B)= L - P(AS/B)= 2

CHUONG 2: SHUONG 2PHUONG 2 R GI ta duge: ra, tire trong h

I Giới thiệu về phan mềm R

1.Sự ra đời của phần mềm R

Năm 1996, trong một bài bao quan trọng về tính toán thống kê, hai nhà thống kê học

Ross Ihaka va Robert Gentlan thuộc Trường đại học Auckland, New Zealand phác hoạ

một ngôn ngữ mới cho phân tích thống kê mà họ đặt tên là R Sáng kiến này được rất nhiều nhà thống kê học trên thé giới tán thành và tham gia vào việc phát triển R Vậy R

là gì? Nói một cách ngắn gọn, R là một phần mềm sử dụng cho phân tích thống kê và

vẽ biêu đồ Thật ra, về bản chất, R là ngôn ngữ máy tính đa năng, có thể sử dụng cho

Trang 19

mathatics), tinh toán ma trận(matrix), đến các phân tích thống kê phức tạp.

Trang 20

mọi nơi cho bắt cứ việc gì, kế cả bán các sản phẩm từ R theo điều kiện của giấy phép

Bắt kỳ ai cũng được hỗ trợ đễ đưa ra ý tưởng phát triển, phát triển package mdi Tat ca

những phương pháp, mô hình mà các phần mềm thương mại có thê làm được thì R cũng có thê làm được Phân tích số liệu bằng biêu dé là một lợi thế của R, vì R có rất

nhiều gói lệnh giúp tạo ra những biểu đồ đẹp, chính xác và trực quan hóa rất tốt dữ

liệu, ví dụ: ggplots, ggedit, R gắn liền với giới học thuật, hầu hết những mô hình thông kê mới nhất đều được hỗ trợ bởi R R chạy được trên nhiều hệ điều hành

3 Một số hạn chế của R

O Khong hé tro dé hoa động hoặc 3D

H R sử dụng nhiều bộ nhớ hơn so với Python

H R thiếu bảo mật cơ bản Không thê được nhúng vào ứng dụng web

H R có cái bất lợi là dùng lệnh R không phải là một ngôn ngữ đễ học Do đó,

những người không có kinh nghiệm lập trình trước có thê cảm thầy khó học R

Các gói R và ngôn ngữ lập trình R chậm hơn nhiều so với các ngôn ngữ khác như

MATLAB va Python Cac thuat toan trong R dugc trai đều trên các gói khác nhau

Các lập trình viên không có kiến thức trước về các gói có thể gặp khó khăn khi

II Sử dụng R để phân tích thống kê mô tả

7 Thủ công từng thông kê

O Trung binh: mean (tenbien)

Trang 21

H Giá trị cao nhất nhỏ nhất min (tenbien), max (tenbien)

3 Dimg lénh Describe (tenbien)

Phai co package psych

Dùng lệnh describeBy để mô tả dữ liệu theo nhóm

Cầu trúc: DescribeBy (tenbien,group = tenbien)

Ngày đăng: 08/12/2024, 19:43

TÀI LIỆU CÙNG NGƯỜI DÙNG

  • Đang cập nhật ...

TÀI LIỆU LIÊN QUAN

w