Cụ thể, nhóm 4 lựa chọn đề tài: “Khảo sát 80 sinh viên Đại học Thương Mại gồm 40 sinh viên nam và 40 sinh viên nữ về số tiền chi tiêu hàng tháng của họ” làm đề tài thảo luận của nhóm.. Ư
Trang 1ĐẠI HỌC THƯƠNG MẠI
*******
BÀI THẢO LUẬN
Đề tài: Khảo sát 80 sinh viên Đại học Thương Mại (gồm 40 sinh viên nam và 40 sinh viên nữ) về số tiền
chi tiêu hàng tháng của họ
Giáo viên hướng dẫn: Vũ Thị Thu Hương
Lớp học phần: 231_AMAT1011_15
Nhóm: 4
Hà Nội, 2023
Trang 2BẢNG PHÂN CÔNG NHIỆM VỤ
và câu 2
10/10
Trang 3CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM
Độc lập – Tự do – Hạnh phúc
BIÊN BẢN HỌP NHÓM LẦN 1
1 Thời gian: ngày 02 tháng 11 năm 2023
2 Địa điểm: phòng họp online trên Microsoft Team
3 Thành phần tham dự: 10/10 thành viên nhóm 4
4 Nội dung thảo luận:
- Các thành viên cùng trao đổi và đặt các câu hỏi liên quan đến đề tài thảo luận
- Nhóm trưởng cùng các thành viên xây dựng, phân chia nội dung đề tài thảo luận
và phân công nhiệm vụ đến từng thành viên được tổng hợp trong bảng các thànhviên nhóm
- Bàn bạc xây dựng mẫu Google Form để thu thập thông tin cho bài khảo sát
- Thống nhất thời gian hoàn thành nhiệm vụ cho từng thành viên
5 Đánh giá: Các thành viên trong nhóm tham gia đầy đủ, tích cực trao đổiđóng góp ý kiến
Trang 4CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM
Độc lập – Tự do – Hạnh phúc
BIÊN BẢN HỌP NHÓM LẦN 2
1 Thời gian: ngày 19 tháng 11 năm 2023
2 Địa điểm: phòng họp online trên Microsoft Team
3 Thành phần tham dự: 10/10 thành viên nhóm 4
4 Nội dung thảo luận:
- Các thành viên đưa ra những việc cần làm nốt và thảo luận về những bài tập chưalàm được
- Nhóm trưởng chốt những việc chưa làm xong, các thành viên đóng góp ý kiến vềbài làm của các thành viên khác Nếu làm chưa đúng, đưa ra phương hướng giảiquyết lại bài tập đó
- Làm Excel cho kết quả khảo sát từ Google Form để hoàn thiện bài thảo luận
- Thống nhất thời gian hoàn thành nhiệm vụ cho từng thành viên
5 Đánh giá: Các thành viên trong nhóm tham gia đầy đủ, tích cực trao đổiđóng góp ý kiến
Trang 5MỤC LỤC
CHƯƠNG I: LỜI MỞ ĐẦU 2
CHƯƠNG 2: CƠ SỞ LÝ THUYẾT 3
I Ước lượng các tham số của đại lượng ngẫu nhiên 3
1 Ước lượng điểm 3
2 Ước lượng bằng khoảng tin cậy 5
II Kiểm định giả thuyết thống kê 11
1 Một số khái niệm và định nghĩa 11
2 Kiểm định giả thuyết về tham số của Đại lượng ngẫu nhiên (ĐLNN) 13
CHƯƠNG 3: GIẢI BÀI TẬP VÀ XỬ LÝ SỐ LIỆU BẰNG EXCEL 18
CHƯƠNG 4: GIẢI BÀI TẬP PHẦN 2 29
CHƯƠNG 5: KẾT LUẬN 53
Trang 6CHƯƠNG I: LỜI MỞ ĐẦU Toán học là môn khoa học đề cập đến logic của con số, cấu trúc, không gian và cácphép biến đổi Toán học là nền tảng cơ bản của vạn vật, xuất hiện trong mọi vật xungquanh chúng ta Đó là thước đo cho mọi thứ trong cuộc sống hàng ngày
Cuộc sống chứa đựng vô vàn những sự vật, hiện tượng, và mọi thứ đều gắn với sự ngẫunhiên Để khám phá thế giới khổng lồ này nhằm đưa ra những dự báo, quyết định, việchiểu biết về mô hình xác suất và suy diễn thống kê đóng vai trò rất quan trọng Điều đócàng trở nên cấp thiết hơn trong kỉ nguyên 4.0, khi mà việc xây dựng các mô hình tựđộng hóa trí tuệ nhân tạo đòi hỏi kĩ năng xây dựng mô hình dự báo từ số liệu có sẵn.Không thể phủ nhận rằng, xác suất thống kê là nền tảng của khoa học dữ liệu, là cơ sở đểphát triển những công nghệ tiến bộ và phục vụ cho công cuộc phát triển đất nước Nhận thấy tầm quan trọng của xác suất thống kê trong đời sống hàng ngày, nhóm chúng
em quyết định thảo luận và nghiên cứu về thống kê toán Chúng em vận dụng kiến thứcmình được học để áp dụng vào một trong những khía cạnh cấp thiết của các bạn sinh viênnhư chúng em, đó là vấn đề kiểm soát và định mức chi tiêu hàng tháng Cụ thể, nhóm 4lựa chọn đề tài: “Khảo sát 80 sinh viên Đại học Thương Mại (gồm 40 sinh viên nam và
40 sinh viên nữ) về số tiền chi tiêu hàng tháng của họ” làm đề tài thảo luận của nhóm
Do chưa có nhiều kinh nghiệm và kiến thức trong quá trình nghiên cứu, tổng hợp và ápdụng lý thuyết vào thực tiễn, không thể tránh khỏi những sai sót trong kết quả được đưa
ra Chúng em rất mong được các thầy cô góp ý để sửa chữa, hoàn thiện bài làm, cũng nhưtích lũy thêm kinh nghiệm trong quá trình học tập tại Đại học Thương Mại
Chúng em xin chân thành cảm ơn!
2
Trang 7CHƯƠNG 2: CƠ SỞ LÝ THUYẾT
I Ước lượng các tham số của đại lượng ngẫu nhiên
Để thu thập một thông tin nào đó của một tổng thể, trong nhiều trường hợp, do bị hạnchế về nhân lực, tài chính và thời gian, hoặc do các lý do khác, ta không thể khảo sát toàn
bộ các phần tử của tổng thể Vì thế chúng ta thường lấy ra một mẫu, khảo sát, đo lường,tính toán trên mẫu này, sau đó suy rộng ra cho tổng thể Quá trình ấy được gọi là ướclượng
Tuy nhiên do sự biến động của tổng thể, do có sai số trong quá trình thu thập thông tinnên chúng ta cần có những phương pháp có hiệu quả để sự ước lượng này có sự chínhxác và độ tin cậy nhất định
Ta có hai dạng ước lượng chính là ước lượng điểm và ước lượng khoảng Trong dạngthứ nhất, ta tìm một giá trị để ước lượng cho thông số khảo sát; còn trong dạng thứ hai, tatìm một khoảng giá trị Tùy theo điều kiện cụ thể của vấn đề mà ta sử dụng một trong hai(hoặc cả hai) dạng ước lượng
1 Ước lượng điểm
nhiên X trên một đám đông nào đó
Trang 8Chú ý: Có nhiều cách chọn thống kê θ, thông thường người ta chọn θ là các đặc trưng
Bước 1: Ta lấy mẫu ngẫu nhiên W =(X1,X2, ,Xn); n¿ 1000
n.∑
i=1
n (X i phù hợp với θ=E(X )=μ)
khoảng 76,8 tuổi
- Các tiêu chuẩn đánh giá bản chất tốt của ước lượng:
a) Ước lượng không chệch
- Thống kê θ ¿
- Ngược lại, ta nói θ ¿
Ví dụ:E(S ' 2)=σ 2nên S ' 2 là ước lượng không chệch của Var( X)=σ 2
−θ|<ε)=1
c) Ước lượng hiệu quả (ƯLKC tốt nhất)
- Thống kê θ ¿
có phương sai nhỏ nhất so với các ước lượng không chệch khác trên cùng một mẫu
4
Trang 9Ví dụ: θ 1 ,θ2 là các ƯLKC của θ Nếu Var(θ 1)<Var(θ 2) thì θ 1 là ƯLHQ của θ.
2 Ước lượng bằng khoảng tin cậy
Bước 1: Lấy mẫu ngẫu nhiên W =(X1,X2, ,Xn)
γ=1−α gọi là độ tin cậy 1=θ2−θ 1 gọi là độ dài của khoảng tin cậy
Chú ý:
2 ta cókhoảng tin cậy ngắn nhất và đó là các khoảng tin cậy đối xứng
Để ước lượng giá trị tối thiểu cho θ ta chọn: [α 1 =0 ,α α 2 =
α 1 =α, α 2 =0
2.1 Ước lượng kỳ vọng toán của đại lượng ngẫu nhiên
- Bài toán: Xét một đại lượng ngẫu nhiên X trên một đám đông nào đó Các số đặc trưng
Trang 10Có E ( X) =μ,Var (X )=σ ,p=P( A), … là một số cụ thể, muốn biết phải điều tra toàn bộđám đông Việc làm đó sẽ gặp nhiều khó khăn thậm chí không thực hiện được như đốivới đám đông vô hạn hoặc là nó bị phân hủy ngày trong quá trình điều tra.
TH1: X N(μ;σ 2) với σ 2 đã biết:
Bước 1: Vì X N(μ;σ2)nên X N(μ;σ2
X−μ σ
√n
N (0 ;1)
Bước 2: Đưa ra khoảng tin cậy
a) Khoảng tin cậy đối xứng (α α 1 = 2 =
2
6
Trang 11(1) P ( μưε<X <μ+ε) =γ
√n ta có 3 bài toán sau: {Bàitoán1: Biết n,γ Tìmε
Bàitoán2: Biết n,ε Tìm γ Bàitoán3: Biết ε ,γ Tìm n
b) Khoảng tin cậy phải (α 1 =0 ,α 2 =2 ) Ước lượng μmin
- Với độ tin cậy γ= ư 1 α ta tìm được phân vị uα sao cho: P(U <uα)=γ
P(U > Xưuα.σ
√n)=γ
√n;+∞)
c) Khoảng tin cậy trái (α 1 =α ,α 2 =0 ) Ước lượng μ max
- Với độ tin cậy γ= ư 1 α ta tìm được phân vị uα sao cho: P(U >ưuα)=γ
Bước 3: Tính toán và kết luận
Bước 1: Vì n>30 nên X N(μ;σ
2
Xưμ σ
√n
N (0 ;1)
Bước 2: tương tự TH1
Trang 12Bước 3: tương tự TH1
Chú ý: Nếu σ chưa biết, vì n>30 nên ta lấy σ≈s '
TH3: X N(μ;σ 2) với σ 2 chưa biết, n<30
√n
T (n−1)
Bước 2: Đưa ra khoảng tin cậy
a) Khoảng tin cậy đối xứng (α α 1 = 2 =
√n<μ<X +tα
(n−1) s '
√n)=γ
P ( μ−ε<X <μ+ε)=γ trong đó: ε=t α
(n−1) s'
√n
Khoảng tin cậy đối xứng của μ là: (X−t(n−1)α s '
√n<μ<X +t(n−1)α s '
√n)
b) Khoảng tin cậy phải (α1=0 ,α2=2 ) Ước lượng μ min
- Với độ tin cậy γ= − 1 α ta tìm được phân vị t α
(n−1)
sao cho: P(T <t (n−1)α
)=γ
8
Trang 13√n;+ ∞)
c) Khoảng tin cậy trái (α 1 =α ,α 2 =0 ) Ước lượng μmax
- Với độ tin cậy γ= − 1 α ta tìm được phân vị t α
Khoảng tin cậy phải của μ là: (−∞; X+t α(n−1 ).√s'n)
Bước 3: Tính toán và kết luận
2.2 Ước lượng tỷ lệ
- Bài toán: Xét một đám đông có kích thước N, trong đó có M phần tử mang dấu hiệu A
Bước 2: Đưa ra khoảng tin cậy
2) Ước lượng p , f ,M,N, nα
Trang 14- Với độ tin cậy γ= − 1 α ta tìm được phân vị uα sao cho: P(−u α <u<u α)=γ
Bước 3: Tính toán và kết luận
- Bài toán cho p, ước lượng tần suất mẫu f: (*) P (f −ε< p<f +ε )=γ
- Bài toán cho N ,f(n,n A), ước lượng M: (*) P(f −ε<M
10
Trang 15b) Khoảng tin cậy phải (α 1 =0 ,α 2 =2 ) Ước lượng p min ,f max ,M min ,N max ,n A max
- Với độ tin cậy γ= − 1 α ta tìm được phân vị uα sao cho: P(U <uα)=γ
P(p>f −u α √pq
n)=γ
Khoảng tin cậy phải của p là: (f −u α √pq
n;1)
c) Khoảng tin cậy trái (α1=α ,α2=0 ) Ước lượng p max ,f min ,M max ,N min ,n A min
- Với độ tin cậy γ= − 1 α ta tìm được phân vị u α sao cho: P(U >−uα)=γ
P(p<f +uα.√pq
n)=γ
Khoảng tin cậy trái của p là: (0 ;f +uα.√pq
n)
II Kiểm định giả thuyết thống kê
1 Một số khái niệm và định nghĩa
1.1.Giả thuyết thống kê
Như ta đã biết, vì không điều tra cả đám đông nên ta không biết dạng phân phối xácsuất của dấu hiệu cần nghiên cứu X trên đám đông hoặc có thể biết dạng phân phối xác
xét khác nhau về các yếu tố chưa biết, đó là các giả thuyết thống kê
- ĐLNN X phân phối theo quy luật chuẩn
- Tham số θ của X bằng θ 0
Khi nghiên cứu hai hay nhiều ĐLNN thể hiện trên cùng một đám đông hoặc trên nhữngđám đông khác nhau, ta có thể đưa ra các nhận xét: các ĐLNN đó độc lập hay phụ thuộc
Trang 16hoặc các tham số của chúng có bằng nhau hay không, đó cũng là các giả thuyết thống kê.Một cách ngắn gọn ta có thể đưa ra định nghĩa:
trưng của ĐLNN hoặc về tính độc lập của các ĐLNN được gọi là giả thuyết thống kê, kíhiệu là H0
đã chọn cặp giả thuyết H 0 và H 1 thì việc bác bỏ H 0 tức là chấp nhận H 1 và ngược lại H 0
1.2 Tiêu chuẩn kiểm định
G = f (X1,…, Xn,θ0)
xác suất của G hoàn toàn xác định Một thống kê như vậy được gọi là tiêu chuẩn kiểm
1.3 Miền bác bỏ, quy tắc kiểm định
P(G ∈W α /H 0 )=α Trong đó: {Wα: miềnbácbỏ
α :mức ýnghĩa
xảy ra trong một lần thực hiện phép thử
Do đó, với mẫu cụ thể, ta tính được g m mà g m ∈W α thì ta bác bỏ giả thuyết H 0
12
Trang 17Từ đám đông, lấy mẫu ngẫu nhiên kích thước n, và tính giá trị gm:
g m ∈W α thì bác bỏ H0, chấp nhận H1.
g m ∉W α thì chưa đủ cơ sở để bác bỏ H 0
1.4 Các loại sai lầm khi kiểm định
Theo quy tắc kiểm định trên ta có thể mắc hai loại sai lầm sau:
- Sai lầm loại II: Thực ra H0 là sai nhưng ta lại chấp nhận
Kết luận
H 0 (bác bỏ H 1) Bác bỏ H 0 (chấp nhận H 1)
2 Kiểm định giả thuyết về tham số của Đại lượng ngẫu nhiên (ĐLNN)
2.1 Kiểm định giả thuyết về kì vọng toán của một ĐLNN
Trang 19- Với mẫu cụ thể tính: utn =x−μ0
σ
√n
Nếuu tn ∉W α :chưacó cơ sở bácbỏ H 0
Bước 1: Xây dựng tiêu chuẩn kiểm định
Trang 202.2 Kiểm định giả thuyết về phương sai của ĐLNN phân phối chuẩn
kiểm định giả thuyết H 0: σ 2 =σ 0
' 2
σ 0
Nếu H0đúngthì X2
X 2 ( n−1 ) Bài toán 1: {H0: σ 2 =σ0
1−α2( n−1 )
}
Trong đó :X tn
2 =(n−1)S' 2
Trang 21Ta tìm được X α sao cho P(X > Xα )=α
* Công thức P-giá trị (P-Value):
Đối với bài toán 1: {H 0 : σ 2
Trang 22CHƯƠNG 3: GIẢI BÀI TẬP VÀ XỬ LÝ SỐ LIỆU BẰNG
EXCEL
1 Xử lý số liệu
Mẫu bảng hỏi
vị: triệu đồng)
80
18
Trang 2629 Đoàn Thị Vân Nữ 3 - 4
22
Trang 2755 Mai Tiến Đạt Nam 2 - 3
Trang 282 Tính trung bình số tiền chi tiêu hàng tháng của sinh viên trên toàn mẫu và theogiới tính (dùng phần mềm excel).
Giới tính Trung bình chi tiêu hàng tháng của sinh viên trên toànmẫu và theo giới tính (đơn vị: triệu đồng)
3 Tính độ lệch tiêu chuẩn mẫu; độ lệch tiêu chuẩn mẫu điều chỉnh xét trên toàn mẫu
và theo giới tính (dùng phần mềm excel)
24
Trang 29mẫu (đơn vị: triệu đồng/ tháng).
đám đông (đơn vị: triệu đồng/ tháng)
- Vì n=80>30 nên X N(μ ,σ
2
n) và U =
X−μ σ
Trang 30mẫu (đơn vị: triệu đồng/ tháng).
26
Trang 31μ là số tiền chi tiêu trung bình hàng tháng của sinh viên Đại học Thương Mại trênđám đông (đơn vị: triệu đồng/ tháng).
Trang 32trên mẫu (đơn vị: triệu đồng/ tháng).
trên đám đông (đơn vị: triệu đồng/ tháng)
√40
=− 0,968 >− =− uα 2,576
→utn∉W α : Chưa đủ cơ sở để bác bỏ H 0
Kết luận: Với mức ý nghĩa 5%, ta chưa thể kết luận rằng số tiền chi tiêu trung bình sinhviên nữ của trường Đại học Thương mại có số tiền chi tiêu trung bình hàng tháng ít hơn
so với sinh viên nam Đại học Thương Mại hàng tháng của sinh viên Đại học ThươngMại
28
Trang 33CHƯƠNG 4: GIẢI BÀI TẬP PHẦN 2
Phần II: Giải bài tập
Bài 3.1 (trang 39)
a Một ngày có 2 máy hỏng:
- Nếu coi sự hoạt động của mỗi máy là một phép thử, ta có 5 phép thử độc lập
- Trong mỗi phép thử chỉ có 2 trường hợp: hoặc máy hỏng hoặc không Xác suất hỏngcủa mỗi máy đều bằng 0,1
- Gọi X là số máy hỏng trong một ngày thì X phân phối theo quy luật nhị thức với cáctham số n=5 ,p=0,1 (tức là XB (5 ;0,1 ))
Trang 34P (X =2)¿ C 5 (0 , 1 ) (1−0,1) =0,0729
Vậy xác suất để một ngày có đúng 2 máy hỏng là 0,0729
b Một ngày có không quá 1 máy hỏng
Xác suất để trong ngày có không quá 1 máy hỏng là xác suất để X nhận giá trị trongkhoảng [0, 1]
Vậy xác suất để một ngày có không quá 1 máy hỏng là 0,91854
c Gọi X là số máy bị hỏng trong thời gian T Tính E(X), Mod(X), Var(X)
Ta có bảng phân phối xác suất:
: “Gia đình không có máy tính”
¿ C 15
4 0,4 4 0,6 11 =0,12678
b) P(X ≥ 2) ¿1− ¿ P(X<2) ¿ 1− ¿ [P(X¿ 0) + P(X ¿ 1)]
30
Trang 35- Vậy kết quả có thể xảy ra là:
0
π sin 2 xd(2 x )¿−12 cos2 x|π
4 0
Trang 36- Xác suất sản phẩm bị hỏng trong thời gian bảo hành là:
P(X ≤ 2) ¿ Φ (2−μ
σ )+0,5=Φ (−1 )+0,5=0,5−Φ (1)
¿ 0,5 0,34134 0,15866 − =
- Nếu quy định thời hạn bảo hành là 2 năm thì tiền lãi trung bình khi bán 1 sản phẩm là:
100 000−47 598=52 402 (đồng)Vậy nếu quy định thời hạn bảo hành là 2 năm thì tiền lãi trung bình khi bán 1 sản phẩm là
Trang 37- Gọi B là thời gian bảo hành cần quy định để tiền lãi khi bán sản phẩm được 70 000 đồng (đơn vị: năm)
Gọi X là độ dài chi tiết máy đạt II → X ~ N( , s ) 𝜇 2
Tỉ lệ chi tiết máy đạt tiêu chuẩn là:
- Công thức ước lượng trung bình mẫu:
Trang 38∑
i=1 x i n
x i là các giátrị doanhthutrongmẫu nlàkíchthước củamẫu(số lượng quansát trongmẫu)
- Cách tiếp cận này giúp bạn ước lượng điểm doanh thu trung bình dựa trên dữ liệu thuthập được Tuy nhiên, để đảm bảo tính chính xác và đáng tin cậy của ước lượng, cần lưu
ý đến việc chọn mẫu đủ lớn và đại diện cho toàn bộ doanh thu của cửa hàng Ngoài ra,cũng cần xem xét các phương pháp thống kê khác như khoảng tin cậy để đánh giá mức
độ chắc chắn của ước lượng
- Tuy nhiên, để có một ước lượng phương sai đáng tin cậy, cần thu thập một mẫu dữ liệu
đủ lớn và đại diện cho việc bán lẻ hàng hóa đó
- Ngoài ra, cần lưu ý rằng việc sử dụng phương pháp ước lượng phương sai mẫu có thể bịảnh hưởng bởi độ lệch của dữ liệu nếu có
Bài 5.3 (trang 87)
- Để ước lượng điểm tỉ lệ phế phẩm của một lô hàng hóa, ta có thể sử dụng phương pháp ước lượng tỉ lệ mẫu qua công thức:
^p=xn
34
Trang 39Trong đó:{ ^ plàước lượngtỉlệ mẫu
xlà số lượng phế phẩmtrongmẫu nlàkích thước củamẫu(tổngsốlượng sản phẩmtronglôhàng)
- Để ước lượng điểm tỉ lệ phế phẩm, ta cần lấy một mẫu ngẫu nhiên từ lô hàng hóa vàđếm số lượng sản phẩm là phế phẩm trong mẫu đó Sau đó, chia số lượng phế phẩm chotổng số lượng sản phẩm trong mẫu để có ước lượng tỉ lệ mẫu
- Tuy nhiên, cần chú ý rằng để có ước lượng tỉ lệ chính xác và đáng tin cậy, mẫu cầnđược lựa chọn một cách ngẫu nhiên và đại diện cho toàn bộ lô hàng hóa Điều này giúpđảm bảo tính khả thi của việc áp dụng ước lượng tỉ lệ mẫu cho toàn bộ lô hàng
- Ngoài ra, cũng có thể sử dụng khoảng tin cậy để đánh giá mức độ chắc chắn của ướclượng tỉ lệ, đặc biệt khi muốn đưa ra dự đoán về tỉ lệ phế phẩm trong lô hàng hóa lớnhơn
Bài 5.4 (trang 87)
n¿50
Gọi X là trọng lượng của gói hàng
E(X) là trọng lượng trung bình của gói hàng do máy đóng
Gọi Var(X) là phương sai trọng lượng của gói hàng
=1
n∑
i=1
n (Xi¿ − X ) 2 ¿
- Trên mẫu cụ thể: