1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Bài tập thực hành nhóm số 1 môn học phân tích dữ liệu

16 0 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Bài tập thực hành nhóm số 1 môn học phân tích dữ liệu
Tác giả Trần Thanh Bình, Bùi Thị Trúc Mai, Trần Nhật Ngân, Nguyễn Nam Hưng, Phạm Duy Khánh
Người hướng dẫn Cô Võ Thị Lệ Uyển
Trường học Đại học Quốc gia TP.HCM, Trường Đại học Kinh tế - Luật
Chuyên ngành Phân tích dữ liệu
Thể loại Bài tập thực hành nhóm
Năm xuất bản 2024
Thành phố Hồ Chí Minh
Định dạng
Số trang 16
Dung lượng 0,92 MB

Nội dung

Với mức ý nghĩa 5%, hãy cho biết: có sự khác biệt về điểm APACHE cơ bản apache giữa bệnh nhân được điều trị và không được điều trị hay không biến điều trị là treat?. Tìm khoảng tin cậy 9

Trang 1

ĐẠI HỌC QUỐC GIA TP.HCM TRƯỜNG ĐẠI HỌC KINH TẾ - LUẬT

BÀI TẬP THỰC HÀNH NHÓM SỐ 1 Môn học: Phân tích dữ liệu Giảng viên hướng dẫn: Cô Võ Thị Lệ Uyển

Thực hiện: Nhóm 10

T

Hồ Chí Minh, ngày 21 tháng 10 năm 2024

Trang 2

BÀI TẬP NHÓM 2 - NHÓM SỐ 10.

Sử dụng phần mềm Stata, thực hiện các phân tích và trả lời các câu hỏi được đính kèm trong file "BTNHOM2.pdf"

P/S: Bài nộp gồm:

1 dofile

2 file thảo luận các kết quả, được trình bày dưới dạng Word.

FILE Bài tập BTNHOM2.pdf

File import sephis.dta

BÀI TẬP THỰC HÀNH NHÓM SỐ 2 Sử dụng bộ dữ liệu sepsis.dta, hãy trả lời các câu hỏi sau:

Câu hỏi 1 Sử dụng đồ thị thích hợp để mô tả phân phối xác suất của nhiệt độ ban đầu (temp0) và nhiệt độ sau 2 giờ theo dõi (temp1)? Thảo luận về kết quả thu được? Câu hỏi 2.Với những bệnh nhân được điều trị có chủng tộc được ghi nhận là "Other", hãy kiểm tra xem có khác biệt đáng kể giữa nhiệt độ ban đầu (temp0) và nhiệt độ sau

2 giờ (temp1) hay không? Thảo luận về kết quả thu được?

Câu hỏi 3 Với những bệnh nhân được điều trị có chủng tộc được ghi nhận là "White", hãy tìm khoảng ước lượng với độ tin cậy 90% cho sự khác biệt giữa nhiệt độ ban đầu (temp0) và nhiệt độ sau 4 giờ (temp2) Thảo luận về khoảng tin cậy thu được?

Câu hỏi 4 Sử dụng đồ thị thích hợp để mô tả phân phối xác suất của điểm APACHE

cơ bản (apache) giữa bệnh nhân được điều trị và không được điều trị (biến điều trị là treat)? Thảo luận về kết quả thu được(Các tổng thể có tuân theo phân phối chuẩn không? Trung bình các tổng thể có bằng nhau không? Phương sai các tổng thể có bằng nhau không?)?

Câu hỏi 5 Với mức ý nghĩa 5%, hãy cho biết: có sự khác biệt về điểm APACHE cơ bản (apache) giữa bệnh nhân được điều trị và không được điều trị hay không (biến điều trị là treat)? Thảo luận về kết quả thu được?

Câu hỏi 6 Tìm khoảng tin cậy 95% cho sự khác biệt về điểm APACHE cơ bản

(apache) giữa bệnh nhân được điều trị và không được điều trị Thảo luận về kết quả thu được?

Câu hỏi 7 Sử dụng đồ thị thích hợp để mô tả phân phối xác suất của điểm APACHE

cơ bản (apache) theo các chủng tộc người (race)? Thảo luận về kết quả thu được (Các tổng thể có tuân theo phân phối chuẩn không? Trung bình các tổng thể có bằng nhau không? Phương sai các tổng thể có bằng nhau không?)?

Trang 3

Câu hỏi 8 Với mức ý nghĩa 5%, hãy cho biết: có sự khác biệt về điểm APACHE cơ bản (apache) giữa các chủng tộc người (race) hay không? Thảo luận về kết quả thu được (Lưu ý: Cần thảo luận về việc đáp ứng các điều kiện của ANOVA)

Câu hỏi 9 Nếu có sự khác biệt về điểm APACHE cơ bản (apache) theo các chủng tộc người, hãy sử dụng đồ thị thích hợp để hiển thị sự khác biệt này? Thảo luận về kết quả thu được?

Câu hỏi 10 Nếu có sự khác biệt về điểm APACHE cơ bản (apache) theo các chủng tộc người, ở mức ý nghĩa 5%, hãy cho biết sự khác biệt đó là giữa những cặp chủng tộc nào? Thảo luận về kết quả thu được?

Câu hỏi 11 (Câu hỏi cộng 1 điểm thưởng) Với mức ý nghĩa 5%, hãy cho biết: có sự khác biệt về điểm APACHE cơ bản (apache) giữa các chủng tộc người (race) và các phương pháp điều trị (treat) hay không? Thảo luận về kết quả thu được?

NHÓM 10.

CÂU 1 CÂU 2 CÂU 3 CÂU 4 CÂU 5 CÂU 6 CÂU 7 CÂU 8 CÂU 9 CÂU 10 CÂU 11( không bắt

buộc) 1.

Trang 4

- Cả hai phân phối của temp0 và temp1 đều có hình dạng gần giống với phân phối chuẩn (bell-shaped)

- Sự dịch chuyển của đỉnh đường màu đỏ (temp1) sang trái và thấp hơn đường màu xanh (temp0) cho thấy nhiệt độ trung bình sau 2 giờ có xu hướng giảm so với nhiệt độ ban đầu

2.

- H0:k h ô ng c ó s ự k h á c bi ệ t đá ng k ể gi ữ a temp 0 v à temp 1

Trang 5

- H1: c ó s ự k h á c biệ t đá ng k ể giữ atemp 0 v à temp 1

Ta có p-value = 0.0063 < α = 0.05

⇒ B á c b ỏ H0

Kết luận: Có sự khác biệt đáng kể giữa nhiệt độ ban đầu (temp0) và nhiệt độ sau 2

giờ (temp1)

*THẢO LUẬN: Kết quả kiểm định cho thấy rằng nhiệt độ đã thay đổi đáng kể trong

khoảng thời gian 2 giờ Điều này có thể do nhiều nguyên nhân, chẳng hạn như quá trình vật lý xảy ra, lỗi đo hoặc ảnh hưởng của các yếu tố môi trường

3.

Với độ tin cậy 90%, sự chênh lệch trung bình giữa nhiệt độ ban đầu (temp0) và sau 4

giờ (temp2) được ước tính nằm trong khoảng từ -0.9847 đến -0.6822.

Vì toàn bộ khoảng này là âm, điều này cho thấy nhiệt độ sau 4 giờ giảm đáng kể so

với nhiệt độ ban đầu

Vì khoảng tin cậy không chứa 0, ta có thể kết luận rằng có sự khác biệt có ý nghĩa thống kê giữa nhiệt độ ban đầu và sau 4 giờ.

Cụ thể, nhiệt độ trung bình sau 4 giờ thấp hơn khoảng 0.83°C so với nhiệt độ ban đầu, với độ lệch nằm trong khoảng từ 0.68°C đến 0.98°C.

Sự giảm nhiệt độ này có thể phản ánh hiệu quả của phương pháp điều trị hoặc các yếu

tố ảnh hưởng khác trong quá trình theo dõi

Tùy vào bối cảnh lâm sàng, mức giảm này có thể được coi là có ý nghĩa thực tế nếu

nó giúp cải thiện tình trạng bệnh nhân hoặc đạt được mục tiêu điều trị

Kết luận:

Khoảng tin cậy 90% cho thấy rằng nhiệt độ trung bình sau 4 giờ giảm rõ rệt so với nhiệt độ ban đầu Sự giảm này không chỉ có ý nghĩa thống kê mà còn có thể mang ý nghĩa thực tiễn, tùy thuộc vào ngữ cảnh điều trị

4.

Trang 6

Các tổng thể không tuân theo phân phối chuẩn

Trang 7

Tất cả các giá trị p đều lớn hơn 0.05, cho thấy chúng ta không có đủ bằng chứng để bác bỏ giả thuyết H0 (không có sự khác biệt trung bình giữa hai nhóm)

Do đó, không có sự khác biệt có ý nghĩa thống kê giữa hai nhóm Placebo và Ibuprofen

về mặt trung bình

Tất cả các giá trị p đều lớn hơn 0.05, có nghĩa là không có đủ bằng chứng để bác bỏ giả thuyết H0 (giả thuyết rằng phương sai của hai nhóm là bằng nhau)

Dựa trên kết quả này, có thể kết luận rằng không có sự khác biệt có ý nghĩa thống kê

về phương sai giữa hai nhóm (Placebo và Ibuprofen)

5.

Trang 8

p-value = 0.6626 > 0.5

Kết luận: Không có sự khác biệt đáng kể về điểm APACHE cơ bản giữa bệnh nhân

được điều trị và không được điều trị

6.

- Khoảng tin cậy từ -1.0176 đến 1.5991

Kết luận: Khoảng tin cậy bao gồm 0 nên không có sự khác biệt về điểm APACHE cơ

bản giữa bệnh nhân được điều trị và không được điều trị

7.

Trang 9

Biểu đồ Hist:

Biểu đồ Plot:

Trang 10

Nhận xét: Dựa vào đường mật độ, có thể thấy đường này không khớp với các dữ

liệu(cột) của 3 chủng tộc nên có thể kết luận rằng các tổng thể không tuân theo phương phối chuẩn Bằng cách so sánh vị trí của các đỉnh trong các đồ thị, ta có thể cho rằng trung bình của các tổng thể có thể khác nhau Bằng cách so sánh độ rộng của các phân phối, ta có thể cho rằng phương sai của các tổng thể có thể khác nhau

Lưu ý: Dựa vào đồ thị không thể xác định chắc chắn các nhận xét trên, cần tiến thành

thực hiện các kiểm định

8.

Kiểm định tính xấp xỉ phân phối chuẩn:

Kết luận: các giá trị Prob>z đều bé hơn 0.05 nên có thể chắc rằng các tổng thể không tuân theo phân phối chuẩn.

Trang 11

Kiểm định anova và nhận xét việc các trung bình tổng thể có bằng nhau hay không:

Nhận thấy giá trị p-value = 0.0003 < 0.05 nên có thể xác định rằng có thể bãi bỏ H0 với H0 : các trung bình tổng thể bằng nhau

=> Các trung bình tổng thể không bằng nhau

Kiểm định tính đồng nhất của các phương sai:

Trang 12

Dựa vào giá trị của W0 , W50 , W10 đều bé hơn mức ý nghĩa là 0.05 nên có thể kết luận

rằng các phương sai tổng thể là khác nhau.

Thảo luận về điều kiện thực hiện phân tích ANOVA: Tuy có thể thấy qua phân tích

Levene rằng các phương sai tổng thể không bằng nhau, nhưng qua dự đoán từ câu 7

và kết quả phân tích Oneway, cho thấy rằng có thể các trung bình tổng thể thật sự có

sự khác nhau, cho dù việc điều kiện yêu cầu bằng nhau của các phương sai là không

đáp ứng

9.

Từ dữ kiện và kết luận từ câu 8 là có sự khác biệt về điểm APACHE cơ bản theo các chủng tộc người Biểu đồ phù hợp để thể hiện sự khác biệt mà nhóm chúng em chọn là biểu đồ hộp râu

Trang 13

Nhận xét:

- Nhóm người black có trung bình và trung điểm APACHE cao hơn hai nhoms người còn lạ

- Nhóm người black có khoảng phân bố rộng nhất

- Nhóm người other có một giá trị ngoại lai đặc biệt (dấu chấm tròn), vượt xa so với phần lớn dữ liệu

10.

Trang 14

Nhận xét: Dựa vào kiểm định Tukey, có thể thấy cả 3 cặp đều có sự khác biệt, trong đó:

Black vs White:

Giá trị p = 0.000 << 0.05 Điều này cho thấy có sự khác biệt rất đáng kể về trung bình điểm APACHE giữa nhóm Black và White Cụ thể, nhóm Black có điểm APACHE trung bình cao hơn nhóm White khoảng 2.8794 điểm Khoảng tin cậy 95% không bao gồm giá trị 0, củng cố kết luận về sự khác biệt giữa hai nhóm

Other vs White:

Giá trị p = 0.873 > 0.05 Điều này cho thấy không có sự khác biệt có ý nghĩa thống kê

về trung bình điểm APACHE giữa nhóm Other và White

Trang 15

Other vs Black:

Giá trị p = 0.029 < 0.05 Điều này cho thấy có sự khác biệt có ý nghĩa thống kê về trung bình điểm APACHE giữa nhóm Other và Black Cụ thể, nhóm Black có điểm APACHE trung bình cao hơn nhóm Other khoảng 3.5245 điểm

11.

Giá trị tới hạn white = 0.01273 < 0.05

Giá trị tới hạn black = 0.00258 < 0.05

Giá trị tới hạn other = 0.0.00395 < 0.05

Giá trị tới hạn placebo = 0.00107 < 0.05

Giá trị tới hạn Ibuprofen = 0.0001 < 0

Vậy bác bỏ => Dữ liệu không tuân phân phối chuản với mức ý nghĩa 5%

Kiểm định phương sai đồng nhất

Trang 16

Có giá trị tới Prob > F = 0.0062 < 0.

Vậy nên ta bác bỏ , điều kiện không đồng nhất về phương sai ở mức ý nghĩa 5%, vậy nên không thể dùng bảng Anova để đánh giá

Ngày đăng: 29/10/2024, 20:18

w