Với mức ý nghĩa 5%, hãy cho biết: có sự khác biệt về điểm APACHE cơ bản apache giữa bệnh nhân được điều trị và không được điều trị hay không biến điều trị là treat?. Tìm khoảng tin cậy 9
Trang 1ĐẠI HỌC QUỐC GIA TP.HCM TRƯỜNG ĐẠI HỌC KINH TẾ - LUẬT
BÀI TẬP THỰC HÀNH NHÓM SỐ 1 Môn học: Phân tích dữ liệu Giảng viên hướng dẫn: Cô Võ Thị Lệ Uyển
Thực hiện: Nhóm 10
T
Hồ Chí Minh, ngày 21 tháng 10 năm 2024
Trang 2BÀI TẬP NHÓM 2 - NHÓM SỐ 10.
Sử dụng phần mềm Stata, thực hiện các phân tích và trả lời các câu hỏi được đính kèm trong file "BTNHOM2.pdf"
P/S: Bài nộp gồm:
1 dofile
2 file thảo luận các kết quả, được trình bày dưới dạng Word.
FILE Bài tập BTNHOM2.pdf
File import sephis.dta
BÀI TẬP THỰC HÀNH NHÓM SỐ 2 Sử dụng bộ dữ liệu sepsis.dta, hãy trả lời các câu hỏi sau:
Câu hỏi 1 Sử dụng đồ thị thích hợp để mô tả phân phối xác suất của nhiệt độ ban đầu (temp0) và nhiệt độ sau 2 giờ theo dõi (temp1)? Thảo luận về kết quả thu được? Câu hỏi 2.Với những bệnh nhân được điều trị có chủng tộc được ghi nhận là "Other", hãy kiểm tra xem có khác biệt đáng kể giữa nhiệt độ ban đầu (temp0) và nhiệt độ sau
2 giờ (temp1) hay không? Thảo luận về kết quả thu được?
Câu hỏi 3 Với những bệnh nhân được điều trị có chủng tộc được ghi nhận là "White", hãy tìm khoảng ước lượng với độ tin cậy 90% cho sự khác biệt giữa nhiệt độ ban đầu (temp0) và nhiệt độ sau 4 giờ (temp2) Thảo luận về khoảng tin cậy thu được?
Câu hỏi 4 Sử dụng đồ thị thích hợp để mô tả phân phối xác suất của điểm APACHE
cơ bản (apache) giữa bệnh nhân được điều trị và không được điều trị (biến điều trị là treat)? Thảo luận về kết quả thu được(Các tổng thể có tuân theo phân phối chuẩn không? Trung bình các tổng thể có bằng nhau không? Phương sai các tổng thể có bằng nhau không?)?
Câu hỏi 5 Với mức ý nghĩa 5%, hãy cho biết: có sự khác biệt về điểm APACHE cơ bản (apache) giữa bệnh nhân được điều trị và không được điều trị hay không (biến điều trị là treat)? Thảo luận về kết quả thu được?
Câu hỏi 6 Tìm khoảng tin cậy 95% cho sự khác biệt về điểm APACHE cơ bản
(apache) giữa bệnh nhân được điều trị và không được điều trị Thảo luận về kết quả thu được?
Câu hỏi 7 Sử dụng đồ thị thích hợp để mô tả phân phối xác suất của điểm APACHE
cơ bản (apache) theo các chủng tộc người (race)? Thảo luận về kết quả thu được (Các tổng thể có tuân theo phân phối chuẩn không? Trung bình các tổng thể có bằng nhau không? Phương sai các tổng thể có bằng nhau không?)?
Trang 3Câu hỏi 8 Với mức ý nghĩa 5%, hãy cho biết: có sự khác biệt về điểm APACHE cơ bản (apache) giữa các chủng tộc người (race) hay không? Thảo luận về kết quả thu được (Lưu ý: Cần thảo luận về việc đáp ứng các điều kiện của ANOVA)
Câu hỏi 9 Nếu có sự khác biệt về điểm APACHE cơ bản (apache) theo các chủng tộc người, hãy sử dụng đồ thị thích hợp để hiển thị sự khác biệt này? Thảo luận về kết quả thu được?
Câu hỏi 10 Nếu có sự khác biệt về điểm APACHE cơ bản (apache) theo các chủng tộc người, ở mức ý nghĩa 5%, hãy cho biết sự khác biệt đó là giữa những cặp chủng tộc nào? Thảo luận về kết quả thu được?
Câu hỏi 11 (Câu hỏi cộng 1 điểm thưởng) Với mức ý nghĩa 5%, hãy cho biết: có sự khác biệt về điểm APACHE cơ bản (apache) giữa các chủng tộc người (race) và các phương pháp điều trị (treat) hay không? Thảo luận về kết quả thu được?
NHÓM 10.
CÂU 1 CÂU 2 CÂU 3 CÂU 4 CÂU 5 CÂU 6 CÂU 7 CÂU 8 CÂU 9 CÂU 10 CÂU 11( không bắt
buộc) 1.
Trang 4- Cả hai phân phối của temp0 và temp1 đều có hình dạng gần giống với phân phối chuẩn (bell-shaped)
- Sự dịch chuyển của đỉnh đường màu đỏ (temp1) sang trái và thấp hơn đường màu xanh (temp0) cho thấy nhiệt độ trung bình sau 2 giờ có xu hướng giảm so với nhiệt độ ban đầu
2.
- H0:k h ô ng c ó s ự k h á c bi ệ t đá ng k ể gi ữ a temp 0 v à temp 1
Trang 5- H1: c ó s ự k h á c biệ t đá ng k ể giữ atemp 0 v à temp 1
Ta có p-value = 0.0063 < α = 0.05
⇒ B á c b ỏ H0
Kết luận: Có sự khác biệt đáng kể giữa nhiệt độ ban đầu (temp0) và nhiệt độ sau 2
giờ (temp1)
*THẢO LUẬN: Kết quả kiểm định cho thấy rằng nhiệt độ đã thay đổi đáng kể trong
khoảng thời gian 2 giờ Điều này có thể do nhiều nguyên nhân, chẳng hạn như quá trình vật lý xảy ra, lỗi đo hoặc ảnh hưởng của các yếu tố môi trường
3.
Với độ tin cậy 90%, sự chênh lệch trung bình giữa nhiệt độ ban đầu (temp0) và sau 4
giờ (temp2) được ước tính nằm trong khoảng từ -0.9847 đến -0.6822.
Vì toàn bộ khoảng này là âm, điều này cho thấy nhiệt độ sau 4 giờ giảm đáng kể so
với nhiệt độ ban đầu
Vì khoảng tin cậy không chứa 0, ta có thể kết luận rằng có sự khác biệt có ý nghĩa thống kê giữa nhiệt độ ban đầu và sau 4 giờ.
Cụ thể, nhiệt độ trung bình sau 4 giờ thấp hơn khoảng 0.83°C so với nhiệt độ ban đầu, với độ lệch nằm trong khoảng từ 0.68°C đến 0.98°C.
Sự giảm nhiệt độ này có thể phản ánh hiệu quả của phương pháp điều trị hoặc các yếu
tố ảnh hưởng khác trong quá trình theo dõi
Tùy vào bối cảnh lâm sàng, mức giảm này có thể được coi là có ý nghĩa thực tế nếu
nó giúp cải thiện tình trạng bệnh nhân hoặc đạt được mục tiêu điều trị
Kết luận:
Khoảng tin cậy 90% cho thấy rằng nhiệt độ trung bình sau 4 giờ giảm rõ rệt so với nhiệt độ ban đầu Sự giảm này không chỉ có ý nghĩa thống kê mà còn có thể mang ý nghĩa thực tiễn, tùy thuộc vào ngữ cảnh điều trị
4.
Trang 6Các tổng thể không tuân theo phân phối chuẩn
Trang 7Tất cả các giá trị p đều lớn hơn 0.05, cho thấy chúng ta không có đủ bằng chứng để bác bỏ giả thuyết H0 (không có sự khác biệt trung bình giữa hai nhóm)
Do đó, không có sự khác biệt có ý nghĩa thống kê giữa hai nhóm Placebo và Ibuprofen
về mặt trung bình
Tất cả các giá trị p đều lớn hơn 0.05, có nghĩa là không có đủ bằng chứng để bác bỏ giả thuyết H0 (giả thuyết rằng phương sai của hai nhóm là bằng nhau)
Dựa trên kết quả này, có thể kết luận rằng không có sự khác biệt có ý nghĩa thống kê
về phương sai giữa hai nhóm (Placebo và Ibuprofen)
5.
Trang 8p-value = 0.6626 > 0.5
Kết luận: Không có sự khác biệt đáng kể về điểm APACHE cơ bản giữa bệnh nhân
được điều trị và không được điều trị
6.
- Khoảng tin cậy từ -1.0176 đến 1.5991
Kết luận: Khoảng tin cậy bao gồm 0 nên không có sự khác biệt về điểm APACHE cơ
bản giữa bệnh nhân được điều trị và không được điều trị
7.
Trang 9Biểu đồ Hist:
Biểu đồ Plot:
Trang 10Nhận xét: Dựa vào đường mật độ, có thể thấy đường này không khớp với các dữ
liệu(cột) của 3 chủng tộc nên có thể kết luận rằng các tổng thể không tuân theo phương phối chuẩn Bằng cách so sánh vị trí của các đỉnh trong các đồ thị, ta có thể cho rằng trung bình của các tổng thể có thể khác nhau Bằng cách so sánh độ rộng của các phân phối, ta có thể cho rằng phương sai của các tổng thể có thể khác nhau
Lưu ý: Dựa vào đồ thị không thể xác định chắc chắn các nhận xét trên, cần tiến thành
thực hiện các kiểm định
8.
Kiểm định tính xấp xỉ phân phối chuẩn:
Kết luận: các giá trị Prob>z đều bé hơn 0.05 nên có thể chắc rằng các tổng thể không tuân theo phân phối chuẩn.
Trang 11Kiểm định anova và nhận xét việc các trung bình tổng thể có bằng nhau hay không:
Nhận thấy giá trị p-value = 0.0003 < 0.05 nên có thể xác định rằng có thể bãi bỏ H0 với H0 : các trung bình tổng thể bằng nhau
=> Các trung bình tổng thể không bằng nhau
Kiểm định tính đồng nhất của các phương sai:
Trang 12Dựa vào giá trị của W0 , W50 , W10 đều bé hơn mức ý nghĩa là 0.05 nên có thể kết luận
rằng các phương sai tổng thể là khác nhau.
Thảo luận về điều kiện thực hiện phân tích ANOVA: Tuy có thể thấy qua phân tích
Levene rằng các phương sai tổng thể không bằng nhau, nhưng qua dự đoán từ câu 7
và kết quả phân tích Oneway, cho thấy rằng có thể các trung bình tổng thể thật sự có
sự khác nhau, cho dù việc điều kiện yêu cầu bằng nhau của các phương sai là không
đáp ứng
9.
Từ dữ kiện và kết luận từ câu 8 là có sự khác biệt về điểm APACHE cơ bản theo các chủng tộc người Biểu đồ phù hợp để thể hiện sự khác biệt mà nhóm chúng em chọn là biểu đồ hộp râu
Trang 13Nhận xét:
- Nhóm người black có trung bình và trung điểm APACHE cao hơn hai nhoms người còn lạ
- Nhóm người black có khoảng phân bố rộng nhất
- Nhóm người other có một giá trị ngoại lai đặc biệt (dấu chấm tròn), vượt xa so với phần lớn dữ liệu
10.
Trang 14Nhận xét: Dựa vào kiểm định Tukey, có thể thấy cả 3 cặp đều có sự khác biệt, trong đó:
Black vs White:
Giá trị p = 0.000 << 0.05 Điều này cho thấy có sự khác biệt rất đáng kể về trung bình điểm APACHE giữa nhóm Black và White Cụ thể, nhóm Black có điểm APACHE trung bình cao hơn nhóm White khoảng 2.8794 điểm Khoảng tin cậy 95% không bao gồm giá trị 0, củng cố kết luận về sự khác biệt giữa hai nhóm
Other vs White:
Giá trị p = 0.873 > 0.05 Điều này cho thấy không có sự khác biệt có ý nghĩa thống kê
về trung bình điểm APACHE giữa nhóm Other và White
Trang 15Other vs Black:
Giá trị p = 0.029 < 0.05 Điều này cho thấy có sự khác biệt có ý nghĩa thống kê về trung bình điểm APACHE giữa nhóm Other và Black Cụ thể, nhóm Black có điểm APACHE trung bình cao hơn nhóm Other khoảng 3.5245 điểm
11.
Giá trị tới hạn white = 0.01273 < 0.05
Giá trị tới hạn black = 0.00258 < 0.05
Giá trị tới hạn other = 0.0.00395 < 0.05
Giá trị tới hạn placebo = 0.00107 < 0.05
Giá trị tới hạn Ibuprofen = 0.0001 < 0
Vậy bác bỏ => Dữ liệu không tuân phân phối chuản với mức ý nghĩa 5%
Kiểm định phương sai đồng nhất
Trang 16Có giá trị tới Prob > F = 0.0062 < 0.
Vậy nên ta bác bỏ , điều kiện không đồng nhất về phương sai ở mức ý nghĩa 5%, vậy nên không thể dùng bảng Anova để đánh giá