1. Mô tả và trình bày dữ liệu bằng bảng 2. Mô tả và trình bày dữ liệu bằng biểu đồ 3. Các số đo định tâm 4. Các số đo độ phân tán
Trang 1Chương 2
MÔ TẢ & TRÌNH BÀY DỮ LIỆU
Trang 2NỘI DUNG
1 Mô tả và trình bày dữ liệu bằng bảng
2 Mô tả và trình bày dữ liệu bằng biểu đồ
3 Các số đo định tâm
4 Các số đo độ phân tán
MÔ TẢ & TRÌNH BÀY DỮ LIỆU
Trang 4Mở tập tin dữ liệu
1 Mô tả và trình bày dữ liệu bằng bảng
Trang 5Tập tin Dữ liệu
1 Mô tả và trình bày dữ liệu bằng bảng
Trang 6Mở file excel
1 Mô tả và trình bày dữ liệu bằng bảng
Trang 7Lập bảng tần số một chiều
1 Mô tả và trình bày dữ liệu bằng bảng
• Stat > Tables > Tally Individual Variables…
Trang 81 Mô tả và trình bày dữ liệu bằng bảng
Trang 9Bảng tần số hai chiều
1 Mô tả và trình bày dữ liệu bằng bảng
• Stat > Tables > Cross Tabulation and square…
Trang 10Chi-1 Mô tả và trình bày dữ liệu bằng bảng
Bảng tần số hai chiều
Bảng 2.3 Chỉ số thể trọng và giới tính của 200 bệnh nhân
Trung bình 51 (34.93) 24 (44.44) 75 (37.50) Mập 63 (43.15) 22 (40.74) 85 (42.50) Béo phì 29 (19.86) 8 (14.81) 37 (18.50)
Trang 1140 – 49
50 – 59
60 – 69
70 – 79 Tổng
Số bệnh nhân
3 6 8 11 12 40
Trang 12Nhập liệu
2 Mô tả và trình bày dữ liệu bằng biểu đồ
Trang 13Vẽ biểu đồ: Graph > Pie Chart …
2 Mô tả và trình bày dữ liệu bằng biểu đồ
Trang 14Khai báo
2 Mô tả và trình bày dữ liệu bằng biểu đồ
Trang 15Ghi nhãn
2 Mô tả và trình bày dữ liệu bằng biểu đồ
Trang 16Pie Chart vẽ bằng Minitab
2 Mô tả và trình bày dữ liệu bằng biểu đồ
Trang 17Time Series Plot
•Dùng biểu diễn sự thay đổi của dữ liệu
theo thời gian.
Thí dụ Nồng độ của Hg trong 20 năm ở hai vị trí khác nhau
của Địa Trung hải.
Trang 18Vẽ biểu đồ: Graph > Time Series Plot…
2 Mô tả và trình bày dữ liệu bằng biểu đồ
Trang 19Vẽ biểu đồ: Graph > Time Series Plot…
2 Mô tả và trình bày dữ liệu bằng biểu đồ
Trang 20Khai báo
2 Mô tả và trình bày dữ liệu bằng biểu đồ
Trang 21Khai báo
2 Mô tả và trình bày dữ liệu bằng biểu đồ
Trang 22Khai báo
2 Mô tả và trình bày dữ liệu bằng biểu đồ
Trang 23Khai báo
2 Mô tả và trình bày dữ liệu bằng biểu đồ
Trang 24Hình 2.2 Time Series Plot với 1 trục Y
2 Mô tả và trình bày dữ liệu bằng biểu đồ
700 600 500 400 300 200 100 0
Trang 25Thêm thang đo thứ hai cho trục Y
• Click chuột phải
vào Edit Y Scale
2 Mô tả và trình bày dữ liệu bằng biểu đồ
Trang 26Thêm thang đo thứ hai cho trục Y
2 Mô tả và trình bày dữ liệu bằng biểu đồ
Trang 27Hình 2.2 Time Series Plot với 2 trục Y
2 Mô tả và trình bày dữ liệu bằng biểu đồ
700 600 500 400 300 200 100 0
Trang 28Line Plot
2 Mô tả và trình bày dữ liệu bằng biểu đồ
• Dùng so sánh dữ liệu của 2 hay nhiều nhóm
VD: Chi phí y tế (%GDP) trong giai đoạn từ 1960 đến 2000
Trang 29Vẽ biểu đồ: Graph > Line Plot …
2 Mô tả và trình bày dữ liệu bằng biểu đồ
Trang 30Vẽ biểu đồ: Graph > Line Plot …
2 Mô tả và trình bày dữ liệu bằng biểu đồ
Trang 31Vẽ biểu đồ: Graph > Line Plot …
2 Mô tả và trình bày dữ liệu bằng biểu đồ
Trang 33Bar Chart
2 Mô tả và trình bày dữ liệu bằng biểu đồ
•Dùng so sánh các giá trị của các chuỗi
dữ liệu
•Thí dụ 1: Ở Mỹ, số người tham gia tổ
chức bảo vệ sức khoẻ (HMOs = Health Maintenace Organization):
– Năm 1980: 9.1 triệu
– Năm 1990: 33.0 triệu
– Năm 2000: 80.9 triệu
Trang 34Vẽ biểu đồ: Graph > Bar Chart…
2 Mô tả và trình bày dữ liệu bằng biểu đồ
Trang 35Vẽ biểu đồ: Graph > Bar Chart…
2 Mô tả và trình bày dữ liệu bằng biểu đồ
Trang 36Vẽ biểu đồ: Graph > Bar Chart…
2 Mô tả và trình bày dữ liệu bằng biểu đồ
Trang 37Vẽ biểu đồ: Graph > Bar Chart…
2 Mô tả và trình bày dữ liệu bằng biểu đồ
Trang 38Bar Chart
2 Mô tả và trình bày dữ liệu bằng biểu đồ
2000 1980
90 80 70 60 50 40 30 20 10 0
Trang 39Ví dụ 2
2 Mô tả và trình bày dữ liệu bằng biểu đồ
• Tỉ lệ người mắc bệnh tiểu đường theo 5 độ tuổi.
Trang 4025 20
Tỉ lệ %
15 10
5 0
32.7 24.3
25.0 26.1 28.6
Trang 41Stack Bar Chart (theo tần số)
2 Mô tả và trình bày dữ liệu bằng biểu đồ
Dưới 50
70 60 50 40 30 20 10 0
Mứ c độ béo phì Bình thường Mập Béo p hì
60-69
Nhóm tuổi
Trang 42Stack Bar Chart (theo tỉ lệ %)
2 Mô tả và trình bày dữ liệu bằng biểu đồ
70 trở lên 50-59
60-69
Nhóm t uổi
Trang 43Interrval Plot
2 Mô tả và trình bày dữ liệu bằng biểu đồ
•Dùng để biểu diễn giá trị trung bình cùng với khoảng tin cậy hoặc sai số
•Biểu đồ này vừa minh họa cho các số đo trung tâm, vừa cho thấy biến động của dữ liệu
•Graph > Interval Plot …
Trang 44Interrval Plot
2 Mô tả và trình bày dữ liệu bằng biểu đồ
800 0
sm sw
Absolute Growth Rate
Trang 452 Mô tả và trình bày dữ liệu bằng biểu đồ
•Dùng cho các biến được phân lớp
•Các giá trị của biến được nhóm thành
từng lớp (còn gọi là bin) thường có độ
rộng bằng nhau
•Trước khi thiết lập biểu đồ, các dữ liệu
phải được sắp xếp lại trong bảng tần số
1 chiều
Trang 46Bảng Tần số huyết áp tối đa (mmHg)
2 Mô tả và trình bày dữ liệu bằng biểu đồ
Giá Tần Giá Tần Giá Tần Giá Tần
Trang 472 Mô tả và trình bày dữ liệu bằng biểu đồ
Trước khi vẽ biểu đồ cần:
– Chia dữ liệu thành các lớp (khoảng)
•Thường chia thành 5 – 15 khoảng
Trang 4836 34 48
27 20
6
Trang 50Stem-and-Leaf Plot
2 Mô tả và trình bày dữ liệu bằng biểu đồ
Count Stems Leaves
Trang 512 Mô tả và trình bày dữ liệu bằng biểu đồ
• Trình bày sự phân bố của một biến
liên tục
• Dùng cho các dữ liệu nhỏ
•Graph > Dotplot …
Trang 522 Mô tả và trình bày dữ liệu bằng biểu đồ
Ví dụ: huyết áp tối đa của 40 bệnh nhân được chia thành hai nhóm: dưới 60 và trên 60 tuổi
Tuổi trên 60 Tuổi dưới 60
170 160 150 120
110
100 130 140
Huyết áp tối đa (mmHg)
Trang 532 Mô tả và trình bày dữ liệu bằng biểu đồ
•Dùng để trình bày mối quan hệ giữa hai nhóm dữ liệu thu được trong thí nghiệm
•Rất hiệu quả với các biến liên tục, cở
mẫu nhỏ hoặc trung bình
•Graph > Scatterplots …
Trang 542 Mô tả và trình bày dữ liệu bằng biểu đồ
Trang 55Các đặc điểm quan trọng của dữ liệu
Trang 56Trung bình cộng (Arithmetic mean)
3 Các số đo định tâm
•Trung bình mẫu là một số mà các giá trị của mẫu có xu hướng qui tụ quanh nó
•Trung bình mẫu:
Trang 57Trung bình cộng (Arithmetic mean)
3 Các số đo định tâm
Ví dụ: Khối lượng (gram) của 16 chuột cái tại thời
điểm cai sữa:
n i=1
=
= 47, 58 gr am
Trang 58Trung bình cộng trong bảng phân bố tần số
Trang 59Trung bình cộng trong bảng phân bố tần số
3 Các số đo định tâm
Ví dụ: Phân bố tần số khối lượng của 4547 lợn
Piétrain x (Yorkshire x Landrace) nuôi vỗ béo đến
210 ngày tuổi (kg).
Trang 60Trung bình cộng trong bảng phân bố tần số
Trang 61Trung bình cộng gia quyền (Weighted mean)
Trang 62Trung bình cộng gia quyền (Weighted mean)
3 Các số đo định tâm
Ví dụ: Khảo sát mật độ khoáng trong xương ở đốt
sống thắt lưng của 3 kiểu gen khác nhau, người ta
thu nhận được số liệu như sau:
Kiểu gen Cỡ mẫu (n) Trung bình mẫu
Trang 63Trung bình điều hòa (Harmonic mean)
Trang 64Trung bình điều hòa (Harmonic mean)
Trang 65Trung bình điều hòa (Harmonic mean)
Trang 66Trung bình nhân (Geometric mean)
3 Các số đo định tâm
•Còn được gọi là trung bình hình học
•Dùng để tính tốc độ phát triển trung bình khi các giá trị xi là các con số tốc độ phát triển liên hoàn
GMs = n x1 ∗ x2 ∗ ⋯ ∗ xn
Không được dùng khi dữ liệu có giá trị
âm hoặc 0
Trang 67Trung bình nhân (Geometric mean)
3 Các số đo định tâm
• VD: Tỉ lệ % gia tăng lượng calci trong xương của một nhóm 10 bệnh nhân giữa các lần khám bệnh được ghi nhận như sau: 5.4%, 8.9%, 9.6%, 6.4%.
• Các tỉ lệ % có thể được viết dưới dạng tỉ số:
1.054 1.089 1.096 1.064
GM s = 1 054 ∗ 1 089 ∗ 1 096 ∗ 1 064
= 1 076 = 7 6%
4
Trang 68Trung bình cụt (Trimmed Mean)
3 Các số đo định tâm
•Trường hợp dữ liệu bị lẫn các giá trị ngoại lai (cực đoan - outlier), nghĩa là các giá trị quá lớn hoặc quá nhỏ, trung bình dữ liệu sẽ bị kéo lệch về phía các giá trị này
•Để điều chỉnh, người ta tính trung bình cụt bằng cách loại bỏ các phần đầu và cuối của chuỗi dữ liệu (theo tỉ lệ %), rồi lấy trung bình cộng của phần dữ liệu còn lại
Trang 69Trung vị (Median)
3 Các số đo định tâm
•Là giá trị nằm ở giữa của chuỗi dữ liệu
•Khi chuỗi dữ liệu có n giá trị quan sát:
–Nếu n là số lẻ → trung vị là số thứ (n+1)/2–Nếu n là số chẵn → trung vị là trung bình của số thứ n/2 và số thứ (n/2)+1
Để tìm trung vị trước tiên cần sắp xếp lại dữ liệu theo thứ tự từ nhỏ đến lớn (sort)
Trang 71Yếu vị = Số trội (Mod)
Trang 72–Nếu µ = Md = Mo → phân bố đối xứng
–Nếu µ < Md < Mo → phân bố lệch trái
–Nếu µ > Md > Mo → phân bố lệch phải
Trang 73Các dạng phân bố
Phân bố đối xứng
3 Các số đo định tâm
Trang 74Khoảng biến thiên (Range)
4 Các số đo độ phân tán
•Là khoảng khác biệt giữa hai giá trị
quan sát lớn nhất và nhỏ nhất
•Range = Max – Min
•Khoảng biến thiên càng nhỏ thì tổng thể càng đồng đều, số trung bình càng có tính đại diện cao và ngược lại
Trang 76Phương sai (Variance)
4 Các số đo độ phân tán
•Là số trung bình cộng của bình phương các
độ lệch giữa các biến và số trung bình cộng của các biến đó
•Phương sai mẫu được tính bằng:
Trang 77Độ lệch chuẩn (Standard deviation)
4 Các số đo độ phân tán
s = 1
n − 1 Σ ( x − x̅)i 2
n i=1
• Bằng căn bậc hai của phương sai
• Có số đo cùng đơn vị với số đo gốc
Trang 78Sai số chuẩn (Standard Error)
4 Các số đo độ phân tán
•Là số đo phản ánh độ biến thiên của các số trung bình mẫu của các mẫu được rút ra từ một tổng thể
•Nếu chọn mẫu N lần (mỗi lần với n đối tượng) thì ta sẽ có N số trung bình Độ lệch chuẩn của N số trung bình này chính là sai
số chuẩn (Se)
• Se thường được ước lượng bởi:
Se = s
n
Trang 79Hệ số biến động (Coefficient of Variation)
4 Các số đo độ phân tán
•Dùng để so sánh độ biến thiên tương đối trong các tổng thể có trung bình khác nhau, hoặc để so sánh độ phân tán của các hiện tượng có đơn vị tính khác nhau
•Công thức tính:
x̅
CV = x 100s
Trang 80Box plot
4 Các số đo độ phân tán
• Còn gọi là box and whiskers plot cung cấp:
–1 số đo về vị trí trung tâm của dữ liệu (trung vị) –2 số đo về độ phân tán của số liệu (khoảng
biến thiên và khoảng tứ vị)
–Các số ngoại lai (outlier).
• “box” có dạng hộp hình chữ nhật, chứa 50% dữ liệu với các giá trị Q1, Q2 (trung vị) và Q3.
• Mỗi “whisker” biểu diễn cho 25% dữ liệu với các giá trị cực tiểu (min) và cực đại (max).
Trang 82Box plot
4 Các số đo độ phân tán