Nhập số liệu Trang 4 Sử dụng phần mềm Thống kê y họcoCác thang đo được sử dụng trong phần mềm thống kê• Bao gồm các thang đo dùng cho biến định tính và biến định lượngBiến định tính*Tha
Trang 1Sử dụng phần mềm Thống kê y học
I Giới thiệu phần mềm thống kê SPSS
- Có nhiều phần mềm được sử dụng trong thống kê Y học như exell, epi inffo, Stata, SPSS Trong đó SPSS được sử dụng nhiều vì đơn giản hơn, ít dùng lệnh phức tạp
- SPSS (chữ viết tắt của Statistical Package For the Social Sciences) là chương trình máy tính phục vụ công tác thống kê NCKH Hỗ trợ xử lý và phân tích dữ liệu
- Có nhiều phiên bản SPSS Windows for 16, 20, 22, đến nay đã có 25 Bài này giới thiệu phiên bản 20.0
1.1.Tải phần mềm SPSS về máy
- Vào đường lin tải về máy
- Giải nén file sau khi tải về
- Sau giải nén tắt Internet tạm thời (sau khi cài xong thì mở lên bình thường)
- Mở file cài đặt bấm next Bấm install để bắt đầu cài đặt
Trang 2Sử dụng phần mềm Thống kê y học
1.2.Khởi động SPSS
• Nhấp vào biểu tượng trên Desktop (đã coppy ra) hoặc chọn Start/All
programs/SPSS for Windows/SPSS 20 Window
Màn hình làm việc
- Sau khi tải phần mềm SPSS (20.0) ta có 4 màn hình có thể làm việc
- Màn hình quản lý biến (variable view)
- Màn hình quản lý dữ liệu (Data view)
- Màn hình quản lý kết quả (Output)
- Màn hình quản lý cú pháp (Syntax)
Trang 3• Định nghĩa trạng thái của biến
• Khai báo biến
- Từ phiếu điều tra (CĐ)
Trang 4Sử dụng phần mềm Thống kê y học
oCác thang đo được sử dụng trong phần mềm thống kê
• Bao gồm các thang đo dùng cho biến định tính và biến định lượng
Biến định tính
*Thang đo định danh (Nominal Scale)
-Dùng để phân loại đối tượng -Con số không có sự hơn kém(chỉ là mã hóa)
Vd: Họ và tên, nơi sinh
*Thang đo thứ bậc (Odinal Scale)
-Dùng để phân loại đối tượng
-Con số không có biểu hiện hơn, kém
-VD: trình độj: 1.phổ thông, 2.ĐH, 3
Sau đại học
Biến định lượng
*Thang đo khoảng (Interval Scale)
-Là thang đo có khoảng cách bằng nhau -Có thể dùng các phép tính đại số (trừ phép chia) -Thường là dẫy chữ số liên tục đều đặn, trong đó số đầu và số cuối đối nghịch nhau
VD Điểm thi của lớp từ 4 đến 9 điểm (thấp nhất và cao nhất)
*Thang đo tỷ lệ (Ratio Scale)
- Giống như thang đo khoảng cách -Có thể dụng câc phép tính đại số -VD;chiều cao của bố 1,68m Chiềcao của con là 0,84 (50% của cha)
Trang 5Sử dụng phần mềm Thống kê y học
1.3 Làm việc với tập tin dữ liệu
o Mở fil
• Nếu có fil sẵn, ta chọn File/Open/Data
• Trong hộp thoại open file chọn fil muốn mở và bấm open
(có thể mở file dạng SPSS, exel, Lotus, tab-deliminated mà không cần chuyển sang định dạng trung gian)
• Để mở tập tin exel: trong mục files of type, chọn file exel, chọn tên flie và bấm open
• Lưu dữ liệu: Chọn File/save
Cửa sổ biên tập dữ liệu
o Cửa sổ Data editor: cung cấp 2 bảng xem dữ liệu
• Data view: quản lý dữ liệu
• Variable view: quản lý các biến
o Output: quản lý kết quả
o Syntax: Quản lý các lệnh
Trang 6Trên thanh công cụ có các menu chính như:
File: tạo file mới, mở file sẵn có, lưu file, đổi tên file, thoát
Edit: copy, cut, paste, undo, redo, find, replace, options
View: hiển thị các thanh công cụ, dòng trạng thái, đổi fond
chữ
Data: Các lệnh liên quan đến dữ liệu (định nghĩa tính chất các
biến, sắp xếp các biến và dữ liệu, lựa chọn dữ liệu thỏa mãn tính chất nào đó )
Transform: chuyển đổi dữ liệu, tính toán trên các biến, mã hóa
lại các biến
Analyze: Các phân tích thống kê mô tả và thống kê suy luận
Graphs: vẽ biểu đồ, đồ thị
Utilies: Thông tin về các biến, file
Windows: sắp xếp và di chuyển các cửa sổ làm việc
Help: trợ giúp
Trang 7Màn hình Data View (quản lý dữ liệu)
Trang 8khai báo các biến
nghiên cứu và là nơi
Name: tên hoặc ID
Type: dạng của biến (Namuric: dạng số, string: dạng chữ, dấu phẩy, dấu chấm Hiển thị dưới dạng: xxx,xxx, ký hiệu khoa học: Scientific notation VD;5.634E-5 có nghĩa là:
0,00005634, ngày (date): một số định dạng lịch, ngày, giờ )
Width: độ rộng của các biến (ký tự)
Decimals: số ký tự thập phân
Label: nhãn (tên)
Values: giá trị (tính chất của nhãn)
Missing; thiếu (không khai báo)
Colums: cột (độ rộng)
Align: Căn lề (phải, trái, giữa)
Missure: Thang đo (loại gì)
Trang 9Làm việc với tập tin dữ liệu
Trang 10Sử dụng phần mềm Thống kê y học
oMàn hình quản lý kết quả (Output)
Là cửa sổ hiển thị các kết quả phân tích thống kê, khi người dùng thực hiện các lệnh xuất hiện dữ liệu
Là tập hợp các dữ liệu có cấu trúc và liên quan với nhau được lưu trữ
trên máy tính, được nhiều sử dụng và được tổ chức theo một mô hình
oThành phần của cơ sở dữ liệu trong SPSS
Quan sát (Observation/case)chứa thông tin về một đối tượng điều tra/thời gian nghiên cứu
Biến (Variable): Thể hiện thuộc tính của quan sát
Trang 11Sử dụng phần mềm Thống kê y học
II Phân loại Các biến trong SPSS:
2.1 Phân theo tính chất dữ liệu ta có:
Biến định danh (Norminale Scale)
Biến thứ bậc (Odine Scale)
Biến khoảng ( Intevale Scale)
Biến tỷ lệ (Ratio Scale)
2.2 Phân theo lựa chọn ta có:
Biến 1 lựa chọn
VD: Anh chị có thường xuyên uống bia rượu không? Câu trả lời chỉ có 1 là có hoặc 2 là không
Biến có 2 hoặc nhiều lựa chọn
VD: Anh chị vui lòng cho biết lý do anh chị chọn đến Bệnh viện A điều trị vì:
a) Địa điểm gần nhàTrang thiết bị hiện đại
b) Chất lượng cán bộ chuyên môn giỏi
c) Trang thiết bị hiện đại
d) Thái độ phục vụ của nhân viên tốt
Câu trả lời có thể 1 hoặc 2,3 lý do
Trang 12Sử dụng phần mềm Thống kê y học
III Khai báo biến trong SPSS
o 3.1 Các quy tắc đặt tên biến (Variable name)
• Phải bắt đầu bằng một chữ
• Độ dài tên biến không quá 8 ký tự
• Tên biến không kết thúc bằng dấu chấm
• Dấu cách và ký tự đặc biệt VD: !,?,” và *) không được sử dụng
• Tên biến phải duy nhất không trùng lặp Các tên viết hoa viết thường được coi là giống nhau: NEWVA, Newva, newva
• Tránh dùng tên biến kết thúc bằng dấu gạch dưới (tránh xung đột với biến được lập tự động)
o 3.2 Khai báo biến cho cơ sở dữ liệu
3.2.1 Nhập dữ liệu trực tiếp
Mã hóa các biến định tính (chỉ mã hóa biến định tính)
Mở cửa sổ SPSS (cửa sổ variable)
Trang 13Sử dụng phần mềm Thống kê y học
• Trật tự các biến được sắp xếp theo ma trận theo thứ tự được hỏi trong phiếu điều tra
• mỗi đối tượng (quan sát) tương ứng với 1 dòng (1 case)
• Nhập từ trái qua phải trên cửa sổ dât của SPSS (theo từng dòng)
• Mỗi cột tương ứng với 1 biến (variable)
• Với biến nhiều câu trả lời phải sử dụng nhiều cột khai đủ các câu trả lời đó
Bài tập thực hành:
• VD1.Ta có bệnh án nghiên cứu như sau: (thực hành 1)
Trang 14Sử dụng phần mềm Thống kê y học
PHIẾU ĐIỀU TRA
• Họ và tên: Nguyễn Văn A
• Giới tính: 1: Nam 2: Nữ
• Năm sinh:
• Trình độ học vấn: 1: Phổ thông, 2: Cao đẳng 4: Sau đại học
• Thu nhập bình quân/tháng: 1: từ 5 triệu trở xuống, 2: 6 đến triệu, 3: 11 đến 20 triệu, 4: trên 20 triệu.
• Câu hỏi 1: Ông /bà đến khám chữa bệnh tại Bệnh viện A vì lý do gì?
Trang 15• Nơi ở: 1: 2: Nông thôn (đồng bằng) 3: Nông thôn (miền núi)
• Trình độ học vấn: 1:Phổ thông, trung học; 2: Cao đẳng 3: Đại học 4:
• Thu nhập bình quân/tháng: 1: từ 5 triệu trở xuống; 2: 6 đến 10 triệu; 3: 11 đến 20 triệu;
4: trên 20 triệu
• Câu hỏi 1: Anh/chị vui lòng cho biết mình có bị tăng huyết áp không? (huyết áp từ
140/90mmHg trở lên) 1: có x 2: không
• Câu 2: Anh/chị có thói quen nào trong các thói quen sau:
1) Uống cafe mỗi sáng (Từ 5 buổi/tuần)
2) Uống rượu bia hàng ngày (từ 5 lần/tuần trở lên)
3) Hút thuốc lá thường xuyên (từ 10 điếu/ngày)
Trang 16Sử dụng phần mềm Thống kê y học
3.2.2 Nhập dữ liệu từ bảng dữ liệu exel có sẵn
• Ta có file chứa bảng dữ liệu exel cần chuyển sang SPSS Mở File kiểm tra nội
dung của bảng dữ liệu (dự kiến chuyển tất cả hay một phần dữ liệu?)
• Mở màn hình SPSS (bảng Data view)
• Chọn File/open/Data và tìm đến File exell cần chuyển và chọn Trên màn hình xuất hiện và hỏi đọc tất cả hay một phần Nến chọn tất: bấm OK, nếu 1 phần thì đánh từ cột dòng nào? Và ok
• Kiểm tra dữ liệu và khai báo bổ sung các biến cho phù hợp với SPSS
• Lưu file vào ổ mà mình muốn.
Ví dụ thực hành:
Ta mở file exell kiểm tra, mở cửa sổ quản lý dL SPSS
Trang 17 4 Tạo biến trong SPSS bằng lệnh Trasform->Compute variable
• 4.1.Tạo biến mới bằng biểu thức
• ABS (numexprs) Trả về giá trị tuyệt đối
• SQRT(numexprs) Lấy căn bậc hai
• SUM (numexprs,numexprsI, I) Tổng của các số
• MEAN(numexprs,numeprsI, I) Tính trung bình cộng
• MEDIAN(numexprs,numexprsI, I) Tính trung vị
• VARIA(numexprs,numexprsI, I) Tính phương sai
• SD(numexprs,numexprsI, I) Tính độ lệch chuẩn
• MIN(value.valueI, I) Lấy giá trị nhỏ nhất
• LOWER(strexps) Viết thường các ký tự
• UPCASE(streprs) Viết hoa các ký tự
Trang 18THỰC HÀNH TẠO BIẾN TRONG
SPSS BẰNG LỆNH
Transform -> Compute
1
Ví dụ:Ta quay lại file cần tạo trong SPSS từ năm
sinh thành biến tuổi
Trang 19TẠO BIẾN TRONG SPSS BẰNG LỆNH
• Nhấp File/open tìm File cần tạo thêm và mở
• Mở cửa sổ SPSS Data View
• Chọn lệnh Transform/Compute Variable sẽ hiện ra hộp thoại
- Nhấn Reset để xóa biểu thức hiện có
- Trong mục Target Variable nhập tên biến cần tạo
- Trong mục Numeric Expression: nhập biểu thức cần gán cho biến cần tạo
- Chọn biến cần thay đổi, bấm mũi tên chuyển vào biểu thức trong mục Numeric Expresson
• Như vậy trong dữ liệu điều tra ta chỉ có năm sinh Khi muốn tạo biến “Tuổi” dùng lệnh trên ta với biểu thức: Tuổi =2022-Năm sinh
-Trong cửa sổ Compute tại ô Target variable điền biến “Tuổi”
-Viết biểu thức trong mục Numeric Variable: Tuổi=2022 (năm hiện
tại) chọn biến cần đổi là năm sinh, bầm mũi tên chuyển sang biểu thức là 2022-Năm sinh, bấm ok Bảng mới xuất hiện và có thêm biến tuổi.
Trang 20TẠO BIẾN TRONG SPSS BẰNG LỆNH
4.2.Tạo biến mới thỏa mãn điều kiện nào đó (Dùng phím if Include if )
.Phím if áp dụng phép chuyển đổi với nhóm đối tượng được chọn lọc, có
sử dụng biểu thức điều kiện
.Nút Include all cases: tiến hành cho tất cả các đối tượng của tập số liệu
.Nút Include if case satifies condition: Thành lập một biểu thức so sánh để làm tiêu chuẩn hạn chế nhóm cần biến đổi (VD: 1(nam) 2(nữ) nếu giới
tính=1 là chỉ biến đổi ở đối tượng nam)
-Nhấn Continue: để quay lại hộp thoại cũ
-Nhấn Ok để phép biến đổi đã xác định được tiến hành
Ví dụ: ta chỉ biến đổi năm sinh sang tuổi ở các đối tượng nữ thôi chẳng hạn
+Chọn nút Include IF case satifies condition chọn biến giới tính nữ=2 nhấn
continue quay lại cửa sổ cũ, ấn ok.
-Mở Data view kiểm tra
-Khai báo bổ sung cho phù hợp tại cửa số Variable view
Trang 214.3 Tạo biến mới bằng mã hóa lại biến trong file dữ liệu
Trong SPSS dùng lệnh: Transform->recode
• Được sử dụng khi ta muốn thay đổi biến có sẵn trong bảng dữ liệu (chuyển biến định lượng
thành biến định tính)
Mã hóa thành một biến khác
• Dùng lệnh: Transform -> Recode into Diffirent Variable (nên dùng)
Mã hóa lại dữ liệu trên cùng một biến (không tạo ra biến mới và mất dữ liệu gốc)
Transform -> Recode inti same Variable ( hạn chế dùng)
Trang 22Tạo biến mới bằng mã hóa lại biến trong file dữ liệu
Ta nên dùng lệnh tạo biến mới với các giá trị mã hóa, trong khi biến cũ vẫn được giữ lại Cụ thể:
Chọn lệnh: Transform/recode into Difirent Variable…
Chọn biến cần mã hóa đưa vào khung bên phải
Gõ tên biến đích vào ô name Có thể gán nhãn cho biến đích vào ô label, sau đó ấn change để khảng định
Nếu muốn mã hóa tiếp theo thì ta lặp lại
Việc gán nhãn thực hiện:
Nhấn nút Old and New Values để xác định việc chuyển đổi Lúc này hộp
thoại mới xuất hiện
Lần lượt khai báo giá trị cũ Old Values tương ứng với giá trị mới New
Values Các giá trị cũ được mã hóa như sau:
Trang 23Tạo biến mới bằng mã hóa lại biến trong file dữ liệu
Từng giá trị cũ rời rạc tương ứng với giá trị mới
System or missing: Giá trị khuyết của hệ thống
System or user missing: Giá trị khuyết của hệ thống hoặc do dùng định nghĩa.
Range: Từ khoảng cũ tương ứng với một giá trị mới
Range…Through: từ giá trị này đến giá trị kia (khoảng giữa hai giá trị)
Range, Lowest through value: Từ giá trị nhỏ nhất đến giá trị được nhập
Range, Highest though value: Từ giá trị nhập vào đến giá trị cao nhất
All other value: các giá trị khác
Mỗi lần xác định xong một cặp giá trị cũ và chỉ định giá trị mới cần ấn Add, giá trị mới này sẽ vào ô Old->new
Khi xong, ấn continue để trở lại hộp thoại trước đó, ấn ok để thực hiện lệnh mã
hóa
Quay lại màn hình Variable để khai báo bổ sung biến cho phù hợp
• Thực hành: trên file bài tập……
Trang 24XỬ LÝ THỐNG KÊ VÀ TRÌNH BẦY DỮ LIỆU
Trang 25PHÂN TÍCH THỐNG KÊ
1.Thống kê tần số, tỷ lệ của một hay nhiều biến (biến định tính)
• Công cụ Frequencies sử dụng các thông số thống kê cho nhiều loại biến
• Có thể khảo sát thông qua các công cụ như: tần số xuất hiện, tỷ lệ phần trăm, phần trăm tích lũy
• Cho phép đo lường tập trung như: độ tập trung, độ phân tán, tứ vị và phân vị, phân phối dữ liệu
• Tóm tắt dữ liệu bằng lập bảng, ngoài ra giúp ta phát hiện những sai sót trong dữ liệu như những giá trị bất thường (quá lớn hoặc quá nhỏ)
• Với biến định tính, thường biểu diễn bằng bảng phân bố tần số, các giá trị thống kê và đồ thị của một biến nào đó
• Với biến định lượng: thường quan tâm đến tham số thống kê hay biểu đồ chuẩn.
• Ta có thể thực hiện qua các biến để phân tích sự khác nhau đó.
• 1.1 Lập bảng một biến
• Chọn lệnh: Analyze/Descriptive Statistive/Frequencies
• Hộp thoại xuất hiện: ô Frequencies bên trái (tên các biến) và ô Variable bên phải
• Chọn các biến cần phân tích đưa vào khung Variable và nhấn ok
• Lúc này cửa sổ ouput xuất hiện và cho kết quả (có thể chọn một hoặc nhiều biến).
• Các đại lượng đo lường có thể dạng tần số (lần), tần suất (%), Tổng số (Total)
Trang 261.Thống kê cho một hay nhiều biến (biến định lượng)
Thống kê cho các biến định lượng
Cách 1: Chọn lệnh: Analyze/Descriptive Statitics/Frequencies
• Hộp thoại sẽ xuất hiện ô bên trái là tên các biến Ô bên phải (Variables) trắng
• Nhấn Stitics hiện ra hộp thoại để tính các đại lượng với các biến định lượng bao gồm:
• Khung Central Tendency dùng để chọn cần tính các đại lượng thống kê đo lường khuynh hướng
tập trung như
Mean: Giá trị trung bình của biến
Median: Trung vị (giá trị nằm giữa dẫy quan sát được sắp xếp từ nhỏ đến lớn, nếu lượng quan sát
là số chẵn) Đây là công cụ để đo lường mức độ tập trung của dạng thang đo thứ bậc.
Mode: Giá trị có tần suất xuất hiện lớn nhất của tập hợp số đó
Sum: Tổng các giá trị
• Khung Dispersion: Dùng để tính các đại lượng thống kê đo lường khuynh hướng phân tán
Std Deviation: Độ lệch chuẩn, dùng để đo mức đọ phân tán xung quanh giá trị trung bình của nó.
Variance: phương sai, dùng để đo mức độ phân tán của một tập các giá trị xung quanh giá trị
trung bình của một tập quan sát đó
Range: Độ trải (khoảng biến thiên) giữa giá trị nhỏ nhất và lớn nhất.
Minimum: Giá trị nhỏ nhất
Trang 27Thống kê cho một hay nhiều biến (biến định lượng)
Skewness: cho biết dạng phân phối có đối xứng hay không? (>0: lệch phải, <0: lệch trái)
Kurtosis: Tính độ nhọn để so sánh mức độ phân tán của đường cong quan sát và đường
cong phân phối chuẩn (=0)
• Khung Percantile Values: Hỗ trợ đưa ra các giá trị tứ phân vị, thập phân vị của biến.
Quartiles: Để tính ra tứ vị
Cut points for: Chia thành n phần với số lượng mẫu, các phần xấp xỉ bằng nhau
Percentiles: tính ra tứ vị tương ứng với tỷ lệ phần trăm đối tượng
Change: để loại bỏ tỷ lệ phần trăm đó
Values are group midpoints: Giá trị trong số liệu được mã hóa theo điểm giữa của nhóm
Trang 28Thống kê cho một hay nhiều biến (biến định lượng)
• Cách 2: Chọn lệnh: Analyze/Descriptive Satatistics/Descriptives
• Chọn biến cần chuyển sang ô Variables nhấn Option xuất hiện hộp thoại Descritives, Option cho phép ta tính ra tham số thống kê.
• Với biến định lượng cần phân tích trong bảng có các giá trị Đánh dấu kiểm
vào chỉ số muốn hiển thị, Nhấn Continue, nhấn ok
• Nút Save standardized values as variables có thể được tích hoặc không
(tùy ta có muốn ghi lại các biến chuẩn hóa vào bảng số liệu hay không?)
(Nên dùng cách 1 vì giữ lại được số liệu gốc)
Trang 291.2 Lập bảng với biến có nhiều lựa chọn
• Một số biến có thể có 2 hoặc nhiều hơn sự lụa chọn như:
• Câu hỏi 1: Ông bà vui lòng cho biết lý do đưa con đến khám chữa bệnh tại
khoa Nội Tim mạch Bệnh viện 19 – 8:
a) Do gần nhà thuận tiện đi lại
b) Do bác sỹ và nhân viên của khoa có trình độ chuyên môn tốt và nhiệt tình c) Do cơ sở vật chất trang thiết bị hiện đại
d) Do chi phí dịch vụ phù hợp với điều kiện chi trả của gia đình.
Câu trả lời có thể là 1 hoặc nhiều hơn sự lựa chọn
Câu hỏi trên gồm 4 lựa chọn được mã hóa theo dạng nhị phân (1=có,
2=không) Đối với câu hỏi này cần hình thành 4 biến bao gồm: C1.1, C1.2,
C1.3, C1.4
-Trước khi lập bảng ta cần thực hiện bước để tạo biến mới Cau2 là biến
tổng hợp của 4 biến con này Các bước tiến hành như sau: