VII. Bàn luận thêm về phân số nguy cơ quy trách dân số
3. Cách cách để thực hiện lệnh trong chương trình Stata
Cĩ hai cách để thực hiện lệnh trong chương trình Stata: Dùng bàn phím để gõ lệnh vào cửa sổ lệnh (Stata Command) hay sử dụng con trỏ chuột để chọn các trình đơn (menu) giao diện đồ họa (Graphic Interface)
Dùng bàn phím để gõ lệnh
Dùng bàn phím để gõ lệnh vào cửa sổ lệnh (Stata Command). Đây là cách sử dụng Stata của người chuyên nghiệp vì nĩ cho phép thực hiện tất cả các lệnh của Stata một cách nhanh chĩng với đầy đủ các chức năng phụ của lệnh. Tuy nhiên phương pháp này cĩ thể khơng thích hợp cho người mới sử dụng do nĩ địi hỏi người dùng phải thuộc các câu lệnh và cú pháp của nĩ
Con trỏ chuột với giao diện đồ họa (Graphic Interface)
Cĩ thể dùng chuột thực hiện các lệnh nhằm thao tác số liệu (menu Data), vẽ đồ thị (menu Graphics) và phân tích số liệu (menu Statistics). Phương pháp sử dụng chuột và menu là phương pháp dễ sử dụng nên sẽ được ưu tiên trình bày trong tài liệu này.
Giả sử chúng ta chọn tập tin này là "baitap.smcl" hãy gõ "baitap" vào hộp File Name rồi nhấp OK.
Khi đĩ trên cửa số kết quả (Stata results) sẽ hiện ra thơng báo để cho biết rằng biên bản kết quả phân tích sẽ được lưu tại tập tin "D:\Dung\Science\BSCK2_Hieu_mat\baitap.smcl"
. log using "D:\Dung\Science\BSCK2_Hieu_mat\baitap.smcl"
--- log: D:\Dung\Science\BSCK2_Hieu_mat\baitap.smcl
log type: smcl
opened on: 10 Oct 2004, 12:01:34
Sau đĩ bạn cĩ thể thực hiện các bước phân tích.
Khi muốn xem lại biên bản (kết quả phân tích) hãy nhấp vào nút cơng cụ log một lần nữa để hiện ra cửa sổ Stata Log Options.
Sau đĩ chọn vào nút chọn View snapshot of log file và nhấp vào nút lệnh OK để xem biên bản. Khi muốn chấm dứt việc ghi biên bản (kết quả phân tích) hãy nhấp vào nút cơng cụ log để hiện ra cửa sổ Stata Log Options.
Sau đĩ chọn vào nút chọn Close log file và nhấp vào nút OK.
Lời khuyên: Người sử dụng Stata cĩ kinh nghiệm sau khi mở tập tin số liệu luơn luơn mở tập tin log trước khi tiến hành các phân tích thống kê để khơng bỏ mất các kết quả của quá trình phân tích.
Mơ tả số liệu với Stata 8.0 for Windows
Chương này sẽ hướng dẫn bạn phương pháp mơ tả số liệu với phần mềm Stata 8.0 sử dụng bộ số liệu ivf.dta cĩ trong thư mục C:\DATA sau khi bạn cài đặt các tập tin số liệu mẫu.
Thơng thường trước khi mơ tả số liệu chúng ta cần thực hiện bước chuẩn bị và việc thao tác số liệu (data processing). Cơng tác chuẩn bị bao gồm việc mở tập tin số liệu, mở tập tin log (Open log file), khảo sát số liệu cĩ bao nhiêu bản ghi và cĩ những biến số nào cũng như nghiên cứu đề cương nghiên cứu (chủ yếu là mục tiêu nghiên cứu) để giúp việc phân loại biến số. Việc thao tác số liệu là việc rà sốt số liệu cĩ bị sai sĩt hay nhầm lẫn gì hay khơng, tạo biến số mới theo yêu cầu của phân tích và tiến hành việc dán nhãn số liệu để giúp cho việc hiểu rõ hơn số liệu và đọc kết quả của phân tích thống kê.
Trước tiên chúng ta hãy khởi động Stata theo cách đã hướng dẫn ở chương Khởi động Stata. Sau đĩ thực hiện các bài tập 1 đến 3 cho cơng tác chuẩn bị và các bài tập 4 đến 6 cho cơng tác thao tác số liệu.
1- Mở tập tin ivf_v.dta và mở tập tin log
Khởi động cửa sổ Use New Data bằng cách 1 trong 2 cách:
- Nhấn nút cơng cụ mở file ( vị trí đầu tiên trên thanh cơng cụ). - Chọn menu File :: Open
Sau khi cửa sổ Use New Data sẽ hiện ra. Nhấp vào mũi tên bên phải hộp Look in để chọn ổ đĩa thích hợp và dùng con chuột nhấp vào các thư mục để chọn thư mục cĩ chứa số liệu (thơng thường tập tin số liệu nằm ở thư mục C:\Data). Tìm tập tin số liệu ivf_v.dta, nhấp đúp vào tên tập tin này để mở tập tin (hoặc nhấp vào tập tin này để tên tập tin rơi vào hộp File Name rồi sau đĩ nhấp vào nút lệnh Open để mở tập tin).
Log nằm vị trí thứ tư từ trái ở trên thanh cơng cụ để bắt đầu log kết quả (begin log). Máy tính sẽ hiện ra hộp thoại Begin Logging Stata Output để chúng ta chọn tên tập tin (File name) và thư mục lưu (Save In) của tập tin log.
Thí dụ chúng ta muốn lưu tập tin log với tên là ivf_v.smcl vào thư mục c:\data; chúng ta nhập vào các thơng tin như trên.
2. Khảo sát các biến số của tập tin và nghiên cứu mục tiêu nghiên cứu để phân loại biến số Hướng dẫn: Để xem liệt kê các biến số chúng ta cĩ thể nhấn phím chức năng F3 hay sử dụng menu (nhấp vào menu Data :: Describe data :: Describe variable in memory) để xem các biến số của số liệu
. describe
Contains data from C:\DATA\ivf_v.dta
obs: 641
vars: 7 15 Aug 2006 15:27 size: 20,512 (99.8% of memory free)
--- storage display value
variable name type format label variable label
--- maso float %9.0g ma so
tuoime float %9.0g tuoi me (nam)
tangha float %9.0g tang huyet ap thai ki - 1=tang ha, 0=khong tang ha
tuoithai float %9.0g tuoi thai (tuan)
gioi float %9.0g gioi tinh tre - 1=trai, 0=gai tlsosinh float %9.0g trong luong so sinh (gram) nghenghiep float %9.0g nghe nghiep me - 1=tu do, 2=cong nhan, 3=vien chuc
--- Sorted by: maso
Giả sử từ đề cương nghiên cứu chúng ta biết đây là tập tin của số liệu 641 đứa trẻ được sinh từ bà mẹ thụ thai trong ống nghiệm (in-vitro fertilisation) với mục tiêu nghiên cứu là xem tuổi thai và tăng huyết áp trong thai kì cĩ ảnh hưởng lên trọng lượng thai hay khơng. Cách lí giải số liệu được minh họa
STT Tên biến Ý nghĩa của biến Phân loại biến số:
(Độc lập hay Phụ thuộc) – (Định tính hay định lượng)
1 Maso Mã số
2 Tuoime Tuổi của mẹ (năm tuổi) 3 Tangha Tăng huyết áp thai kì 1= cĩ
0= khơng
4 Tuoithai Tuổi thai (tính theo tuần) 5 Gioi Giới tính của trẻ 1=trai 0=gái 6 Tlsosinh Trọng lượng sinh tính theo
grams
7 Nghenghiep Nghề nghiệp của mẹ 1=tự do 2=cơng nhân 3=viên chức 3. Làm thế nào để xem số liệu
Hướng dẫn: Cĩ thể xem số liệu bằng 2 cách:
- Dùng nút lệnh Data Browser (vị trí 11 tính từ bên trái của thanh cơng cụ) - Dùng menu Data :: Data browser (read-only editor)
Sử dụng Data Browser cho phép nhìn số liệu trong lưới (như các ơ của chương trình Excel) nhưng nĩ khơng cho phép in số liệu. Muốn nhìn số liệu ra của sổ kết xuất (output) để sau đĩ in ra hãy sử dụng menu Data:: Describe Data :: List data.
4. Hãy thực hiện thống kê mơ tả tất cả các biến số trong bộ số liệu này:
Hướng dẫn: trước tiên chúng ta phải xác định biến số nào là biến số định lượng và biến số nào là biến số định tính. Sau đĩ thực hiện thống kê mơ tả cho các biến số: đối với biến định lượng, thực hiện lệnh summarize để để cĩ trung bình và độ lệch chuẩn, đối với biến định tính thực hiện lệnh tab1 để cĩ bảng phân phối tần suất của các biến số.
Trong bộ số liệu này cĩ các biến tuoime, tuoithai, tlsosinh là biến định lượng. Để mơ tả biến số này chúng ta sử dụng menu Statistics :: Summaries, tables, & tests :: Summary Statistics.
Kết quả được trình bày nhưu sau:
. summarize tuoime tuoithai tlsosinh
Variable | Obs Mean Std. Dev. Min Max ---+--- tuoime | 641 33.97192 3.87046 23 43 tuoithai | 641 38.68725 2.329931 24.69 42.35 tlsosinh | 641 3129.137 652.7827 630 4650
Các biến số định tính bao gồm tang_ha (tăng huyết áp), gioi (giới tính của trẻ), nghenghiep (nghề nghiệp của mẹ). Để tĩm tắt các biến số định tính này (tang_ha, gioi, nghenghiep) chúng ta sử dụng menu Statistics :: Summaries, tables & test :: Tables :: Multiple one-way tables.
Các bước thực hiện gồm:
- Bước 1: đưa con trỏ vào hộp văn bản categorical variable(s)
- Bước 2: đưa con trỏ vào cửa sổ Variables và nhấp vào các biến tang_ha, gioi, nghenghiep để đưa các tên biến này vào hộp văn bản Categorical variables(s)
- Bước 3: nhấp nút lệnh OK để hồn tất
. tab1 tang_ha gioi nghenghiep -> tabulation of tang_ha tang huyet |
ap thai ki | - 1=tang | ha, 0=khong |
tang ha | Freq. Percent Cum. ---+--- 0 | 552 86.12 86.12
nghe nghiep | me - 1=tu | do, 2=cong | nhan, |
3=vien chuc | Freq. Percent Cum. ---+--- 1 | 104 16.22 16.22 2 | 238 37.13 53.35 3 | 299 46.65 100.00 ---+--- Total | 641 100.00
5. Các tĩm tắt số liệu như trên là đạt yêu cầu. Tuy nhiên việc mã hố các giá trị của biến số khiến cho việc đọc bảng bảng tần suất của biến số danh định (như gioi và nghenghiep) bị khĩ khăn (nhất là cho những người khơng trực tiếp làm thống kê hay phải đọc lại kết quả sau một khoảng thời gian dài). Do đĩ những người làm thống kê chuyên nghiệp luơn luơn thực hiện ghi chú (dán nhãn) cho các biến số định tính. Hãy thực hiện việc dán nhãn số liệu.
Hướng dẫn:
Việc dán nhãn cho các giá trị mã hĩa là việc làm tốn cơng nhưng nĩ giúp phân biệt người làm thống kê chuyên nghiệp và người làm thống kê khơng chuyên nghiệp. Mặc dù tốn cơng nhưng lợi ích do nĩ đem lại vượt qua cơng sức bỏ ra vì vậy chúng ta cần phải thực hiện việc dán nhãn này.
Việc dán nhãn giá trị biến số được thực hiện qua 2 bước: tạo nhãn (define label value) và dán nhãn cho giá trị (Assign value label to variable).
- Tạo nhãn sex, tang_ha, nhãn nghenghiep
Để tạo nhãn sử dụng menu Data :: Labels & Notes :: Define value label. Cửa sổ Define value label sẽ được hiện ra.
Giả sử chúng ta muốn tạo nhãn sex theo quy tắc 1 =nam và 2=nữ, các bước cụ thể như sau: -Bước 1: nhấp vào nút lệnh Define để hiện ra hộp nhập liệu Define new lable
- Bước 2: gõ sex vào hộp văn bản Label name
- Bước 3: nhấp vào nút lệnh OK khi đĩ hộp nhập liệu Add value sẽ hiện ra - Bước 4: Nhập 1 vào hộp văn bản value
- Bước 5: nhập nam vào hộp văn bản Text
- Bước 6: Nhấp vào nút lệnh OK của hộp nhập liệu Add Value. Khi đĩ hộp nhập liệu Add Value biến mất
- Bước 7: Nhấp vào nhãn sex trong hộp văn bản Defien label names - Bước 8: Nhấp vào nút lệnh Add để hộp nhập liệu Add value sẽ hiện ra - Bước 9: Nhập 0 vào hộp văn bản value
- Bước 10: nhập nữ vào hộp văn bản Text
- Bước 11: Nhấp vào nút lệnh OK của hộp nhập liệu Add Value. Khi đĩ hộp nhập liệu Add Value biến mất
Sau đĩ cĩ thể nhấp vào nút lệnh Close (của hộp thoại Define value labels) để thốt ra hay nhấp vào nút lệnh Define (của hộp thoại Define value labels) để tiếp tục tạo nhãn tang_ha.
Cần lưu ý: tên nhãn cĩ thể khác với tên biến (thí du như trường hợp trên ta đặt tên nhãn là sex trong khi tên biến là giới) hoặc tên nhãn cĩ thể trùng với tên biến (thí dụ ta cĩ thể đặt tên nhãn là tang_ha cho biến tăng ha).
- Bước 4: Nhập 1 vào hộp văn bản value
- Bước 5: nhập huyet ap tang vào hộp văn bản Text
- Bước 6: Nhấp vào nút lệnh OK của hộp nhập liệu Add Value. Khi đĩ hộp nhập liệu Add Value biến mất
- Bước 7: Nhấp vào nhãn tang_ha trong hộp văn bản Define label names
- Bước 9: Nhập 0 vào hộp văn bản value
- Bước 10: nhập huyet ap bt vào hộp văn bản Text
- Bước 11: Nhấp vào nút lệnh OK của hộp nhập liệu Add Value. Khi đĩ hộp nhập liệu Add Value biến mất
Để tiếp tục tạo nhãn nghenghiep ta nhấp vào nút lệnh Define (của hộp thoại Define value labels).
-Bước 1: nhấp vào nút lệnh Define để hiện ra hộp nhập liệu Define new lable - Bước 2: gõ nghenghiep vào hộp văn bản Label name
- Bước 5: nhập tu do vào hộp văn bản Text
- Bước 6: Nhấp vào nút lệnh OK của hộp nhập liệu Add Value. Khi đĩ hộp nhập liệu Add Value biến mất
- Bước 7: Nhấp vào nhãn nghenghiep trong hộp văn bản Define label names - Bước 8: Nhấp vào nút lệnh Add để hộp nhập liệu Add value sẽ hiện ra - Bước 9: Nhập 2 vào hộp văn bản value
- Bước 10: nhập cong nhan vào hộp văn bản Text
- Bước 11: Nhấp vào nút lệnh OK của hộp nhập liệu Add Value. Khi đĩ hộp nhập liệu Add Value biến mất
- Bước 12: Ở hộp Define label names vẫn tiếp tục chọn nhãn nghenghiep, nhấp vào nút lệnh
Add để hộp nhập liệu Add value sẽ hiện ra - Bước 13: Nhập 3 vào hộp văn bản value - Bước 14: nhập vien chuc vào hộp văn bản Text
- Bước 15: Nhấp vào nút lệnh OK của hộp nhập liệu Add Value. Khi đĩ hộp nhập liệu Add Value biến mất. Ta cĩ kết quả như sau:
Khi hộp thoại labels value – Attach value label hiện ra để dán nhãn cho mỗi biến số cần thực hiện 4 bước sau:
- Bước 1: Đặt con trỏ vào hộp văn bản Variable
hộp văn bản Variable.
- Bước 3: Đưa con trỏ vào nhãn sex trong hộp văn bản Attach value label để dán nhãn sex vào
tên biến sex
- Bước 4: Nhấp vào nút lệnh Submit để thực hiện việc dán nhãn.
Để tiếp tục thực hiện tương tự để dán nhãn tang_ha cho biến tang_ha, hãy tiến hành các bước sau:
- Bước 5: Đặt con trỏ vào hộp văn bản Variable
- Bước 6: Đưa con trỏ vào cửa sổ Variable và nhấp vào biến gioi để tên biến này xuất hiện trên