1. Trang chủ
  2. » Thể loại khác

Cẩm nang sử dụng Stata

44 16 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 44
Dung lượng 352,5 KB
File đính kèm cam nang su dung stata.rar (181 KB)

Nội dung

Chương Giới Thiệu Tóm Tắt Stata 1.1 THƠNG TIN HỖ TRỢ Stata phần mềm thống kê sử dụng cho mục đích chung, xây dựng trì cơng ty Stata Stata có số phiên như: “Intercooled stat”, “Small Stata”, mở rộng “ Stata/SE” (special edition) Tất khác dung lượng tối đa tập tin số liệu tốc độ xử lý Mỗi gói phần mềm Stata hỗ trợ cho Windows (98,2000,XP, NT), Unix, Macintosh Trong sách chúng tơi trình bày Intercooled Stata dành cho Windows hầu hết đặc trưng mơ tả có gói phần mềm khác Tài liệu dành cho Stata bao gồm: Stata Getting Started, Stata User’guide, Stata Base Reference Manuals (4 tập), Stata Graphics Reference Manual Ngoài cịn có số sổ tay tham khảo khác Stata Pro-Gramming Reference Manuals Stata Cross-Sectional Time-Series Refernce Manuals (phân tích số liệu theo chiều dọc) Các sổ tay kể liệt kê thông tin chi tiết lệnh Stata, User’s Guide đưa hướng dẫn chung Những đặc trưng hệ điều hành mơ tả sổ tay Getting Started …., Getting Started with Stata for Window Mỗi lệnh có phần hướng dẫn nằm menu help Các tập tin hướng dẫn sổ tay đề cập đến Base Reference Manuals theo [R] tên đăng nhập, User’s Guide theo [U] theo số chương/mục tên, Graphic Manuals [G] tên đăng nhập, vvvv (xem Stata Getting Started Manual, sau nội dung để có danh sách đầy đủ) Ngày có nhiều sách viết Stata Halmilton (2004); Kohler Kreuter (2004), sách viết tiếng Đức, Pháp, Tây Ban Nha Các sách cực hay viết loại phân tích bao gồm A Short Introductin to Stata for Bistatistics Hills De Stavola (2002); Regression Models for Categorical Dependent Variables using Stata Long Freese (2003); An Introduction to Survival Analysis using Stata Cleves, Gould Gutierrez (2004); Generalized Linear Models and Extensions Hardin Hilbe (2001) Truy cập website http:// www.stata.com/bookstore/statabook.html để cập nhật thông tin sách khác Trang web Stata http:// www.stata.com đưa thơng tin bổ ích việc tìm hiểu Stata bao gồm loạt câu hỏi thường gặp (FAQS) Stata đưa khoá học mạng, gọi netcourses Các khoá học diễn thông qua danh sách người tổ chức học viên Mỗi tuần, người tổ chức gửi ghi giảng tập cho học viên giúp học viên thảo luận với người tổ chức gửi đáp án tập với câu trả lời câu hỏi mà học viên đặt Ủy ban kỹ thuật học viện UCLA đưa sách giáo khoa có ích tài liệu ví dụ trang web http://www.ats.ucla.edu/stat/stata/, hướng dẫn cách thực phân tích Stata Các báo From the helpdesk Speaking Stata thuộc tạp chí Stata journal có ích việc học hỏi Stata; xem trang web www.statajournal.com Một đặc trưng thú vị người sử dụng Stata bạn trở thành viên cộng đồng Stata Các gặp gỡ cộng đồng người sử dụng Stata diễn thường niên UK, USA số quốc gia khác; xem mục 1.11 Statalist danh sách mail cho phép hỗ trợ mặt kỹ thuật thành viên Stata người sử dụng chuyên nghiệp ví dụ Nick Cox thường giải đáp thắc mắc người sử dụng 1.2 KHỞI ĐỘNG STATA Mục đề cập cách khái qt có phần mềm Stata 1.2.1 Cửa sổ Stata Khi Stata khởi động, hình xanh hình 1.1 bao gồm cửa sổ với tiêu đề:  Stata Command  Stata results  Review  Variables Hình 1.1: Cửa sổ Stata Mỗi cửa sổ thay đổi kích thước di chuyển bình thường; cửa sổ Variables Review đưa ngồi cửa sổ Muốn đưa cửa sổ bị che mờ phía trước, chọn tên cửa sổ thích hợp menu Window Font cửa sổ thay đổi việc click vào nút trái hình Tất thiết lập lưu tự động đóng Stata 1.2.2 Tập tin số liệu Tập tin số liệu Stata có phần dta mở Stata theo cách bình thường menu File (để biết thêm định dạng số liệu khác, đọc mục 1.4.1) Tương tự phần mềm thống kê nào, tập tin số liệu Stata ma trận với cột trình bày biến số (tên nhãn), hàng trình bày số lần quan sát Khi mở tập tin số liệu, tên biến tên nhã biến trình bày cửa sổ Variables Tập tin số liệu xem dạng hình bảng tính Data Browser click vào nút sửa chữa số liệu Data Editor click vào nút Cả Data Browser Data Editor mở menu Window Cần lưu ý hình Data Browser Data Editor mở khơng thể làm khác (ví dụ cửa sổ Stata Command biến mất) Xem mục 1.4 để biết thêm chi tiết tập tin số liệu 1.2.3 Các lệnh kết Trước Stata 8.0, người dùng phải gõ câu lệnh để sử dụng Stata, nhiều người thích dùng lệnh sau: lệnh đánh vào cửa sổ Command thi hành ấn Return (hay Enter) Lệnh lên hình Results dạng dấu chấm,và kết lệnh trước Nếu kết dài so với hình hiển thị, cuối hình xuất chữ more Nhấn nút để cuộn kết Thanh cuộn dùng để di chuyển lên xuống danh sách kết Tuy nhiên, có số kết hiển thị trước giữ lại hình Vì lý để lưu kết sau, cần tạo nên log file, xem mục 1.2.6 Stata sẵn sàng cho lệnh xuất dấu ngắt (dấu chấm) cuối hình Nếu Stata chưa sẵn sàng để nhập lệnh chạy hay chưa trình bày hết kết quả, tạm ngừng chương trìnhbằng cách giữ Ctrl nhấn phím Pause/Break hay nhấn nút Break cơng cụ hình Stata Một câu lệnh trước xem trở lại cách nhấn phím Pgup Pgdn hay cách chọn lệnh hình Review Lệnh sửa đổi cần trước cho thi hành lệnh Hầu hết lệnh Stata liên quan đến loạt biến, cú pháp command varlist Ví dụ, tập tin số liệu chứa biến x, y, z thì: list x y liệt kê giá trị x, y Các phần khác thêm vào câu lệnh chẳng hạn thêm if exp sau varlist lệnh xử lý lần quan sát thoả điều kiện đưa exp Những lựa chọn (phần thêm sau câu lệnh) phân biệt với lệnh dấu phẩy Cấu trúc lệnh hồn chỉnh thành phần câu lệnh trình bày mục 1.5 1.2.4 GUI so với lệnh Stata 8.0 có tính chất gọi giao diện đồ hoạ người dùng (Graphical User Interface -GUI) cho phép người thực thi lệnh thông qua việc sử dụng chuột Người sử dụng cần chọn menu Data, Graphics, hay Statistic, sau đánh dấu lựa chọn, điền vào hộp thoại, click OK Stata xử lý lệnh tương tự sử dụng Stata cách đánh lệnh trực tiếp Một thuận lợi lớn hệ thống menu giúp cho người làm quen với Stata nắm bắt hồi quy tuyến tính vài phút Một bất lợi hệ thống dùng chuột nhấp tốn nhiều thời gian phải thực nhiều phân tích lúc khơng thể thực lệnh cách tự động, mặt khác, lệnh lưu lại file (gọi do-file Stata) gọi lại sau Theo ý kiến chúng tơi, hệ thống menu lệnh hay dùng để tìm hiểu lệnh chức nào, nhiên phân tích thống kê nghiêm túc tốt nên thực lệnh Vì , sách chúng tơi đề cập menu hộp thoại (thật chúng chủ yếu thích câu lệnh), xin xem mục 1.8 ví dụ tạo đồ thị hộp thoại 1.2.5 Do-files Sẽ hữu ích tạo tập tin chứa câu lệnh thực phân tích Việc thực lệnh Do-file Editor hay trình biên tập khác Do-file editor mở cách nhấn vào nút hay chọn Do… từ menu File Các câu lệnh gõ vào hay chạy tập tin batch cách click vào nút hình Do-file Editor hay sử dụng lệnh dofile Chúng ta thực tập hợp câu lệnh cách ấn nút Do-file sử dụng tập tin Stata sau Xem mục 1.10 để biết thêm chi tiết do-file 1.2.6 Log file Sẽ có ích mở log file từ lúc đầu làm việc với Stata Nhấn nút , gõ tên file vào hộp thoại, chọn Save Theo mặc định, file file smcl (Stata Markup and Control Language, phát âm “smicle”) với phần đuôi scml, file văn ASCII tạo cách chọn đuôi log Nếu tên file bạn nhập vào có, hộp thoại lên thông báo bạn có muốn chép đè lên file cũ hay kếp hợp với file cũ hay không File log xem trước suốt trình làm việc cách chọn nút tự động lưu đóng tập tin File log mở ra, xem, hay đóng lại cách chọn thẻ Begin…, View… , hay Close… Trong menu File Các lệnh sau dùng để mở, đóng file tên my log, thay file cũ tạo trước đó: log using mylog, replace log close Để xem file log tạo từ lần làm việc trước, chọn View thẻ Log menu File, chọn đường dẫn chứa file File log thể in cách chọn Print Viewer từ menu File 1.2.7 Hỗ trợ Phần hỗ trợ tiếp cận cách vào menu Help với hình 1.2 Muốn tìm hiểu lệnh Stata, giả sử tên lệnh biết, chọn Stata Command….đầu tiên để tìm lệnh Stata phù hợp, chọn thẻ Search…trong menu Help, có hình 1.3 Ví dụ, để tìm hồi quy Cox, gõ vào hộp thoại Keyword từ “survival” ấn OK Màn hình Stata Viewer lên dãy tên lệnh có liên quan hay chủ đề mà file hỗ trợ hay câu hỏi thường gặp chứa từ Mỗi mục danh sách bao gồm chữ màu xanh (một hyperlink) dẫn đến file hỗ trợ hay FAQ Mỗi file hỗ trợ chứa hyperlink đến file hỗ trợ liên quan Việc tìm kiếm file hỗ trợ tiếp cận cách dùng lệnh sau search survival help stcox Contents Search Stata Command What’s New? News Offical Updates SJ and User-written Programs Stata Web site About Stata Hình 1.2: Menu Help Hình 1.3: hộp thoại Search Kết phần giúp đỡ lên hình Result Stata với dòng chữ xanh dương đại diện cho hyper link đến file khác Nếu máy bạn có kết nối internet Stata tìm kiếm tài liệu mạng cho bạn, chương trình soạn người sử dụng cách chọn “Search net resources” hộp thoại Search Dấu kiểm cuối cùng, “Search all” tìm kiếm tất tài liệu liên quan bao gồm file hỗ trợ, FAQS, tài liệu mạng Điều tương đương với việc dùng câu lệnh findit keyword Những tìm kiếm lọc khác tiến hành cách sử dụng lệnh search (xem help search) Các lựa chọn khác bao gồm News, Official Updates, SJ and User-Written Programs, Stata Web Site giúp người sử dụng tiếp cận thông tin có liên quan web (xem mục 1.11 cập nhật Stata) 1.2.8 Đóng Stata Stata đóng theo cách:  Nhấp chuột vào nút Close góc phải hình  Chọn Exit từ menu File  Gõ exit, clear vào hình Command nhấn Return 1.3 CÁC QUY ƯỚC TRONG SÁCH Trong sách dùng loại chữ để tên lệnh, chọn lựa, tên biến … Ngược lại chữ in nghiêng không dùng để đánh vào; chúng từ thay chữ khác Ví dụ summarize varname có nghóa varname thay tên biến cụ thể đó, ví dụ age, câu lệnh summarize age Chúng trình bày câu lệnh dạng sau: summarize age drop age Nếu câu lệnh dài dòng dùng dấu */ cuối dòng */ dầu dòng để Stata không ngắt câu lệnh Một cách khác dùng /// cuối dòng Cần ý điều thực do-file không sử dụng hình Command làm sai kết Trong cửa sổ Command, câu lệnh chiếm vài dòng Các kết chiếm khoảng nhỏ trình bày sau dòng lệnh không thụt vào dạng font nhỏ hơn: display 1 Kết chiếm nhiều vị trí trình bày thành chữ lên Một số lệnh có ghi chú, ví dụ lệnh generate liệt kê giá trị bị tạo biến Chúng ta thường không trình bày ghi 1.4 TẬP TIN SỐ LIỆU TRONG STATA 1.4.1 Nhập xuất số liệu Stata có dịnh dạng số liệu riêng với phần mở rộng dta Việc đọc ghi Stata thực trực tiếp Nếu tên file bank.dta, lệnh : use bank save bank Nếu số liệu không nằm thư mục hành, đường dẫn file số liệu phải ghi đầy đủ, lệnh sau: use c:\user\data\bank Tuy nhiên, cách để hạn chế tối thiểu lỗi lưu trữ tất file số liệu cho công việc vào thư mục chuyển thư mục hành sang thư mục muốn chứa file số liệu Stata lưu, đọc tất file chứa thư mục mà không cần đường dẫn cd c:\user\data use bank save bank Tập tin số liệu kèm với Stata đọc cách sử dụng lệnh sysuse Vi dụ, file auto.dta đọc lệnh sysuse auto Trước đọc file số liệu Stata, tất số liệu có nhớ phải xoá sạch, cách chạy lệnh clear trước sử dụng lệnh use hay sử dụng lựa chọn clear cho lệnh use sau: use bank, clear Nếu muốn lưu liệu tên file có sẵn, việc tạo thông báo lỗi trừ dùng lệnh sau: save bank, replace Đối với tập tin số liệu có kích thứơc lớn, cần phải tăng dung lượng nhớ số liệu máy, bình thường máy quy định nhớ Mb Ví dụ, tập tin số liệu tải xuống nhớ (nghóa ta dùng lệnh clear), thiết lập dung lượng nhớ lại cách sử dụng lệnh set memory 2m Lệnh memory đối số đưa thông tin nhớ có dung lượng sử dụng có tổng cộng Nếu file số liệu định dạng Stata, chúng chuyển sang định dạng Stata cách sử dụng phần mềm chuyển đổi khác (ví dụ Stata/Tranfer) hay lưu lại thành file ASCII (mặt dù cách làm sau làm tất nhãn) Khi lưu dạng ACSII, giá trị bị thay ký số Có lệnh dành cho việc đọc loại số liệu ASCII khác nhau: insheet dành cho file chứa quan sát (cho tất biến) dòng với biến phân tách dấu tab dấu phẩy, dòng tên biến; infile với varlist (định dạng tự do) cho phép ngắt dòng chỗ biến phân tách khoảng trống hay dấu tab dấu phẩy; infix dành cho file với định dạng cột hiệu chỉnh quan sát số dòng khác nhau; infile với “từ điể” (định dạng hiệu chỉnh) lệnh thích hợp “từ điển” xác định xác dòng cột chứa thông tin Số liệu lưu lại dạng ASCII cách sử dụng outfile hay outsheet Cuối cùng, lệnh odbc dùng để tải, ghi chép, hay xem số liệu từ nguồn (ODBC) Xem help infiling hay [U] 24 lệnh nhập số liệu để có nhìn tổng quan việc đọc liễu Chỉ có tập tin gọi kết hợp với tập tin hành, cách sử dụng lệnh merge hay append để thêm quan sát hay biến; xem mục 1.6.2 1.4.2 Biến số Có loại biến số Stata: biến chuỗi biến số Mỗi biến số loại lưu trữ cần số lượng byte khác Các loại lưu trữ bao gồm byte, int, long, float, double biến kiểu số str1 đến str80 (str244 sử dụng Stata/SE) biến chuỗi với độ dài khác Bên cạnh loại lưu trữ, biến số kèm với tên, nhãn định dạng chúng Tên biến y đổi thành biến x cách sử dụng: rename y x Nhãn biến định nghóa cách label variable x “cost in pounds” định dạng biến số thiết lập thành “general numeric” với hai số lẻ cách format x %7.2g Biến kiểu số Một giá trị biến kiểu số tượng trưng dấu chấm ‘.’ (giá trị hệ thống), hay dấu chấm theo sau ký tự, ví dụ a, b vvv Giá trị diễn giải số dương lớn vơiù < a < b, vvv Điều dẫn đến sai lầm hồi quy logic; xem mục 1.5.2 Ký hiệu giá trị bị kiểu số ( ví dụ ‘99’) chuyển đổi thành giá trị bị (và ngược lại) cách sử dụng lệnh mvdecode Ví dụ: mvdecode x, mv(-99) thay tất giá trị biến x -99 dấu chấm mvencode x, mv(-99) thay đổi giá trị trở -99 Các biến kiểu số dùng để đại diện cho biến thứ tự hay biến liên tục có biến kiểu ngày tháng Đối với biến thứ tự, thường khó nhớ ký số đại diện cho thứ tự Vì nhã giá trị định nghóa sau: label define s married divorced widowed single label values marital s Thứ tự mã hoá lại, ví dụ như: recode marital 2/3=2 4=3 Sẽ trộn thứ tự thành thứ tự thay thứ tự thành Biến kiểu ngày định nghóa số ngày kể từ 1/1/1960 biểu diễn định dạng ngày %d ví dụ, liệt kê biến thời gian định dạng %7.0g thực sau: list time Time 14976 200 Mà định dạng khó diễn giải format time %d list time Time 01jan2001 19jul1960 Xem help dfmt định dạng ngày khác Biến chuỗi Biến kiểu chuỗi thường sử dụng biến thứ tự hay biến mã số số trường hợp sử dụng biến ngày (ví dụ file từ SPSS lưu 10 để tìm xem trung bình biến x sau trừ giá trị cho x nhiên không cần gõ giá trị trung bình vào do-file kết giá trị số liệu thay đổi Thay vậy, tiếp cận trung bình tính tóan lệnh summarize sử dụng r(mean) quietly summarize x, meanoly gen xnew=x-r(mean) (nếu quan tâm đến trung bình hay tổng, cần sử dụng option meanonly) Hầu hết lệnh Stata đề r-class, nghóa kết lưu tiếp cận cách sử dụng r() với tên thích hợp ngoặc đơn Lệnh ước lượng lưu kết e() Để xem tên số lưu tên gì, xem “store results” lệnh quan tâm sổ tay tham khảo Stata Nếu tập lệnh nội định nghóa mà không dùng dấu =, xuất bên tay phải gõ tên tập lệnh nội dấu ngoặc đơn có tác dụng gõ bất cứu thứ xuất bên tay phải định nghóa tập lệnh Ví dụ, có biến y, sử dụng leänh local a y disp "`a'[1] = "`a' [1] y[1] = -1.0038831 tập lệnh nội hữu do-file hay chương trình mà định nghóa Tập lệnh ngọai định nghóa cách global a=1 tiếp cận cách gắn vào đầu dấu dollar ví dụ gen b=$a có ích tạo tập lệnh chung (hay chương trình) áp dụng cho trường hợp khác nhau) điều cần thiết tên biến tham số cụ thể ứng dụng thông qua chương rình Nếu lệnh lưu do-file, “đối số” mà do-file sử dụng `1’, `2’… Bên do-file Ví dụ, do-file tên filenam.do chứa lệnh list `1’ `2’ chạy cách 30 filename x1 x2 để làm cho x1 x2 liệt kê Cách khác định nghóa chương trình gọi mà sử dụng lệnh tnhư cách bình thường Điều thực cách đính kèm tập lệnh program programe end sau chạy định nghóa chương trình, chạy chương trình cách gõ tên chương trình đối số Hầu hết chương trình yêu cầu thứ lập lại vòng lặp thông qua danh sách đối tượng Điều đạt cách sử dụng foreach forvalues Ví dụ, định nghóa chương trình gọi mylist liệt kê ba quan sát đầu biến danh sách biến: Program mylist Version 8.1 Syntax varlist Foreach var in `varlist’ { /* outer loop: variablres */ Display “`var’” Forvalues i=1/3 { /* inner loop: observations */ Display `var[`i’] } end chạy chương trình sử dụng lệnh mylist x y z lện syntax xác định cú pháp mylist varlist (không cho phép có option ), cho thông báo lỗi varlist không có, ví dụ biến không tồn tại, đặt tên biến vào macro nội “varlist’ (xem help syntax [P] syntax) Vòng lặp ngòai foreach lặp lại thứ thắng biến varlist Trong vòng lặp, biến đặt macro var biến, vòng lặp forvalues lặp lại lệnh display i 1, 31 Một chương trình định nghóa cách gõ chương trình vào cửa sổ command Nhưng điều không thực thực tế Tuy nhiên, phương pháp có ích hon sọan chương trình dofile Cần lưu ý chương trình load vào nhớ (bằng cách sử dụng lệnh program) phải làm từ nhớ lệnh program drop trước tái xác định Vì lệnh sau có ích Capture program drop mylist Trong do-file trước chạy lệnh program capture đảm bảo do-file tiếp tục chạy chí mylist chưa tồn Một chương trình lưu file riêng biệt (chỉ chứa định nghóa chương trình) với tên với chương trình có duoi ado ado-file (do-file tự động) thư mục Stata tìm kiếm ado-file, ví dụ, thư mục hành xử lý đơn giản cách gõ tên tập tin Không cần phải tải chương trình (bằng cách định nghóa chương trình) Để tìm hiểu nơi Stata tìm kiếm ado-file, gõ Adopath Lệnh liệt kê vài thư mục bao gồm \ado\personal/, thư mục chứa ado-file cá nhân lưu lại Nhiều lệnh Stata thật ado-file nằm thư mục ado thư mục Stata xử lý (ví dụ wstata.exe) nằm Sổ tay tham khảo lập trình [P] cung cấp thông tin chi tiết lệnh lập trình vừa trình bày nhiều lệnh khác Xem [P] dialos để biết thêm thông tin lập trình hộp thọai Không đề cập sổ tay dành cho phiên spi cho phép kết hợp chương trình c để gọi từ chương trình Stata Thông tin làm điều thực tìm thấy http:/www.Stata.com/support/plugins/ Chương 13 sách đưa số ví dụ tối đa khả riêng bạn thảo luận chi tiết goul et al (2003) 1.11 CẬP NHẬT STATA Công ty Stata cập nhật Nếu máy tính kết nối internet, Stata cập nhật lệnh 32 update all Ado-file tự động tải xuống máy tính lưu trữ vào thư mục file thi hành lệnh bị thay đổi trước đó, file thi hành lệnh tải xuống (ví dụ wstata.bin) file sử dụng để chép đè lên file cũ (ví dụ wstata.exe) sau máy lưu file cũ tên (ví dụ wstata.old) Một cách nhanh chóng dễ dàng để thực công việc gõ lệnh update swap Stata Lệnh help whatsnew liệt kê tất thay đổi có trước tung Stata hành Bên cạnh việc cập nhật thức cho Stata, người dùng cịn cập nhật câu lệnh người sử dụng viết Các báo viết chương trình dành cho người lập trình xuất tạp chí uy tín The Stata Jounal (SJ) thay Stata Technical Bulletin (STB) vào cuối năm 2001 Những chương trình chương trình người sử dụng viết khác tải cách click vào Help SJ & User-written Program, sau chọn website bao gồm web SJ STB Có nhiều chương trình file nén Statistical Software Components (SSC) web site http://ideas.repec.org/s/boc/bocode.html kit baun trì (file nén phần ideas sử dụng sở lập trình RePEc) Những chương trình tải xuống lệnh ssc Để tìm hiểu câu lệnh vấn đề cụ thể đó, sử dụng lệnh findit Ví dụ chạy lệnh findit meta cửa sổ Stata viewer với danh sách dài nhập liệu bao gồm stb-42 33 Chương Mô Tả Số Liệu Phân Tích Đơn Giản: Các Bệnh Nhân Tâm Thần Nữ 2.1 Mô tả liệu Bộ số liệu thuộc nghiên cứu Hand cộng (1994) 118 bệnh nhân tâm thần nữ bao gồm biến sau Biến số age IQ Chú thích Tuổi tính năm Chỉ số thơng minh 34 Các giá trị anxiety Lo lắng depress Trầm cảm sleep Bà/cơ ngủ bình thường hay khơng? sex Bà/cơ có hứng thú quan hệ hay không? life Gần bà/cơ có nghĩ việc kết liễu sống hay khơng Tăng cân nặng vịng sáu tháng vừa qua (tính theo pao) weight 4 2 khơng nhẹ vừa nặng khơng nhẹ vừa nặng có khơng khơng có khơng có Dữ liệu nằm bảng 2.1; giá trị mã hóa dạng –99 có số câu hỏi đặt cho liệu ví dụ như: liệu liên quan nào?, người phụ nữ có ý định tự tử có khác người khơng có khía cạnh xét đến hay khơng? Chúng ta cần quan tâm đến việc liệu có mối liên hệ lo lắng trầm cảm, thay đổi trọng lượng, tuổi IQ hay không Cần ý kết hợp phát bảng chéo nghiên cứu sở đưa đến mối quan hệ nhân Bảng 2.1 Dữ liệu tập tin fem.dat id age IQ weight anxiety depress sleep sex life 10 11 12 13 14 15 16 39 41 42 30 35 44 31 39 35 33 38 31 40 44 43 32 2 2 -99 3 2 3 2 1 2 2 2 2 2 2 -99 2 2 2 2 2 1 2 1 2 4.9 2.2 -2.6 -.3 -1.5 3.5 -1.2 -1.9 5.5 2.7 4.4 3.2 -1.5 94 89 83 99 94 90 94 87 -99 92 92 94 91 86 90 -99 35 2 2 2 2 -99 2 2 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 32 43 46 30 34 37 35 45 35 31 32 44 40 42 36 42 46 41 30 39 40 42 35 31 33 43 37 32 34 34 42 41 31 32 29 41 39 41 34 39 35 31 32 41 41 44 91 82 86 88 97 96 95 87 103 -99 91 87 91 89 92 84 94 92 96 96 86 92 102 82 92 90 92 88 98 93 90 91 -99 92 92 91 91 86 95 91 96 100 99 89 89 98 3 2 2 2 3 3 2 -99 2 2 -99 2 3 2 2 3 2 2 2 2 3 -99 -99 2 2 -99 2 1 2 2 1 2 2 2 2 -99 2 2 2 2 2 2 2 2 2 2 2 2 1 2 2 1 2 2 2 36 -99 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 1 2 2 2 1 1 2 2 2 2 2 1 -99 1 2 2 1 1 2 2 -1.9 8.3 3.6 1.4 -99 -99 -1 6.5 -2.1 -.4 -1.9 3.7 4.5 4.2 -99 1.7 4.8 1.7 -3 1.5 1.3 1.5 3.4 -99 -99 6 3.3 4.8 -2.2 -1.2 5.9 3.5 2.9 -.6 -.6 -2.5 3.2 2.1 3.8 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 35 41 41 42 33 41 43 37 36 44 42 31 29 32 35 42 32 39 34 34 42 43 31 31 36 37 43 32 32 32 43 41 43 39 41 41 32 44 42 39 45 39 31 34 41 33 98 103 91 91 94 91 85 92 96 90 87 95 95 87 95 88 94 -99 -99 87 92 86 93 92 106 93 95 95 92 98 92 88 85 92 84 92 91 86 92 89 -99 96 97 92 92 98 2 2 2 2 3 -99 2 2 -99 2 2 2 3 2 3 2 2 -99 3 2 -99 3 2 2 2 -99 2 2 2 2 2 -99 -99 2 2 2 -99 2 2 2 2 2 2 2 2 2 2 2 -99 2 2 2 2 2 2 -99 2 37 2 -99 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 -99 2 2 1 1 2 2 2 1 1 2 2 2 2 1 2 1 2 2 2 -2.4 -.8 5.8 2.5 -1.8 4.3 -99 3.5 3.3 -.7 -1.6 -.2 -3.7 3.8 -1 4.7 -4.9 -99 2.2 -4.2 -1.1 -1 4.2 2.4 4.9 -.3 1.2 2.6 1.9 3.5 -.6 1.4 5.7 4.6 -99 -99 2.8 -2.1 -2.5 2.5 109 100 111 112 113 114 115 116 117 118 34 42 40 35 41 32 39 41 33 42 91 91 89 94 90 96 87 86 89 -99 3 3 2 3 3 2 2 2 2 1 2 2 2 1 2 2 2 5.7 2.4 1.5 1.7 2.5 -99 -99 -1 6.5 4.9 2.2 So sánh nhóm tương quan Bảng 2.1 trình bày biến liên tục (thay đổi trọng lượng, tuổi, IQ), biến thứ tự (anxiety depression) biến nhị giá (sex sleep) dùng để so sánh hai nhóm phụ nữ: nhóm có ý nghĩ tự tự nhóm khơng có ý nghĩ tự tự Đối với biến liên tục, phép kiểm sử dụng phổ biến phép kiểm ttest với giả thuyết điều kiện quan sát hai nhóm phải độc lập với rút từ hai dân số có phân phối bình thường phương sai Ngồi cịn sử dụng phép kiểm Mann-Whiney U-test (không sử dụng hai giả thuyết điều kiện trên) Đối với biến thứ tự, sử dụng phép kiểm Mann-Whitney U-test hay phép kiểm chi bình phương tùy vào số bậc biến thứ tự phép kiểm chi bình phương sử dụng để so sánh biến nhị giá nhóm Đối với biến liên tục để tính mối tương quan sử dụng hệ số tương quan Pearson Nếu quan tâm đến việc liệu tương quan hai biến có thật khác hay không, phải sử dụng phép kiểm với giả thuyết điều kiện hai biến phải có phân phối bình thường Tuy nhiên sử dụng phép kiểm khác không cần giả thuyết điều kiện phân phối bình thường Phép kiểm dựa hệ số tương quan biến xếp hạng, hệ số tương quan xếp hạng Spearman Sau hết, biến có vài giá trị, sử dụng hệ số Kendall’s tau-b để đo lường mối tương quan (xem Sprent va Smeeton, 2001) Các phép kiểm hệ số tương quan trình bày chi tiết Altman (1991) Agresti (2002) 2.3 Phân tích số liệu Stata Giả sử số liệu lưu dạng bảng tính hay phần mềm thống kê có định dạng ASCII, với tên gọi fem.dat Chúng ta dùng lện sau để đọc file này: insheet using fem.dat, clear Có nhiều giá trị số liệu mã dạng –99 Chúng ta thay giá trị giá trị quy định Stata ‘.’ lệnh sau mvdecode _all, mv(-99) 38 Biến sleep có quan sát bị nhập liệu sai thành giá trị Để phát lỗi nhập liêu sai kiểu trên, sử dụng lệnh codebook để liệt kê thông tin tất biến Thơng tin biến sleep trình bày đây: sleep type: numeric (byte) range: unique values: [1,3] tabulation: Freq 14 98 units: missing : 5/118 Value Ngoài cách dùng lệnh assert để phát lỗi nhập liệu biến sleep dùng lệnh assert sau assert sleep==1|sleep==2|sleep== contradiction in 118 observations assertion is false 39 Chương Hồi quy đa biến: Các yếu tố định ô nhiễm thành phố mỹ 3.1 mô tả số liệu số liệu ô nhiễm không khí 41 thành phố mỹ sokal rohlf (1981) thu thập từ tạp chí phủ mỹ mô tả bảng 3.1 có biến phụ thuộc biến s02, nồng độ tập trung trung bình so2 năm tính theo mg/m3 số liệu trung bình ba năm từ 1969 1971 thành phố Các giá trị biến giải thích lại, hai biến sinh thái người biến môi trường, ghi chép lại mô tả đây: temp: nhiệt độ trung bình năm theo độ f manuf: số nhà máy sản xuất thuê mướn từ 20 công nhân trở lên pop: kích thước dân số (theo điều tra 1970) tính ngàn wind: tốc độ gío trung bình năm tính theo dặm/giờ precip: vũ lượng trung bình năm days: số ngày trung bình có mưa năm câu hỏi đặt mức ô nhiễm thông qua nồng độ so2 không khí xác định sáu yếu tố lại Phương pháp trọng tâm phân tích hồi quy đa biến 3.2 mô hình hồi quy đa biến mô hình hồi quy đa biến có dạng chung sau yi biến đáp ứng liên tục (hay phụ thuộc) cho thành viên thứ i mẫu, x 1i, x2i…, xpi tập hợp biến giải thích (biến độc lập) hay gọi đồng biến, hệ số hồi quy số dư hay số hạng sai số với có nghóa không liên quan với biến giải thích Vọng trị đáp ứng giá trị cho trước đồng biến 40 giá trị muốn dự đóan cho cá nhân với giá trị đồng biến xi biết hệ số hồi quy Mỗi hệ số hồi quy tượng trưng cho thay đổi trung bình biến đáp ứng biến giải thích tương ứng tăng lên đơn vị biến lại nguyên giá trị Vì vậy, hệ số tương quan tượng trưng cho tác động biến giải thích, kiểm sóat biến giải thích khác mô hình, tạo thuật ngữ hệ số hồi quy phần Số dư khác biệt giá trị quan sát đáp ứng giá trị dự đoán biến giải thích Hệ số tương quan nhìn chung ước lượng bình phương tối thiểu, hay nói cách khác số ước lượng tối thiểu tổng khác biệt bình phương đáp ứng quan sát dự đóan, hay tổng bình phương số dư ước lượng Phép kiểm có ý nghóa hệ số tương quan thực dựa giả định số dư có phân phối bình thường độc lập với trung bình phương sai định Đối với n quan sát đáp ứng biến giải thích, mô hình hồi quy viết xác Trong y nx1 vecto đáp ứng, x ma trận số biết gồm n x (p+1), cột chứa lọat số hạng tương ứng với mô hình 3.1, cột lại giá trị biến giải thích Các yếu tố vecto hệ số hồi quy vecto số dư Bình phương tối thiểu ước lượng hệ số tương quan viết Và phương sai đồng biến ùc lượng tìm thấy Trong s2 ước lượng phương sai số dư cho trước tổng bình phương số dư ước lượng công thức 3.2 chia cho n-p-1 mức độ phù hợp mô hình thường mô tả dạng phần trăm phương sai biến đáp ứng giải thích biến giải thích, cho trước R2, bình phương hệ số tương quan đa Hệ số tương quan đa tương quan niến đáp ứng quan sát đáp ứng dự đoán mô hình Muốn biết thêm chi tiết, xem thêm rawling et all (1998) 3.3 PHÂN TÍCH BẰNG STATA 41 giả sử tập tin số liệu nằm dạng file ASCII tên usair.dat thư mục hành file chứa tên thành phố (bảng tóm tắt 3.1), chúng đọc dạng Stata sử dụng cấu trúc sau đây: infile str10 town so2 temp manuf wind precip days using usair,dat hải gợi ý lọai cho biến chuỗi town str10 nghóa “biến chuỗi có 10 ký tự” trước phân tích phương trình hồi quy, tốt hết nên mô tả mối liên hệ biến dạng đồ thị thông qua ma trận phân tán đồ Ma trận phân tán đồ cho phép xác định mối quan hệ chung biến, nhận diện giá trị ngọai lai, phát vấn đề đồng tuyến tính biến giải thích Đồ thị vẽ lệnh graph matrix so2 manuf pop wind precip days temp 2000 4000 10 12 100 s o2 50 4000 manuf 2000 4000 pop 2000 12 10 w ind 60 40 pr ec ip 20 day s temp 50 100 2000 4000 kết trình bày hình 3.1 số phân tán đồ cho thấy có giá trị ngọai lai, mối quan hệ manuf pop mạnh gợi ý sử dụng hai biến phân tích hồi quy dẫn đến rắc rối (xem sau) Các mối quan hệ quan tâm, cụ thể mối quan hệ so2 biến giải thích trình bày hàng ma trận cho thấy 42 có quan hệ không tuyến tính Để dễ hiễu dán nhãn tên thành phố cho chấm điểm phân tán đồ Đầu tiên tạo biến chứa ba ký tự của chuỗi biến town sử dụng hàm substr() gen str3 twn=substr(town,1,3) vẽ ma trận phân tán đồ với biến tạo twn graph matrix so2-days, msymbol(none) mlabel(twn) mlabposition(0) 40 60 Ch i Pro Pro 80 Mi a Ph Ho Jauoc Ne Dawl Me m 60 Lro NaAtl sNosr Wa Al Sfrb Ric Wic Lo ua BaStL Ch l Ph i Ka Ci nInd nWil DeaSL n C Om Co la t Pit De sSeDe HaCle r Bu MfilM in Alb temp Pro Ch i 40 Ph i De t Cle Ho M in BaStL Da l r Mul fC Sfr De nSe i n laus Ha Wa Bu Ka nilAtl Ind Me Na Co Mi Ph Ne Om wam Ric Wic Ja Car Alb Pit Lro De ssLo NoWil Al bocaSL Ch 60 40 20 4000 Ch i Ch i Pro Pro Cle Ph i Pi tStL Ha r Alb Ba l Wi l De t Ch No aC r uMi Lo Se Wa SL Ind Ric Co las n Atl Na snnil De De sCin Om Ja Ka aoM LroSfr Alb Bu f lu M Ph M ia eccw m Ho Ne Da Wi Ph i Cl e Ha rPit StL Al b Ba l Wil De t Ch rMi Lo u Se SLNo CCo Ind RiaCi cWa Atl nsanl ns Na De De Om Ka Ja aM nfDa comilHo Lro Sfr Al Bu bscw M Me Ph ia Ne l u Wi M ia PhcwoHo u Ja Ne Da l M Atl em Lro No Na rs s Ric Wa Alb Wi cSfr Lo uBa Ch aCin l Ph i Ka nStL Wi l Ind De Om Co al n De t SL C Pi Pro DeSe Ha s atrf Cle Alb Bu MMiil n M ia Ph co Ho u NeJa wDa l Me m Atl Lro No Na rs s Ri c Wa Al bLo Wi cSfr StL u l Ch Ph i Ka nBa WilaCi nInd De Om aClanle De t Se SL CrsCo Pit Pro Ha De Al bBu Mf iln Mi Ch i Ph i De t Ho u Ba l Cle Da l ilWa M Ind in Sfr Mm Me Ph ofC Lo Co laus StL Ja Ka De cnaAtl nSe Pit Bu Na s i n Ne w Mi Om a No Wic Ric Al b SL De sChWil Car AlbHa r Lro Wic Bu f M il De s Da Om Cle Ho ul aMNoinr Ka nIndDe t l PitPh i Se as BaStL Wa Me Atl Mi De am n Wil Ha r Al bcSL Ja Alb Sfr C NeLro w Co Lol u NaRic s Ci n Ch a Ph o Miwa Ne Ja c Me m Lro Atl HoNa us Nour BaHa Lo Ric Ch a l rPh i nWil Se Ind Kal fCi nWa Co las StL Bu Pit Da Cle Alb De t Wic Om M ailsM De in Sfr SL C De n Al bo Ph Bu f Se a Cle Ch a Pit Mnin Co l Alb MiMaCi ilsInd LoDe u t Ha r Na NoWil r Ba l Ph i Ric NeJa wcAtl Wa s Me m StL Ho De unas Lro Ka Om DeSL n C Wic Da l Sfr Al b Ph o 50 Ch i 20 40 60 Ch i Ch i Pro Pro 100 Ph i Cle i Ph i ClPiePh Cl e HaPit StL r StLt Ha r StL Ha r Pit 50 Ba l Al b Al b Ba l Al b Ba l Wi l Wi l Wil De t De t De t Ch a Ri cLoSL Nonr ChLo r No Ch a uWa Lo uMin Se as Mi Wa Se sa uAtl sr Co C SL C Mi n Co Ind SL C Wa Ind l Ind lnaNo Ric Atl Atl CinNa sCoDe CiRic nl Se a NaLro s Ja c NaMcsCi n De s De n De s De n De s M il Mil il Ja c Ka n Om a Om a Ka n Om Ka n a Ja Lro Lro Sfr Sfr Sfr Alb f Ph Al ob Bu lf Me Bu f Ph o Me Ho umNeMiwPh a o Al b Da HoNe umwMi a Ne M w iam Ho Daul Bu l Me Wic WicDa Wic M ia Mi a Mi a Ph o Ho u Ho uJa Ho uJa c NeJa wc NecwPh o Da l Da l Da l Ne w Me m Me m Me m Atl Atl Atl Lro Lro Lro No No Nasrs RiNa c s Alb Ric Ric Wa s No r Wa sNars Wa Al bSfrWic StL Wic Al b Sfr WicStL StL uWi u nCh a Ch aCin LoSfr Ch Ba Ba l i Ci Ph Ph PhLo Ka nLo Ka nBa l Kail n Ci Wi naillu Wil Ind nInd De De nC a Ind CoDe l Pit Om atPi Co la Co Se aDeCh Se Se a SL C SLnC Om SLOm iDeas Ch itPro i rt lPit Pro tCle DeCl Pro De De De s Ch Ha AlHab r AlsBu be fHa r b Cl eBu f Bu f M il Mil M ilAl Mi n Mi n Min Ph o Ch i Ch i manuf Ph i De t Cle StLl MiMi n l Ba DaHol u De Ci nWa nSfr Ha r Ka sAtl Bu f nNa Se Ind a Pro Pi t Me Co Lo sr mNe Om alWic w SL C JaPh c oMia lauNo AlDe b s Wi Ch AlRic bLro Pro Ch i 2000 2000 4000 Ch i 4000 Ch i Cle Ph i HaPir t StL Al b Ba l laNo r De tWi CLo u sAtl Mi n Se aC SL Ind Co lhWa Ci nRic s Ja c De sKa Mi lOm anWic nNa Lro Sfr Bu fDe Al bMe mDa Ho Ph Ne l wuoMia s o2 80 Ph i De t Ho u Ba ln Da Wa Ind sCle M eCin m Ph Lo oM uMi Co latnStL Ja Se Ka De Pi crSfr nil Atl Na Bu s f Ne w Om M ia a No Wi Ric Alb De scl r SL Pro C Lro Alb Ch Wi aHa WiBu c f M il De saDaCle Om Ho nlu NoPro r Mi Ka n De t Ind Ba l Ph i Se Pi atStL Wa MHa el m Atl Wi M De ia rns Alb Ja c SL C Sfr Cowul Ne Lo Lro Na s Ric Cin Ch a Ph o M iaw Ne Ja c M esm Lro Atl Ho u Na No r uBa Lo Ric Pro Ch aHa Wi l lanrs l Ph i Cin Se Wa Ind Co Ka Bu PiDa tStL f Cle l Alb De Wi scaM il De t Om Mi n Sfr SLDe Cn Alb Ph o BuSe f a Cle Ch a Pi t Mi nAl bCoCil n Mia r tiLo u Pro MiHa lDe Ch Ind sr Ne No Jaw c Ph Ric Wi liNa Ba Wa l sAtl De sKa Lrom Ho u n Me Om aStL SL DeCnWic Da l Sfr Al b Ph o Buaf Se Ch aPi t Cle Mi Alb Co l n Cin MLo ia Ha Pro M uril De t Ind Na Ja No crlwsBas l Ric Atl Ph i Wi Ne Wa MKa De seam Ho Lro nStLu Om SL C n WiDe c Da l Sfr Alb Ph o Pro Ch i 100 Ch i pop 2000 Ch i Ch i Ch i WiBu cf M il De saClDa Om enHo l u Pro No rMi KaInd n De t l Ph i StL Se Pit aBa Wa Wil Ha MbMe De rAtlSfr ncms Al bia Al Ja SL C Co NeLo w ul Lro RiNac s Ci n Ch a Ph o M iaw NeJa c Me Lro AtlsmHo u Na No Ha rLo u l Pro Ri cr Ba Ch WilaSe Ph i Ci n Wa Ind a Ka Co n lesl Pit StL ClfDa Al bBu De scaM il De t Wi Om Mi n Sfr SLDe Cn Al Ph b o Bu af Se Cl e Ch a Pit Mi AlMbCiia n l n De t Ha rCo Pro LoM Na scuil No rwInd RiJa Atl cWa Ph i Wil Ne Basl Me De sStL Lro Ka Om anmHo u SL Cc n WiDe Da l Sfr Al b Ph o 4000 Ch i Ph i Ph i Ph i De tCle DeClt e De t Cl e StL StL Ho Ho Ho uM Mi nul M il Mi n StLBa Da lHa lr u Ba ilMin Cin Lo Sfr De nBa De n Sfr MilDa CitPro nasNa SfrDaDel Ka nMe Ci Ha Wa rInd s l nPro Wa Wa slMi Ha Ka Bu f Ka Bu n f n Buaf Atl Se a Se Ind Atl Atl Ind Me Pit m Pi Me m m s Co u l Co Lo l u s Na Lo uarnlPit Se PhCh o a RiNa M ia Ph o Mi Ph a o cLro NeSL wWi OmDe Ric Necw Ric wPro Ja Cbc l No Wic SLOm C crsCo r as Wic Al bSL C Om DeAlasbCh No r Ja Lro DeaNe sJa No Wi Wil Al Alb al Lro Al b Wic Al bCh a Ch i Ph i De t Ho u Ba l s Da l MiMi n Cle Ind Wa lSe Sfr StL uMe Co Pi Ka taLo nNa JaPh c oMia BuOm fDe Ci nRic sr mNe w anlWic NoAtl Al Pro Ha Pro SL C AlDe b sr Wi Ch labLro Bu f Wic Mi l De sa Om DaHol u Pro Ch i Mi n Cle Pro Chti No r De Ka n Ba il s StL Se PiInd taPh Atlm Ja c Mia r Wi nWa l bMe Al AlHa bDe SL C Sfr CoLo l u Ne w NaLro s Ric Ci n Ch a Ph o Mia Ne Jaw c Me Lro Atl Na sr m Ho u No Ha r Wi Lo u Pro Pro Ric Ba Ch Ph lail s Ci n Se Ind a Wa Co Ka l n Pi f ti StL Da l Cle Ch i Bu AlDe bCh De st aWic Om MiMi nl Sfr SL C De n Al b Ph o Ch i 2000 Ph i Cl e De t StL Mi Da Ba ll u M ilnHo Ci De nSfr Ha rCo Wa Ka Bu Se Atl Pro M Pit Lo sanfcoulms M Ph ia Om Ne RiaNa aeInd SL Wi C Lro De No Wil Ch Al Al bJa bsccrw Ch i Ch i Ch i Ch i Ch i Ch i Ch i Ph i Ph i Ph i De t De t De t Ho u Ho u Ho u Ba l MiCle Ba l BaInd Da l Da l Da l Wa Ind s n Mi n Cl Wa Ind e s Wa sl ilCo Cl e Sfr M il Sfr Mil Sfr M Me m c Ph o m StL StL StL Ph o CinNaLo uMe Ph oDe n uAtl Lo uMin Co lia Co lnaNa Ja De Se cPit nmKa a nNo Ka Pi Se tnLo Ja DeOm Ka nMe naNe Ja crsCi Atl Atl s Bu f Bu Ci f s Na nlPit Se Buaf Ne w Ne w w M Om a Om a Mi a Mi r No r No Ric RicPro Alb Al b Wic DeAlsbCh De sWil SL Ha Cb rl ProDe s Wic Al bSL C Wic Pro Ha r SL C HaAlar bCh a Lro Al Ch a Ri cLro Wi Wi al Lro WicBu f Wic Bu f 12 Mil M il DeClasDae l De s Da l Om Cl e HoauNoPro MiOm n i Pro NoHor u ChrDe iMin DeCh t n t Ka Ka n 10 Ind Ph Ba l Ba PhInd li StL StL Pi Se t asiMe Pit Se a Wa Wa w ind m Mi a Al b De nMe m AtlsMi Hal rAtlJa Wil Ha Al De bSLnCSfr AlCo bWi Ja c Alar bl Sfr SL C Ne l u Necw w Co Lo Lo u Lro Lro Na s Na s Ric Ric Ci n Ci n Ch a Ch a Ph o Ph o M Mi a NeJa w ia Ne c Jawc Me Lro Atlm Ho u Lro Atl Ho um Na s uMe Na sur No r No r Lo Ha r Lo Ha Ri c Pro Ric Pro Ba Ba Ch aCin Ph lInd PhInd nCh aSe Wa Se as il n Da l Bu f Wa sl i Ci a CoWi l StL Ka nWil Co Da l KaStL Cle Cl eBu f iAltblPit Al bPit DeCh t iDeas Wic Deas Ch WicOm Om MDe ilMin pr ec ip Mi n M il Sfr Sfr SLDe Cn SLnC De Alb Ph o Ph o Al b Bu f Bu Se a Sefa Cle Cl eCh a Ch a Pit Pi t n Mi nAlCo Al lb DeMi ln r Cin Co t i M il DeCh tbCii Lo M Mi a Ha Pro Pro Lo uHaiarInd Mil Ch Ind Na s Naurs Ja cPh No Ri cNeJa Atl Ph Ric l s il No r Wi wWi Necw Wa Ba Wa Ba sill Atl mKa nOm HoDe uas De aStL sKa n Me Ho LroMeStL Lroum Om SLDe Cn SLnC Wic De Wic Da l Da l Sfr Sfr Alb Al b Ph o Ph o 10 12 150 day s 100 50 50 100 150 option mlabel() seõ dán cho chấm điểm tên giá trị biến twn Theo mặc định, ký tự quy chấm phải khử cách option msymbol(none); mlabposition() đưa nhãn vào Đồ thị mong muốn trình bày hình 3.2 rõ ràng chicago philadelphia vượt chút xem số ngọai lai Chicago có ức ô nhiễm cao so 43 với thành phố khác nên có lẽ cần xem trường hợp đặc biệt loại trừ phân tích sau dó Chúng ta bỏ quan sát chiacago cách drop if town== "Chicago" (1 observation deleted) 44 ... thành viên Stata người sử dụng chuyên nghiệp ví dụ Nick Cox thường giải đáp thắc mắc người sử dụng 1.2 KHỞI ĐỘNG STATA Mục đề cập cách khái qt có phần mềm Stata 1.2.1 Cửa sổ Stata Khi Stata khởi... đặc trưng thú vị người sử dụng Stata bạn trở thành viên cộng đồng Stata Các gặp gỡ cộng đồng người sử dụng Stata diễn thường niên UK, USA số quốc gia khác; xem mục 1.11 Statalist danh sách mail... lại cách sử dụng lệnh set memory 2m Lệnh memory đối số đưa thông tin nhớ có dung lượng sử dụng có tổng cộng Nếu file số liệu định dạng Stata, chúng chuyển sang định dạng Stata cách sử dụng phần

Ngày đăng: 28/09/2021, 15:21

TỪ KHÓA LIÊN QUAN

w