1. Trang chủ
  2. » Luận Văn - Báo Cáo

Hướng dẫn sử dụng chương trình Stata 8

86 0 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

ë ®©y biÕn reg7 cã 7 gi¸ trÞ tõ 1 ®Õn 7 t−¬ng øng víi 7 biÕn gi¶ tõ region1 ®Õn region7 sÏ ®−îc t¹o ra. BiÕn region1 nhËn gi¸ trÞ b»ng 1 nÕu nh− biÕn reg7 nhËn gi¸ trÞ 1, nÕu kh«ng th× b»ng 0. T−¬ng tù biÕn region7 nhËn gi¸ trÞ 1 nÕu nh− biÕn reg7 b»ng 7. LÖnh nµy cho phÐp t¹o biÕn míi theo gi¸ trÞ cña hµm sè ®−îc chØ ra bëi fcn. BiÕn míi nµy sÏ nhËn gi¸ trÞ cè ®Þnh cho mäi quan s¸t.

Sö dông ch−¬ng tr×nh Stata 8 néi dung Ch−¬ng I: Giíi thiÖu chung vÒ ch−¬ng tr×nh Stata 2 1 Tæ chøc l−u tr÷ d÷ liÖu trong Stata (Dataset in Stata) 2 2 Khëi ®éng vµ tho¸t khái Stata (Open and exit) 3 3 Giao diÖn Stata 7 (Stata interface) 3 4 Biªn b¶n lµm viÖc (log file) Error! Bookmark not defined 5 NhËp vµ l−u d÷ liÖu (Use, input and and save) 6 Ch−¬ng II: Khai th¸c d÷ liÖu 8 1 CÊu tróc lÖnh trong Stata (Stata command syntax) 8 2.To¸n tö vµ hµm sè (Operators and functions) 11 3 M« t¶ d÷ liÖu (Data reporting) 12 4 Biªn tËp vµ söa ch÷a d÷ liÖu (Data manipulation) 25 5 QuyÒn sè trong VHLSS (Weight) 38 Ch−¬ng III: KiÓm ®Þnh gi¶ thiÕt vµ ph©n tÝch håi quy 43 1 ¦íc l−îng vµ kiÓm ®Þnh gi¶ thiÕt (Estimation and hypothesis testing) 43 2 Ph©n tÝch t−¬ng quan vµ håi quy (Correlation and regression) 49 Ch−¬ng IV: VÏ ®å thÞ 55 1 VÏ ®å thÞ (graph) 55 2 Mét sè lo¹i ®å thÞ th−êng dïng 64 3 L−u tr÷ vµ hiÓn thÞ ®å thÞ (Saving and graph using) 71 Ch−¬ng V: LËp tr×nh trong Stata 73 1 Giíi thiÖu chung vÒ ch−¬ng tr×nh do-file 73 2 Local vµ global macros 77 3 TÝch v« h−íng vµ ma trËn (scalar and matrix) 80 4 LÖnh ®iÒu kiÖn vµ vßng lÆp 82 5 Giíi thiÖu vÒ file ado 84 Tµi liÖu tham kh¶o 85 Phô lôc 85 1 Ch−¬ng I: Giíi thiÖu chung vÒ ch−¬ng tr×nh Stata 8 1 Tæ chøc l−u tr÷ d÷ liÖu trong Stata (Dataset in Stata) Stata lµ phÇn mÒm thèng kª sö dông ®Ó qu¶n lý, ph©n tÝch sè liÖu vµ vÏ ®å thÞ Stata cho phÐp l−u tr÷ th«ng tin vÒ c¸c ®Æc ®iÓm cña c¸c ®èi t−îng nghiªn cøu Sè liÖu l−u tr÷ trong Stata cã thÓ ®−îc hiÓn thÞ d−íi d¹ng b¶ng nh− vÝ dô sau: maho tenchuho quymoho thunhapbq 101 Nguyen Van A 6 2100 102 Le Thi B 5 3210 103 Tran Van C 10 1200 Quan s¸t (observation) Mçi mét hµng ngang cña b¶ng sè liÖu ®−îc gäi lµ mét quan s¸t, hay mét b¶n ghi (record) l−u tr÷ sè liÖu vÒ mét ®èi t−îng nghiªn cøu ë vÝ dô trªn cã 3 quan s¸t l−u tr÷ sè liÖu vÒ M hé (maho); Tªn chñ hé (tenchuho); Quy m« hé (quymoho); Thu nhËp b×nh qu©n (thunhapbq) cña 3 hé gia ®×nh BiÕn (variable) Th«ng tin vÒ ®èi t−îng nghiªn cøu ®−îc thu thËp vµ l−u tr÷ theo c¸c ®Æc ®iÓm cña chóng C¸c ®Æc ®iÓm nµy ®−îc gäi lµ biÕn BiÕn ®−îc xem lµ c¸c cét cña b¶ng sè liÖu ë vÝ dô trªn cã 4 biÕn, víi tªn lµ maho, tenchuho, quymoho, vµ thunhapbq Tªn biÕn dµi tõ 1 ®Õn 32 ký tù, ®−îc b¾t ®Çu ch÷ hoÆc dÊu g¹ch d−íi (_) Tªn biÕn chØ bao gåm ch÷, sç vµ dÊu g¹ch d−íi C¸c ký tù ®Æc biÖt kh¸c kh«ng thÓ dïng ®Ó ®Æt tªn cho biÕn BiÕn x¸c ®Þnh (identifying variables) Th«ng th−êng trong c¸c biÕn sÏ cã c¸c biÕn dïng ®Ó nhËn d¹ng quan s¸t, ®−îc gäi lµ biÕn x¸c ®Þnh Nhê cã c¸c biÕn x¸c ®Þnh nµy mµ c¸c quan s¸t cã thÓ ph©n biÖt ®−îc víi nhau Mçi mét quan s¸t cã mét gi¸ trÞ cña c¸c biÕn nµy ë vÝ dô trªn, biÕn x¸c ®Þnh lµ maho, ®èi víi mçi mét quan s¸t biÕn maho nhËn mét gi¸ trÞ C¸c ®Æc ®iÓm cña biÕn C¸c biÕn cã thÓ ®−îc g¸n nh n (chó thÝch) VÝ dô biÕn maho cã thÓ ®−îc g¸n nh n lµ “M hé” BiÕn cã thÓ ®−îc ®Þnh d¹ng (format) lµ biÕn sè vµ biÕn ký tù víi c¸c lo¹i l−u tr÷ kh¸c nhau BiÕn sè cã thÓ l−u tr÷ d−íi lo¹i byte; int; long; float; double Cßn biÕn ký tù th× cã thÓ l−u tr÷ d−íi d¹ng str1 ®Õn str80 cho c¸c ®é dµi kh¸c nhau KiÓu l−u tr÷ Dung l−îng Gi¸ trÞ nhá nhÊt Gi¸ trÞ lín nhÊt KiÓu d¹ng sè (Byte) byte 1 -127 126 Sè nguyªn int 2 -32,767 32,766 Sè nguyªn long 4 -2,147,483,647 2,147,483,646 Sè nguyªn float 4 -10^36 10^36 double 8 -10^308 10^308 Sè thùc Sè thùc C¸c biÕn sè cã thÓ bao gåm c¸c biÕn rêi r¹c vµ liªn tôc C¸c biÕn nh− lµ quy m« hé gia ®×nh, giíi tÝnh chñ hé, vïng ®Þa lý, tr×nh ®é gi¸o dôc lµ c¸c biÕn rêi r¹c (discrete) (hay cßn gäi lµ biÕn ph©n lo¹i 2 (categorical)) C¸c biÕn nµy cã thÓ ®−îc l−u tr÷ d−íi d¹ng byte, int, vµ long C¸c biÕn liªn tôc (continuous) nh− thu nhËp, chi tiªu cña hé th× l−u tr÷ d−íi d¹ng float hoÆc double BiÕn ký tù (string) dïng ®Ó l−u tr÷ c¸c lo¹i ký tù VÝ dô biÕn tenchuho lµ biÕn kiÓu ký tù dïng ®Ó l−u tr÷ tªn cña chñ hé KiÓu l−u tr÷ Byte §é dµi lín nhÊt d¹ng ch÷ 1 2 str1 1 80 str2 2 str80 80 2 Khëi ®éng vµ tho¸t khái Stata (Open and exit) Stata ®−îc khëi ®éng t−¬ng tù nh− c¸c ch−¬ng tr×nh tin häc øng dông kh¸c, b»ng c¸ch kÝch vµo biÓu t−îng cña tÖp wstata.exe trong Windows explorer, hoÆc chän b»ng c¸ch chän Start -> Program -> Stata Ch−¬ng tr×nh ®−îc tho¸t ra b»ng lÖnh exit tõ cöa sæ lÖnh Stata Command, hoÆc tuú chän exit trong thùc ®¬n (menu) File 3 Giao diÖn Stata 8 (Stata interface)1 Sau khi Stata ®−îc khëi ®éng, giao diÖn cña Stata sÏ ®−îc hiÖn lªn, bao gåm thanh thùc ®¬n (menu bar) ë trªn cïng, d−íi ®ã lµ thanh c«ng cô (tool bar) vµ c¸c cöa sæ (windows) 3 C¸c cöa sæ cña Stata C¸c cöa sæ cña Stata ®−îc më ra b»ng viÖc lùa chän c¸c tuú chän ë thanh thùc ®¬n Windows (menu bar) C¸c cöa sæ nµy bao gåm: Results HiÓn thÞ c¸c lÖnh vµ kÕt qu¶ Graph HiÓn thÞ ®å thÞ Viewer HiÓn thÞ cöa sæ trî gióp (help) vµ hiÓn thÞ néi dung c¸c file v¨n b¶n (text) Command Dïng ®Ó gâ c¸c c©u lÖnh Review HiÓn thÞ c¸c lÖnh ® thùc hiÖn Variables HiÓn thÞ danh s¸ch c¸c biÕn cña tÖp sè liÖu Data editor HiÓn thÞ vµ söa ch÷a sè liÖu d−íi d¹ng b¶ng Do-file editor HiÓn thÞ cöa sæ ®Ó so¹n th¶o ch−¬ng tr×nh Thanh thùc ®¬n (Menu bar) B»ng c¸ch kÝch vµo thanh thùc ®¬n vµ c¸c tuú chän trong ®ã, Stata sÏ thùc hiÖn c¸c lÖnh kh¸c nhau Thanh thùc ®¬n bao gåm c¸c nhãm lÖnh sau ®©y: File Më file sè liÖu Open View Xem c¸c file cña Stata trong cöa sæ Viewer Save L−u file sè liÖu Save as L−u file sè liÖu d−íi tªn míi File name Chän tªn file ®Ó ®−a vµo cöa sæ lÖnh Log §ãng, më, xem l¹i log file Save graph L−u gi÷ file ®å thÞ Print graph In ®å thÞ Print results In kÕt qu¶ Exit Tho¸t khái Stata Edit Sao chÐp v¨n b¶n (text) Copy text Sao chÐp b¶ng biÓu Copy tables D¸n Paste Lùa chän sao chÐp b¶ng sè liÖu Table copy options Lùa chän sao chÐp ®å thÞ (kh«ng cã trong Stata 7) Graph copy options 4 Prefs C¸c tuú chän vÒ mµu s¾c, ph«ng ch÷, vµ kÝch cì Windows Më cöa sæ kÕt qu¶ Results Më cöa sæ ®å thÞ Graph Më cöa sæ log file Log Më cöa sæ trî gióp (help) vµ xem néi dung file Viewer Më cöa sæ c©u lÖnh Command Më cöa sæ c¸c lÖnh ® thùc hiÖn Review Më cöa sæ danh s¸ch c¸c biÕn cña tÖp sè liÖu Variables Më cöa sæ trî gióp (help) Help/Search Më cöa ®Ó xem sè liÖu l−u tr÷ d−íi d¹ng b¶ng Data editor Më cöa sæ viÕt ch−¬ng tr×nh Do-file editor Help C¸c trî gióp liªn quan ®Õn viÖc sö dông Stata Thanh c«ng cô (tool bar) C¸c tuú chän trªn thanh c«ng cô ®−îc thiÕt kÕ ®Ó thùc hiÖn c¸c lÖnh th«ng dông cña Stata NÕu chóng ta di chuyÓn con trá ®Õn c¸c nót nµy th× sÏ hiÖn lªn c¸c c©u huíng dÉn, bao gåm: Open (use) Më file sè liÖu Stata Save L−u tr÷ file sè liÖu ra ®Üa Print results In néi dung cña cöa sæ kÕt qu¶ Begin log Më, ®ãng vµ xem néi dung cña file log Start viewer Më cöa sæ trî trî (help) Bring Dialog Window to font §−a cöa sæ hép tho¹i ra phÝa tr−íc Bring Result Window to font §−a cöa sæ kÕt qu¶ ra phÝa tr−íc Bring Graph Window to font §−a cöa sæ vÏ ®å thÞ ra phÝa tr−íc Do-file editor Më cöa sæ so¹n th¶o ch−¬ng tr×nh Data editor Më cöa sæ söa ch÷a sè liÖu Data browser Më cöa sæ xem sè liÖu Clear –more- condition T¾t lÖnh more Break Dõng viÖc thùc hiÖn lÖnh hoÆc ch−¬ng tr×nh 5 4 NhËp vµ l−u d÷ liÖu (Use, input and and save) Më tÖp sè liÖu ®ang cã: TÖp sè liÖu Stata cã thÓ ®−îc më b»ng lùa chän Open trªn thùc ®¬n File; hoÆc nót Open (use) trªn thanh c«ng cô tool bar NÕu file sè liÖu cã dung l−îng lín th× chóng ta ph¶i thiÕt lËp bé nhí cÇn dïng cho Stata b»ng lÖnh: set memory #[k|m] VÝ dô: set mem 32m set mem 32000k NhËp sè liÖu Cã mét sè c¸ch ®Ó nhËp sè liÖu tõ bµn phÝm vµo bé nhí cña Stata - Sö dông cöa sæ Stata editor ®Ó nhËp sè liÖu HoÆc tõ cöa sæ command, gâ lÖnh edit Sau ®ã nhËp sè liÖu theo kiÓu biÓu b¶ng trong cöa sæ nµy 6 Stata cho phÐp nhËp sè liÖu tõ c¸c file c¬ së d÷ liÖu kh¸c Tr−íc hÕt c¸c file sè liÖu nµy cÇn ®−îc l−u tr÷ d−íi d¹ng text (cã thÓ b»ng ch−¬ng tr×nh Excel), c¸c quan s¸t ®−îc c¸c nhau 1 dßng vµ c¸c gi¸ trÞ c¸ch nhau 1 dÉu phÈy (commas) hoÆc dÊu c¸ch (tab) Sau ®ã dïng lÖnh copy vµ paste ®Ó nhËp sè liÖu nµy vµo Stata L−u tr÷ sè liÖu ViÖc l−u tr÷ sè liÖu cã thÓ thùc hiÖn b»ng c¸c tïy chän Save vµ Save as ë trong thanh thùc ®¬n (menu bar); hoÆc nót Save trªn thanh c«ng cô (tool bar) Chó ý: Xem thªm lÖnh infile vµ outfile 7 Ch−¬ng II: Khai th¸c d÷ liÖu 1 CÊu tróc lÖnh trong Stata (Stata command syntax) CÊu tróc c¬ b¶n cña mét lÖnh trong Stata nh− sau: [by danh s¸ch biÕn:] Có ph¸p lÖnh [danh s¸ch biÕn] [biÓu thøc] [®iÒu kiÖn] [ph¹m vi] [quyÒn sè] [, tuú chän] Trong phÇn H−íng dÉn s− dông (Help) cña Stata, có ph¸p lÖnh tr×nh bµy b»ng tiÕng Anh nh− sau: [by varlist:] command [varlist] [=exp] [if exp] [in range] [weight] [, options] Trong ®ã dÊu ngoÆc vu«ng ký hiÖu c¸c tuú chän Chó ý: - C¸c c©u lÖnh Stata ®−îc viÕt b»ng ch÷ th−êng - §èi víi tªn biÕn, Stata ph©n biÖt ch÷ viÕt th−êng víi ch÷ viÕt hoa VÝ dô, trong cïng mét tÖp sè liÖu, biÕn “Ho_ten” vµ biÕn “ho_ten” lµ 2 biÕn kh¸c nhau - C¸c tuú chän ®−îc ký hiÖu trong dÊu ngoÆc vu«ng [ ] C¸c tuú chän nµy cã thÓ cã hoÆc kh«ng trong c©u lÖnh C¸c tham sè b¾t buéc (tªn biÕn) ®−îc ®Æt trong dÊu ngoÆc < > C¸c c©u lÖnh sÏ kh«ng thùc hiÖn ®−îc nÕu c¸c tham sè b¾t buéc nµy kh«ng ®−îc khai b¸o - Mét sè lÖnh Stata cho phÐp viÕt t¾t VÝ dô lÖnh summarize cã thÓ viÕt t¾t lµ sum Trong cuèn tµi liÖu nµy phÇn g¹ch ch©n d−íi có ph¸p cña c©u lÖnh lµ có ph¸p “viÕt t¾t” cña c©u lÖnh ®ã - C¸c vÝ dô trong cuèn tµi liÖu nµy sö dông sè liÖu §iÒu tra Møc sèng d©n c− n¨m 1998 do Tæng côc Thèng kª tiÕn hµnh Trong ®ã TÖp chi tiªu tæng hîp Hhexp98n.dta th−êng xuyªn ®−îc sö dông by danh s¸ch biÕn (by varlist): Stata sÏ thùc hiÖn c©u lÖnh víi theo tõng gi¸ trÞ ®−îc chØ ra bëi danh s¸ch biÕn BiÕn ®−îc chØ ra bëi danh s¸ch biÕn ®−îc yªu cÇu s½p xÕp tr−íc khi thùc hiÖn lÖnh VÝ dô: sort sex by sex: sum rlpcex1 -> sex = 1 Variable | Obs Mean Std Dev Min Max -+ - rlpcex1 | 4375 2980.906 2430.648 357.318 45801.71 -> sex = 2 Variable | Obs Mean Std Dev Min Max -+ - rlpcex1 | 1624 3748.368 3231.241 376.9805 30624.77 8 Dïng thanh c«ng cô menu bar Danh s¸ch biÕn (varlist) ChØ ra danh s¸ch c¸c biÕn chÞu t¸c ®éng cña c©u lÖnh NÕu nh− kh«ng cã biÕn nµo ®−îc chØ ra th× lÖnh Stata sÏ cã t¸c dông lªn tÊt c¶ c¸c biÕn (all variables) VÝ dô: sum hhsize sex reg7 Variable | Obs Mean Std Dev Min Max -+ - hhsize | 5999 4.752292 1.954292 1 19 sex | 5999 1.270712 4443645 1 2 reg7 | 5999 4.01917 2.145305 1 7 sum Variable | Obs Mean Std Dev Min Max -+ - househol | 5999 19617.86 11201.92 101 38820 year | 5999 97.94666 2247337 97 98 month | 5999 6.340723 3.011082 1 12 9 LÖnh sum nµy hiÓn thÞ thèng kª c¬ b¶n cña tÊt c¶ c¸c biÕn trong tÖp sè liÖu §iÒu kiÖn (if exp) Stata chØ thùc hiÖn c©u lÖnh ®èi víi c¸c quan s¸t mµ gi¸ trÞ cña nã cho kÕt qu¶ cña biÓu thøc lµ ®óng VÝ dô: sum poor if reg7==1 Variable | Obs Mean Std Dev Min Max -+ - poor | 859 4982538 5002882 0 1 LÖnh nµy chØ cã t¸c dông ®èi víi c¸c quan s¸t mµ biÕn reg7 cã gi¸ trÞ b»ng 1 Ph¹m vi (in range) ChØ ra ph¹m vi c¸c quan s¸t chÞu t¸c ®éng cña c©u lÖnh Range (ph¹m vi) cã thÓ cã c¸c d¹ng sau: sum poor in 10 TÝnh gi¸ trÞ trung b×nh cña biÕn poor cho quan s¸t 10 (chÝnh b»ng gi¸ trÞ cña biÕn poor t¹i quan s¸t thø 10) sum poor in 10/100 TÝnh gi¸ trÞ trung b×nh cña biÕn poor cho quan s¸t tõ 10 ®Õn 100 sum poor in f/100 TÝnh gi¸ trÞ trung b×nh cña biÕn poor cho quan s¸t tõ ®Çu tiªn ®Õn 100 sum poor in 100/l TÝnh gi¸ trÞ trung b×nh cña biÕn poor cho quan s¸t tõ thø 100 ®Õn quan s¸t cuèi cïng QuyÒn sè (weight) Cho phÐp tÝnh to¸n sñ dông quyÒn sè Tuú chän vÒ quyÒn sè sÏ ®−îc tr×nh bµy kü ë môc 5 cña ch−¬ng nµy C¸c tuú chän (Options) NhiÒu c©u lÖnh Stata cho phÐp c¸c tuú chän riªng C¸c tuú chän nµy ®−îc chØ ra sau dÊu phÈy VÝ dô: LÖnh sum cã tuú chän lµ detail, cho phÐp tÝnh to¸n thªm mét sè thèng kª kh¸c ngoµi gi¸ trÞ trung b×nh vµ ®é lÖnh chuÈn sum rlpcex1, detail comp.M&Reg price adj.pc tot exp - Percentiles Smallest 1% 682.9575 357.318 5% 1012.433 366.2792 10% 1238.088 376.9805 Obs 5999 25% 1671.054 381.3502 Sum of Wgt 5999 50% 2397.042 Mean 3188.667 Std Dev 2692.567 75% 3711.917 Largest 26944.64 Variance 7249918 90% 5940.803 30624.77 10

Ngày đăng: 26/03/2024, 08:08

Xem thêm:

w