1. Trang chủ
  2. » Luận Văn - Báo Cáo

Hướng dẫn sử dụng stata

49 33 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Nội dung

#1 Giao diện Stata số hướng dẫncơ Đây file Excel xử lý trước đưa vào Stata chạy hồi quy Mình có sheet “Raw Data” để lưu data gốc (GVHD cho) biến cần Sau Filter tiêu chí cần thiết (vd: Tài sản > 0, Lợi nhuận > 0, Nợ/Vốn > 0, thuộc ngành sản xuất (do đề tài doanh nghiệp sản xuất), …) Thực tính tốn biến VD tính ratio Tiền/Tổng tài sản Sau tạo sheet mới, lưu trữ data biến thực đưa vào Stata Có sheet Note lại làm gì, lỡ có làm sai (vd: collect thiếu data, lọc data sai, tính tốn biến sai, thêm biến…) nên bắt đầu lại từ sheet Khu vực command lần gõ câu lệnh thực câu lệnh xong tới câu lệnh khác Trong hướng dẫn mn chủ yếu xài do-file Gõ hết lệnh chạy hết lần (chủ yếu code xong xi hết, bạn sau lỡ có chạy lại nhanh Các bạn nên tạo folder, lưu giữ tất file liên quan đến việc xử lý liệu, chạy hồi quy, xuất kết Stata Mình tạo folder KLTN, đường dẫn máy H:\KLTN (máy tính người thường ổ D:\, ngựa ngựa nên ổ H:\, ko cần để ý nha )))) Trong folder có file Excel ban show bạn file Excel Data_Import copy sheet cần import vơ stata thành file riêng cho nhẹ Import Data từ Excel vô Stata: File => Import => Excel spreadsheet Bấm Browse… để chọn file cần import Nhớ tick vô Import first row as variable names (để đặt tên biến nhanh luôn) Kiểm tra lại Preview xem có ý chưa Mọi quyền thuộc https://www.facebook.com/minun2020bc Bấm vô Xem data sử dụng (hướng dẫn trang 3) Save data folder KLTN Chúng ta download thêm package/library bên ngồi, nói nơm na phần mềm stata ko đủ câu lệnh thỏa mãn nhu cầu, phải xài thêm bên ssc install xttest3 Thêm nha Làm theo hướng dẫn https://phantichstata.com/cach-cai-dat-lenh-xtserial-dekiem-tra-tuong-quan-chuoi-serial-correlation.html để download thêm xtserial #4 Tips xử lý p-value không ý nghĩa Khi bạn nghiên cứu mối quan hệ hai biến Y – X mức ý nghĩa biến X yếu tố quan trọng định GVHD có chấp nhận đề tài & kết bạn hay khơng Các biến X kiểm sốt có ý nghĩa mà biến X khơng có ý nghĩa khơng ))) Nên gần bạn phải đổi đề tài, đổi phương pháp tiếp cận để “ép” cho ý nghĩa ))))  Nghe phản nghiên cứu (vì thật ), bạn “bị ép” vơ phải làm cho KLTN để trường, bạn khơng phải nhà nghiên cứu khoa học chân (nếu bạn giỏi, muốn đề tài thật độc lạ để trường xin lỗi nói câu Vì thực tế chứng minh có nhiều anh chị khóa trước trường với đề tài độc đáo, lập luận giỏi, kết đẹp, vinh danh (nhưng bạn “người bình thường” đau khổ để trường tập trung vào sản phẩm nhé, đừng mơ mộng) Khi mơ hình bạn khơng cho p-value ý nghĩa, phương pháp thơng thường: • Đổi phương pháp đo lường biến X Đơi data vùng nghiên cứu khác nhau, sử dụng chung công thức đo lường ko cho kết giống VD: biến X bạn đo lường khoản doanh nghiệp tính = Cash/Total Assets, bạn thay Cash/Total Equity, Cash/(Total Assets – Nợ ngắn hạn), ln(Cash/Total Assets),… Tất nhiên việc thay đổi cách đo lường biến X phải support nghiên cứu sử dụng cách tính cho việc đại diện tính khoản doanh nghiệp => Nếu khơng GVHD bác bỏ • Lọc lại liệu theo tiêu chí khác VD: bạn xài data HOSE + HNX, thay lại data HOSE HNX thôi, lọc cơng ty HOSE + HNX theo tiêu chí abc xyz (thuộc ngành sản xuất + chăn nuôi, có tổng tài sản >= 50 tỷ, khu vực địa lý miền Nam, cty có liệu thu thập >= năm…) Các sub-sample thường cho kết khác (nhưng hên xui )) Đương nhiên phải giải thích lý chia sub-sample vậy, again, cần nghiên cứu khác support • Winsor biến (hướng dẫn trang sau) • Đổi mơ hình hồi quy Thơng thường nên thử mơ hình OLS, FEM, REM Nếu OLS có kết đẹp FEM, REM thêm vào để tăng độ tin cậy (nếu FEM, REM đẹp) & làm đủ số trang KLTN Nếu OLS ko đẹp mà đẹp xài FEM, REM Nếu ko đẹp cân nhắc xài thêm FGLS (hướng dẫn trang sau) Các mơ logit, probit, GMM,… hem biết, nên hem Gần tất thứ viết bạn cần support nghiên cứu (nghiên cứu ko phải báo cải), khơng GVHD bác bỏ => đọc nhiều nghiên cứu vào, phải hiểu làm bảo vệ đề tài trước câu hỏi GVHD Lưu ý sub-sample, sample bạn lọc mà khơng có tối thiểu 1000 quan sát (observations) đừng mong GVHD accept trường))) (trích GVHD) Mình chạy lại OLS để demo cho bạn cách dùng winsor2 Nhớ download trước: ssc install winsor2 VD biến capex có liệu (-100000, 1, 3, 7, , 11, 22, 25, 50, 34134748) Các bạn thấy (1, 3, 7, , 11, 22, 25, 50) có giá trị gần (nếu vẽ đồ thị đường thẳng ok), dưng có số thấy gớm -100000, 34134748 Hai số gọi outliers, thường mà kết chạy khơng xác Hiểu nơm na số “hy hữu” cần trend/pattern “bình thường” Winsor2 giúp “làm mượt” số này, thành giá trị gần gần với dãy số (1, 3, 7, , 11, 22, 25, 50) Cịn làm không cần hiểu đâu… (Cái cần hiểu bạn nghiên cứu mối quan hệ gì, biến x ảnh hưởng biến y sao, có nghiên cứu support, có nghiên cứu kìa…) Bạn winsor2 p-value xấu thơi Chứ đẹp đừng winsor2 làm cho rách việc ))) Nhớ gõ tên biến capex_w Kết bạn thấy, (may mắn thay) p-value capex_w có ý nghĩa 1% Khơng phải lúc hên với winsor2 đâu nha Đừng cố chấp, thử tới cut(5 95) mà ko bng xi )) Các bạn khơng thiết winsor2 biến Có thể phối hợp winsor2 2, biến, nguyên tắc biến kết ))) hy vọng mn tìm tổ hợp winsor2 cho p-value ưng ý (nói đừng lạm dụng, GVHD hỏi em winsor2 nhiều thế) FGLS thường cho kết đẹp, có điều kiện hạn chế so với OLS Kết chạy FGLS đây, đẹp (do OLS đẹp rồi, nên FGLS đẹp, khó thấy khác biệt) Nên bạn OLS chưa đẹp, thử FGLS xem có khác biệt khơng Để xuất kết word bạn cần chạy outreg2 sau chạy xtgls Khi tắt Stata có thơng báo hỏi muốn lưu data lại hong Do tạo biến firms với biến capex_w Nếu Save sau mở lại do-file ko cần chạy encode, winsor2 Còn hong save sau phải chạy lại lệnh Nhưng muốn save bạn phải chắn biết làm Trong ví dụ biến trên, thực tế bạn dùng lệnh xóa biến xóa số quan sát, nên lỡ save nghỉ undo lun ))) #5 Appendix Mình khuyến khích bạn thực hành data bạn ln Nhưng lỡ bạn chưa có data, sợ file (sợ copy paste lưu trữ nhiều nơi nhé) cho bạn Example_Data.xlsx Example_Do_file.pdf Các bạn download (làm ơn đừng bấm request xin edit nhé) tập thực hành câu lệnh stata cho quen Example_Data.xlsx: https://docs.google.com/spreadsheets/d/18ctvK1bwb4QKnXlyzJhrrCCjqzrEkIfu/edit?usp=sharing& ouid=109129132729917744182&rtpof=true&sd=true Example_Do_file.pdf: https://drive.google.com/file/d/14cxUT8vqlkfWpKAXcs46cPsdGOCTp2WD/view?usp=sharing Tổng hợp số câu lệnh Stata bạn bè làm (ghi tiếng Anh với ghi tắt nên khó hiểu) Nhìn chung bạn khơng có nhu cầu đặc biệt nghĩ hướng dẫn cover gần hết Nếu bí cần mở file Tổng hợp xem them (nhưng báo trước coi nhiều khơng hiểu đâu nha )) https://drive.google.com/file/d/1io28yj6XCBkFQ6cK-pSnnfvBHdi2WcHG/view?usp=sharing Nhìn chung bạn không nên tốn nhiều thời gian cho việc xử lý liệu & chạy Stata Thời gian chạy Stata nên chiếm 20% q trình thơi, 80% cịn lại tập trung vào viết KLTN cho chặt chẽ, đầy đủ phần, quan trọng đủ số trang, minimum 60 trang, không đủ 60 trang đừng hỏi điểm thấp ko trường )))) Nếu người thấy hướng dẫn có ích, hy vọng mn share cho bạn bè gặp khó khăn Tích đức để qua môn chưa lỗi thời ))) chuyện tâm linh không đùa đâu )) Cuối chúc người chạy liệu lần đầu kết đẹp ý é, GVHD chấp nhận hết idea & kết quả, viết thuận lợi, không bị stress Good luck

Ngày đăng: 12/12/2023, 20:08

TỪ KHÓA LIÊN QUAN

w