CHƯƠNG 3 : PHƯƠNG PHÁP NGHIÊN CỨU VÀ THU THẬP DỮ LIỆU
3.1. Phương pháp thu thập dữ liệu
Dữ liệu phục vụ việc nghiên cứu của Luận văn bao gồm: số liệu về các công ty thực hiện phát hành lần đầu ra cơng chúng bằng hình thức đấu giá (mã chứng khoán, ngày đấu giá, giá chào bán, tổng số lượng cổ phần đưa ra đấu giá, tổng số cổ phần được các nhà đầu tư yêu cầu) số liệu về các công ty niêm yết trên thị trường chứng khoán Việt Nam (hiện nay có 3 sàn là: HOSE, HNX và UPCOM), số liệu thể hiện hiệu quả hoạt động của công ty (tổng tài sản của công ty vào năm cuối cùng trước khi IPO, thời gian hoạt động của công ty từ lúc thành lập đến khi thực hiện IPO), các chỉ số về thị trường (giá đóng cửa của các mã chứng khoán, tỉ suất sinh lợi của thị trường). Các số liệu nêu trên được thu thập từ năm 2015 đến năm 2020. Các doanh nghiệp nằm trong phạm vi nghiên cứu là các doanh nghiệp niêm yết trên thị trường chứng khoán Việt Nam.
Các chỉ số cơ bản của các doanh nghiệp là số liệu thứ cấp, thể hiện trong báo cáo tài chính của các doanh nghiệp niêm yết. Tác giả có sử dụng hệ thống FiinPro Platform của Stoxplus để thu thập số liệu, tuy nhiên các số liệu cung cấp bởi Stock Plus từ năm 2015 đến năm 2020, do đó tác giả đã thu thập những số liệu cịn thiếu qua bản cáo bạch, báo cáo tài chính của doanh nghiệp và các chuyên trang tài chính như Cafef, Vietstock finance và Cophieu68. Việc thực hiện thu thập qua Stoxplus giúp giảm thời gian thực hiện, đồng thời đảm bảo độ chính xác cao so với thu thập theo phương pháp thủ công.
Với các số liệu của các công ty thực hiện đấu giá và niêm yết trên thị trường, tác giả sử dụng số liệu được tổng hợp trên hệ thống FiinPro và dữ liệu được công bố trên website của các sàn chứng khốn.
Với các số liệu về giá đóng cửa của ngày giao dịch, tỉ suất sinh lợi của thị trường không được tổng hợp trên hệ thống của Fiinpro. Tác giả đã tự tổng hợp dựa theo lịch sử giá của từng mã chứng khoán và thống kê chỉ số thị trường được công bố trên các chuyên trang tài chính kể trên (Cafef, Vietstock finance và Cophieu68).
Những số liệu còn lại được tác giả thực hiện tính tốn dựa trên các số liệu đã thu thập được, tác giả sử dụng các hàm trên Excel để đảm bảo độ chính xác, giảm khối lượng cơng viêc và dễ kiểm soát.
Sau khi thu thập dữ liệu, tác giả tiến hành chọn lọc để tìm ra những doanh nghiệp thỏa mãn các điều kiện sau sẽ được đưa vào bộ dữ liệu nghiên cứu: Doanh nghiệp có thời gian đấu giá thực hiện trước thời gian niêm yết, số liệu được tổng hợp từ báo cáo tài chính đã được kiểm tốn, phát hành vào cuối năm tài chính và các doanh nghiệp phải có đầy đủ dữ liệu cần thiết. Sau đó tác giả thực hiện đối chiếu danh sách niêm yết và danh sách đấu giá đã và có đầy đủ số liệu đáp ứng yêu cầu của nghiên cứu để tìm ra những doanh nghiệp định giá thấp IPO.
Quy trình xử lý số liệu của tác giả như sau:
-Lần 1: Lọc dữ liệu và lấy những công ty giá chào bán trong đợt chào bán cổ phiếu lần đầu ra cơng chúng thấp hơn giá đóng cửa của ngày giao dịch đầu tiên, có thời gian niêm yết thực hiện sau thời gian đấu giá. Loại bỏ những cuộc đấu giá không phải là lần đầu phát hành cổ phiếu ra công chúng.
- Lần 2: Loại bỏ những cổ phiếu có tỷ suất sinh lời mang giá trị âm hoặc bằng khơng. Chỉ lấy những cổ phiếu có tỷ suất sinh lời dương.
- Lần 3: Lọc dữ liệu theo tiêu chí: số liệu được tổng hợp từ báo cáo tài chính đã được kiểm tốn, phát hành vào cuối năm tài chính và các doanh nghiệp phải có đầy đủ dữ liệu cần thiết. Các dữ liệu của các biến độc lập được tác giả sử dụng đó là: năm thành lập của cơng ty (Tác giả chia thành 2 loại: doanh nghiệp thành lập không do hợp nhất hoặc chuyển đổi, mốc thời gian thành lập công ty là mốc thời gian doanh nghiệp bắt đầu hoạt động; đối với doanh nghiệp thành lập do hợp nhất hoặc chuyển đổi, mốc thời gian dựa trên thời điểm doanh nghiệp bắt đầu hoạt động sau hợp nhất/chuyển đổi trong thời kì đổi mới), số lượng cổ phiếu phát hành trong đợt IPO của doanh nghiệp, số lượng cổ phiếu của doanh nghiệp mà nhà đầu tư đặt mua (để thực hiện tính tốn tỷ lệ mua vượt mức), thời gian đấu giá và thời gian niêm yết của doanh nghiệp để thực hiện tính tồn độ trễ niêm yết, tổng tài sản vào năm cuối trước năm doanh nghiệp thực hiện IPO để đại diện cho quy mô của
công ty, giá chào bán cổ phiếu trong đợt IPO và các giá trị thị trường của cổ phiếu. Qua lần lọc này, tác giả thu được bộ dữ liệu được sử dụng trong bài nghiên cứu.
Như vậy, sau khi tiến hành lựa chọn, loại bỏ các quan sát dị biệt để tránh những sai sót và khuyết tật cho mơ hình hồi quy, tác giả chọn ra được 207 doanh nghiệp phù hợp được niêm yết trên thị trường chứng khoán Việt Nam, thu thập các dữ liệu đã nêu trên để phục vụ quá trình nghiên cứu.