Một trong những lý do sử dụng phương pháp Pooled OLS là vì phương pháp này làm tăng kích cỡ mẫu so với phương pháp OLS thông thường. Bằng việc sử dụng dữ liệu dạng bảng những quan sát khác nhau của từng công ty sẽ được đưa vào mô hình, do đó mô hình ước lượng sẽ đáng tin cậy hơn.
Sử dụng phương pháp Pooled OLS không giải quyết được vấn đề đưa thiếu biến vào mô hình. Thiếu biến là tình trạng những biến có ảnh hưởng lớn đến biến phụ thuộc nhưng lại không được đưa vào mô hình, do đó có thể dẫn đến mô hình ước lượng bị sai. Sử dụng biến giả là ngành có thể cho phép xem xét tác động những nhân tố đặc trưng của từng ngành tới quyết định nắm giữ tiền mặt (Ferreira và Vilela, 2004). Trong bài viết tác giả sử dụng 8 ngành đại diện cho các công ty niêm yết trên sàn HOSE và HNX (Phân ngành theo Global Industry Classification Standards – Chuẩn phân ngành toàn cầu) bao gồm: công nghệ (TECHNO), công nghiệp (INDUSTR), năng lượng (ENERGY), dịch vụ tiêu dùng (CONSSERV), y tế (HEALTH), hàng tiêu dùng (CONSGOODS), nguyên vật liệu (MATERIAL) và dịch vụ tiện ích (ULTILITIES). Biến giả là biến nhận giá trị 0 hoặc 1 để chỉ sự tồn tại hay không tồn tại của hiệu ứng ngành có tác động tới kết quả mô hình. Biến giả đại diện cho các công ty ngành công nghiệp sẽ nhận giá trị 1 nếu công ty thuộc ngành công nghiệp và 0 cho các ngành khác. Tương tự cho 6 ngành còn lại, nếu công ty thuộc ngành đó sẽ nhận giá trị 1 và 0 cho các ngành còn lại. Vì có tất cả 8 ngành nên tác giả sử dụng 7 biến giả đại diện cho ngành để tránh rơi vào bẫy biến giả. Trong bài tác giả không có biến giả cho ngành năng lượng, ngành năng lượng trở thành ngành so sánh của các ngành khác.
Phương trình hồi quy Pooled OLS với biến giả ngành được biểu thị như sau: 𝐶𝐴𝑆𝐻𝑖, 𝑡= 𝛽0 +𝛽1𝐶𝐹𝑖, 𝑡+ 𝛽2𝐿𝐼𝑄𝑖, 𝑡+ 𝛽3𝐿𝐸𝑉𝑖, 𝑡+ 𝛽4𝐺𝑅𝑇𝑖, 𝑡+ + 𝛽5𝑆𝐼𝑍𝐸𝑖, 𝑡+ + 𝛽6𝐼𝑁𝑉𝑖, 𝑡+ 𝛽7𝐷𝐼𝑉𝑖, 𝑡 +β8CONSGOODSi.t + β9CONSSERVi,t + β10HEALTHi,t+ + β11INDUSTRi,t + β12 ULTILITIESi,t + β13TECHNOi,t + β14MATERIAL i,t + εi,t
với: i=1,2,…,444; t=1,2,…,6
Trong đó: CASHi,t là tiền mặt nắm giữ của công ty i trong năm t, CFi,t là tỷ lệ dòng tiền trên tổng tài sản, LIQi,t là tỷ lệ tài sản thanh khoản không bao gồm tiền trên tổng tài sản, LEVi,t là tỷ lệ tổng nợ trên tổng tài sản, GRTi,t là tốc độ tăng trưởng doanh thu, SIZEi,t là logarith tự nhiên của tổng tài sản, INVi,t là tỷ lệ đầu tư vào tài sản cố định trên tổng tài sản, DIVi,t là tỷ lệ chi trả cổ tức, CONSGOODSi,t là biến giả đại diện cho ngành hàng tiêu dùng nhận giá trị 1 nếu công ty thuộc ngành hàng tiêu dùng và nhận giá trị 0 nếu thuộc các ngành khác, CONSSERVi,t là biến giả đại diện cho ngành dịch vụ tiêu dùng nhận giá trị 1 nếu công ty thuộc ngành dịch vụ tiêu dùng và nhận giá trị 0 nếu thuộc các ngành khác, HEALTHi,t là biến giả đại diện cho ngành y tế nhận giá trị 1 nếu công ty thuộc ngành y tế và nhận giá trị 0 nếu thuộc các ngành khác, INDUSTRi,t là biến giả đại diện cho ngành công nghiệp nhận giá trị 1 nếu công ty thuộc ngành công nghiệp
và nhận giá trị 0 nếu thuộc các ngành khác, ULTILITIESi,t là biến giả đại diện cho ngành
dịch vụ tiện ích nhận giá trị 1 nếu công ty thuộc ngành dịch vụ hạ tầng và nhận giá trị 0 nếu thuộc các ngành khác, TECHNOi,t là biến giả đại diện cho ngành công nghệ nhận giá trị 1 nếu công ty thuộc ngành công nghệ và nhận giá trị 0 nếu thuộc các ngành khác, MATERIALi,t là biến giả đại diện cho ngành nguyên vật liệu nhận giá trị 1 nếu công ty thuộc ngành công nghệ và nhận giá trị 0 nếu thuộc các ngành khác βi,t là các hệ số ược lượng, ɛi,t là các sai số mô hình.