Lí do chọn đề tài: Với môi trường kinh doanh và các chính sách khuyến khích các loại hình doanh nghiệp phát triển bình đẳng của Nhà nước ngày càng thông thoáng, đã giúp cho khu vực DN n
Trang 1TRƯỜNG ĐẠI HỌC KINH TẾ TP HỒ CHÍ MINH
KHOA TOÁN – THỐNG KÊ
TRÊN ĐỊA BÀN THÀNH PHỐ HỒ CHÍ MINH
LỚP: Cao học Thống kê – Kinh tế K29.2 GVHD: Ths Nguyễn Thảo Nguyên Nhóm học viên thực hiện: Nhóm 3 1 Huỳnh Ngọc Bích Liên 2 Nguyễn Thị Kim Trang 3 Võ Thị Anh Thư 4 Lưu Thị Thu Huyền
5 Nguyễn Văn Minh Đồng Nai, ngày 17 tháng 10 năm 2021
Trang 2MỤC LỤC DANH MỤC TỪ VIẾT TẮT
DANH MỤC BẢNG DANH MỤC HÌNH-BIỂU ĐỒ
CHƯƠNG 1 GIỚI THIỆU 1
1.1 Lí do chọn đề tài: 1
1.2 Mục đích nghiên cứu: 2
1.3 Đối tượng nghiên cứu: 2
1.4 Phạm vi nghiên cứu: 2
1.5 Phương pháp nghiên cứu: 2
1.6 Giới thiệu phần mềm Clementine 12.0 2
CHƯƠNG 2 CƠ SỞ LÝ THUYẾT VÀ MÔ HÌNH 5
Trang 32.5.1 Cơ sở xây dựng mô hình các nhân tố ảnh hưởng đến doanh thu hoạt động
kinh doanh 13
2.5.2 Giả thuyết về mối tương quan giữa kế quả doanh thu hoạt động kinh doanh và các nhân tố ảnh hưởng 13
CHƯƠNG 3: KẾT QUẢ MÔ HÌNH NGHIÊN CỨU 14
3.1 Kết quả chạy hồi quy 14
3.2 Kết quả chạy cây quyết định (CHAID) 15
CHƯƠNG 4: KẾT LUẬN 18
4.1 Kết luận mô hình hồi quy 18
4.2 Kết luận mô hình cây quyết định: 18
4.3 So sánh kết quả 2 mô hình hồi quy và cây quyết định: 18
4.4 Những kết quả đạt được và hạn chế của đề tài 19
4.4.1 Kết quả đạt được: 19
4.4.2 Hạn chế: 19
4.4.3 Hướng nghiên cứu và phát triển sau khi hoàn thành đề tài 20
TÀI LIỆU THAM KHẢO 21
Trang 4DNCN Doanh nghiệp ngành công nghiệp
CNCBCT Công nghiệp chế biến chế tạo
TPHCM Thành phố Hồ Chí Minh
SXKD Sản xuất kinh doanh
Trang 5DANH MỤC BẢNG
Bảng 2.1 Giá trị đóng góp của các doanh nghiệp tính theo giá hiện hành
qua 2 kỳ Tổng điều tra (2012 - 2017)
Trang 6DANH MỤC HÌNH-BIỂU ĐỒ
Hình 3.1 Sự quan trọng của biến ở phương pháp CHAID Hình 3.2 Kết quả từ mô hình cây quyết định Chaid
Trang 7CHƯƠNG 1 GIỚI THIỆU
1.1 Lí do chọn đề tài:
Với môi trường kinh doanh và các chính sách khuyến khích các loại hình doanh nghiệp phát triển bình đẳng của Nhà nước ngày càng thông thoáng, đã giúp cho khu vực DN nói chung và DN trong nước nói riêng đang ngày càng phát triển mạnh mẽ, đặc biệt là các DN ngoài nhà nước trong những năm gần đây đã có bước phát triển vượt bậc, đóng góp quan trọng vào việc thu hút lao động, giải quyết việc làm và tăng trưởng kinh tế của cả nước và các địa phương
Để tồn tại và phát triển, DN luôn cần phải nâng cao hiệu quả hoạt động sản xuất kinh doanh của mình Hiệu quả hoạt động kinh doanh là mối quan hệ so sánh giữa kết quả đạt được trong quá trình sản xuất kinh doanh với chi phí bỏ ra để đạt được kết quả đó Các đại lượng này chịu tác động bởi rất nhiều các nhân tố khác nhau với các mức độ khác nhau, do đó có ảnh hưởng tới hiệu quả hoạt động kinh doanh của doanh nghiệp
Ngành sản xuất chế biến chế tạo là ngành công nghiệp mà Việt Nam đang có nhiều lợi thế và tiềm năng phát triển Tuy nhiên, sự phát triển của ngành này đang chịu ảnh hưởng rất nhiều bởi các yêu cầu về an toàn chế tạo, về chất lượng và sức ép cạnh tranh với các nước trên thế giới
Xuất phát từ tầm quan trọng và sự cần thiết phải tìm hiểu các nhân tố ảnh hưởng đến hiệu quả hoạt động sản xuất kinh doanh nhằm giúp cho các công ty ngành sản xuất chế biến chế tạo nâng cao năng lực cạnh tranh, nhóm đã lựa chọn
đề tài “Ứng dụng kỹ thuật hồi quy và cây quyết định để xem xét các yếu tố ảnh hưởng đến doanh thu của các doanh nghiệp ngành công nghiệp trên địa bàn TP.Hồ Chí Minh” làm hướng nghiên cứu của mình
Trang 81.2 Mục đích nghiên cứu:
Xác định nhân tố ảnh hưởng đến doanh thu của các đơn vị hoạt động ngành công nghiệp chế biến chế tạo, từ đó phân tích và đo lường mức độ ảnh hưởng của các nhân tố tác động đến doanh thu của các đơn vị hoạt động ngành công nghiệp chế biến chế tạo bằng phương pháp hồi quy và phương pháp cây quyết định
Kết hợp khai thác dữ liệu bằng phương pháp cây quyết định và phương pháp hồi qui để so sánh và đưa ra đánh giá, nhận xét mô hình phù hợp
1.3 Đối tượng nghiên cứu:
- Đối tượng nghiên cứu: các yếu tố ảnh hưởng đến doanh thu - Đối tượng khảo sát: các doanh nghiệp ngành sản xuất chế biến chế tạo trên địa bàn Thành phố Hồ Chí Minh
1.4 Phạm vi nghiên cứu:
Nghiên cứu các doanh nghiệp công nghiệp sản xuất chế biến chế tạo hoạt
động trên địa bàn TP.HCM 1.5 Phương pháp nghiên cứu:
Dữ liệu thu thập từ kết quả điều tra doanh nghiệp 2018 của 827 công ty ngành sản xuất chế biến chế tạo Cụ thể gồm các chỉ tiêu: doanh thu, vốn, lao động, loại hình, chi phí quản lý, chi phí bán hàng, DN đang hoạt động trong khu chế xuất công nghiệp hay ngoài khu chế xuất
Ứng dụng phần mềm Clementine 12.0 với kỹ thuật hồi quy và kỹ thuật cây quyết định để phân tích sự ảnh hưởng các nhân tố đến doanh thu hoạt động kinh doanh của doanh nghiệp ngành công nghiệp đồng thời căn cứ vào các kết quả của từng mô hình và đưa ra đánh giá, nhận xét mô hình phù hợp nhất
1.6 Giới thiệu phần mềm Clementine 12.0
Clementine là một phần mềm của SPSS inc, SPSS Clementine là một trong sản phẩm mô hình hóa quá trình khai phá dữ liệu, cho phép người dùng nhanh chóng phát triển các mô hình đã được dự đoán trước bằng cách sử dụng kinh nghiệm thực tế và triển khai chúng vào các lĩnh vực cụ thể được tốt hơn
Trang 9Clementine có 8 palette nodes nằm ở phía dưới cùng của cửa sổ chính Để thêm các node vào dòng dữ liệu, chỉ cần nhấn đúp vào biểu tượng hoặc kéo và thả chúng vào stream, sau đó liên kết chúng để tạo ra một dòng, gọi là dòng chảy của dữ liệu Mỗi palette nodes chứa một tập các nút liên quan, sử dụng cho các giai đoạn khác nhau của các hoạt động trong dòng chảy Cụ thể là:
• Favorites: Chỉnh sửa các nút được lựa chọn mặc định • Sources: Nhập dữ liệu vào Clementine
• Record Ops: Thực hiện các hoạt động trên các dữ liệu, chẳng hạn như lựa chọn, hợp nhất, thêm
• Field Ops: Thực hiện các hoạt động dựa trên các items của dữ liệu • Graphs: Các nút đồ họa hiển thị dữ liệu trước và sau khi thực hiện các bước khai thác dữ liệu
• Modeling: Mô hình hóa các thuật toán có sẵn trong Clementine như mạng thần kinh, cây quyết định, các thuật toán clustering; và sắp xếp lại dữ liệu
• Output: Xuất một loạt các dữ liệu, bảng biểu và kết quả mô hình dưới dạng bản báo cáo, SPSS,
• Export: Xuất dữ liệu đầu ra dưới dạng Excel, SPSS,
Clementine đã xử lý dữ liệu như thế nào?
Quy trình xử lý dữ liệu gồm các bước sau: - Nguồn dữ liệu: nguồn dữ liệu bao gồm tập dữ liệu với rất nhiều các định dạng giúp người sử dụng dễ dàng đưa dữ liệu của mình vào để xử lý như là: Excel, SPSS,
- Trích chọn dữ liệu: chọn nguồn dữ liệu phù hợp nhất với yêu cầu bài toán đặt ra Dữ liệu được chọn phải chứa những thông tin đầy đủ liên quan đến yêu cầu cần đặt ra, phải thỏa mãn các tiêu chí nhất định nào đó
- Tiền xử lý dữ liệu: là quá trình làm sạch dữ liệu (xử lý với dữ liệu không đầy đủ, dữ liệu nhiễu, dữ liệu không nhất quán, v.v.), rút gọn dữ liệu (sử dụng hàm nhóm và tính tổng, các phương pháp nén dữ liệu, sử dụng histograms, lấy mẫu, )
Trang 10rời rạc hóa dữ liệu (rời rạc hóa dựa vào histograms, dựa vào entropy, dựa vào phân khoảng, ) Sau bước này, dữ liệu sẽ nhất quán, đầy đủ, được rút gọn, và được rời rạc hóa
- Biến đổi dữ liệu: là quá trình chuẩn hóa và làm mịn dữ liệu để đưa dữ liệu về dạng ngắn gọn và đơn giản giúp giải quyết bài toán một cách nhanh nhất Có thể biến đổi thành các loại dữ liệu sau: Range (khoảng cách, hàng), Default (mặc định), Flag (dạng cờ), Set (tập hợp), Ordered Set, Typeless, Discrete
- Khai phá dữ liệu: đây được xem là bước quan trọng và tốn nhiều thời gian nhất của toàn quá trình Áp dụng các kỹ thuật phân tích để khai phá dữ liệu Trong quá trình này sử dụng các thuật toán phân hoạch, các thuật toán phân cụm phân cấp để khai phá dữ liệu: như thuật toán K-means, PAM, CLARA, BIRCH
- Đánh giá và biểu diễn tri thức: Đây là kết quả của toàn bộ quá trình Kết quả được thể hiện dưới các dạng khác nhau như bảng biểu (Excel, Table, Custom Table ), dạng cây (C&R Tree, C5.0.), hay dưới dạng đồ thị (Graphboard, Plot, Distribution, histogram, collection, multiplot, Web, Timelot, Evaluation) giúp đưa ra kết quả gần gũi với người sử dụng, có cái nhìn trực quan hơn đối với yêu cầu được đặt ra
Phần mềm Clementine là một phần mềm hữu ích trong việc thống kê dữ liệu và hỗ trợ trong khai phá dữ liệu Để tìm kiếm các thông tin, tri thức ở những kho dữ liệu lớn là một việc khó khăn đối với những nhà thống kê học, vì vậy việc khai phá dữ liệu để tìm kiếm thông tin, tri thức cần phải chính xác và nhanh chóng giúp cho công việc nghiên cứu trở nên dễ dàng hơn Có rất nhiều công cụ hỗ trợ trong lĩnh vự này, nhưng Clementine là một phần mềm điển hình giúp người dùng xây dựng các mô hình khai phá dữ liệu cho toàn bộ quá trình của bài toán mà nó khác với các phương pháp truyền thống
Trang 11CHƯƠNG 2 CƠ SỞ LÝ THUYẾT VÀ MÔ HÌNH
2.1 Cơ sở lý thuyết: 2.1.1 Một số khái niệm 2.1.1.1 Doanh thu:
- Doanh thu thuần hoạt động sản xuất, kinh doanh của DN là thu nhập của DN do tiêu thụ sản phẩm, hàng hóa, cung cấp các dịch vụ cho bên ngoài sau khi trừ các khoản thuế (thuế tiêu thụ đặc biệt, thuế xuất khẩu, thuế giá trị gia tăng theo phương pháp trực tiếp phải nộp) và trừ các khoản giảm trừ (chiết khấu, giảm giá hàng bán, hàng bán bị trả lại)
- Vai trò của doanh thu kinh doanh đối với các DN Là điều kiện hết sức quan trọng trong việc đảm bảo sự tồn tại và phát triển của doanh nghiệp
Là nhân tố thúc đẩy sự cạnh tranh và tiến bộ trong sản xuất kinh doanh Là điều kiện thực hiện mục tiêu bao trùm của DN là tối đa hóa lợi nhuận
- Nợ phải trả: là tổng các khoản nợ phát sinh mà DN phải trả, phải thanh toán cho các chủ nợ, bao gồm tiền nợ vay (vay ngắn hạn, vay dài hạn, vay trong nước, vay nước ngoài), các khoản nợ phải trả cho người bán, cho Nhà nước, các khoản phải trả cho công nhân viên (tiền lương, tiền phụ cấp…) và các khoản phải trả khác
- Theo lý thuyết Modigliani và Miller, lý thuyết cơ cấu vốn tối ưu và các nghiên cứu thực nghiệm trên thế giới như nghiên cứu của Zeitun và Tian (2007),
Trang 12Onaolapo và Kajola (2010), Fozia Memon (2012) có thể thấy được việc lựa chọn và sử dụng nguồn vốn như thế nào sẽ có tác động đến hiệu quả hoạt động SXKD
của doanh nghiệp 2.1.1.3 Lao động (LD)
- LD của DN là toàn bộ số lao động do DN quản lý, sử dụng và trả lương, trả công LD của DN không bao gồm:
+ Những người nhận vật liệu của DN về làm tại gia đình họ (lao động gia đình)
+ Những người đang trong thời gian học nghề của các trường, trung tâm gởi đến thực tập mà DN không quản lý và trả lương
+ Những lao động của các liên doanh gửi đến mà DN không quản lý và trả lương
- Với các doanh nghiệp tư nhân thì những người là thành viên trong gia đình có tham gia quản lý sản xuất hoặc trực tiếp sản xuất nhưng không nhận tiền lương, tiền công - thu nhập của họ là thu nhập hỗn hợp, bao gồm cả lãi kinh doanh cũng được tính là lao động của DN
2.1.1.4 Chi phí bán hàng (CPBH)
Chi phí bán hàng là khoản chi phí được sử dụng nhằm mục đích xây dựng quy trình bán hàng hoặc cung cấp dịch vụ của DN đến tay khách hàng… Chúng bao gồm các khoản chi phí cơ bản như: Cơ sở vật chất, lương, khấu hao và bảo hành Điều quan trọng là xác định chi phí bán hàng chính xác để đảm bảo định giá sản phẩm hoặc dịch vụ được thiết lập ở các cấp cung cấp tỷ suất lợi nhuận gộp phù hợp, đưa doanh nghiệp vào vị trí để tối đa hóa lợi nhuận bằng cách quản lý chi phí
trên cao 2.1.1.5 Chi phí quản lý
Một doanh nghiệp vận hành hiệu quả và phát triển tốt đến từ rất nhiều yếu tố, trong đó không thể thiếu công việc quản lý chi phí của doanh nghiệp Chi phí quản lý doanh nghiệp là tổng hợp các chi phí mà doanh nghiệp cần quản lý và chi trả để
Trang 13đảm bảo hoạt động thường xuyên của doanh nghiệp Đây là công việc mang tính trọng yếu của doanh nghiệp bởi nó đảm bảo tính vận hành trong hệ thống chi phí của doanh nghiệp Vậy nên rất nhiều các nhà quản trị đều sẽ quan tâm đến việc làm thế nào để quản lý tốt, cắt giảm chi phí để tối ưu hóa vận hành
2.2 Tổng quan về ngành CNCBCT TP.HCM
Ngành công nghiệp chế biến, chế tạo đóng vai trò đặc biệt quan trọng, là động lực dẫn dắt nền kinh tế tăng trưởng, thay thế cho ngành nông nghiệp đang ngày càng giảm tỷ trọng trong tổng sản phẩm trong nước, giúp nền kinh tế tránh khỏi nguy cơ tụt hậu và tham gia vào chuỗi giá trị toàn cầu Mặc dù điều kiện phát triển trong từng thời kỳ khác nhau nhưng nhìn chung, ngành công nghiệp chế biến, chế tạo của Việt Nam nói chung và TP.HCM nói riêng đã có sự phát triển tích cực, đạt được nhiều thành tựu đáng ghi nhận và thể hiện vai trò quan trọng tạo nền tảng phát triển kinh tế Hệ thống cơ sở vật chất của ngành công nghiệp chế biến, chế tạo với quy mô lớn, phong phú về chủng loại, đa dạng về cơ cấu đã được hình thành, đáp ứng được nhu cầu của nền kinh tế quốc dân Tỷ trọng giá trị tăng thêm của công nghiệp chế biến, chế tạo ngày càng tăng trong GDP của toàn bộ nền kinh tế; sản phẩm chế biến, chế tạo đã có mặt tại nhiều quốc gia trên thế giới; năng lực của doanh nghiệp chế biến, chế tạo không ngừng nâng cao Trong một số ngành, trình độ của công nghiệp chế biến, chế tạo đã dần tiệm cận với tiến bộ khoa học – công nghệ trên thế giới, đáp ứng được nhu cầu của thị trường nội địa và xuất khẩu sang thị trường nhiều nước có yêu cầu chất lượng sản phẩm nghiêm ngặt
Giai đoạn từ năm 2011 đến năm 2016, mặc dù tình hình kinh tế và chính trị xã hội thế giới luôn trong tình trạng bất ổn, kinh tế tăng trưởng chậm, khủng hoảng tài chính và suy thoái kinh tế của các nền kinh tế lớn như: Mỹ, EU, Nhật Bản, Braxin,… tình hình chính trị bất ổn xảy ra nhiều hơn tại các khu vực Trung Đông, Bắc Phi và Biển Đông Trong bối cảnh bất lợi của thế giới, tất yếu tác động trực tiếp đến kinh tế - xã hội nước ta, vì vậy những năm gần đây có tốc độ tăng trưởng chậm lại so với giai đoạn trước, trong đó kinh tế TPHCM cũng phần nào bị ảnh
Trang 14hưởng Tuy nhiên, xét trên bình diện chung, thì trong giai đoạn 2011 - 2016, tốc độ tăng trưởng của Thành phố vẫn giữ được nhịp độ tăng khá, với mức tăng bình quân 13,6% của thời kỳ 2011-2016 cao hơn mức bình quân chung của cả nước
Bảng 2.1 GIÁ TRỊ ĐÓNG GÓP CỦA CÁC DOANH NGHIỆP TÍNH THEO GIÁ HIỆN HÀNH QUA 2 KỲ TỔNG ĐIỀU TRA (2012 - 2017)
Tổng sản phẩm trên địa bàn
(tỷ đồng)
Cơ cấu giá trị tổng sản phẩm trên địa bàn (%)
Tỷ lệ bình quân giai đoạn 2011-
2016 (%)
Năm 2011 Năm 2016 Năm
2011 Năm 2016
Trong đó chia theo khối doanh
Phân theo khu vực kinh tế
2.1 Khu vực Nông, lâm nghiệp và
2.2 Khu vực công nghiệp - Xây
2.3 Khu vực Dịch vụ 251.365 644.352 49,03 66,40 120,7
Theo báo cáo kết quả 2 kỳ tổng điều tra
Như vậy, tình hình chính trị - xã hội trên địa bàn Thành phố tiếp tục ổn định, phúc lợi xã hội có những mặt được nâng lên, đời sống người dân tiếp tục được cải thiện, tất cả những thành tựu có phần đóng góp không nhỏ từ sự tăng trưởng sản xuất của khu vực doanh nghiệp nói chung và khu vực doanh nghiệp trong nước nói riêng
2.3 Mô hình nghiên cứu: 2.3.1 Hồi quy
Đây là một phương pháp thống kê mà giá trị kỳ vọng của một hay nhiều biến ngẫu nhiên được dự đoán dựa vào điều kiện của các biến ngẫu nhiên (đã tính toán) khác Cụ thể, có hồi qui tuyến tính, hồi qui lôgic, hồi qui Poisson và học có giám sát
Phân tích hồi qui không chỉ là trùng khớp đường cong (lựa chọn một đường cong mà vừa khớp nhất với một tập điểm dữ liệu); nó còn phải trùng khớp với một