Hồi quy dữ liệu và ứng dụng tính điểm rủi ro của doanh nghiệp phục vụ thanh tra thuếHồi quy dữ liệu và ứng dụng tính điểm rủi ro của doanh nghiệp phục vụ thanh tra thuếHồi quy dữ liệu và ứng dụng tính điểm rủi ro của doanh nghiệp phục vụ thanh tra thuếHồi quy dữ liệu và ứng dụng tính điểm rủi ro của doanh nghiệp phục vụ thanh tra thuếHồi quy dữ liệu và ứng dụng tính điểm rủi ro của doanh nghiệp phục vụ thanh tra thuếHồi quy dữ liệu và ứng dụng tính điểm rủi ro của doanh nghiệp phục vụ thanh tra thuếHồi quy dữ liệu và ứng dụng tính điểm rủi ro của doanh nghiệp phục vụ thanh tra thuếHồi quy dữ liệu và ứng dụng tính điểm rủi ro của doanh nghiệp phục vụ thanh tra thuếHồi quy dữ liệu và ứng dụng tính điểm rủi ro của doanh nghiệp phục vụ thanh tra thuếHồi quy dữ liệu và ứng dụng tính điểm rủi ro của doanh nghiệp phục vụ thanh tra thuế
1 MỞ ĐẦU Lý chọn đề tài Sự phát triển nhanh chóng ứng dụng cơng nghệ thơng tin Internet vào nhiều lĩnh vực khác đời sống xã hội năm gần tạo nhiều sở liệu (CSDL) khổng lồ Để khai thác hiệu nguồn thông tin CSDL khổng lồ nhằm mục đích dự báo, hỗ trợ định, bên cạnh phương pháp khai thác thông tin truyền thống, nhà nghiên cứu sử dụng cơng cụ máy tính điện tử để phát triển phương pháp, kỹ thuật hỗ trợ tiến trình khám phá, phân tích, tổng hợp thơng tin Lĩnh vực gọi khai phá liệu khám phá tri thức (Data Mining and Knowledge Discovery) Trong khai phá liệu, phân lớp hồi quy phương pháp quan trọng có ứng dụng rộng rãi, hiệu tốn phân tích liệu dự báo lĩnh vực kinh tế, tài Hồi quy liệu việc xác định hàm ánh xạ từ mẫu liệu vào biến dự đốn có giá trị thực Các phương pháp hồi quy chia thành nhóm chính: Hồi quy tương quan để xác định mối liên hệ nhiều biễn ngẫu nhiên với nhau; hồi quy tuyến tính đơn biến để xác định mối liên hệ biến độc lập vào biến phụ thuộc; hồi quy tuyến tính đa biến xác định mối liên hệ nhiều biến độc lập vào biến phụ thuộc… Hồi qui thường xếp vào loại tốn tối ưu nỗ lực để tìm kiếm giải pháp sai số phần dư tốt Trong lĩnh vực thuế, vấn đề gian lận trốn thuế diễn biến ngày trầm trọng phổ biến giới nói chung Việt Nam nói riêng Trên giới, phân tích rủi ro doanh nghiệp để phát gian lận lĩnh vực thuế chiến lược cải thiện nguồn thu ngân sách hầu hết phủ trên, đặc biệt nước phát triển Nhận thức vấn đề nghiêm trọng đó, quốc gia giới xây dựng phần mềm máy tính để phân tích rủi ro doanh nghiệp nộp thuế dựa kỹ thuật phân tích liệu nhằm phát doanh nghiệp gian lận, trốn thuế Tại Việt Nam, theo thống kê Bộ Tài cho biết năm 2013 thực tra, kiểm tra 64.119 doanh nghiệp (tăng 8% so với năm 2012) xử lý truy thu, phạt truy hoàn số tiền 13.657,08 tỷ đồng Năm 2014 thực tra, kiểm tra 67.053 doanh nghiệp với tổng số thuế tăng thu qua tra, kiểm tra 12.224,85 tỷ đồng [24] Nhiều vụ gian lận thuế phát thời gian gần Việt Nam cho thấy vấn đề gian lận thuế xảy với mức độ nghiêm trọng Để thực cơng tác phòng ngừa gian lận thuế, công tác tra, kiểm tra hoạt động này, Tổng cục Thuế xây dựng kho liệu tập trung tình hình thu, nộp thuế tra thuế doanh nghiệp Bài toán đặt từ số liệu kết thu nộp thuế, để dự báo doanh nghiệp có khả gian lận thuế để có biện pháp phòng ngừa, đặc biệt tổ chức biện pháp tra thuế nhằm truy thu thuế, đảm bảo chống thất thu ngân sách Do đó, việc xây dựng phần mềm máy tính nhằm tính điểm rủi ro doanh nghiệp dựa vào số liệu thu nộp thuế nhằm hỗ trợ công tác lập kế hoạch tra thuế yêu cầu cấp thiết Doanh nghiệp có điểm rủi ro cao khả gian lận thuế cao, cần đưa vào diện tiến hành tra 3 Từ ý nghĩa khoa học thực tiễn nêu trên, học viên chọn đề tài: “Hồi quy liệu ứng dụng tính điểm rủi ro doanh nghiệp phục vụ tra thuế” Tổng quan vấn đề nghiên cứu Các nước nghiên cứu, xây dựng ứng dụng để tính điểm rủi ro nhằm phục vụ hoạt động thanh, kiểm tra doanh nghiệp đặc biệt doanh nghiệp có mức độ rủi ro cao nhằm hạn chế tiến tới ngăn chặn hành vi chốn thế, gian lận thuế cá nhân, doanh nghiệp Tại Việt Nam, Tổng cục Thuế ban hành tiêu chí phân tích rủi ro thuế doanh nghiệp nhiên việc xây dựng ứng dụng tính điểm rủi ro nhiều tồn tại, tính khách quan độ xác chưa cao Trên sở đó, luận văn xác định số nội dung trọng tâm cần giải sau: - Tìm hiểu tốn tính điểm rủi ro doanh nghiệp dựa tiêu chí phân tích rủi ro - Tìm hiểu phương pháp hồi quy liệu, tập trung vào phương pháp hồi quy tuyến tính đơn biến, đa biến - Cài đặt chương trình thử nghiệm tính điểm rủi ro số doanh nghiệp Cục thuế Hà Nội Mục đích nghiên cứu - Nghiên cứu số phương pháp hồi quy liệu, tập trung vào phương pháp hồi quy tuyến tính - Cài đặt chương trình thử nghiệm đánh giá độ xác mơ hình hồi quy tuyến tính tốn tính điểm rủi ro cho số doanh nghiệp Cục thuế Hà Nội Đối tượng phạm vi nghiên cứu 4.1 Đối tượng nghiên cứu: Các phương pháp hồi quy 4.2 Phạm vi nghiên cứu: - Phương pháp hồi quy tuyến tính đơn biến, đa biến - Thử nghiệm với tốn tính điểm rủi ro cho doanh nghiệp phục vụ tra thuế Phương pháp nghiên cứu - Nghiên cứu lý thuyết: Sử dụng phương pháp phân tích, tổng hợp thơng tin để tổng kết kiến thức tảng, công bố khoa học ứng dụng phương pháp hồi quy liệu - Nghiên cứu thực nghiệm: Bao gồm nội dung: 1) Tìm hiểu tốn tính điểm rủi ro doanh nghiệp phục vụ cơng tác tra thuế 2) Cài đặt chương trình tính điểm rủi ro thử nghiệm chương trình liệu thử nghiệm số doanh nghiệp thuộc Cục thuế Hà Nội 3) Công cụ thực nghiệm: Sử dụng ngơn ngữ lập trình R Visual Studio Bố cục luận văn Luận văn có bố cục gồm: Phần mở đầu, chương chính, phần kết luận, tài liệu tham khảo phụ lục Được bố trí theo thứ tự: - Mở đầu - Chương 1: Phát biểu tốn tính điểm rủi ro doanh nghiệp phục vụ tra thuế - Chương 2: Một số phương pháp hồi quy tuyến tính - Chương 3: Xây dựng thử nghiệm chương trình tính điểm rủi ro doanh nghiệp phục vụ tra thuế - Kết luận - Tài liệu tham khảo - Phụ lục Chương 1- PHÁT BIỂU VỀ BÀI TỐN TÍNH ĐIỂM RỦI RO CỦA DOANH NGHIỆP PHỤC VỤ THANH TRA THUẾ 1.1 Bài tốn tính điểm rủi ro doanh nghiệp 1.1.1 Tổng quan tình hình nghiên cứu ngồi nước Gian lận thuế vấn nạn quốc gia gây thất thu ngân sách vô lớn ảnh hưởng nghiêm trọng tới phát triển kinh tế, xã hội quốc gia Xác định tình trạng gian lận thuế thơng qua điều tra nhóm nhỏ yếu tố tuân thủ nộp thuế liệu lợi nhuận xác định qua đơn vị thứ ba Nhóm tác giả Bruno Chiarini cộng xây dựng phần mềm phân tích gian lận thuế giá trị gia tăng (GTGT) thu nhập doanh nghiệp (TNDN) phương pháp phân tích chuỗi thời gian (time series analysis) [21] Nhóm tác giả Stefano Pisani cộng [21] xây dựng phần mềm phân tích rủi ro thuế dựa liệu thu nhập phát sinh qua thẻ tín dụng sử dụng phương pháp định CART Nhóm tác giả Shebo Nalishebo cộng [23] thực phân tích rủi ro thuế thơng qua khảo sát định lượng vấn nhóm người theo loại hình doanh nghiệp ngành nghề kinh doanh sử dụng phương pháp phân tích phương sai ANOVA mơ hình hồi quy tuyến tính đa biến Nhóm tác giả Francisco Roberto Pinto cộng [24] xây dựng cơng cụ phân tích rủi ro qua khảo sát doanh nghiệp dựa bốn giả thuyết: khác biệt doanh nghiệp; loại hình doanh nghiệp; khác biệt quan điểm kinh doanh; liệu kê khai nộp thuế sử dụng mơ hình hồi quy tuyến tính đa biến 6 1.1.2 Tổng quan tình hình nghiên cứu nước Tại Việt Nam, nghiên cứu ứng dụng phân tích liệu nhiều hạn chế Về nghiên cứu khoa học, phân tích liệu hình thành chuyên ngành nghiên cứu nhóm nghiên cứu phân tích liệu Việt Nam chưa nhiều Về triển khai ứng dụng, nhiều quan, tổ chức Việt Nam thể quan tâm lớn đến lĩnh vực phân tích liệu Sau thời gian dài xây dựng vận hành ứng dụng nghiệp vụ, nhiều quan, tổ chức Việt Nam lưu trữ khối lượng liệu khổng lồ mong muốn thực phân tích liệu Ví dụ, ngành thuế có nhu cầu phân tích hành vi tn thủ người nộp thuế, phân tích phát gian lận thuế nhằm khắc phục tình trạng thâm hụt thuế, chống thất thu ngân sách 1.1.3 Tính cấp thiết tốn tính điểm rủi ro doanh nghiệp Với điều kiện CSDL tập trung tình hình thu, nộp thuế, với tiến khoa học kỹ thuật, khoa học máy tính đặc biệt phát triển phương pháp phân tích liệu hồn tồn xây dựng hệ thống tính điểm rủi ro doanh nghiệp nhằm phục vụ mục đích thanh, kiểm tra thuế, phòng ngừa sai phạm hoạt động thuế doanh nghiệp Xuất phát từ nhu cầu thực tế trên, tốn tính điểm rủi ro doanh nghiệp phục vụ tra thuế dựa số liệu thống kê thu nộp thuế doanh nghiệp qua năm để dự báo khả gian lận thực nghĩa vụ thuế với Nhà nước thực cần thiết 7 1.2 Quy định pháp luật áp dụng quản lý rủi ro quản lý thuế 1.2.1 Khái quát quản lý rủi ro thuế Quản lý rủi ro thuế việc phân loại, đánh giá NNT dựa hệ thống tiêu thức rủi ro thuế từ xác định NNT có mức độ tuân thủ thấp khả gian lận thuế cao để tập trung nguồn lực xử lý nhằm nâng cao tính tuân thủ tự nguyện NNT theo nguyên tắc ưu tiên nguồn lực quản lý gian lận mang lại tổn thất lớn sai phạm có nhiều khả xảy 1.2.2 Một số văn pháp quy quản lý rủi ro quản lý thuế Xuất phát từ yêu cầu thực tế, Việt Nam, quan chức từ Trung ương đến địa phương ban hành văn pháp quy quản lý lý thuế nói chung quản lý rủi ro quản lý thuế nói riêng như: Luật Quản lý thuế số 78/2006/QH11; Nghị định số 83/2013/NĐ-CP; Nghị định số 12/2015/NĐ-CP; Nghị số 19/NQ-CP Trong việc quản lý rủi ro quản lý thuế, Bộ Tài ban hành Thơng tư số 205/2015/TT-BTC ngày 21/12/2015 quy định áp dụng quản lý rủi ro quản lý thuế; Bên cạnh đó, để tạo điều kiện thuận lợi tăng tính khách quan quản lý rủi ro quản lý thuế, Tổng Cục thuế ban hành Quyết định số 1733/QĐ-TCT ngày 01/10/2013 ban hành 21 tiêu chí đánh giá rủi ro thuế doanh nghiệp người nộp thuế 1.2.3 Xu áp dụng quản lý rủi ro Quản lý rủi ro xu thế, ngày áp dụng rộng rãi công tác quản lý Đối với quan thuế việc áp dụng mơ hình quản lý thuế theo rủi ro yêu cầu khách quan giải pháp để giải vấn đề thực tiễn đặt nhằm nâng cao chất lượng, hiệu công tác quản lý thuế Tính tất yếu việc áp dụng phương pháp quản lý rủi ro thấy rõ hai khía cạnh, từ nội quan thuế nhu cầu xã hội 1.2.4 Nguyên tắc áp dụng quản lý rủi ro quản lý thuế Áp dụng quản lý rủi ro quản lý thuế cần phải tuân thủ nguyên tắc sau: Cơ quan thuế áp dụng quản lý rủi ro để khuyến khích, tạo điều kiện thuận lợi để NNT tuân thủ tốt quy định pháp luật, đồng thời phòng chống, phát hiện, xử lý kịp thời hành vi vi phạm pháp luật thuế quản lý thuế NNT [26] 1.3 Bộ tiêu chí phân tích rủi ro thuế doanh nghiệp Bộ tiêu chí phân tích rủi ro thuế doanh nghiệp Tổng cục Thuế ban hành kèm theo Quyết định số 1733/QĐ-TCT ngày 01/10/2013 với 21 tiêu chí chia thành nhóm tiêu chí đánh giá mức độ rủi ro thuế doanh nghiệp thực nghĩa vụ thuế với Nhà nước Mỗi nhóm tiêu chí có quy định phương pháp tính điểm rủi ro cụ thể (kèm theo phụ lục luận văn) 1.4 Kết luận chương Trong chương 1, học viên trình bày khái quát tình hình, thực trạng gian lận thuế, chốn thuế nước giới Việt Nam Đồng thời nêu giải pháp mà nước, có Việt Nam áp dụng để hạn chế tiến tới ngăn chặn tình trạng gian lận thực nghĩa vụ thuế với Nhà nước Việc áp dụng quản lý rủi ro quản lý thuế nhiều nước áp dụng, có Việt Nam Việc quản lý rủi ro quản lý thuế xu tất yếu để tăng cường lực quản lý quan thuế với điều kiện đội ngũ cán có hạn, tình trạng gian lận thuế, trốn thuế ngày tăng Trong chương luận văn, học viên nêu số pháp lý quản lý thuế nói chung quản lý rủi ro quản lý thuế Việt Nam nói riêng Đồng thời nêu khái quát tiêu chí phân tích rủi ro làm để chấm điểm rủi ro thuế NNT Đây quan trọng lưu trữ CSDL thu, nộp thuế Tổng cục Thuế quản lý nhằm dự báo đưa vào kế hoạch thanh, kiểm tra thuế NNT có điểm rủi ro cao 10 Chương 2- MỘT SỐ PHƯƠNG PHÁP HỒI QUY TUYẾN TÍNH 2.1 Tổng quan hồi quy tuyến tính 2.1.1 Khái quát phân tích liệu Phân tích liệu kỹ thuật tảng trình khám phá tri thức từ liệu với hai mục tiêu chính: mơ tả liệu (hiểu liệu) xây dựng mơ hình phân tích nhằm trích lọc tri thức có ích, tiềm ẩn liệu phục vụ cho công tác dự báo, định 2.1.2 Phân tích hồi quy tuyến tính a) Phân tích tương quan Là phép phân tích sử dụng thước đo độ lớn mối liên hệ biến định lượng nghiên cứu Thông qua thước đo người nghiên cứu xác định mối liên hệ tuyến tính biến độc lập, phụ thuộc nghiên cứu Phân tích tương quan dựa khoảng tin cậy cho trước có giá trị tương quan mơ hình biến đại diện Khoảng giá trị hệ số tương quan chạy đoạn giá trị [-1 đến 1] Dấu hệ số tương quan nói lên tính liên hệ thuận nghịch biến đồng thời phản ánh tính chất tuyến tính mơ hình hồi quy b) Hồi quy mơ hình hồi quy tuyến tính Hồi quy việc xác định hàm ánh xạ từ mẫu liệu vào biến dự đốn có giá trị thực Phân tích hồi quy bao gồm: hồi quy tương quan để xác định mối liên hệ nhiều biến ngẫu nhiên với nhau; hồi quy tuyến tính đơn biến để xác định mối liên hệ biến độc lập vào biến phụ thuộc; hồi quy tuyến tính đa biến xác định mối liên hệ nhiều biến độc lập vào biến phụ thuộc 11 Hồi quy tuyến tính (linear regression analysis) phương pháp phân tích quan hệ biến phụ thuộc Y với hay nhiều biến độc lập X Mơ hình hóa sử dụng hàm tuyến tính (bậc 1) Các tham số mơ hình (hay hàm số) ước lượng từ liệu 2.2 Hồi quy tuyến tính đơn biến 2.2.1 Vấn đề mơ hình hồi quy Mơ hình HQTT đơn biến: Y = ax + b + ε (2.2.3) Mơ hình (2.2.3) gọi mơ hình hồi quy tuyến tính (HQTT) đơn; x gọi biến hồi quy; Y gọi biến phản hồi (hay biến phụ thuộc, biến giải thích); a, b gọi tham số hồi quy, a: hệ số chặn, b: hệ số góc; đường thẳng y = ax + b gọi đường hồi quy (lý thuyết) Mô hình gọi tuyến tính tuyến tính với tham số a, b (a, b có lũy thừa 1); gọi đơn có biến hồi quy Để khảo sát mơ hình, ta phải tiến hành thí nghiệm, phép quan sát để có số liệu {(xi, yi)} Từ đó, đưa ước lượng tốt cho tham số Mơ hình với hệ số ước lượng gọi mô hình thực nghiệm hay mơ hình lọc Dùng mơ hình thực nghiệm tiến hành số dự đốn, tính giá trị cực trị khía cạnh vấn đề điều khiển 2.2.2 Ước lượng hệ số hồi quy Phương trình hồi quy thực nghiệm y = 𝑎̂𝑥 + 𝑏̂ (2.2.10) Với 𝑎̂, 𝑏̂ ước lượng hệ số phương pháp bình phương cực tiểu 12 2.2.3 Tính chất ước lượng hệ số hồi quy 2.2.4 Kiểm định giả thuyết a) Sử dụng kiểm định T b) Phân tích phương sai 2.2.5 Khoảng tin cậy a) Khoảng tin cậy tham số b) Khoảng tin cậy cho đáp ứng trung bình c) Dự đốn quan sát tương lai d) Lưu ý sử dụng mơ hình hồi quy - Trường hợp nội suy: Nói chung, sau kiểm định giả thiết, sử dụng mơ hình hồi quy thực nghiệm (2.2.10) để làm số dự đoán “nội suy” Cụ thể là, X nhận giá trị x0 nằm dải biến thiên [a; b] số liệu, giá trị dự đốn trung bình giá trị quan sát tương lai biến đầu 𝑎̂ + 𝑏̂x0 … Sự xác công thức phần b c mục 2.2.5 - Trường hợp ngoại suy: Sử dụng phương trình hồi quy để dự đốn giá trị biến Y ứng với trụ biến đầu vào X nằm dải biến thiên số liệu gọi dự đốn ngoại suy Tuy nhiên, ngồi dải biến thiên số liệu, giả thiết mô hình, chí quan hệ E[Y | X = x] = ax + b khơng Vì thế, dự đốn với sai lầm đáng kể gây từ ngoại suy Một cách khắc phục lấy thêm quan sát (làm thêm thí nghiệm) để dải biến thiên rộng ra, chứa điểm ta quan tâm Tuy nhiên kỹ thuật, nhiều ngoại suy cách mà ta tiếp cận vấn đề Cần lưu ý ta nên áp dụng cách mềm mỏng, với x0 không xa dải biến thiên [a; b], ta có kết Tóm lại, ta áp dụng ngoại suy cách hãn hữu cần thiết, chưa thể có đủ số liệu khơng cách khác [1] 13 2.2.6 Tính phù hợp mơ hình a) Phân tích phần dư b) Hệ số xác định (coefficient of determination) 2.3 Hồi quy tuyến tính đa biến Mơ hình HQTT đa biến (hồi quy tuyến tính bội) mở rộng tự nhiên mơ hình HQTT đơn 2.3.1 Phương trình hồi quy a) Dạng quan sát dạng ma trận b) Dạng quan sát dạng ma trận Giả sử mối quan hệ biến phụ thuộc Y k biến độc lập x1,…, xk cho mơ hình: Y = 𝛽0 + 𝛽1x1 + … + 𝛽kxk + ε (2.3.1) 𝛽0, 𝛽1, …, 𝛽k tham số chưa biết, gọi hệ số hồi quy, 𝛽0 gọi hệ số chặn, 𝛽1, …, 𝛽k hệ số góc; ε sai số ngẫu nhiên có kỳ vọng phương sai σ2 Khi không sợ nhầm lẫn, ta viết ngắn gọn (2.3.1) dạng: E[Y | x1, …, xk] = 𝛽0 + 𝛽1x1 + … + 𝛽kxk (2.3.2) Hay đơn giản nữa: E[Y]= 𝛽0 + 𝛽1x1 + …+ 𝛽kxk (2.3.3) Để thuận lợi cho ký hiệu phân tích tiếp theo, sử dụng ký hiệu ma trận sau đây: 𝑦1 𝜀1 𝑥11 𝑥12 𝑥1𝑘 𝛽0 y = [ ];X = [ ]; 𝜷 = [ ]; ε = [ ] 𝑦𝑛 𝜀𝑛 𝑥𝑛1 𝑥𝑛2 𝑥𝑛𝑘 𝛽𝑘 Khi (2.3.4) viết lại dạng ma trận: y=X𝜷+ε (2.3.5) y n – véc tơ quan sát, X ma trận cấp n * p biến độc lập (p = k + 1) – gọi ma trận kế hoạch - 𝜷 p – véc tơ hệ số hồi quy, ε n – véc tơ sai số ngẫu nhiên 14 c) Tuyến tính hóa số mơ hình 2.3.2 Ước lượng hệ số hồi quy tính chất ước lượng 2.3.3 Kiểm định giả thiết a) Kiểm định ý nghĩa hồi quy b) Hệ số xác định bội R2 hệ số xác định hiệu chỉnh 𝑅𝑎𝑑𝑗 c) Kiểm định tham số triệt tiêu (Kiểm định T) 2.3.4 Ước lượng dự đoán a) Khoảng tin cậy cho tham số đơn lẻ b) Khoảng tin cậy cho đáp ứng trung bình c) Dự đốn cho quan sát d) Vấn đề ngoại suy với mô hình hồi quy bội 2.3.5 Phân tích phần dư 2.3.6 Sử dụng phần mềm 2.4 So sánh, đánh giá phương pháp hồi quy tuyến tính 2.5 Kết luận chương Trong chương luận văn, học viên trình bày cách khái qt phân tích liệu khoa học kỹ thuật sâu trình bày phương pháp hồi quy tuyến tính đơn biến đa biến Thơng qua ví dụ thực tế lý thuyết mơ hình HQTT đơn biến đa biến để hiểu rõ phương pháp xây dựng mơ hình phù hợp tốn thực tế Phương pháp HQTT mối quan hệ tuyến tính biến phụ thuộc biến tiên lượng thơng qua phương trình hồi quy dựa vào giá trị quan sát thí nghiệm thực tế Phương trình HQTT xây dựng có giá trị dự báo cao thực tế Đây 15 phương pháp sử dụng phổ biến phân tích dự báo nhằm giải toán thực tế Trong Chương luận văn, học viên phân tích đánh giá phương pháp HQTT: đơn biến, đa biến Chỉ khả ưu việt phương pháp HQTT đa biến gần với tốn thực tế Từ lựa chọn phương pháp HQTT đa biến MHHQ để giải toán rủi ro vấn đề gian lận thuế, chốn thuế NNT trình bày Chương Bên cạnh đó, học viên trình bày số thủ tục thường sử dụng việc lựa chọn biến đưa vào MHHQ để mơ hình có giá trị thực tế cao đồng thời giảm thiểu thời gian tính tốn, chi phí tính phức tạp áp dụng mơ hình 16 Chương 3- XÂY DỰNG VÀ THỬ NGHIỆM CHƯƠNG TRÌNH TÍNH ĐIỂM RỦI RO CỦA DOANH NGHIỆP PHỤC VỤ THANH TRA THUẾ 3.1 Phân tích tốn tính điểm rủi ro doanh nghiệp 3.2 Xây dựng mơ hình tính điểm rủi ro doanh nghiệp 3.2.1 Xây dựng mơ hình hồi qui tuyến tính đa biến a) Xây dựng tập liệu mẫu để huấn luyện kiểm tra mơ hình hồi quy b) Xây dựng mơ hình hồi quy tuyến tính đa biến Phương trình hồi quy: Điểm rủi ro = 1 *TC1 + 2 *TC2+ +n *TCn + θ Ở TC1, TC2, TCn thuộc tính liệu huấn luyện, 1, 2, , n trọng số thuộc tính, θ tham số ngưỡng NSD đưa vào để tăng độ xác mơ hình hồi quy Kết thu phương pháp hồi quy đa biến hệ số 1, 2, , n, giá trị ngưỡng θ người sử dụng đưa vào a) Kiểm tra mơ hình hồi quy tuyến tính đa biến từ tập liệu kiểm tra b) Thực thi mơ hình để tính điểm rủi ro cho doanh nghiệp Sau kết thúc trình huấn luyện kiểm tra mơ hình, ta thu mơ hình tính điểm rủi ro, hàm hồi quy mơ tả mối quan hệ đầu (điểm rủi ro) với tiêu chí rút gọn đầu vào Điểm rủi ro = 1 *TC1 + 2 *TC2+ +n *TCn + θ Như vậy, chất mơ hình tính điểm rủi ro hàm hồi quy với: 17 - Các thuộc tính đầu vào tương ứng với tiêu chí phân tích rủi ro Tổng cục thuế quy định Giá trị thuộc tính đầu vào giá trị điểm rủi ro tính theo cơng thức tiêu chí phân tích rủi ro Q trình tính điểm rủi ro doanh nghiệp phục vụ lập kế hoạch tra, kiểm tra thực sau: 1) Từ tệp liệu đầu vào trích xuất từ hệ thống CSDL tập trung Tổng cục thuế (TPH), thực tính giá trị điểm rủi ro cho thuộc tính đầu vào theo cơng thức quy định tiêu phân tích rủi ro Tổng cục thuế quy định (Xem phần phụ lục) 2) Sử dụng hàm hồi quy thu (mơ hình tính điểm rủi ro) để tính điểm rủi ro cho doanh nghiệp 3) Các giá trị trọng số 1, 2, , n thuộc tính đầu vào (được học từ liệu lịch sử) 4) Giá trị ngưỡng θ người sử dụng đưa vào Kết điểm rủi ro doanh nghiệp tính mơ hình hồi quy ghi lại sử dụng để lập kế hoạch tra, kiểm tra thuế in hồ sơ phân tích rủi ro cho doanh nghiệp Sau có kết tra, kiểm tra cho đối tượng này, liệu tra, kiểm tra tiếp tục sử dụng để huấn luyện mơ hình sử dụng mơ hình tính điểm rủi ro cho năm Như vậy, trình huấn luyện liên tục thực hiên qua năm, độ xác mơ hình hồi quy ngày tăng lên phản ánh quy luật liệu Do đó, độ xác mơ hình dự báo điểm rủi ro đảm bảo mặt khoa học 18 3.3 Thử nghiệm đánh giá kết 3.3.1 Mục tiêu thử nghiệm Mục tiêu thử nghiệm thử nghiệm mơ hình tính điểm rủi ro doanh nghiệp xây dựng số liệu thử nghiệm số liệu lịch sử tình hình nộp thuế kết tra doanh nghiệp thuộc Cục thuế Hà Nội quản lý kết xuất từ hệ thống tập trung liệu Tổng cục thuế (TPH) 3.3.2 Công cụ môi trường thử nghiệm Thực lập trình ngơn ngữ C# mơi trường Visual Studio NET, sử dụng ngơn ngữ phân tích liệu R tích hợp vào Visual Studio NET để thực xây dựng mơ hình hồi quy tuyến tính đa biến Mơi trường tiến hành thử nghiệm máy tính cá nhân cài đặt hệ điều hành Windows 10 Pro 64-bit, cấu hình xử lý Intel(R) Core (TM) i3, CPU @ 1.90 GHz, 4.00GB RAM 3.3.3 Quy trình thử nghiệm a) Chuẩn bị liệu huấn luyện liệu kiểm tra b) Xây dựng mơ hình hồi quy tuyến tính đa biến từ tập liệu huấn luyện c) Kiểm tra độ xác mơ hình Nhận xét kết thử nghiệm: - Trên tập liệu kiểm tra, độ xác mơ hình hồi quy đạt 90.59% - Mơ hình xây dựng sử dụng để tính điểm rủi ro cho doanh nghiệp phục vụ lập hồ sơ phân tích rủi ro doanh nghiệp phục vụ công tác lập kế hoạch tra, kiểm tra thuế 19 3.4 Kết luận chương Trong chương 3, luận văn trình bày tốn tính điểm rủi ro doanh nghiệp mơ hình giải tốn sử dụng phương pháp HQTT đa biến Chương nêu rõ việc thực bước giải tốn tính điểm rủi ro phương pháp HQTT đa biến Trên sở liệu lịch sử thu nộp thuế số doanh nghiệp thuộc Cục thuế Hà Nội quản lý, mơ hình xây dựng giải việc tính điểm rủi ro doanh nghiệp để phục vụ công tác lập hồ sơ tra, kiểm tra hàng năm Trên tập liệu kiểm tra, độ xác mơ hình hồi quy đạt 90.59% Sau có kết tra, kiểm tra thuế doanh nghiệp, liệu tra, kiểm tra tiếp tục sử dụng để huấn luyện mơ hình sử dụng mơ hình tính điểm rủi ro cho năm Vì vậy, trình huấn luyện liên tục thực qua năm, độ xác mơ hình hồi quy ngày tăng lên phản ánh quy luật liệu Mơ hình HQTT xây dựng sử dụng tính điểm rủi ro cho doanh nghiệp, phục vụ lập hồ sơ phân tích rủi ro doanh nghiệp phục vụ công tác lập kế hoạch tra, kiểm tra 20 KẾT LUẬN Luận văn trình bày thực trạng gian lận thuế, trốn thuế doanh nghiệp giới nói chung Việt Nam nói riêng Nêu biện pháp mà nước Việt Nam áp dụng để hạn chế tình trạng gian lận thuế, trốn thuế Trình bày sở khoa học, sở pháp lý để tính điểm rủi ro cho doanh nghiệp phục vụ công tác tra, kiểm tra nhằm hạn chế sai phạm thuế Luận văn nêu khái quát phương pháp hồi quy, trình bày chi tiết phương pháp hồi quy tuyến tính đơn biến đa biến từ nêu lý lựa chọn sử dụng phương pháp hồi quy tuyến tính đa biến để giải tốn tính điểm rủi ro nêu Luận văn trình bày việc xây dựng mơ hình dự báo từ liệu ngành Thuế việc sử dụng phương pháp phân tích HQTT đa biến, xây dựng hàm hồi quy để tính điểm rủi ro cho doanh nghiệp dựa vào số liệu nộp thuế doanh nghiệp nhằm hỗ trợ quan thuế công tác tra, kiểm tra Xây dựng ứng dụng tính điểm rủi ro doanh nghiệp dựa mơ hình hồi quy tuyến tính đa biến ngơn ngữ lập trình C# ngơn ngữ phân tích liệu R Mơ hình triển khai thực tế trợ giúp hiệu phận tra thuế công tác lập kế hoạch tra, chống thất thu ngân sách đem lại hiệu kinh tế, xã hội to lớn Trong trình thực luận văn, học viên tìm hiểu thu thập nguồn liệu nộp thuế cục thuế Hà Nội cung cấp, liệu thống kê để làm sở cho phân tích rủi ro Trên sở liệu thu thập tiến hành bước tiền xử lý liệu, xây dựng liệu 21 huấn luyện để xây dựng mơ hình Sử dụng mơ hình đánh giá tính xác, độ tin cậy mơ ứng dụng xây dựng 22 ... hàm hồi quy để tính điểm rủi ro cho doanh nghiệp dựa vào số liệu nộp thuế doanh nghiệp nhằm hỗ trợ quan thuế công tác tra, kiểm tra Xây dựng ứng dụng tính điểm rủi ro doanh nghiệp dựa mơ hình hồi. .. trình tính điểm rủi ro doanh nghiệp phục vụ tra thuế - Kết luận - Tài liệu tham khảo - Phụ lục Chương 1- PHÁT BIỂU VỀ BÀI TỐN TÍNH ĐIỂM RỦI RO CỦA DOANH NGHIỆP PHỤC VỤ THANH TRA THUẾ 1.1 Bài tốn tính. .. liệu ứng dụng tính điểm rủi ro doanh nghiệp phục vụ tra thuế Tổng quan vấn đề nghiên cứu Các nước nghiên cứu, xây dựng ứng dụng để tính điểm rủi ro nhằm phục vụ hoạt động thanh, kiểm tra doanh nghiệp