(Luận văn thạc sĩ) Ứng dụng phương pháp phân cụm mờ cho bài toán phân tích thông tin rủi ro quản lý thuế doanh nghiệp

55 2 0
(Luận văn thạc sĩ) Ứng dụng phương pháp phân cụm mờ cho bài toán phân tích thông tin rủi ro quản lý thuế doanh nghiệp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

(Luận văn thạc sĩ) Ứng dụng phương pháp phân cụm mờ cho bài toán phân tích thông tin rủi ro quản lý thuế doanh nghiệp(Luận văn thạc sĩ) Ứng dụng phương pháp phân cụm mờ cho bài toán phân tích thông tin rủi ro quản lý thuế doanh nghiệp(Luận văn thạc sĩ) Ứng dụng phương pháp phân cụm mờ cho bài toán phân tích thông tin rủi ro quản lý thuế doanh nghiệp(Luận văn thạc sĩ) Ứng dụng phương pháp phân cụm mờ cho bài toán phân tích thông tin rủi ro quản lý thuế doanh nghiệp(Luận văn thạc sĩ) Ứng dụng phương pháp phân cụm mờ cho bài toán phân tích thông tin rủi ro quản lý thuế doanh nghiệp(Luận văn thạc sĩ) Ứng dụng phương pháp phân cụm mờ cho bài toán phân tích thông tin rủi ro quản lý thuế doanh nghiệp(Luận văn thạc sĩ) Ứng dụng phương pháp phân cụm mờ cho bài toán phân tích thông tin rủi ro quản lý thuế doanh nghiệp(Luận văn thạc sĩ) Ứng dụng phương pháp phân cụm mờ cho bài toán phân tích thông tin rủi ro quản lý thuế doanh nghiệp(Luận văn thạc sĩ) Ứng dụng phương pháp phân cụm mờ cho bài toán phân tích thông tin rủi ro quản lý thuế doanh nghiệp(Luận văn thạc sĩ) Ứng dụng phương pháp phân cụm mờ cho bài toán phân tích thông tin rủi ro quản lý thuế doanh nghiệp(Luận văn thạc sĩ) Ứng dụng phương pháp phân cụm mờ cho bài toán phân tích thông tin rủi ro quản lý thuế doanh nghiệp(Luận văn thạc sĩ) Ứng dụng phương pháp phân cụm mờ cho bài toán phân tích thông tin rủi ro quản lý thuế doanh nghiệp(Luận văn thạc sĩ) Ứng dụng phương pháp phân cụm mờ cho bài toán phân tích thông tin rủi ro quản lý thuế doanh nghiệp(Luận văn thạc sĩ) Ứng dụng phương pháp phân cụm mờ cho bài toán phân tích thông tin rủi ro quản lý thuế doanh nghiệp(Luận văn thạc sĩ) Ứng dụng phương pháp phân cụm mờ cho bài toán phân tích thông tin rủi ro quản lý thuế doanh nghiệp(Luận văn thạc sĩ) Ứng dụng phương pháp phân cụm mờ cho bài toán phân tích thông tin rủi ro quản lý thuế doanh nghiệp(Luận văn thạc sĩ) Ứng dụng phương pháp phân cụm mờ cho bài toán phân tích thông tin rủi ro quản lý thuế doanh nghiệp

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ VŨ THỊ THU HƢƠNG ỨNG DỤNG PHƢƠNG PHÁP PHÂN CỤM MỜ CHO BÀI TỐN PHÂN TÍCH THƠNG TIN RỦI RO QUẢN LÝ THUẾ DOANH NGHIỆP LUẬN VĂN THẠC SĨ QUẢN LÝ HỆ THỐNG THÔNG TIN Hà Nội – 2017 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ VŨ THỊ THU HƢƠNG ỨNG DỤNG PHƢƠNG PHÁP PHÂN CỤM MỜ CHO BÀI TỐN PHÂN TÍCH THƠNG TIN RỦI RO QUẢN LÝ THUẾ DOANH NGHIỆP Ngành: Công nghệ thông tin Chuyên ngành: Quản lý Hệ thống thông tin Mã số: LUẬN VĂN THẠC SĨ QUẢN LÝ HỆ THỐNG THÔNG TIN NGƢỜI HƢỚNG DẪN KHOA HỌC: PGS TS Nguyễn Đình Hóa Hà Nội – 2017 LỜI CAM ĐOAN Tơi xin cam đoan luận văn cơng trình nghiên cứu riêng cá nhân tôi, không chép tự nghiên cứu, đọc, dịch tài liệu, tổng hợp thực Nội dung lý thuyết trong luận văn tơi có sử dụng số tài liệu tham khảo trình bày phần tài liệu tham khảo Các số liệu, chương trình phần mềm kết luận văn trung thực chưa cơng bố cơng trình khác Hà Nội, tháng 10 năm 2017 Học viên thực Vũ Thị Thu Hƣơng LỜI CẢM ƠN Lời đầu tiên, em xin gửi lời biết ơn sâu sắc đến PGS.TS Nguyễn Đình Hóa, TS Lê Hồng Sơn người tạo điều kiện thuận lợi, tận tình hướng dẫn, bảo, giúp đỡ em suốt trình làm luận văn Em xin gửi lời cảm ơn đến thầy cô giáo trường Đại học Công nghệ - Đại học Quốc Gia Hà Nội, thầy cô khoa Công nghệ thông tin truyền đạt kiến thức giúp đỡ em suốt trình học Và cuối em xin gửi lời cảm ơn tới đồng nghiệp, gia đình bạn bè, người ủng hộ, động viên tạo điều kiện giúp đỡ để em có kết ngày hôm Hà Nội, tháng 10 năm 2017 Học viên Vũ Thị Thu Hƣơng MỤC LỤC LỜI CAM ĐOAN LỜI CẢM ƠN DANH MỤC CÁC KÝ HIỆU VÀ CÁC TỪ VIẾT TẮT DANH MỤC HÌNH MINH HOẠ VÀ BẢNG BIỂU MỞ ĐẦU CHƢƠNG 1: TỔNG QUAN VỀ PHÂN CỤM DỮ LIỆU 11 1.1 Giới thiệu khai phá liệu 11 1.1.1 Khai phá liệu gì? 11 1.1.2 Các giai đoạn trình khai phá liệu 12 1.2 Tổng quan phân cụm liệu 12 1.2.1 Khái niệm phân cụm liệu 13 1.2.2 Các mục tiêu phân cụm liệu 13 1.2.3 Một số ứng dụng phân cụm liệu 15 1.2.4 Các yêu cầu phân cụm liệu 15 1.3 Một số kỹ thuật tiếp cận phân cụm liệu 16 1.3.1 Phương pháp phân cụm phân hoạch 16 1.3.2 Phương pháp phân cụm phân cấp 17 1.3.3 Phương pháp tiếp cận dựa mật độ 19 1.3.4 Phương pháp phân cụm dựa lưới 20 1.3.5 Phương pháp phân cụm dựa mơ hình 20 CHƢƠNG 2: GIỚI THIỆU BÀI TOÁN PHÂN CỤM MỜ VÀ CÁC PHƢƠNG PHÁP XÁC ĐỊNH SỐ CỤM TRONG GOM CỤM DỮ LIỆU 22 2.1 Bài toán phân cụm mờ 22 2.1.1 Giới thiệu phân cụm mờ 22 2.1.2 Thuật toán Fuzzy C-Mean (FCM) 22 2.1.2.1 Hàm mục tiêu 22 2.1.2.2 Thuật toán FCM 25 2.1.2.3 Đánh giá 27 2.2 Các phƣơng pháp xác định số cụm gom cụm liệu 27 2.2.1 Xác định số cụm dựa phương pháp truyền thống 28 2.2.2 Xác định số cụm phương pháp Eblow 29 2.2.3 Xác định số cụm dựa phương pháp phê duyệt chéo 30 2.2.4 Xác định số cụm dựa độ chồng độ nén liệu 32 2.3 Đề xuất phƣơng án áp dụng thuật toán FCM phƣơng pháp xác định số cụm vào tốn lựa chọn nhóm doanh nghiệp rủi ro vi phạm thuế cao 34 CHƢƠNG 3: ỨNG DỤNG PHƢƠNG PHÁP PHÂN CỤM MỜ CHO BÀI TỐN PHÂN TÍCH THƠNG TIN RỦI RO QUẢN LÝ THUẾ DOANH NGHIỆP 36 3.1 Mơ tả tốn 36 3.2 Dữ liệu đầu vào 37 3.3 Lựa chọn công cụ, môi trƣờng thực nghiệm 39 3.4 Phƣơng pháp phân cụm lựa chọn số cụm 40 3.4.1 Xác định phương pháp phân cụm 40 3.4.2 Lựa chọn số cụm 40 3.5 Kết thực nghiệm 43 3.5.1 Kết phân loại doanh nghiệp 43 3.5.1.1 Kết phân cụm tập liệu data.csv 43 3.5.1.2 So sánh kết phân cụm doanh nghiệp với mức rủi ro vi phạm thuế tương ứng đánh giá từ kinh nghiệp chuyên gia 44 3.5.1.3 Xác định doanh nghiệp thuộc cụm 45 3.5.2 Kết luận 46 3.6 Ứng dụng kết thực nghiệm vào toán khoanh vùng, lựa chọn nhóm doanh nghiệp có khả rủi ro vi phạm thuế cao 47 KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN 50 TÀI LIỆU THAM KHẢO 52 DANH MỤC CÁC KÝ HIỆU VÀ CÁC TỪ VIẾT TẮT Viết tắt Thuật ngữ Giải thích (Anh/Việt) FCM Fuzzy C-Mean Một thuật toán phân cụm mờ GTGT Giá trị gia tăng Tờ khai thuế giá trị gia tăng Mã số thuế Mã số thuế doanh nghiệp MST DANH MỤC HÌNH MINH HOẠ VÀ BẢNG BIỂU Hình 1.1 Quá trình phát tri thức Hình 1.2 Quá trình khai há liệu Hình 1.3 Ví dụ Phân cụm liệu Hình 1.4 Ví dụ phân cụm ngơi nhà dựa khoảng cách Hình 1.5 Ví dụ phân cụm ngơi nhà dựa kích cỡ Hình 1.6 Ví dụ phương pháp phân cụm phân cấp Hình 1.7 Ví dụ phân cụm theo mật độ (1) Hình 1.8 Ví dụ phân cụm theo mật độ (2) Hình 1.9 Cấu trúc phân cụm dựa lưới Hình 1.10 Ví dụ phân cụm dựa mơ hình Hình 2.1 Thuật tốn FCM Hình 2.2 Phân cụm tập liệu với số lượng cụm khác Hình 2.3 Minh họa cho phương pháp xác định số cụm dựa phương pháp truyền thống Hình 2.4 Ví dụ minh họa cách xác định số cụm phương pháp Elbow Hình 2.5 Mơ tả phương pháp Holdout Hình 2.6 Q trình ước lượng số cụm tối ưu dựa độ chồng độ nén liệu Hình 2.7 Đề xuất phương án lựa chọn nhóm doanh nghiệp rủi ro vi phạm thuế cao Hình 3.1 Kết phân cụm liệu với số cụm c = [3, 7] Hình 3.2 Kết phân cụm liệu với tập liệu data.csv Hình 3.3 Xác định doanh nghiệp thuộc cụm Hình 3.4 Mơ tập liệu X’(1) Hình 3.5 Mơ tập liệu X’(2) Hình 3.6 Mơ tập liệu X’(3) Bảng 3.1 Mô tả thông tin tiêu cột liệu thuộc tập liệu data.csv Bảng 3.2 Kết tính F với số cụm c=[3,7] Bảng 3.3 Kết phân cụm doanh nghiệp tập liệu data_cum.csv Bảng 3.4 So sánh kết phân cụm liệu data.csv với thông tin rủi ro vi phạm thuế MỞ ĐẦU Công tác thanh, kiểm tra thuế nhiệm vụ trọng tâm nhằm ngăn ngừa, phát xử lý kịp thời vi phạm thuế Thực tốt công tác thanh, kiểm tra thuế góp phần tăng nguồn thu cho ngân sách, tạo bình đ ng cơng xã hội ngh a vụ thuế đối tượng nộp thuế Hiện nhu cầu tin học hóa quy trình nghiệp vụ ngành Thuế nói chung đại hố cơng tác thanh, kiểm tra thuế nói riêng, góp phần nâng cao hiệu cơng tác quản lý thuế ngày cao Với tính chất đa dạng phức tạp liệu kho liệu Người nộp thuế, cần thiết phải có hướng nghiên cứu cách tổ chức kho liệu để trích xuất thơng tin phù hợp Khai phá liệu hướng nghiên cứu phổ biến nay, phân cụm công cụ hữu hiệu tốn khai phá liệu, phân tích thơng tin [3] Mục tiêu phân cụm chia nhỏ đối tượng vào cụm cho đối tượng cụm tương đồng với Phân cụm có nhiều ứng dụng thương mại, giúp nhà cung cấp biết nhóm khách hàng quan trọng có đặc trưng tương đồng đặc tả họ từ mẫu sở liệu khách hàng Phân cụm mờ phương pháp phân cụm liệu mở rộng điểm liệu thuộc hai hay nhiều cụm với giá trị hàm thuộc tương ứng Năm 1969, Ruspini [17] giới thiệu khái niệm phân hoạch mờ để mô tả cấu trúc cụm mờ Năm 1973, Dunn [18] mở rộng phương pháp phân cụm phát triển thuật toán phân cụm mờ Ý tưởng thuật toán xây dựng phương pháp phân cụm mờ dựa tối thiểu hóa hàm mục tiêu Sau đó, Bezdek [16] cải tiến tổng quát hóa hàm mục tiêu mờ cách thêm trọng số mũ Cho đến nay, có nhiều biến thể phân cụm mờ ứng dụng toán khác [16] Mục tiêu đề tài ứng dụng thuật tốn phân cụm mờ phân tích thơng tin rủi ro quản lý thuế doanh nghiệp Một sở liệu mẫu thông tin tờ khai thuế, báo cáo tài doanh nghiệp, mức độ rủi ro 644 doanh nghiệp sử dụng để làm đầu vào cho hệ thống phân tích rủi ro sử dụng phương pháp phân cụm mờ Hệ thống phân tích triển khai xây dựng thử nghiệm kiểm chứng Các phần luận văn: Chƣơng 1: Tổng quan phân cụm liệu ... ỨNG DỤNG PHƢƠNG PHÁP PHÂN CỤM MỜ CHO BÀI TỐN PHÂN TÍCH THƠNG TIN RỦI RO QUẢN LÝ THUẾ DOANH NGHIỆP Ngành: Công nghệ thông tin Chuyên ngành: Quản lý Hệ thống thông tin Mã số: LUẬN VĂN THẠC SĨ QUẢN... Chƣơng 3: Ứng dụng phương pháp phân cụm mờ cho tốn phân tích thơng tin quản lý rủi ro thuế doanh nghiệp Chương đề cập đến toán phân cụm doanh nghiệp dựa tập liệu mẫu thông tin tờ khai thuế, báo... thể phân cụm mờ ứng dụng toán khác [16] Mục tiêu đề tài ứng dụng thuật tốn phân cụm mờ phân tích thơng tin rủi ro quản lý thuế doanh nghiệp Một sở liệu mẫu thông tin tờ khai thuế, báo cáo tài doanh

Ngày đăng: 23/01/2023, 09:11

Tài liệu cùng người dùng

Tài liệu liên quan