Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 26 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
26
Dung lượng
507,62 KB
Nội dung
BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC ĐÀ NẴNG NGUYỄN HOÀNG ANH THƯ XÂYDỰNGHỆTHỐNGHỎIĐÁPTỰĐỘNGVỀCHÍNHSÁCHTHUẾ Chuyên ngành: Khoa học máy tính Mã số: 60.48.01 TÓM TẮT LUẬN VĂN THẠC SĨ KỸ THUẬT Đà Nẵng - Năm 2013 Công trình được hoàn thành tại ĐẠI HỌC ĐÀ NẴNG Người hướng dẫn khoa học: PGS.TS. PHAN HUY KHÁNH Phản biện 1: PGS.TS. VÕ TRUNG HÙNG Phản biện 2: TS. HOÀNG THỊ LAN GIAO Luận văn được bảo vệ trước Hộiđồng chấm Luận văn tốt nghiệp thạc sĩ Kỹ thuật họp tại Đại học Đà Nẵng vào ngày 19 tháng 5 năm 2013. Có thể tìm hiểu luận văn tại: - Trung tâm Thông tin - Học liệu, Đại Học Đà Nẵng 1 MỞ ĐẦU 1. Lý do chọn đề tài Đối với bất kỳ quốc gia nào trên thế giới, thuếđóng vai trò là công cụ quan trọng của Nhà nước để quản lý, điều tiết sản xuất kinh doanh cũng như phân phối tiêu dùng, thúc đẩy kinh tế phát triển. Thuế là nguồn thu chủ yếu trong ngân sách nhà nước, bảo đảm sự tồn tại cho bộ máy chính trị quốc gia, và là nguồn tài chính không thể thiếu cho các chínhsách đầu tư công, phát triển cơ sở vật chất hạ tầng phục vụ cho các hoạt động kinh tế, và đảm bảo cho đời sống an sinh xã hội. Có được một hệthốngchínhsáchthuế phù hợp, đồng bộ, hoàn thiện và luôn theo kịp sự vận động phát triển của thực tiễn là điều kiện cần thiết và cấp bách. Chínhsáchthuế không những phải phù hợp với tình hình và định hướng phát triển của quốc gia, mà còn phải phù hợp với các thông lệ, chuẩn mực quốc tế, đặc biệt trong điều kiện hội nhập kinh tế quốc tế ngày càng mở rộng hiện nay. Trong vài năm trở lại đây, nhờ ứng dụng tốt công nghệ thông tin và truyền thông, thông tin vềchính sách, luật thuế ngày càng dễ tiếp cận và phổ biến đến mọi người dân. Tuy nhiên ý thức chấp hành luật thuế của người dân còn chưa cao, còn chai ỳ trong việc thực hiện kê khai, nộp thuế, tình trạng trốn thuế còn rất cao. Để Người nộp thuế vận dụng đúng, kê khai đúng, chấp hành đúng luật thuế cần có biện pháp tuyên truyền, hỗ trợ sâu rộng đến Người nộp thuế và cần chú trọng hơn nữa công tác hỗ trợ, giải đáp những vướng mắc vềchínhsách thuế. Tại Cục thuế Quảng Nam, Phòng tuyên truyền & hỗ trợ Người nộp thuế có chức năng tuyên truyền, hỗ trợ hướng dẫn, giải 2 đáp những vướng mắc liên quan đến việc kê khai, thu nộp thuế, với cơ chế tự khai- tự nộp, công tác này được coi là nhiệm vụ quan trọng hàng đầu của toàn ngành thuế. Xâydựng một hệthốnghỏiđápvềchínhsáchthuế phần nào sẽ giúp công tác tuyên truyền, hỗ trợ vướng mắc vềthuế đưa chínhsáchthuế đến gần người dân hơn, giảm tải công việc tại phòng Tuyên truyền và hỗ trợ NNT, và góp phần giúp người dân hiểu và tiếp cận gần hơn với chínhsách thuế, hiểu rõ trách nhiệm, quyền và nghĩa vụ khi thực hiện nghĩa vụ thuế. Đó là lý do mà tôi chọn nghiên cứu và thực hiện đề tài: “Xây dựnghệthốnghỏiđáptựđộngvềchínhsách thuế” dưới sự hướng dẫn của PGS.TS Phan Huy Khánh. 2. Mục tiêu và nhiệm vụ nghiên cứu 2.1. Mục tiêu của đề tài Mục tiêu của đề tài là nghiên cứu và xâydựnghệthốnghỏiđáptựđộngvềchínhsách thuế. 2.2. Nhiệm vụ - Nghiên cứu tổng quan mô hình hỏiđáptự động, phân tích các bước xâydựng một hệthốnghỏi đáp. - Tìm hiểu quy trình thực hiện giải đáp vướng mắc NNT. - Phân tích số liệu nhằm đề ra giải pháp hợp lý trong việc xâydựng và triển khai hệ thống. - Xâydựng CSDL, hệthống QA. - Đánh giá kết quả thực hiện theo tiêu chí đã cho. 3 3. Đối tượng và phạm vi nghiên cứu 3.1. Đối tượng nghiên cứu: - Tìm hiểu về quy trình tuyên truyền và hỗ trợ Người nộp thuế, công tác hỗ trợ, giải đáp vướng mắc từ sổ nhật ký công việc từ năm 2009 đến nay. - Phân tích số liệu, lựa chọn những sắc thuế được yêu cầu giải đáp, hỗ trợ nhiều nhất để triển khai trong hệthốnghỏi đáp. - Nghiên cứư cơ sở lý thuyết tổng quan hệthốnghỏi đáp. - Đánh giá ứng dụng của hệ thống. 3.2 Phạm vi nghiên cứu: - Các vấn đề hỏiđáp liên quan đến các sắc thuế. - Ứng dụng cho các cán bộ làm công tác nghiệp vụ và Người nộp thuế. 4. Phương pháp nghiên cứu - Thu thập và phân tích các tài liệu và thông tin liên quan đến đề tài. - Thảo luận, lựa chọn phương hướng giải quyết vấn đề. - Phân tích thiết kế hệthống chương trình ứng dụng. - Triển khai xâydựng chương trình ứng dụng. - Kiểm tra, thử nghiệm và đánh giá kết quả. 5. Dự kiến kết quả Đề xuất được giải pháp, xâydựng và đánh giá thành công hệthốnghỏiđáptựđộngvềchínhsách thuế. Viết các bài báo công bố kết quả nghiên cứu liên quan đến đề tài. 4 6. Ý nghĩa khoa học và thực tiễn Về mặt lý thuyết: - Tìm hiểu cơ sở lý thuyết liên quan đến đề tài. - Tìm hiểu và vận dụng các công cụ, ngôn ngữ và công nghệ liên quan. Về mặt thực tiễn: - Ứng dụng các công cụ, ngôn ngữ xâydựng được ứng dụng phần mềm. - Sản phẩm là hệthốnghỏiđáptựđộngvềchínhsáchthuế phục vụ cho các cán bộ làm công tác nghiệp vụ nâng cao kiến thức chuyên môn và hỗ trợ giải đáp những vướng mắc gặp phải của người nộp thuế khi đăng ký, kê khai nộp thuế. 7. Tên đề tài “Xây dựnghệthốnghỏiđáptựđộngvềchínhsáchthuế ” 8. Dự kiến bố cục luận văn Luận văn được chia thành ba chương với các nội dungchính của mỗi chương như sau: Phần mở đầu giới thiệu về lý do cần thiết để thực hiện đề tài, xác định mục đích, nhiệm vụ, đối tượng nghiên cứu, phương pháp nghiên cứu, cơ sở nghiên cứu và kết quả mong muốn đạt được. Chương 1 - cơ sở lý thuyết, trong chương này nghiên cứu các nội dung tổng quan vềhệthốnghỏiđáp và phương pháp tiền xử lý, phân loại câu hỏi. 5 Chương 2 - phân tích công tác tuyên truyền và hỗ trợ Người nộp thuế tại Cục thuế tỉnh Quảng Nam, hiện trạng công tác hỗ trợ giải đáp vướng mắc NNT trong các năm từ 2009 đến 2012. Chương 3 - tiến hành phân tích, thiết kế các chức năng, trình bày cách thức xâydựnghệthốnghỏiđápvềchínhsách thuế. 6 CHƯƠNG 1 CƠ SỞ LÝ THUYẾT 1.1. TỔNG QUAN HỆTHỐNGHỎIĐÁPTỰĐỘNG 1.1.1. Giới thiệu chung Khái niệm hệthốnghỏi đáp: Hệthống hỏi-đáp tựđộng (Question Answering System- QA) là một hệthống được xâydựng để thực hiện việc tìm kiếm câu trả lời cho một câu hỏi của người dùng. Hệthống hỏi-đáp tựđộng liên quan đến 3 lĩnh vực lớn là xử lý ngôn ngữ tự nhiên (Natural Language Processing-NLP), tìm kiếm thông tin (Information Retrieval-IR) và rút trích thông tin (Information Extraction-IE). Trong tìm kiếm thông tin, hỏiđáp làm nhiệm vụ tựđộng trả lời câu hỏi dưới dạng ngôn ngữ tự nhiên. Để tìm câu trả lời cho một câu hỏi, một chương trình máy tính có thể sử dụng một cơ sở dữ liệu tiền cấu trúc hoặc sử dụng một tập các văn bản ngôn ngữ tự nhiên. Nghiên cứu QA nhằm mục đích xử lý các loại câu hỏi: sự kiện, danh sách, định nghĩa, các câu hỏi như thế nào, tại sao, các câu hỏi mang tính giả thuyết, các câu hỏi hạn chế về ngữ nghĩa và câu hỏi sử dụng đa ngôn ngữ. 1.1.2. Phân loại hệthốnghỏiđáptựđộng Có nhiều cách phân loại hệthốnghỏiđáp dựa trên các tiêu chí khác nhau như: Phân loại theo miền ứng dụng. Phân loại theo khả năng trả lời câu hỏi. Phân loại theo hướng tiếp cận. 7 1.1.3. Kiến trúc chung hệthốnghỏiđáptựđộng Hình 1.2 Kiến trúc chung hệthốnghỏiđáp a. Giao diện người dùng (User Interface) b. Phân tích câu hỏi (Question Analyzer) c.Tìm kiếm dữ liệu (Data Retrieval) d. Rút trích câu trả lời (Answer Extraction) e. Chiến lược xếp hạng (Ranking) f. Xác minh câu trả lời (Answer Verification) 1.1.4. Các yêu cầu hệthốnghỏiđáp - Tính chính xác - Tính khả dụng - Tính hợp lý về thời gian - Tính hoàn chỉnh - Tính thích hợp của câu trả lời 8 1.2. XỬ LÝ DỮ LIỆU TRONG HỆTHỐNGHỎIĐÁP 1.2.1. Tiền xử lý dữ liệu a. Phân tích câu hỏi - Tạo ra các câu truy vấn thông tin làm cơ sở đáp ứng cho quá trình tìm kiếm tài liệu liên quan. - Xác định, phân loại câu hỏi giúp cho quá trình lựa chọn câu trả lời xác định đúng loại câu trả lời phù hợp. b. Phân tích câu hỏi trong ngôn ngữ tiếng Việt Việc phân tích câu hỏi bằng ngôn ngữ tự nhiên phụ thuộc rất nhiều vào đặc trưng ngôn ngữ của từng ngôn ngữ khác nhau. Khi phân tích câu hỏi tiếng Việt, khác với các câu hỏi tiếng Anh, chúng ta phải giải quyết: - Xác định ranh giới giữa các từ trong câu. - Nhiều từ mật độ xuất hiện cao nhưng không mang ý nghĩa cụ thể nào mà chỉ là những từ nối, từ đệm hoặc chỉ mang sắc thái biểu cảm như những từ láy. - Sự phong phú về nghĩa của một từ (từ đa nghĩa). - Các văn bản có nội dungchính là một vấn đề cụ thể, một đề tài nghiên cứu khoa học nhưng đôi khi trọng số của các từ chuyên môn này thấp so với toàn tập tài liệu. - Tồn tại nhiều bảng mã tiếng Việt đòi hỏi khả năng xử lý tài liệu ở các bảng mã khác nhau. 1.2.2. Tách từ a. Hướng tiếp cận dựa trên từ b. Hướng tiếp cận dựa trên kí tự 1.2.3. Tìm kiếm thông tin a. Các phương pháp b. Mô hình không gian vector (VSM)