1. Trang chủ
  2. » Luận Văn - Báo Cáo

Tóm tắt luận văn Thạc sĩ: Nghiên cứu kho dữ liệu chuyên đề và ứng dụng trong việc trích rút thông tin quản lý án hình sự tại viện kiểm sát nhân dân tối cao

25 2 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 25
Dung lượng 2,09 MB

Nội dung

HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG - Nguyễn Thị Minh Huệ ĐỀ TÀI : NGHIÊN CỨU KHO DỮ LIỆU CHUN ĐỀ VÀ ỨNG DỤNG TRONG VIỆC TRÍCH RÚT THƠNG TIN QUẢN LÝ ÁN HÌNH SỰ TẠI VIỆN KIỂM SÁT NHÂN DÂN TỐI CAO Chuyên ngành: Khoa học máy tính MÃ Số: 60.48.01 TÓM TẮT LUẬN VĂN THẠC SĨ HÀ NỘI – 2012 Luậnvănđượchồnthànhtại: HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THÔNG Ngườihướngdẫnkhoahọc: PGS.TS Đỗ Trung Tuấn Phảnbiện 1: …………………………………………………………………………… …………………………………………………………………………… …………………………………………………………………………… Phảnbiện 2: ………………………………………………………………………… …………………………………………………………………………… …………………………………………………………………………… LuậnvănsẽđượcbảovệtrướcHộiđồngchấmluậnvănthạcsĩtạiHọcviệnCơngnghệBưuchín hViễnthơng Vàolúc: .giờ ngày tháng năm Cóthểtìmhiểuluậnvăntại: - ThưviệncủaHọcviệnCơngnghệBưuchínhViễnthơng MỞ ĐẦU u cầu có thơng tin nhanh chóng, xác phục vụ cho cơng việc khơng dễ có liệu ngày nhiều, lưu trữ phân tán nhiều nơi (phù hợp với tổ chức phân cấp đơn vị), nhiều dạng khơng tương thích với nhau, chí cịn dạng phi cấu trúc Nhiều hệ thống thơng tin xây dựng khơng tương thích với khơng tương thích với hệ thơng tin xây dựng Đến nay, phương pháp xây dựng kho liệu (Data Warehouse) phát triển lý thuyết thực tế Bên cạnh nhà cung cấp phần mềm đưa cơng cụ để xây dựng, trì phát triển kho liệu Trong môi trường cạnh tranh ngày với phát triển nhanh chóng giới, nhà định xác định rõ cần phải có hệ kỹ thuật cơng cụ tính tốn nhằm hỗ trợ họ việc trích xuất thơng tin hữu ích nhúng bên liệu thu thập tích luỹ Do việc nghiên cứu Kho liệu chuyên đề xem xét khả ứng dụng việc xử lý liệu cần thiết Hệ thống quan Viện kiểm sát tổ chức theo cấp hành Viện kiểm sát nhân dân cấp trang bị hệ thống ứng dụng nghiệp vụ toàn ngành Việc tập hợp quản trị liệu phạm vi toàn ngành để cung cấp cho q trình “phân tích, đánh giá, kiểm tra, giám sát, hỗ trợ định” tình hình tội phạm giai đoạn cần thiết Đề tài nghiên cứu lý thuyết, nắm phương pháp luận đưa phần thử nghiệm trích rút thơng tin theo u cầu tốn cụ thể Luận văn bao gồm ba phần:  Chương I, giới thiệu chung kho liệu  Chương II, cấu trúc kho liệu mơ hình liệu  Chương III, ứng dụng việc trích rút thơng tin quản lý án hình Viện kiểm sát nhân dân tối cao 2 CHƯƠNG GIỚI THIỆU CHUNG VỀ KHO DỮ LIỆU Trong chương này, luận văn nêu số khái niệm kho liệu 1.1 Về kho liệu Định nghĩa kho liệu: Có nhiều đinh nghĩa kho liệu, phổ biến định nghĩa kho liệu Bill Inmon: "Kho liệu tập hợp liệu hướng chủ đề, mang tính tích hợp, thay đổi, đơn vị liệu gắn với khoảng thời gian cụ thể Kho liệu thiết kế để hỗ trợ quản trị hệ hỗ trợ định" 1.1.1 Mục đích kho liệu Phải có khả đáp ứng yêu cầu thông tin người sử dụng Giúp cho tổ chức, xác định, quản lý điều hành dự án, nghiệp vụ cách hiệu xác Hỗ trợ để nhân viên tổ chức thực tốt, hiệu công việc như: có định hợp lý, nhanh, hiệu quả, thu lợi nhuận cao hơn… 1.1.2 Các lợi ích kho liệu Kho liệu sở liệu thiết kế đặc biệt cho nhu cầu liên quan đến việc hỗ trợ định Từ góc nhìn người dùng, kho liệu mang lại lợi ích sau:  Dữ liệu lưu trữ tập trung nơi  Thông tin cập nhật  Truy xuất nhanh  Khơng giới hạn kích thước  Dễ hiểu  Rõ ràng đồng  Dữ liệu chuẩn hoá 1.1.3 Sử dụng kho liệu Kho liệu sử dụng theo ba cách chính: Theo cách khai thác truyền thống, kho liệu sử dụng để khai thác thông tin công cụ vấn đáp báo cáo Các kho liệu sử dụng để hỗ trợ cho phân tích trực tuyến (OLAP) Trong ngôn ngữ truy vấn chuẩn SQL cơng cụ làm báo cáo truyền thống miêu tả có CSDL phân tích trực tuyến có khả phân tích liệu, xác định xem giả thuyết hay sai Người ta đưa phương pháp đáp ứng nhu cầu khoa học hoạt động thực tiễn, cơng nghệ khai phá liệu (Data Mining) Đây ứng dụng thứ ba kho liệu 1.2 Đặc điểm liệu kho liệu Theo định nghĩa Bill Inmon Kho liệu có đặc tính gồm: 1.2.1 Hướng chủ thể 1.2.2 Tích hợp 1.2.3 Ít thay đổi 1.2.4 Tích thời gian cụ thể 1.2.5 Dữ liệu chi tiết liệu tổng hợp 1.3 Nguyên lý Kiến trúc chung kho liệu thường gồm nhiều vùng chứa liệu nhỏ Những vùng chứa liệu phân loại dựa cấu trúc bao gồm : Vùng xử lí: Là vùng chứa liệu chuẩn bị cho việc biến đổi liệu thu từ nguồn trước chuyển qua vùng chứa liệu khác kho liệu Trong hình vẽ vùng viết tắt “STG” Vùng chứa liệu dạng chuẩn hoá: Là vùng chứa liệu trung gian sau biến đổi tích hợp từ nhiều nguồn khác Trong vùng này, liệu lưu trữ dạng chuẩn cao, thường dạng chuẩn Dữ liệu vùng sẵn sàng nạp vào vùng kho liệu đầu cuối mà không cần nhiều biến đổi phức tạp Trong hình vẽ vùng viết tắt “NDS” Vùng chứa liệu hoạt động: Là vùng chứa liệu dạng lai vùng liệu chuẩn hố sở liệu hoạt động Mục đích ngồi việc hỗ trợ cho việc nạp liệu vào kho liệu đầu cuối, dùng sở liệu hoạt động tập trung Kho liệu đầu cuối, gọi vùng liệu đa chiều: Là vùng kho liệu đầu cuối, phía người dùng Trong vùng này, liệu lưu trữ dạng mơ hình hố đa chiều nhằm hỗ trợ ứng dụng hay truy vấn dạng phân tích đầu cuối.Trong hình vẽ, vùng viết tắt “DDS”, “DW” hay “DWH” Kho liệu có nhiều loại kiến trúc Từ đơn giản nhất, gồm kho liệu đầu cuối, đến phức tạp, bao gồm nhiều kho liệu trung gian, sử dụng hệ thống lớn Tuy nhiên, hầu hết kiến trúc dựa kiến trúc chung phổ biến sau: 1.3.1 Kiến trúc DDS đơn Hình 3: Kiến trúc DSS đơn Kiến trúc DDS đơn dạng kiến trúc đơn giản kho liệu Kiến trúc có thành phần kho liệu trung tâm 4 1.3.2 Kiến trúc NDS DDS Đây kiến trúc phổ biến Kiến trúc tương tự kiến trúc DDS đơn, có thêm vùng chứa liệu trung gian vùng chứa liệu chuẩn hố NDS Hình 4: Kiến trúc NDS DDS 1.3.3 Kiến trúc ODS DDS Kiến trúc có nhiều điểm tương đồng với kiến trúc NDS DDS Vùng liệu hoạt động sở liệu dạng chuẩn hố cao Tuy nhiên, khơng lưu liệu lịch sử Vùng liệu hoạt động có cấu trúc nghiêng dạng sở liệu phục vụ giao tác (OLTP) nhiều Nó đóng vai trị sở liệu tập trung mà đó, ứng dụng đầu cuối cho phép khai thác Hình 5: Kiến trúc ODS DDS 1.3.3 Vùng xử lí Thơng thường, tất kiến trúc kho liệu, ln có vùng chứa liệu gọi vùng xử lí Dữ liệu chuyển từ nhiều nguồn vào vùng xử lí mà khơng thơng qua (hoặc ít) cơng đoạn xử lí Người ta nạp trực tiếp liệu từ nguồn vào kho liệu đầu cuối 5 Hình : Vùng xử lý 1.3.4 Cơ sở liệu chuẩn hố Hình 7: Mơ hình liệu chuẩn hóa Đối với kiến trúc NDS DDS, vùng chứa liệu dạng chuẩn hố, cịn gọi sở liệu chuẩn hố đóng vai trị sở liệu tập trung 1.3.5 Kho liệu đầu cuối Hình 8: Kho liệu đầu cuối Đây kiểu cấu trúc dựa mơ hình khối đa chiều Mỗi khối đa chiều bao gồm bảng kiện bảng chiều Dữ kiện độ đo, số liệu tính tốn từ chiều Cấu trúc liệu có đặc trưng phi chuẩn hố Đây đặc trưng quan trọng kho liệu mơ hình hố đa chiều 1.4 Kho liệu chun đề Kho liệu chuyên đề (DM) CSDL có đặc điểm giống với Kho liệu với quy mô nhỏ lưu trữ liệu lĩnh vực, chuyên ngành Datamart kho liệu hướng chủ đề Có thể chia làm loại: DM độc lập DM phụ thuộc Datamart phụ thuộc Datamart độc lập 1.5 Hệ hỗ trợ định 1.5.1.Khái niệm Hệ hỗ trợ định hệ thống thuộc Hệ thống thông tin quản lý (MIS), có nhiệm vụ cung cấp thơng tin hỗ trợ cho việc đề định cấp chiến lược chiến thuật trở nên dễ dàng, thuận tiện 1.5.2 Các thành phần hệ thống hỗ trợ định Hình 9: Các thành phần hệ thống hỗ trợ định Dữ liệu: trích lọc từ TPS hay MIS để diễn tả cho kiện liên quan đến vấn đề cần giải Mơ hình: dạng liệu đặc biệt dùng để mô tả khái quát đặc trưng quan trọng kiện, vấn đề mà không cần phải diễn tả lại tồn chi tiết Giá trị mơ hình để giảm bớt chi phí nghiên cứu mơ tả chi tiết cho vấn đề Tương tự database, modelbase lưu trữ mơ hình thống kê, tài chính, tốn học mà DSS sử dụng để thực tự động nhiều phân tích khác vấn đề để tìm lời giải Các phân hệ dựa vào kiến thức: Là máy suy diễn dựa quy tắc kiện biết (từ liệu, mơ hình sở kiến thức tổ chức) Máy tri thức trợ giúp thu thập lưu trữ sử dụng tri thức để hổ trợ tự động hoá việc phân tích, suy diễn, tổng hợp kiện hướng đến giải pháp cho vấn đề Giao diện người dùng: DSS sử dụng theo phương thức tương tác người – máy mức độ cao giải pháp cho toán bán cấu trúc cần tinh chỉnh bước từ phía người sử dụng Sự giao tiếp người - máy thuận tiện hiệu DSS cao nhiêu Người sử dụng: Người sử dụng DSS đóng vai trị cung cấp kiến thức, định cho hệ thống (tinh chỉnh giải pháp, chọn cách giải quyết) suốt trình tìm kiếm giải pháp 1.5.3 Phân loại hệ trợ giúp định Hệ xử lý tác vụ: mục đích Hệ xử lý tác vụ giữ cho việc ghi nhận giao tác xác Hệ thống xây dựng làm định đơn giản việc xác định liệu ghi nhận có hợp lệ hay khơng Hệ xử lý tác vụ làm cơng việc hợp lệ hóa trước ghi nhận giao tác để CSDL làm Hình 10: Phân loại Hệ thông tin quản lý Hệ trợ giúp định: bao gồm hệ thống thiết kế để trợ giúp nhà quản lý định Khác với hệ xử lý tác vụ phục vụ cho hoạt động hàng ngày, DSS phục vụ cho mục tiêu dài hạn cần đến vài ý kiến, phán đốn đóng góp từ chuyên gia Hiện DSS chia thành hai hướng Hướng dựa vào mơ hình theo xu hướng Hệ trợ giúp định cũ Loại Hệ trợ giúp định thứ hai loại Hệ trợ giúp định dựa vào liệu DSS chế vận hành MIS:  Điều khiển theo chu kỳ đóng, dựa quy tắc quản lý tổ chức thiết lập Quản lý dựa kênh thông tin nội  Điều khiển theo chu kỳ mở, dựa tiêu chuẩn độc lập với tổ chức Mơi trường có tham gia vào hoạt động quản lý 1.5.4 Năng lực hệ hỗ trợ định  Phù hợp cho cấp quản lý khác từ cao đến thấp  Phù hợp cho cá nhân lẫn nhóm  Hỗ trợ cho định tuần tự, liên thuộc, đưa lần, vài lần lặp lại  Hỗ trợ cho giai đoạn trình định tìm hiểu, thiết kế chọn lựa  Phù hợp cho số phong cách trình định Dễ dùng thân thiện với người dùng  Có thể tiến hóa theo thời gian  Nhằm vào nâng cao tính hiệu dụng (chính xác, thời gian tính, chất lượng) định thay tính hiệu (giá phí việc định)  Người định kiểm sốt tồn bước trình định, DSS trợ giúp, không thay người định 1.6 Các yêu cầu chức kho liệu Khả cân Khả quản trị Khả sẵn sàng Khả mở rộng Khả mềm dẻo Khả tích hợp Khả truy cập sử dụng Khả tin cậy 1.7 Kết luận Chương trình bày số khái niệm liên quan đến hệ thống trợ giúp định kho liệu, chuẩn bị cho xem xét chi tiết chương sau 9 CHƯƠNG CẤU TRÚC KHO DỮ LIỆU VÀ MƠ HÌNH DỮ LIỆU Chương trình bày cấu trúc cách lựa chọn để tiến hành xây dựng kho liệu Mặc dù lúc vậy, nên lựa chọn cấu trúc cho kho liệu trước bắt đầu tiến hành Cấu trúc định sửa đổi sau bắt đầu tiến hành 2.1 Các lựa chọn cấu trúc 2.1.1 Cấu trúc kho liệu tổng thể Cấu trúc liệu tổng thể trình bầy cấu trúc hỗ trợ cho tất cả, phần lớn đơn vị có nhu cầu kho liệu tích hợp đầy đủ với mức độ truy nhập cao sử dụng xuyên suốt ban ngành ngành nghề kinh doanh 2.1.2 Cấu trúc kho liệu chuyên đề độc lập Hình 13: Cấu trúc kho liệu chuyên đề độc lập Cấu trúc kho liệu chuyên đề độc lập có nghĩa kho liệu chuyên đề đứng độc lập điều khiển nhóm, phịng ban, ngành kinh doanh cụ thể xây dựng để đáp ứng nhu cầu 2.1.3 Cấu trúc Kho liệu chuyên đề phụ thuộc Một cấu trúc kho liệu chuyên đề phụ thuộc hệ thống kho liệu chuyên đề có trao đổi thông tin chặt chẽ Mặc dù kho liệu chuyên đề riêng biệt thực nhóm làm việc, ban ngành ngành nghề kinh doanh cụ thể, chúng tích hợp, liên kết với để tạo liệu có phạm vi rộng lớn toàn doanh nghiệp toàn công ty 2.2 Các lựa chọn thực 2.2.1 Thực từ xuống Thực từ xuống đòi hỏi phải lập kế hoạch công việc thiết kế hoàn thành trước bắt đầu dự án Việc thực từ xuống tạo xác định liệu thích hợp việc thực quy tắc kinh doanh xuyên xuốt đơn vị từ bắt đầu Tuy nhiên, chi phí cho việc lập kế hoạch thiết kế ban đầu tương đối đáng kể Nó q trình địi hỏi tiêu tốn nhiều thời gian làm trì hoãn hoạt động thực tế, lợi nhuận, đầu tư có lợi tức Phương thức quản lý từ xuống làm việc tốt kho có tổ chức IS tập trung chịu trách nhiệm cho tất hệ thống phần cứng 10 2.2.2 Thực từ lên Thực từ lên liên quan tới việc lập kế hoạch thiết kế kho liệu chuyên đề mà không cần chờ có hạ tầng tổng thể Điều khơng có nghĩa khơng triển khai hạ tầng tổng thể hơn; mà xây dựng dần theo kiều mở rộng kho liệu chuyên đề ban đầu Phương thức thực từ lên trở thành chọn lựa nhiều đơn vị, đặc biệt đơn vị quản lý kinh doanh, trình hồn vốn diễn nhanh Nó đem lại kết nhanh kho liệu chun đề có phần thiết kế phức tạp so với kho liệu tổng thể Thêm vào đó, việc thực ban đầu thường tốn phần cứng nguồn lực khác so với việc triển khai kho liệu tổng thể 2.2.3 Phương thức kết hợp Như vừa xem xét, có hai mặt tích cực tiêu cực cần phải cân nhắc thực phương thức từ xuống từ lên Trong nhiều trường hợp phương thức tốt kết hợp hai Điều phức tạp, với người quản lý dự án tốt làm Một chìa khóa phương thức định mức độ kế hoạch thiết kế cần thiết cho phương thức tổng thể để hỗ trợ cho việc tích hợp kho liệu chuyên đề xây dựng với phương thức từ lên Việc phát triển sở hạ tầng mức cho kho liệu tổng thể, từ ban đầu nên thận trọng mức kinh doanh 2.3 Mô hình liệu cho kho liệu Trong phần xét tới hai kỹ thuật xây dựng mô hình liệu bản: xây dựng mơ hình ER xây dựng mơ hình theo chiều Trong mơi trường OLTP, kỹ thuật xây dựng mơ hình ER lựa chọn qua thử thách Vói đời kho liệu, xuất yêu cầu cần có loại kx thuật để hỗ trọ cho môi trường phân tích liệu Mặc dù mơ hình ER sử dụng để hỗ trợ mơi trường kho liệu, quan tâm cách xây dựng mơ hình theo chiều nhằm đáp ứng nhiệm vụ gia tăng 2.3.1 Tại việc xây dựng mơ hình liệu quan trọng Theo cách truyền thống, người ta xây dựng mơ hình liệu phải sử dụng sơ đồ ER, phát triển phần quy trình xây dựng mơ hình liệu, phương tiện thông tin liên lạc với nhà kinh doanh - người sử dụng Đồ thị ER cơng cụ giúp phân tích yêu cầu kinh doanh thiết kế cấu trúc liệu sau Các bước tiếp cận khác mơ hình liệu: việc xây dựng mơ hình ER mơ hình chiều, có liên quan lại khác 2.3.2 Các kỹ thuật xây dựng mơ hình liệu Có hai loại kỹ thuật xây dựng mơ hình liệu thích hợp mơi trường kho liệu xây dựng mơ hình ER xây dựng mơ hình chiều Việc xây dựng mơ hình ER tạo mơ hình liệu lĩnh vực quan tâm định sử dụng hai khái niệm bản: thực thể mối quan hệ thực thể Các mơ hình ER chi tiết bao gồm thuộc tính, thuộc tính đặc tính thực thể đặc tính mối quan hệ 11 Việc xây dựng mơ hình theo chiều sử dụng khái niệm bản: cho phép đo, thực tế chiều Cả hai loại xây dựng mơ hình ER chiều sử dụng để tạo mơ hình trừu tượng chủ đề Mỗi loại có hạn chế khái niệm xây dựng mơ hình quy ước ký hiệu 2.3.3 Xây dựng mơ hình ER Các khái niệm : Mơ hình ER thể sơ đồ ER sử dụng biểu tượng đồ họa để hình thành khái niệm liệu: thực thể, mối quan hệ thuộc tính Hình 17: Ví dụ thực thể sơ đồ ER Trong xây dựng mơ hình ER, đặt tên cho thực thể quan trọng để hiểu thông tin liên lạc dễ dàng rõ Trong mơ hình ER chi tiết, nhiệm vụ quan trọng xác định từ định danh thực thể Từ gọi từ khóa gốc Bổ sung cho khái niệm xây dựng mơ hình ER bản, có khái niệm khác quan trọng: (i) Loại cha con; (ii) Thơng báo ràng buộc Hình 18 : Mơ hình thực thể loại cha (supertype & subtype) 2.3.4 Xây dựng mơ hình theo chiều Về phương diện đó, việc xây dựng mơ hình theo chiều đơn giản có ý nghĩa dễ hiểu so với xây dựng mơ hình ER Các khái niệm : Xây dựng mơ hình theo chiều kỹ thuật để tạo khái niệm hình dung mơ hình liệu tiêu chuẩn mô tả lĩnh vực kinh doanh chung Xây dựng mơ hình theo chiều có số khái niệm bản:  Sự kiện 12  Chiều  Tiêu chuẩn đánh giá (các biến số) Sự kiện : Sự kiện thu thập hạng mục liệu liên quan, bao gồm tiêu chuẩn đánh giá nội dung liệu Chiều: Chiều thu thập thành viên đơn vị loại để xem xét Những thao tác cho OLAP : Xây dựng mơ hình theo chiều chủ yếu hỗ trợ cho OLAP đưa định Có thao tác sử dụng OLAP để phân tích liệu Khi xét tới mức chi tiết khác nhau, thực thao tác drill down roll up Để duyệt chiều sử dụng thao tác lát mỏng kẻ ô vuông (slice dice) Drill down Roll up : Drill down Roll up thao tác dịch chuyển cách nhìn xuống lên xem mức phân cấp theo chiều Lát cắt kẻ ô vuông : Lát cắt kể vng thao tác để trình duyệt liệu qua khối lập phương Lát cắt cắt khối lập phương cho người sử dụng khối lập phương tới việc cảnh khác cho việc phân tích báo cáo sản xuất tháng định theo nhà máy theo sản phẩm, Mơ hình mơ hình bơng tuyết : Có hai loại mơ hình sử dụng xây dựng mơ hình theo chiều (i) Mơ hình sao; (ii) Mơ hình bơng tuyết Mơ hình : Giản đồ mơ hình trở thành thuật ngữ thơng dụng sử dụng bao hàm nghĩa mơ hình chiều Mơ hình bơng tuyết : Việc xây dựng mơ hình theo chiều điển hình bắt đầu việc xác định kiện chiều, sau yêu cầu kinh doanh thu thập Mơ hình bơng tuyết kết việc phân ly nhiều chiều, đơi tự có phân thành cấp 2.4 Kế hoạch xây dựng kho liệu Việc thiết kế kho liệu nên khởi đầu kiến trúc sơ xác định phạm vi dự án Các trình nghiệp vụ đối tượng ý phát triển nên xác định Một cách tiếp cận không khôn ngoan cố gắng phát triển đáp ứng " tất cả", phải nhiều năm hồn thành Thực tế cho thấy lý làm cho việc tạo dựng kho liệu bị thất bại Việc xác định trình nghiệp vụ đưa vào kho liệu mang lại hiệu chúng khả truy cập sử dụng liệu mức, mục tiêu thực thời gian thích hợp 2.5 Luồng liệu qua kho liệu Dữ liệu trích chọn từ nhiều nguồn liệu, chuyển đổi-nếu cần thiết, chuyển tải tới vị trí thích hợp kho lưu trữ liệu Các công cụ truy cập giúp sử dụng liệu kho liệu phục vụ cơng việc phân tích, hỗ trợ định câu hỏi truy vấn liệu, tạo báo cáo… 13 2.6 Các giai đoạn thiết kế kho liệu 2.6.1 Xác định mơ hình nghiệp vụ 2.6.2 Xác định mơ hình logic 2.6.3 Xác định mơ hình chiều 2.6.4 Xác định mơ hình vật lý 2.7 Kết luận Chương trình bày số mơ hình liệu sử dụng tổ chức kho liệu số đánh giá đối sánh Chương sau ứng dụng phân tích chương để xây dựng ứng dụng kho liệu phân tích liệu 14 CHƯƠNG TRÍCH RÚT THƠNG TIN ÁN HÌNH SỰ Chương thể ứng dụng vấn đề nêu tong chương trên, Viện kiểm sát nhân dân tối cao Ứng dụng đề cập trích rút liệu quản lí án hình Viện Kiểm sát Nhân dân Tối cao quan trực thuộc Quốc hội Việt Nam, có chức kiểm sát hoạt động tư pháp thực hành quyền công tố Nhà nước Hệ thống Viện kiểm sát tổ chức theo ba cấp cấp huyện, cấp tỉnh thành phố, cấp trung ương viện kiểm sát quân Hình 23: Trang web Viện 3.1 Nhu cầu xử lý liệu Viện kiểm sát nhân dân tối cao Ngoài việc thực báo cáo định kỳ theo tháng, tháng, năm, Viện kiểm sát tối cao cịn thực việc quản lý án hình qua t n g gia i đ oạ n nhằm nâng cao hiệu quản lý, xử lý vụ án hình sự, nắm tình hình khởi tố, truy tố, đình chỉ, tạm đình chỉ, xét xử sơ thẩm, phúc thẩm, giám đốc thẩm, thi hành án, Công tác quản lý án hình thực cách đầy đủ, chi tiết theo yêu cầu quản lý, đạo điều hành, giải án hình Viện kiểm sát nhân dân cấp Dữ liệu quản lý án hình ngành Kiểm sát nhân dân phục vụ cho hoạt động nghiệp vụ hàng ngày đơn vị giải án hình ngành, cho phép lãnh đạo đơn vị phân cơng, giao việc theo dõi tình hình, tiến độ thụ lý giải vụ án hình đơn vị Thơng qua hệ thống quản lý án hình trao đổi tra cứu thơng tin tội phạm để trích xuất thơng tin án hình từ ngành Cơng an (thơng tin kết điều tra, thông tin thi hành án, ) ngành Tịa án nhân dân (thơng tin kết xét xử), kế thừa thông tin mà nhập vào hệ thống Kho liệu tổng hợp án hình tồn ngành phục vụ việc cung cấp liệu chi tiết, đầy đủ án hình số vụ án, bị can qua giai đoạn kiểm sát điều tra, kiểm sát xét xử sơ thẩm, phúc thẩm, giám đốc thẩm….kết hợp với hệ thống thơng tin khác tồn ngành phục vụ việc trao đổi thông tin với ngành Cơng an, Tịa án kết xuất báo cáo chi tiết, báo cáo tổng hợp toàn ngành Kiểm sát nhân dân Thực tế nhu cầu xử lý liệu Viện kiểm sát nhân dân tối cao lớn với sở liệu lớn, nhiều tiêu báo cáo yêu cầu giải thời gian ngắn để đáp ứng yêu cầu công việc đặt hàng đầu 15 3.2 Hiện trạng sở liệu Viện Trong năm qua ngành Kiểm sát nhân dân bước xây dựng triển khai thực phần mềm ứng dụng vào lĩnh vực công tác, như: Tổng hợp báo cáo thống kê, quản lý danh sách tiêu, quản lý án hình sự, quản lý công văn đến, quản lý đơn khiếu tố, quản lý tài kế tốn, hệ thống thư điện tử, Phần mềm tổng hợp số liệu thống kê, quản lý danh sách tiêu triển khai diện rộng toàn quốc, từ cấp trung ương đến cấp tỉnh cấp huyện từ năm 2000, thay việc thu thập, tổng hợp số liệu, xây dựng gửi báo cáo thống kê theo phương pháp thủ cơng, góp phần nâng cao độ xác, tính kịp thời báo cáo thống kê Thực việc quản lý án hình mạng máy tính nhằm nâng cao hiệu quản lý, xử lý vụ án hình sự, nắm tình hình khởi tố, truy tố, đình chỉ, tạm đình chỉ, xét xử sơ thẩm, phúc thẩm, thi hành án,… Công tác quản lý án hình thực cách đầy đủ, chi tiết nhằm đáp ứng nhu cầu trao đổi thông tin, tổng hợp, báo cáo, phân tích, dự báo hỗ trợ định phục vụ công tác đạo, điều hành lãnh đạo Viện kiểm sát nhân dân cấp Kho liệu quản lý án hình ngành kiểm sát nhân dân gồm Dữ liệu quản trị, Dữ liệu vụ án, Dữ liệu đối tượng (bị can, bị cáo), Dữ liệu tạm giam, tạm giữ, liệu tội danh, liệu khác…được xây dựng hệ sở liệu Oracle Database 11g Release 3.3 Nhu cầu tích hợp liệu Viện trợ giúp định Hệ thống thông tin quản lý án hình hệ thống quan ngành Kiểm sát nhân dân dân Hệ thống không phục vụ công tác nghiệp vụ hàng ngày kiểm sát viên mà cịn phục vụ cơng tác quản lý giám sát điều hành khai thác tra cứu thông tin lãnh đạo Viện kiểm sát nhân dân cấp Dữ liệu nguồn hệ thống quản lý án hình lấy từ kho liệu Viện kiểm sát nhân dân tối cao bao gồm từ nhiều nguồn như: Dữ liệu quản trị, Dữ liệu vụ án, Dữ liệu đối tượng (bị can, bị cáo), Dữ liệu tạm giam, tạm giữ, liệu tội danh, liệu khác… Dữ liệu án hình hình thành kho liệu án dùng chung cho tất cấp Có chế độ bảo mật, phân quyền chặt chẽ để đảm bảo an toàn liệu Để đáp ứng yêu cầu lãnh đạo báo cáo nhanh, xác, liên tục, đảm bảo tính sẵn sàng cao, đáp ứng yêu cầu nghiệp vụ quản lý thống kê án hình cấp địi hỏi việc đồng hóa liệu thực cách tự động theo schedule, số liệu dùng cho hệ thống báo cáo (OLAP) kết xuất từ hệ thống sở liệu trực tuyến (OLAP) bao gồm thông tin vụ án, bị can, định liên quan, … Từ giúp cho lãnh đạo đơn vị theo dõi, kiểm sốt tình hình, tiến độ thụ lý, giải vụ án hình Đáp ứng nhu cầu trao đổi liệu với quan tố tụng Bộ công an, Tòa án nhân dân cấp Đưa dự báo cơng tác phịng chống tội phạm, phân tích tình hình tội phạm đánh giá hoạt động nghiệp vụ quan tiến hành tố tụng, Thực việc kiểm tra, theo dõi giám sát tiến độ thực vụ án 16 3.4 Đề xuất giải pháp theo tiếp cận kho liệu Dữ liệu nguồn hệ thống quản lý án hình lấy từ kho liệu Viện kiểm sát nhân dân tối cao bao gồm từ nhiều nguồn như: Dữ liệu quản trị, Dữ liệu vụ án, Dữ liệu đối tượng (bị can, bị cáo), Dữ liệu tạm giam, tạm giữ, liệu tội danh, liệu khác…Dữ liệu án hình hình thành kho liệu án dùng chung cho tất cấp Phần ứng dụng toán yêu cầu đưa báo cáo danh sách vụ qua qua giai đoạn vụ án, khoảng thời yêu cầu cụ thể Cơ sở liệu sử dụng Oracle Sử dụng cơng cụ Data Stage cho q trình ETL Dùng công cụ BI xử lý liệu đưa báo cáo Mơ hình mơ tả kiến trúc data warehouse Viện kiểm sát nhân dân tối cao Data Repositories Phân tích Database Data Mart Data Warehouse Database BI ETL Data Mart Báo cáo Hình 26: Kiến trúc Data warehouse hệ thống quản lý hình Quá trình tạo DM : Định nghĩa nguồn liệu Các bảng quan hệ file Định nghĩa đối tượng kho liệu theo mơ hình bơng tuyết, sử dụng cơng cụ Oracle BI thiết kế Dimension table Làm sạch, chuẩn hóa liệu (q trình ETL) cơng cụ Data Stage Tạo Data model Định nghĩa Data model Tạo report chọn data model thích hợp để đưa báo cáo 3.5 Thử nghiệm đánh giá kết Luận văn thử nghiệm số khía cạnh :  Thử nghiệm sở liệu Viện kiểm sát nhân dân tối cao  Dữ liệu nguồn lấy từ bảng thực thể : SPP_REGISTER, LST_SPP, LST_LAW, SPP_DECISION, …  Cơ sở liệu sử dụng Oracle Sử dụng cơng cụ Data Stage cho q trình ETL Dùng cơng cụ BI xử lý liệu đưa báo cáo 17 Hình 27: Mơ hình qua hệ thực thể DM quản lý án hình Hình 28: Mơ hình bơng tuyết 18 Hình 29: Mơ tả q trình ETL Quá trình tạo job lấy liệu từ hệ thống nguồn Login vào hệ thống DataStage Tạo job lấy liệu từ hệ thống nguồn a Từ File bạn chọn New b Chọn Server job c Nhấn OK Hình 30: Tạo job lấy liệu từ hệ thống nguồn Từ Palete bạn chọn biểu tượng sau 19 a Database ODBC b Tranformer Sau nối chúng lại với Hình 31: Chọn biểu tượng kết nối Kết nối ODBC nguồn với hệ thống nguồn cần lấy liệu, kết nối ODBC đích với hệ thống đặt liệu đích Hình 32: Kết nối tới hệ thống nguồn 20 Hình 33: Kết nối tới hệ thống đích Lấy liệu từ hệ thống nguồn (Trường hợp ta lấy liệu bảng SPP_DECISION) Hình 34 : Lấy liệu từ hệ thống nguồn 21 Đẩy liệu vào hệ thống đích Hình 36 : Đẩy liệu vào hệ thống đích Q trình đẩy liệu từ hệ thống nguồn đích thơng qua Transformer (Có thể lọc liệu thơng qua Transformer) Hình 37: Q trình đẩy hệ thống nguồn đích Sau tạo xong job dùng phải Compile để chạy job Sau Compile job thực Run job Quá trình tạo báo cáo Tạo data model theo tiêu chí báo cáo Định nghĩa data model Tạo báo cáo từ data model 22 Hình 46: Quá trình kéo báo cáo BI Hình 49 : Kết hiển thị báo cáo vụ án qua giai đoạn Công cụ có khả kết xuất liệu word, excel,… để đáp ứng khả khai thác đầu linh hoạt 23 Kết luận Đề tài thực việc trích rút liệu vụ án trải qua giai đoạn từ kho liệu quản lý án hình Viện kiểm sát nhân dân tối cao, nhiên để đáp ứng đuợc trình khai thác liệu phục vụ cơng tác phịng chống chống tội phạm, quản lý đạo, điều hành lãnh đaọ Viện kiểm sát nhân dân cấp nhanh chóng, xác, hiệu cần có phân tích mang tính chuyên sâu cho người dùng Trong khi, báo cáo thường xuyên chưa đáp ứng u cầu phân tích Do việc khai phá liệu để tìm kiếm tri thức, dự đoán xu hướng hỗ trợ định trở thành nhu cầu cần thiết việc phân tích liệu Khóa luận cần phát triển thêm để trích rút nhiều thơng tin cần thiết phục vụ cho công tác ngành kiểm sát nhân dân

Ngày đăng: 13/01/2024, 02:06

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w