Công nghệ quản lý dữ liệu phi cấu trúc và ứng dụng phát triển hệ thống thông tin quản lý
1 Số hóa bởi trung tâm học liệu http://www.lrc.tnu.edu.vn/ ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN & TRUYỀN THÔNG Phạm Thu Trang CÔNG NGHỆ QUẢN LÝ DỮ LIỆU PHI CẤU TRÚC VÀ ỨNG DỤNG PHÁT TRIỂN HỆ THỐNG THÔNG TIN QUẢN LÝ LUẬN VĂN THẠC SỸ KHOA HỌC MÁY TÍNH Thái Nguyên - 2013 2 Số hóa bởi trung tâm học liệu http://www.lrc.tnu.edu.vn/ ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN & TRUYỀN THÔNG Phạm Thu Trang CÔNG NGHỆ QUẢN LÝ DỮ LIỆU PHI CẤU TRÚC VÀ ỨNG DỤNG PHÁT TRIỂN HỆ THỐNG THÔNG TIN QUẢN LÝ Chuyên ngành : Khoa học máy tính Mã số : 60 48 01 LUẬN VĂN THẠC SỸ KHOA HỌC MÁY TÍNH NGƯỜI HƯỚNG DẪN KHOA HỌC TS. Lê Văn Phùng Thái Nguyên - 2013 i Số hóa bởi trung tâm học liệu http://www.lrc.tnu.edu.vn/ , không . . 6 năm 2013 ii Số hóa bởi trung tâm học liệu http://www.lrc.tnu.edu.vn/ MỤC LỤC MỤC LỤC ii DANH MỤC CÁC TỪ VIẾT TẮT iv DANH MỤC HÌNH VẼ v MỞ ĐẦU 1 Chương 1: Tổng quan về công nghệ quản lý dữ liệu phi cấu trúc và hệ thống quản lý văn bản, điều hành trực tuyến………………………………………………………… 3 1.1. Tổng quan về các công nghệ quản lý dữ liệu phi cấu trúc 3 1.1.1. Khái niệm về tái kỹ nghệ 3 1.1.2. Qui trình chung tái kỹ nghệ phần mềm 7 1.1.3. Các công cụ trợ giúp quá trình tái kỹ nghệ phần mềm 19 1.1.4. Khái quát về dữ liệu phi cấu trúc và công nghệ quản lý dữ liệu phi cấu trúc… 23 1.2. Hệ thống quản lý văn bản và điều hành trực tuyến 29 1.2.1. Cấu trúc hệ thống quản lý văn bản và điều hành trực tuyến ……………… 30 1.2.2. Nghiệp vụ xử lý văn bản và điều hành trực tuyến………………………………30 Chương 2: Các công nghệ quản lý dữ liệu phi cấu trúc………………………… 35 2.1. Công nghệ của hãng Microsoft 35 2.1.1. Windows server…………………………………………………………………. 35 2.1.2. Công nghệ SQLServer của Microsoft 38 2.1.3. Công Nghệ ASP 42 2.2. Công nghệ mã nguồn mở 43 2.2.1. OS Linux…………………………………………………………………………… 43 2.2.2. My SQL…………………………………………………………………………….45 2.2.3. PHP…………………………………………………………………………………48 2.2.4. Apache…………………………………………………………………………… 50 iii Số hóa bởi trung tâm học liệu http://www.lrc.tnu.edu.vn/ 2.3. Công nghệ IBM-Lotus Domino 51 2.3.1. Tổng quan………………………………………………………………………….51 2.3.2. Các phần mềm trong hệ thống Lotus………………………………………… 52 Chương 3. Phát triển và cài đặt hệ thống quản lý văn bản và điều hành trực tuyến trên công nghệ IBM – Lotus Domino…………………………………………………….55 3.1. Những vấn đề đặt ra cần tiến hóa hệ thống 55 3.2. Lựa chọn giải pháp tái kỹ nghệ 56 3.3. Sơ đồ tiến trình thực hiện tái kỹ nghệ và quy trình phát triển hệ thống quản lý văn bản và điều hành trực tuyến 57 3.3.1. Từ mã nguồn của hệ thống chuyển sang mô hình trực quan………………….58 3.3.2. Từ mô hình trực quan cấu trúc lại chương trình……………………………… 60 3.3.3. Tái kỹ nghệ dữ liệu………………………………………………………………….62 3.3.4. Xây dựng mã nguồn…………………………………………………………………62 3.3.5. Hoàn thiện, cài đặt và sử dụng……………………………………………………62 3.4. Môi trường cài đặt 62 3.5. Kết quả đạt được và một số đánh giá 63 3.6. Hệ thống giao diện chương trình 63 KẾT LUẬN 71 a. Tiếng Việt 72 b. Tiếng Anh 72 c. Internet 72 iv Số hóa bởi trung tâm học liệu http://www.lrc.tnu.edu.vn/ DANH MỤC CÁC TỪ VIẾT TẮT CSDL : Cơ sở dữ liệu CV : Chuyên viên DMS : Document Management System HSCV : Hồ sơ công việc QLVB : Quản lý văn bản RUP : Rational Unified Process SQL : Structured Query Language UML : Unifield modeling language VB : Văn bản VP : Văn phòng v Số hóa bởi trung tâm học liệu http://www.lrc.tnu.edu.vn/ DANH MỤC HÌNH VẼ Hình 1.1 : Tái kỹ nghệ phần mềm Hình 1.2: Qui trình tái kỹ nghệ Hình 1.3: Chi phí tái kỹ nghệ Hình 1.4. Quy trình tái kỹ nghệ phần mềm Hình 1.5. Mô hình chung của tái kỹ nghệ phần mềm Hình 1.6: Qui trình dịch mã nguồn Hình 1.7: Tiến trình kỹ nghệ ngược Hình 1.8: Cấu trúc chương trình tự động Hình 1.9: Chuyển đổi dữ liệu Hình 1.10: Quá trình tái kỹ nghệ dữ liệu Hình 1.11: Kỹ nghệ chuyển tiếp và Tái kỹ nghệ phần mềm Hình 1.12: Dịch xuôi và dịch ngược trong UML Hình 1.13: Một bước lặp của quá trình tái thiết kế với xuất phát là mã nguồn Hình 1.14: Một bước lặp của quá trình tái thiết kế xuất phát là mô hình thiết kế Hình 3.1: Sơ đồ tiến trình tái kỹ nghệ “Hệ thống quản lý văn bản & điều hành trực tuyến” Hình 3.2: Từ mã nguồn của hệ thống chuyển sang mô hình trực quan Hình 3.3: Mô hình use case cho thấy các yêu cầu của hệ thống Hình 3.4: Mô hình use case cho quyền quản trị Hình 3.5: Mô hình use case cho quyền người dùng Hình 3.6: Biểu đồ tuần tự cho chức năng tìm kiếm Hình 3.7: Màn hình đăng nhập Hình 3.8: Màn hình cập nhật văn bản đến Hình 3.9: Màn hình cập nhật văn bản đi Hình 3.10: Biểu mẫu xuất văn bản đến Hình 3.11: Biểu mẫu xuất văn bản đi Hình 3.12: Giao diện trang chủ Hình 3.13: Giao diện tác nghiệp phụ Hình 3.14: Giao diện danh sách văn bản đến vi Số hóa bởi trung tâm học liệu http://www.lrc.tnu.edu.vn/ Hình 3.15: Giao diện chi tiết văn bản đến Hình 3.16: Giao diện danh sách văn bản đi Hình 3.17: Giao diện chi tiết văn bản đi Hình 3.18: Giao diện yêu cầu công việc Hình 3.19: Giao diện tìm kiếm văn bản Hình 3.20: Tìm kiếm toàn bộ văn bản Hình 3.21: Tìm kiếm theo sổ văn bản Hình 3.22: Tìm kiếm theo loại văn bản Hình 3.23: Tìm kiếm theo nơi gửi 1 Số hóa bởi trung tâm học liệu http://www.lrc.tnu.edu.vn/ MỞ ĐẦU Khoa học máy tính nghiên cứu về cơ sở lý thuyết thông tin, tính toán, thực hiện và ứng dụng trong các hệ thống máy tính. Khoa học máy tính có nhiều ngành con. Một số ngành nhấn mạnh vào việc tính toán các kết quả cụ thể trong khi đó một số ngành tập trung vào các thách thức trong cài đặt các tính toán. Cùng với sự ra đời và phát triển của hệ thống máy tính với tốc độ xử lý ngày càng mạnh thì ngành khoa học máy tính cũng phát triển theo với việc giải quyết càng nhiều các bài toán thực tiễn liên quan tới đời sống và kinh tế xã hội, nó trở thành cơ sở cũng như công cụ để giải quyết các bài toán cho các lĩnh vực khoa học khác như thống kê, quản trị… Công nghệ phần mềm phát triển nhanh chóng và đi sâu vào đời sống kinh tế xã hội với những ứng dụng thiết thực, cùng với sự bùng nổ thông tin làm cho một loạt các hoạt động luôn bị thay đổi và các yêu cầu thực tiễn của quản lý làm cho yêu cầu phần mềm cũng thay đổi theo và kèm theo đó là sự thay đổi phần mềm để đáp ứng với các yêu cầu thực tiễn trên cơ sở phần mềm cũ. Người ta gọi đó là tái kỹ nghệ phần mềm với mục tiêu kế thừa những tinh hoa của phần mềm cũ và cập nhật những thay đổi mới để giảm chi phí. Một trong những công cụ của việc tái kỹ nghệ là việc quản lý dữ liệu phi cấu trúc. Vấn đề đặt ra là tái kỹ nghệ sử dụng công cụ quản lý dữ liệu phi cấu trúc như thế nào để đảm bảo tính hiệu quả và khoa học. Chính vì thế luận văn của tôi với chủ để “Công nghệ quản lý dữ liệu phi cấu trúc và ứng dụng phát triển hệ thống thông tin quản lý” với mục tiêu nghiên cứu sâu hơn và làm rõ những mấu chốt trong việc sử dụng công nghệ quản lý dữ liệu phi cấu trúc trong tái kỹ nghệ phần mềm đồng thời ứng dụng nó vào việc tái kỹ nghệ phát triển hệ thống quản lý văn bản và điều hành trực tuyến cho Sở Y tế Bắc Kạn. Để thực hiện được mục đích này đề tại đặt ra những nhiệm vụ cần đạt được như sau: - Tìm hiểu khái quát về tái kỹ nghệ và các công nghệ sử dụng trong quá trình tái kỹ nghệ. - Nghiên cứu các công nghệ quản lý dữ liệu phi cấu trúc và khả năng ứng dụng của chúng. 2 Số hóa bởi trung tâm học liệu http://www.lrc.tnu.edu.vn/ - Ứng dụng một công nghệ quản lý dữ liệu phi cấu trúc là Lotus Domino của IBM để phát triển hệ thống quản lý văn bản và điều hành trực tuyến thông qua đổi mới cơ chế tìm kiếm thông tin. Luận văn gồm 3 chương: Chương 1. Tổng quan về các công nghệ quản lý dữ liệu phi cấu trúc và hệ thống quản lý văn bản, điều hành trực tuyến. Chương 2. Các công nghệ quản lý dữ liệu phi cấu trúc. Chương 3. Phát triển và cài đăt Hệ thống quản lý văn bản và điều hành trực tuyến dựa trên công nghệ IBM-Lotus Domino. [...]... TỔNG QUAN VỀ CÁC CÔNG NGHỆ QUẢN LÝ DỮ LIỆU PHI CẤU TRÚC VÀ HỆ THỐNG QUẢN LÝ VĂN BẢN, ĐIỀU HÀNH TRỰC TUYẾN 1.1 Tổng quan về các công nghệ quản lý dữ liệu phi cấu trúc 1.1.1 Khái niệm về tái kỹ nghệ Chikofsky và Cross đã định nghĩa tái kỹ nghệ là: “Kiểm tra, phân tích, biến đổi hệ thống phần mềm hiện thời để xây dựng lại thành một hệ thống mới, và bổ sung thêm một số thành phần mới vào trong đó” [6]... của hệ thống mới nhận được Trong điều kiện mà công nghệ thông tin thay đổi rất nhanh, nhu cầu tái thiết kế các hệ thông phần mềm là rất lớn, và tính khả chuyển trên đây có ý một nghĩa cực kỳ quan trọng trong triển khai thực tế 1.1.4 Khái quát về dữ liệ u phi cấ u trúc và công nghệ quả n lý dữ liệ u phi cấ u trúc 1.1.4.1 Khái niệm dữ liệu phi cấu trúc Dữ liệu phi cấu trúc thường dùng để chỉ dữ liệu. .. quá trình này Đặc tả hệ thống Hệ thống mới Thiết kế và thực thi Kỹ thuật dịch xuôi Hệ thống phần mềm hiện thời Hệ thống tái kỹ nghệ Hiểu và chuyển đổi Tái kỹ nghệ phần mềm Hình 1.1 : Tái kỹ nghệ phần mềm Sự khác biệt then chốt giữa tái kỹ nghệ và phát triển một hệ thống phần mềm mới chính là điểm xuất phát cho việc phát triển Đối với việc phát triển một hệ thống phần mềm mới, công việc sẽ bắt đầu với... trên cấu trúc Kiến trúc quản lý thông tin phi cấu trúc (UIMA) cung cấp một khuôn khổ chung cho xử lý thông tin này để trích xuất ý nghĩa và tạo ra cấu trúc dữ liệu về thông tin UIMA là viết tắt của phi cấu trúc kiến trúc quản lý thông tin Một tiêu chuẩn OASIS UIMA đến nay các tiêu chuẩn công nghiệp chỉ dành cho phân tích nội dung Kiến trúc UIMA ra đời do một yêu cầu thực tế: hiện nay các chương trình quản. .. việc quản lý và khai thác dữ liệu này Hình ảnh , video, email , tài liệu, văn bản, email,… là một ví dụ về dữ liệu phi cấu trúc Gần đây các nhà phân tích định lượng rằng dữ liệu sẽ tăng trưởng 800% trong vòng năm năm tới và thông tin dữ liệu phi cấu trúc chiếm hơn 70% đến 80% trong tất cả dữ liệu của các công ty, tổ chức Sự nhìn nhận này cho thấy sự bùng nổ về dữ liệu mà trong đó đa phần là dữ liệu phi. .. số sản phẩm từ các công ty như SAS, Provalis Research và Số hóa bởi trung tâm học liệu http://www.lrc.tnu.edu.vn/ 27 SPSS cũng như nhiều dịch vụ chuyên ngành như Attensity, Clarabridge và Sysomos tập trung vào việc phân tích dữ liệu phi cấu trúc của các mạng xã hội 1.1.4.3 Công nghệ quản lý dữ liệu phi cấu trúc Với sự bùng nổ của thông tin mà chủ yếu thông tin là các dữ liệu phi cấu trúc một cách nhanh... liệu phi cấu trúc như thách thức về lưu trữ dữ liệu phi cấu trúc với khối lượng lớn mà đảm bảo được việc truy xuất và tính mềm dẻo của hệ thống, đảm bảo được hiệu suất và khả năng mở rộng của dữ liệu phi cấu trúc, tính nhất quản của dữ liệu liên quan tới mối quan hệ chúng ta sẽ làm rõ nó trong phần sau Ngoài hệ điều hành và CSDL SQL Server mạnh thì Microsoft còn xây dựng công nghệ ASP Công nghệ này... đề phát triển dữ liệu Lưu trữ, tổ chức và định dạng của dữ liệu được xử lý bởi chương trình cũ phải được tiến hóa để phù hợp với những thay đổi của phần mềm Quá trình phân tích và tổ chức lại cấu trúc dữ liệu và đôi khi là cả giá trị của dữ liệu trong hệ thống làm cho nó trở nên dễ hiểu hơn được gọi là tái kỹ nghệ dữ liệu Nói chung, tái kỹ nghệ dữ liệu không cần thiết nếu như các chức năng của hệ thống. .. từ phát triển đến bảo trì phần mềm 1.1.2.5 Cấu trúc lại hệ thống Cấu trúc lại hệ thống là một giai đoạn quan trọng và rất cần thiết trong qui trình tái kỹ nghệ Cấu trúc lại hệ thống không chỉ đơn thuần là xây dựng lại cấu trúc cho hệ thống cũ, mà chúng ta phải thực hiện cải tiến lại hệ thống cũ, tạo ra một hệ thống mới phù hợp với môi trường hiện tại, cung cấp đầy đủ các tính năng mà hiện tại hệ thống. .. lý các khối lượng dữ liệu lớn cũng như các tính năng quản lý mail server, quản lý dữ liệu mail phục vụ cho quản lý của công ty tổ chức Ngoài ra hệ quản trị CSDL SQL Server là một hệ quản trị CSDL điển hình của Microsoft với các phi n bản khác nhau được nâng cấp để phù hợp với yêu cầu quản lý dữ liệu phi cấu trúc tiêu biểu là phi n bản 2008 với sự cải tiến vượt bậc giải quyết các thách thức của dữ liệu . các công nghệ quản lý dữ liệu phi cấu trúc và hệ thống quản lý văn bản, điều hành trực tuyến. Chương 2. Các công nghệ quản lý dữ liệu phi cấu trúc. Chương 3. Phát triển và cài đăt Hệ thống quản. lý dữ liệu phi cấu trúc và ứng dụng phát triển hệ thống thông tin quản lý với mục tiêu nghiên cứu sâu hơn và làm rõ những mấu chốt trong việc sử dụng công nghệ quản lý dữ liệu phi cấu trúc. TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN & TRUYỀN THÔNG Phạm Thu Trang CÔNG NGHỆ QUẢN LÝ DỮ LIỆU PHI CẤU TRÚC VÀ ỨNG DỤNG PHÁT TRIỂN HỆ THỐNG THÔNG TIN QUẢN LÝ Chuyên ngành