NGHIÊN CỨU XÂY DỰNG HỆ THỐNG LƯU TRỮ VÀ QUẢN LÝ TÀI LIỆU
ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Lê Tiến NGHIÊN CỨU XÂY DỰNG HỆ TH Ố NG LƯU TRỮ VÀ QUẢN LÝ TÀI LIỆU KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY Ngành: Công Nghệ Thông Tin HÀ NỘI – 2009 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ • Lê Tiến NGHIÊN CỨU XÂY DỰNG HỆ THỐNG LƯU TRỮ VÀ QUẢN LÝ TÀI LIỆU KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY Ngành: Các hệ thống thông tin Cán bộ hướng dẫn: TS. Trần Minh o HÀ NỘI - 2009 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Lê Tiến NGHIÊN CỨU XÂY DỰNG HỆ TH Ố NG LƯU TRỮ VÀ QUẢN LÝ TÀI LIỆU KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY Ngành : Công Nghệ Thông Tin Cán bộ hướng dẫn: TS. Trần Minh HÀ NỘI – 2009 TÓM TẮT NỘI DUNG KHÓA LUẬN Trong thời đại công nghệ thông tin bùng nổ, máy vi tính đã đi đến tới hầu hết các cơ quan, tổ chức, cá nhân. Theo đó các tài liệu, giấy tờ, hợp đồng đã dần được chuyển sang lưu trữ dưới dạng tài liệu điện tử (Electronic Document). Công tác lưu trữ ra đời là do đòi hỏi khách quan đối với việc bảo quản và tổ chức sử dụng tài liệu. Việc xây dựng hệ thống lưu trữ và quản lý tài liệu là một vấn đề không dễ dàng đối với những người học công nghệ thông tin. Điều này càng trở nên khó khăn và phức tạp đối với những người không có chuyên môn về tin học. Yêu cầu bức thiết được đặt ra là phải có một hệ thống cho phép mọi người có thể nhanh chóng sử dụng để lưu trữ và quản lý tài liệu của họ. Hệ quản trị tài liệu (DMS – Document Management System) là một bước tiến trong quá trình xây dựng hệ thống . Nắm bắt được tình hình và nhu cầu của cơ quan, doanh nghiệp, tổ chức … em đã nghiên cứu xây dựng hệ thống lưu trữ và quản lý tài liệu. Đồng thời phát triển hệ thống đó cho phù hợp với việc lưu trữ và quản lý tại Viện Công Nghiệp Phần Mềm Và Nội Dung Số Việt Nam. Và hệ thống mã nguồn mở Alfresco đã được em chọn để làm hệ thống lưu trữ và quản lý tài liệu. Mục lục Mở đầu 1 Chương 1. Tổng quan về vấn đề lưu trữ và quản lý tài liệu 3 1.1. Vấn đề lưu trữ văn bản giấy 3 1.2. Ứng dụng công nghệ thông tin 5 1.3. Lưu trữ văn bản số 5 1.4. Tổng quan về hệ thống lưu trữ và quản lý tài liệu số (Document Management System) 7 1.4.1. Tổng quát hệ thống lưu trữ và quản lý tài liệu 7 1.4.2. Lịch sử hệ th ống lưu trữ và quản lý tài liệu 8 1.4.3. Thành phần hệ thống lưu trữ và quản lý tài liệu 8 1.5. Giới thiệu một số công nghệ và giải pháp 10 Chương 2. Xây dựng hệ thống lưu trữ và quản lý tài liệu dựa trên nền tảng Alfresco 12 2.1. Giới thiệu Alfresco 12 2.1.1. Tổng quan về Alfresco 12 2.1.2 Kiến trúc mở rộng 13 2.1.3 Thành phần kiến trúc cơ bản 15 2.1.4. Lợi ích của Alfresco 17 2.1.5. Sử dụng Alfresco cho quản lý tài liệ u 17 2.1.6. Tính năng của Alfresco 18 2.2. Xây dựng và cấu hình hệ thống 19 2.2.1. Hệ điều hành: Windows, Linux, UNIX, MacOS 19 2.2.2. Cơ sở dữ liệu: MySQL, Oracle, MS SQL Server 19 2.2.3. Ứng dụng Máy chủ: Tomcat, Jboss 20 2.2.4. Cài đặt trên Linux 20 2.2.5. Cấu hình 21 Chương 3. Lưu trữ và quản lý văn bản tại Viện Công Nghiệp Phần Mềm Và Nội Dung Số Việt Nam 22 3.1. Giới thiệu nhiệm vụ, chức năng của Viện 22 3.1.1. Giới thiệu 22 3.1.2. Vị trí, chức năng 23 3.1.3. Nhiệm vụ và quyền hạn 23 3.2. Bài toán hành chính tại Viện Công Nghiệp Phần Mềm và Nội Dung Số Việt Nam 25 3.2.1. Tổng quan 25 3.2.2. Phân tích các luồng công việ c tại Viện Công Nghiệp Phần Mềm và Nội Dung Số Việt Nam 26 3.2.2.1. Quản lý văn bản đến 26 3.2.2.2. Quản lý văn bản đi 29 3.3. Mô tả hoạt động quản lý tại Viện Công Nghiệp Phần Mềm và Nội Dung Số Việt Nam 31 3.3.1. Hoạt động trước đây 31 3.3.2. Hoạt động hiện nay 32 3.4. Cấu trúc lưu trữ tài liệu trên Alfresco của Viện Công Nghiệp Phần Mềm và Nội Dung Số Việt Nam 32 3.4.1. Hệ thống người dùng 32 3.4.2. Hệ thống thư mục cá nhân 33 3.4.3. Hệ thống thư mục Viện 34 3.4.3.1. Thư mục User Homes 34 3.4.3.2. Thư mục Văn Phòng 35 3.4.3.3. Thư mục P.Nghiên Cứu Phát Triển 36 3.4.3.4. Thư mục P.Dự Án 37 3.4.3.5. Thư mục P.Trung Tâm Đào Tạo Dịch Vụ 38 3.4.3.6. Các Thư mục Lãnh đạo, Thư mục Public, Thư mục Welcome To NISCI 39 3.5. Giới thiệu một quy trình xử lý 39 Chương 4. Phát triển và mở rộng hệ thống 42 4.1. Các công nghệ Việt Hóa 42 4.2. Cấu hình và tùy chỉnh hệ thống 43 4.2.1. Thuộc tính của văn bản đến 43 4.2.2. Thuộc tính của văn bản đi 45 4.2.3. Thuộc tính của hồ s ơ 46 4.3. Thực thi 46 4.3.1. Việt Hóa 46 4.3.2. Thuộc tính cho từng loại văn bản 50 4.3.2.1. Văn bản đến 50 4.3.2.2. Văn bản đi 54 4.3.2.3. Hồ sơ 57 Kết luận 61 Phụ lục 1 62 Phụ lục 2 66 Phụ lục 3 73 1 Mở đầu Chúng ta đang sống trong kỷ nguyên của nền kinh tế tri thức với sự ra đời và phát triển mạnh mẽ của Internet mà qua đó mọi người có thể dễ dàng tìm kiếm, khai thác và trao đổi thông tin. Làm thế nào để chúng ta có thể lưu trữ tài liệu cũng như quản lý, khai thác, trao đổi tài liệu khi số lượng tài liệu xuất hiện liên tục và ngày càng nhiều? Đây là câu hỏi lớn đang đặt ra cho các nhà quản lý. Trong quá trình hoạt động củ a con người, việc trao đổi thông tin trở thành nhu cầu không thể thiếu được. Thông tin được con người trao đổi với nhau bằng nhiều phương tiện khác nhưng chủ yếu nhất là bằng văn bản. Đặc biệt là khi nhà nước ra đời thì văn bản trở thành phương tiện không thể thiếu trong hoạt động quản lý và điều hành xã hội. Văn bản được sử dụng để ghi chép các sự kiện, hi ện tượng, truyền đạt các chỉ thị, mệnh lệnh, là căn cứ để truy cứu trách nhiệm … Chính vì thế, con người ngày càng nhận thấy rõ vai trò của văn bản. Họ đã biết giữ lại các văn bản, giấy tờ quan trọng để sử dụng khi cần thiết và văn bản đã trở thành tài sản quý báu để lưu truyền cho đời sau. Xã hội ngày càng phát triển, nhu cầu trao đổi thông tin c ủa con người ngày càng cao thì các hình thức văn bản ngày càng phong phú. Tuy nhiên, do bộ não con người có giới hạn, họ không thể nhớ nổi các thông tin đã được ghi chép lại. Con người cần nghĩ ra cách lưu giữ các giấy tờ đó. Công tác lưu trữ ra đời nhằm đáp ứng nhu cầu lưu giữ các văn bản, giấy tờ để phục vụ cho hoạt động của xã hội loài người. Trong hoạt động quản lý hàng ngày của cơ quan, có thể nói rằng, tài liệu lưu trữ luôn luôn được hình thành trong quá trình hoạt động của bất kỳ một cơ quan nào. Trong các cơ quan hiện nay, tài liệu lưu trữ có những vai trò sau: - Cung cấp chính xác các thông tin giúp cơ quan đề ra các chủ trương, chính sách, các biện pháp công tác phù hợp với pháp luật, phù hợp với thực tiễn và mang tính khả thi cao. - Cung cấp thông tin, số liệu, giúp các cơ quan xây dựng chương trình kế hoạch công tác ngắ n hạn, dài hạn. 2 - Cung cấp số liệu giúp cơ quan sơ kết, tổng kết tình hình hoạt động qua các giai đoạn khác nhau. - Giúp cơ quan giải quyết các vấn đề về chế độ chính sách đối với cán bộ, nhân viên (lương, phụ cấp, bảo hiểm, các chế độ công tác phí…). - Giúp các cơ quan giải quyết các nhu cầu chính đáng của công dân như nhu các nhu cầu về đất đai, nhà ở, tư pháp, hộ tịch … - Ngoài ra, tài liệu lưu trữ còn giúp cơ quan tổng kết, đánh giá quá trình hoạt động quan các thời kỳ lịch sử khác nhau, giúp cho mọi tầng lớp trong xã hội nhận biết một cách sâu sắc vai trò, vị trí và những thành tựu mà các cơ quan trong hệ thống chính trị ở nước ta đã làm được. Do đó, một hệ thống lưu trữ và quản lý tài liệu có ý nghĩa khoa học và thực tiễn rất lớn đối với một cơ quan, tổ chức, cá nhân ….Đối tượng nghiên cứu chính là việc xây dựng hệ thống này dự trên nền tảng Alfresco, nhằm mục đích xây dựng các dịch vụ lưu trữ, tìm kiếm hồ sơ, tài liệu cho các cơ quan, tổ chức, cá nhân thông qua Internet. Đạt được kết quả nghiên cứu như trình bày ở khóa luận sau đây, em xin được trân trọng cảm ơn sự giúp đỡ tận tình, có hiệu quả của thầy giáo hướng dẫn TS. Tr ần Minh, các thầy giáo trong Khoa Công Nghệ Thông Tin, thầy chấm phản biện, hội đồng chấm khóa luận và đặc biệt là các giáo viên giảng dạy bộ môn Các Hệ Thống Thông Tin đã quan tâm giúp đỡ và đóng góp các ý kiến quý báu cho em trong quá trình thực hiện khóa luận này. Do thời gian cũng như kiến thức còn có những hạn chế, trong khóa luận khó tránh khỏi còn có những thiếu sót nhất định, rất mong nhận được ý kiến đóng góp của các thầy cô giáo và toàn thể các bạn để luận văn có thể hoàn thiện hơn nữa. Xin chân thành cảm ơn! 3 Chương 1. Tổng quan về vấn đề lưu trữ, quản lý tài liệu 1.1. Vấn đề lưu trữ văn bản giấy Qua kết quả khảo sát tại Viện Công Nghiệp Phần Mềm và Nội Dung Số Việt Nam, số lượng công văn, hồ sơ lưu chuyển của một đơn vị trong một năm có thể từ một ngàn đến vài ngàn, tổng số lượng công văn lưu trữ của viện hàng năm lên tới chục ngàn hồ sơ, tài liệu, văn bản. Vấn đề ở đây là v ới số lượng như vậy dẫn đến tính lưu động thấp với sự đồ sộ, nặng nề của tài liệu giấy, khả năng truy cập, không dễ dàng tìm kiếm, có thể sắp xếp và đánh chỉ mục cho việc tìm kiếm nhưng tốn kém … Xét trong một phạm vi nhỏ, sự lưu trữ văn bản giấy không phải không có những ưu điểm như gi ấy giá thấp, ít tốn tiền, linh động, dễ di chuyển. Giấy là một người bạn, có thể đọc, viết … nhưng trong phạm vi qui mô lớn, giấy là thiết bị lưu trữ kém, đồ sộ mà mức độ thông tin thấp, khó tìm kiếm do thiếu sức mạnh của máy tính, không dễ dàng phân loại và phục hồi. Tài liệu giấy được lưu trữ dưới nhiều loại hình: - Tài liệu hành chính: Là loại hình tài liệu có nội dung ph ản ánh các hoạt động về tổ chức và quản lý của các cơ quan trên các mặt kinh tế, chính trị, văn hoá, khoa học và các lĩnh vực hoạt động khác. Tài liệu hành chính bao gồm bản gốc, bản chính các loại tài liệu, văn kiện như: Luật, Lệ, Chiếu, Chỉ, Sắc, Dụ, Tấu, Sớ, Chương, …; các loại sổ sách hình thành trong quá trình hoạt động của các cơ quan thuộc các triều đại phong kiến như: s ổ hộ tịch, sổ địa bạ, sổ duyệt tuyển. Ngày nay, tài liệu hành chính bao gồm các loại Hiến pháp, Luật, Pháp lệnh, Lệnh, Nghị quyết, Nghị định, Quyết định, Chỉ thị, Thông tư, Thông báo, Công văn, Kế hoạch, Báo cáo, Tờ trình, Biên bản … Đây là loại hình tài liệu có nội dung phong phú (chúng phản ánh tất cả các lĩnh vực của đời sống xã hội) và có khối lượng lớn nhất trong thành phần tài li ệu phông lưu trữ Quốc gia Việt Nam. Khối lượng tài liệu này ngày càng tăng lên theo sự phát triển của xã hội. - Tài liệu khoa học kỹ thuật: Là loại hình tài liệu phản ánh các công trình nghiên cứu khoa học và ứng dụng các thành tựu khoa học kỹ thuật vào thực tiễn sản xuất. Loại hình tài liệu này bao gồm các loại bản vẽ, bản thiết kế thi công các công trình xây dựng cơ bản; bản vẽ, bản thiết k ế chế tạo các sản phẩm công nghiệp; Các loại bản đồ, 4 đồ án; tài liệu khí tượng thuỷ văn; tài liệu điều tra thăm dò địa chất (Báo cáo khảo sát địa chất)… Đây là loại hình tài liệu chiếm khối lượng lớn thứ hai sau tài liệu hành chính và không ngừng tăng lên theo sự phát triển của Khoa học kỹ thuật. - Tài liệu nghe nhìn (TL ảnh, phim điện ảnh, ghi âm, hình, ): Là tài liệu được sản sinh ra trong hoạt động của các cơ quan văn hóa, thông tin tuyên truyền; các cơ quan quản lý nhà nước. Các cơ quan nghiệp vụ và các cơ quan nghiên cứu khoa học, những người chụp ảnh, quay phim nghiệp dư mà có giá trị khoa học, lịch sử và thực tiễn không kể thời gian, địa điểm sản sinh và trên những vật liệu gì mà nó mang tin, được nộp lưu vào các viện; các kho lưu trữ theo các chế độ nhất định thì gọi là tài liệu lưu trữ nghe nhìn. Tài liệu nghe nhìn là loại tài liệu đặc biệt cả về hình thức lẫ n nội dung mang tin, loại tài liệu này bao gồm: + Tài liệu ảnh + Tài liệu phim điện ảnh: + Tài liệu ghi âm: …. - Tài liệu điện tử. Theo Keneth Thibodeau (Giám đốc trung tâm lưu trữ tài liệu điện tử thuộc Lưu trữ Quốc gia Mỹ) thì: Tài liệu lưu trữ là tài liệu được bảo quản ở dạng đặc biệt chỉ có thể đọc, xử lý và in ra bằng máy vi tính. Trong cuốn “Thuật ngữ l ưu trữ quốc tế” do Hội đồng Lưu trữ Quốc tế xuất bản năm 1988 định nghĩa: Tài liệu điện tử được coi là một dạng tài liệu đọc bằng máy. Loại tài liệu này được lập ra dưới dạng mã hoá các vật mang tin như đĩa từ, băng từ, thẻ đục lỗ mà nội dung của chúng chỉ có thể tiếp cận được bằng máy vi tính. Như vậy có thể thấy rằng có nhiều khái niệm về tài liệu điện tử. Theo Tiến sĩ Nguyễn Cảnh Đương thì: Tài liệu lưu trữ điện tử là bộ phận tài liệu điện tử có giá trị như bản chính, phản ánh chân thực các hoạt động của cơ quan, tổ chức hoặc cá nhân được bảo quản với mục đích phục vụ nhu cầ u của xã hội trước mắt cũng như lâu dài. Hiện nay, tài liệu điện tử ở nước ta chưa nhiều nhưng trước những cơ hội và thách thức mới đang mở ra, ta đang bước đầu quan tâm đến lưu trữ tài liệu điện tử. Nó có ý nghĩa đối với việc thành lập chính phủ điện tử , giảm các phiền hà sai sót trong việc quản lý hành chính như cấp sổ đỏ, giấy đóng thuế … [...]... phần hệ thống lưu trữ và quản lý tài liệu Để giải quyết những vấn đề trên, một hệ thống lưu trữ và quản lý tài liệu phải bao gồm những thành phần sau: - Metadata thường được đính nhãn trong mỗi tài liệu Vd: Ngày tài liệu được lưu trữ, tên người dùng lưu trữ nó… - Tích hợp: Tích hợp các hệ thống quản lý tài liệu vào các ứng dụng khác, người sử dụng có thể tải các tài liệu trong hệ thống quản lý tài liệu, ... quan về hệ thống lưu trữ và quản lý tài liệu số (Document Management System) 1.4.1 Tổng quát hệ thống lưu trữ và quản lý tài liệu Một hệ thống quản lý tài liệu là một hệ thống máy tính (hoặc thiết lập bởi chương trình máy tính) được sử dụng để theo dõi và lưu giữ các tài liệu điện tử, các hình ảnh của các tài liệu giấy Thuật ngữ có một số liên quan tới các khái niệm về hệ thống quản lý nội dung và thường... quản lý tài liệu, hợp tác, hồ sơ quản lý, kiến thức quản lý, quản lý nội dung trang web, và hình ảnh Bạn có thể cấu hình và tuỳ chỉnh Alfresco đến địa chỉ doanh nghiệp yêu cầu Một lợi ích của Alfresco là sử dụng trong việc lưu trữ và quản lý tài liệu 2.1.5 Sử dụng Alfresco cho quản lý tài liệu Sử dụng Alfresco, bạn có thể thực hiện các giải pháp quản lý tài liệu như quản lý tài liệu doanh nghiệp, quản. .. thức, và Dịch vụ Web … 12 Hình 1 Sơ đồ tổng quan của Alfresco tích hợp với hệ thống bên ngoài Kho tài liệu là một máy chủ hoặc một tập hợp các dịch vụ được sử dụng để lưu trữ, tìm kiếm, truy cập, và kiểm soát tài liệu Kho tài liệu cung cấp các dịch vụ này để các ứng dụng tài liệu chuyên gia như quản lý tài liệu, hệ thống quản lý nội dung trang web, lưu trữ hình ảnh và quản lý hệ thống, quản lý hồ sơ,... các hệ thống đề quản lý tài liệu giấy Các hệ thống này quản lý tài liệu giấy, trong đó không chỉ bao gồm việc in và xuất bản các tài liệu, mà còn là hình ảnh, bản in … Sau đó, một hệ thống thứ hai đã được phát triển, để quản lý tài liệu điện tử, nghĩa là, tất cả những tài liệu, hoặc tác phẩm, được tạo ra trên máy vi tính, và thường được lưu trữ trên hệ thống tập tin địa phương của người sử dụng Hệ thống. .. tử, đánh chỉ mục, … Và phần quản lý lưu trữ gồm: Phần cứng: Hệ thống máy tính, mạng, máy chủ, máy khách Phần mềm: Các phần mềm quản trị hệ thống Vậy về cơ bản, phần quan trọng nhất của hệ thống lưu trữ và quản lý văn bản là công nghệ số hóa, hệ thống quản lý Giải pháp cho một hệ thống quản lý trên thế giới hiện nay thì có nhiều cách, nhưng mỗi một hệ thống đều có những ưu điểm và nhược điểm riêng của... thiếu của doanh nghiệp, quản lý nội dung và các hệ thống kỹ thuật số liên quan đến quản lý tài sản, tài liệu hình ảnh, văn bản, hồ sơ… Hệ thống quản lý tài liệu có thể quản lý nội dung một doanh nghiệp thông qua nhiều cách Có một số vấn đề liên quan trong quản lý tài liệu, cho dù là một hệ thống thông tin, quảng cáo, học tập thì đều phải có hình thức, cấu trúc, tăng cường hệ thống máy tính cho nhiều... liệu tài liệu hoặc từ ngữ lập chỉ mục từ nội dung tài liệu Kỹ thuật dùng ở đây là Index Topology - Kho lưu trữ: dùng để lưu trữ tài liệu điện tử Quản lý tài liệu được nhiều người dùng chung Các vấn đề quan trọng là nơi tài liệu được lưu trữ, trong thời gian bao lâu, lưu trữ từ một nơi này chuyển sang nơi khác, tiêu hủy tài liệu … - Khai thác, tìm kiếm: Khai thác các tài liệu điện tử được lưu trữ mặc... thường chỉ để lưu trữ - Bảo mật: Quan trọng trong nhiều ứng dụng quản lý tài liệu Tuân thủ các yêu cầu đối với một số tài liệu có thể khá phức tạp, phụ thuộc vào loại tài liệu đó Vd: Health insurance Portability and Accountability Act ra yêu cầu rằng các tài liệu y tế có 1 số yêu cầu về an ninh Một vài hệ thống quản lý văn bản có quyền quản lý module cho phép quản trị viên truy cập vào các tài liệu cơ bản... Nhưng nhược điểm dường như nó chỉ là một công cụ quản lý (chưa đạt tới mức hệ thống) , không gồm nhiều chức năng của một hệ thống quản lý tài liệu số đã nêu ở trên … LaserFiche: Hệ thống này cũng đã được tìm hiểu và phát triển bởi phòng Nghiên cứu và phát triển của Viện Ưu điểm của hệ thống này là phổ biến, chức năng khá đầy đủ của một hệ thống quản lý tài liệu Được nhiều nơi sử dụng Nhưng nhược điểm ở . quát hệ thống lưu trữ và quản lý tài liệu 7 1.4.2. Lịch sử hệ th ống lưu trữ và quản lý tài liệu 8 1.4.3. Thành phần hệ thống lưu trữ và quản lý tài liệu. Management System) 1.4.1. Tổng quát hệ thống lưu trữ và quản lý tài liệu Một hệ thống quản lý tài liệu là một hệ thống máy tính (hoặc thiết lập bởi chương