Bài báo mô tả quá trình xây dựng một trang web quản lí báo cáo số liệu nuôi trồng thủy sản trên địa bàn tỉnh Trà Vinh. Trên đó, một kho dữ liệu được xây dựng để hỗ trợ cho việc phân tích và trực quan hóa số liệu nhằm đưa ra các báo cáo và biểu đồ hỗ trợ cho việc nắm bắt tình hình nuôi trồng thủy sản và ra quyết định của các cấp quản lí.
TẠP CHÍ KHOA HỌC TRƯỜNG ĐẠI HỌC TRÀ VINH, SỐ 28, THÁNG 12 NĂM 2017 ỨNG DỤNG KHO DỮ LIỆU VÀ TRỰC QUAN HĨA DỮ LIỆU TRONG QUẢN LÍ SỐ LIỆU NUÔI TRỒNG THỦY SẢN TẠI TRÀ VINH APPLIED DATA WAREHOUSE AND DATA VISUALIZATION IN AQUACULTURE DATA MANAGEMENT IN TRA VINH PROVINCE Nguyễn Bảo Ân1 , Nguyễn Nhứt Lam2 , Hà Thị Thúy Vi3 Tóm tắt – Bài báo mơ tả q trình xây dựng trang web quản lí báo cáo số liệu nuôi trồng thủy sản địa bàn tỉnh Trà Vinh Trên đó, kho liệu xây dựng để hỗ trợ cho việc phân tích trực quan hóa số liệu nhằm đưa báo cáo biểu đồ hỗ trợ cho việc nắm bắt tình hình ni trồng thủy sản định cấp quản lí Hệ thống xây dựng với công nghệ NET, hệ quản sở liệu Microsoft SQL Server 2014, kĩ thuật phân tích liệu OLAP Microsoft SQL Analysis Services 2014, Reporting services 2017 tiện ích OLAP Microsoft Excel 2013 I MỞ ĐẦU Trà Vinh tỉnh ven biển thuộc Đồng sơng Cửu Long Trà Vinh có lợi lớn nơng nghiệp nói chung ni trồng thủy sản nói riêng Hiện nay, loại thủy sản nuôi trồng địa bàn tỉnh đa dạng gồm: tôm sú, tôm thẻ chân trắng, tôm xanh, cua biển, cá lóc, cá tra, cá nước loại, nghêu, Hình thức ni đa dạng bao gồm nuôi công nghiệp, thâm canh, bán thâm canh, quảng canh; tơm sú tơm xanh cịn có hình thức ni kết hợp tơm rừng (ni rừng ngập mặn), tôm lúa (nuôi tôm kết hợp với lúa), tôm cá (nuôi tôm kết hợp với cá), tôm cua (nuôi tôm kết hợp với nuôi cua) Tuy nhiên, với xu hướng tăng trưởng quy mô thả nuôi, thiệt hại nuôi thủy sản năm gần tăng dần, đặt nhu cầu chiến lược quản lí lãnh đạo ngành thủy sản nói riêng ngành nơng nghiệp nói chung Nhiệm vụ quản lí số liệu thủy sản giao cho Chi cục Thủy sản trực thuộc Sở Nông nghiệp Phát triển Nông thôn tỉnh Việc báo cáo số liệu thực theo chu kì tuần, tháng, quý năm theo chế phân cấp: cấp xã báo cáo lên cấp huyện, cấp huyện báo cáo lên cấp tỉnh Công tác tổng hợp báo cáo cấp xã thực cán nông nghiệp xã, cấp huyện thực cán Phịng Nơng nghiệp huyện, cấp tỉnh thực cán kĩ thuật Chi cục Thủy sản Với quy trình nay, cán phụ trách báo cáo số liệu chưa trang bị phần mềm chuyên dụng nên tất số liệu nhập tính tốn phần mềm Microsoft Excel, sau Từ khóa: kho liệu, OLAP, trực quan hóa, thủy sản Trà Vinh Abstract – This paper introduces an information system developed to maintain data management and reporting on aquaculture in Tra Vinh province A data warehouse was also built for data analysis and visualization in order to produce general reports and charts that help the managers in decision making The proposed system was built using NET technology, Microsoft SQL Server 2014 DBMS, Microsoft SQL Analysis Services and OLAP features of Microsoft Excel 2013 Keywords: data warehouse, OLAP, data visualization, Tra Vinh aquaculture 1,2,3 Bộ môn Công nghệ Thông tin, Khoa Kỹ thuật Công nghệ, Trường Đại học Trà Vinh Email: annb@tvu.edu.vn Ngày nhận bài: 26/10/2017; Ngày nhận kết bình duyệt: 05/12/2017; Ngày chấp nhận đăng: 29/12/2017 64 TẠP CHÍ KHOA HỌC TRƯỜNG ĐẠI HỌC TRÀ VINH, SỐ 28, THÁNG 12 NĂM 2017 đó, cán lập báo cáo văn dựa vào số liệu tập tin excel để báo cáo lên cấp qua e-mail Sau nhận e-mail báo cáo, cán phụ trách số liệu cấp tính tốn tổng hợp số liệu lại từ tất địa phương trực thuộc excel tiếp tục soạn thảo văn báo cáo dựa vào số liệu tính tốn Một số hạn chế quy trình hành liệt kê sau đây: i) gây thời gian, có nguy chậm trễ việc gửi báo cáo cho Ủy ban Nhân dân tỉnh Tổng cục Thủy sản; ii) gây sai sót số liệu thống kê, số liệu địa phương lưu trữ tập tin excel rời rạc, nên tổng hợp thủ công số liệu từ nhiều tập tin việc làm nhàm chán, dễ gây sai sót khơng dễ thực hiện; iii) lưu số liệu không giúp trả lời câu hỏi so sánh, xu hướng, (ví dụ: ba tháng vừa qua, diện tích ni trồng thủy sản huyện Cầu Ngang tăng hay giảm, so với kì năm trước nào?); iv) để nắm tình hình chung diện tích thả ni, số lượng giống, số lượng thu hoạch, số lượng thiệt hại, tình hình dịch bệnh, cán quản lí cấp huyện, cấp tỉnh phải đọc hết tất báo cáo văn tự tổng hợp thơng tin tính toán từ hàng chục tập tin excel rời rạc khơng có phương tiện trực quan biểu đồ, dashboard, để trợ giúp định Trước vấn đề trên, nhằm nâng cao hiệu chất lượng công tác báo cáo số liệu nuôi trồng thủy sản tỉnh nhà, xây dựng hệ thống báo cáo số liệu trực tuyến kết hợp công nghệ data warehouse (kho liệu) trực quan hóa liệu cho công tác báo cáo số liệu địa tỉnh Trà Vinh II KHOA HỌC CÔNG NGHỆ - MÔI TRƯỜNG dịch trực tuyến (OnLine Transaction Processing – OLTP), kho liệu lại hỗ trợ cho thao tác phân tích liệu trực tuyến (OnLine Analytical Processing – OLAP) Các sở liệu dành cho OLTP thường hỗ trợ tác vụ xử lí liệu thường xuyên xảy trình hoạt động hệ thống nên liên tục có thao tác đọc, ghi cập nhật liệu thường xuyên, chẳng hạn giao dịch ngân hàng, hệ thống thương mại điện tử, Vì thế, sở liệu OLTP thường phải chuẩn hóa (normalized) để tối ưu hiệu truy vấn cập nhật, phải ln bảo đảm tính qn khả khôi phục liệu Trái lại, xây dựng nhằm mục tiêu phân tích liệu lịch sử để hỗ trợ định [2] nên kho liệu khơng tập trung vào tính cập nhật tức thời liệu mà tối ưu hóa thao tác truy vấn cần tính tốn dựa số lượng lớn ghi, để trả lời truy vấn mang tính tổng hợp, ví dụ: tổng doanh thu năm gần cao hay thấp so với năm trước Chi tiết so sánh OLTP OLAP thể Bảng 2) Kiến trúc kho liệu: Kiến trúc kho liệu, xét theo tính năng, chia thành ba tầng: tầng đáy – data warehouse server, tầng trung gian – OLAP server, tầng đỉnh – công cụ đầu cuối (front-end tools) [3] Khi có lượng lớn liệu cần đưa vào kho, người ta dùng công cụ ETL (Extract – Transform – Load) để trích chọn liệu từ nhiều nguồn, trích chọn chuyển định dạng liệu định dạng thống nạp vào kho Về mặt vật lí, kho liệu sở liệu thiết kế đặc biệt (theo lược đồ hình bơng tuyết) để đáp ứng nhu cầu tính tốn truy vấn với số lượng lớn Một kho liệu bao gồm nhiều data mart, tức tập hợp liệu có giá trị với nhóm người dùng định Dữ liệu kho xử lí qua công cụ OLAP để kết xuất kết cho công cụ đầu cuối truy vấn, báo cáo, phân tích khai thác liệu Mơ hình kiến trúc kho liệu thể Hình TỔNG QUAN NGHIÊN CỨU A Kho liệu 1) Định nghĩa: Từ năm 1970, Bill Inmon, cha đẻ thuật ngữ kho liệu (data warehouse) định nghĩa kho liệu tập hợp liệu tương đối ổn định (không hay thay đổi), cập nhật theo thời gian, tích hợp theo hướng chủ đề sử dụng chủ yếu việc hỗ trợ trình định mặt quản lí [1] Về mặt vận hành, kho liệu thường trì tách biệt với sở liệu hệ thống Trong sở liệu hệ thống thường hỗ trợ xử lí giao B Data cube OLAP Một kho liệu hình thành dựa mơ hình liệu đa chiều, mơ hình thể 65 TẠP CHÍ KHOA HỌC TRƯỜNG ĐẠI HỌC TRÀ VINH, SỐ 28, THÁNG 12 NĂM 2017 KHOA HỌC CÔNG NGHỆ - MÔI TRƯỜNG Bảng So sánh OLTP OLAP Tiêu chí OLTP (Online Transaction Processing) Người dùng Nhân viên, phận IT, khách hàng hàng ngàn người Dữ liệu nguồn Được nhập liệu thường xuyên người dùng cuối Dữ liệu chi tiết tới nghiệp vụ Mục đích liệu Phản ánh liệu Để kiểm soát chạy nghiệp vụ kinh tế bản, thiết yếu xảy hàng ngày Phục vụ người dùng cấp hoạt động doanh nghiệp Cho thấy ảnh chụp nhanh trình kinh doanh liên tục Thêm sửa liệu Thêm, sửa nhanh chóng tạo người dùng cuối cấp hoạt động, số lượng lớn giao dịch (insert, update, delete) thời gian ngắn Truy vấn Liên quan đến truy vấn bản, số lượng dịng liệu trả Tốc độ xử lí Thường nhanh vài giây Không gian lưu trữ Tương đối nhỏ liệu lịch sử cắt giảm lưu trữ thích hợp (trăm MB - GB) Thiết kế database Sao lưu phục hồi liệu Mơ hình thiết kế theo mơ hình quan hệ thực thể, sở liệu thiết kế cho hệ thống thường chuẩn hóa Dữ liệu hoạt động quan trọng với hoạt động nên phải bảo trì lưu cẩn thận, việc liệu đồng nghĩa với việc thời gian, tiền bạc công sức nhập liệu, trách nhiệm pháp lí OLAP (Online Analysis Processing): Chuyên viên phân tích liệu, phận định vài chục đến vài trăm người Dữ liệu hợp Thường lưu trữ dạng tính tốn, có tính lịch sử theo mơ hình đa chiều (multi-dimensional) Phục vụ mục đích lập kế hoạch, giải vấn đề, hỗ trợ định Phục vụ cho cấp bậc quản lí chiến lược Số liệu cung cấp góc nhìn đa chiều hoạt động kinh doanh doanh nghiệp Chạy theo chu kì, theo lơ lớn giao dịch, vào định để tập hợp, tính tốn làm liệu Số lượng tương đối thấp giao dịch Thường có nhiều truy vấn u cầu tính tốn tổng hợp liệu Thường truy vấn với câu truy vấn tính tốn phức tạp dựa khối lượng liệu lớn Phụ thuộc vào khối lượng liệu cần xử lí Một lần xử lí lơ query để tập hợp tính tốn liệu kéo dài hàng Thường lớn, tồn liệu tổng hợp mang tính lịch sử, cần nhiều mục so với OLTP (trăm GB - TB) Thường khơng cần chuẩn hóa, table Thường theo lược đồ hình bơng tuyết Khi mát liệu xảy ra, nhiều hệ thống OLAP thường load lại liệu từ nguồn liệu gốc hệ thống OLTP giải pháp phục hồi liệu (Nguồn: Data Mining: Concepts and Techniques [2]) liệu dạng data cube (khối liệu) Một data cube cho phép mơ hình hóa xem liệu nhiều chiều, mơ hình liệu đa chiều có hai loại bảng: i) bảng chiều (dimension table): thể thông tin chiều liệu, ví dụ: thời gian (ngày, tháng, năm), địa điểm (thành phố, vùng, quốc gia), ; ii) bảng fact (fact table) chứa thuộc tính quan tâm (measures) cube số lượng bán ra, tổng thành tiền bán ra, khóa ngoại liên kết với bảng chiều Hình 2a ví dụ kết hợp chiều kho liệu hệ thống thương mại điện tử có bốn chiều: thời gian (time), sản phẩm (item), vị trí (location) nhà cung cấp (supplier) Hình 2b thể data cube với ba chiều thời gian, sản phẩm vị trí, measure số lượng bán Trong sở liệu OLAP, thao tác sử dụng nhiều là: roll-up (cuộn lên), drill-down (khoan xuống), slice and dice (cắt lát) pivot (quay) Trong đó, roll-up thao tác loại bỏ chiều khỏi cube, số liệu Hình 1: Kiến trúc tầng kho liệu (Nguồn: An Overview of Data Warehousing and OLAP Technology) 66 TẠP CHÍ KHOA HỌC TRƯỜNG ĐẠI HỌC TRÀ VINH, SỐ 28, THÁNG 12 NĂM 2017 KHOA HỌC CÔNG NGHỆ - MƠI TRƯỜNG chiều cho kho liệu nơng nghiệp, Hầu hết nghiên cứu xây dựng kho liệu cho lĩnh vực nông nghiệp nhằm đưa mơ hình hệ thống mơ hình sở liệu để tích hợp liệu nông nghiệp khứ vào kho liệu, sau sử dụng cơng cụ phân tích liệu trực tuyến (OLAP) khai khoáng liệu (data mining) để rút trích mẫu, tri thức tiềm ẩn bên liệu mà người sở hữu liệu khó đúc kết, mường tượng thiếu cơng cụ, từ sử dụng tri thức cho việc hỗ trợ định Đối với nước, hệ thống báo cáo số liệu trực tuyến quan nhà nước Hệ thống nhiều quan, ban ngành triển khai Tuy nhiên, thao tác tích hợp liệu vào data warehouse trực quan hóa liệu, hỗ trợ lãnh đạo định cho nghiệp vụ chưa quan tâm mức Trong lĩnh vực nông nghiệp, Trường Đại học Cần Thơ thực đề tài có phạm vi nghiên cứu rộng hệ thống thơng tin hỗ trợ phịng chống dịch bệnh trồng thủy sản cho vùng kinh tế trọng điểm [6] Đề tài đưa nhiều giải pháp cổng thông tin, hệ thống báo cáo, phân tích liệu trực tuyến (OLAP), web ngữ nghĩa để dự đoán, chẩn đoán bệnh lúa bệnh thủy sản, hệ thống thơng tin địa lí (GIS), mơ phỏng, Mục đích đề tài nhằm đưa giải pháp tổng thể hệ thống thông tin xử lí dịch bệnh nơng nghiệp khơng nhằm phục vụ cho cơng tác quản lí số liệu quan nhà nước Năm 2012, Phan Quốc Nghĩa [7] đề xuất xây dựng mơ hình sở liệu đa chiều phân tích OLAP tình hình dịch bệnh lúa Trà Vinh Năm 2013, Sở Nông nghiệp Phát triển Nông thôn Thành phố Cần Thơ [8] phát triển hệ thống WebGIS quản lí liệu cho sáu chi cục trực thuộc (Thủy sản, Thủy lợi, Thú y, Phát triển Nông thôn, Bảo vệ Thực vật, Nước Vệ sinh Môi trường) để tận dụng chức hệ thống thông tin địa lí vào việc quản lí số liệu nơng nghiệp Năm 2013, Phạm Thị Xuân Lộc cộng [9] nghiên cứu xây dựng kho liệu lúa-tôm-cá cho khu vực Đồng sông Cửu Long ứng dụng kĩ thuật datamart OLAP Năm 2016, Bộ Nông nghiệp Phát triển Nông thôn [10], hỗ trợ từ phủ Hình 2: Cấu trúc data cube (Nguồn: Data Mining: Concepts and Techniques [2]) theo chiều cịn lại tính tốn lại theo hàm tóm lược (aggregation function) Drill-down thao tác ngược lại roll-up, ta muốn chi tiết hóa số liệu theo chiều từ số liệu tóm lược Slice thao tác trích chọn liệu theo chiều đó, cịn dice thao tác trích chọn liệu theo hai chiều Pivot thao tác trình bày liệu trực quan trình bày liệu bảng chữ nhật, đó, cạnh chiều liệu C Tình hình nghiên cứu Việc ứng dụng cơng nghệ kho liệu vào hệ thống thông tin phục vụ nông nghiệp nghiên cứu rộng rãi giới Các mơ hình hệ thống thường đề xuất nhằm quản lí số liệu tình hình sản xuất, thu hoạch dịch bệnh, Năm 2000, Yost [4] đề xuất mơ hình kho liệu hệ thống hỗ trợ định cho sử dụng số liệu thống kê cho Bộ Nơng nghiệp Hoa Kì Gupta cộng [5] đề xuất mơ hình sở liệu đa 67 TẠP CHÍ KHOA HỌC TRƯỜNG ĐẠI HỌC TRÀ VINH, SỐ 28, THÁNG 12 NĂM 2017 Phần Lan, triển khai dự án Phát triển hệ thống thơng tin quản lí ngành Lâm nghiệp Việt Nam, với chức quản lí số liệu lâm nghiệp số liệu kinh tế xã hội vùng dân cư có rừng, hỗ trợ phân tích định quản lí lĩnh vực lâm nghiệp Các nghiên cứu thể việc phát triển hệ thống thơng tin quản lí nơng nghiệp nhu cầu thiết thực Vì vậy, với lĩnh vực thủy sản, việc phát triển hệ thống báo cáo số liệu tích hợp tính kho liệu kinh doanh thơng minh (Business Intelligence) có tính khả thi ứng dụng cao III KHOA HỌC CÔNG NGHỆ - MÔI TRƯỜNG liệu từ sở liệu báo cáo (QLTS_DB) nạp sang kho liệu (QLTS_DW), sở liệu website báo cáo thiết kế theo lược đồ hình kho liệu Trong đó, số liệu phát sinh tuần loại thủy sản địa phương lưu ghi bảng BaoCao (báo cáo), số liệu cần nhập bao gồm: sản lượng thu hoạch (tấn), số hộ, diện tích (hecta), số lượng giống (ngàn con) thả nuôi bị thiệt hại tuần; sau số liệu chi tiết tính tốn số nâng lên (tổng số tích lũy từ đầu vụ đến tuần hành), tỉ lệ (%) thiệt hại so với thả nuôi Các loại thủy sản (bảng ConGiong) phân loại theo môi trường thả nuôi (bảng MoiTruong) bao gồm môi trường nước nước mặnlợ Hình thức thả ni (bảng HinhThucNuoi, bao gồm công nghiệp, bán công nghiệp quảng canh) bao gồm báo cáo Tính phân cấp báo cáo theo đơn vị hành thể bảng địa phương (DiaPhuong) Trong đó, địa phương phân theo ba cấp: xã, huyện tỉnh Chiều thời gian báo cáo thể bảng ThoiGian phân cấp theo ngày, tuần, tháng, năm mùa vụ Website báo cáo phát triển sử dụng công nghệ ASP.NET MVC nên sở liệu tự động chèn thêm số bảng khác phục vụ cho thao tác phân quyền xác thực người dùng NỘI DUNG A Mơ hình hệ thống Với nhu cầu phát triển hệ thống báo cáo có ứng dụng cơng cụ phân tích trực quan hóa số liệu nuôi trồng thủy sản mô tả phần I, chúng tơi đề xuất mơ hình hệ thống Hình Hệ thống bao gồm website dành cho cán nông nghiệp cấp xã, huyện cán Chi cục Thủy sản báo cáo số liệu tuần; đó, quan trọng báo cáo tuần cấp xã Báo cáo bao gồm số liệu thay đổi tuần tình hình ni trồng thủy sản địa bàn phụ trách, để làm sở cho báo cáo cán cấp cao Cơ sở liệu hệ thống báo cáo đặt tên QLTS_DB Hằng tuần, liệu báo cáo nạp vào kho liệu (QLTS_DW) để làm sở cho thao tác phân tích báo cáo trực quan Cơ sở liệu website kho liệu phát triển hệ quản trị sở liệu MS SQL Server 2014, công cụ OLAP hỗ trợ MS SQL Analysis Services 2014, công cụ front-end MS Reporting Services 2017 Microsoft Excel 2013 Chúng phát triển module ETL để nạp liệu từ tập tin excel chứa báo cáo từ vụ mùa 2014-2015 đến từ sở liệu báo cáo vào kho liệu Chi tiết phát triển thành phần hệ thống mô tả mục B C phần Website báo cáo có ba cấp độ người dùng tương ứng với ba cấp độ quản lí theo đơn vị hành (xã, huyện, tỉnh) Mỗi người dùng có quyền tạo cập nhật báo cáo định kì (theo tuần, tháng, năm) thuộc địa bàn phụ trách quyền xem báo cáo địa phương trực thuộc địa bàn quản lí Như vậy, cán cấp tỉnh xem tất báo cáo từ cấp xã, huyện đến cấp tỉnh Chi tiết phân quyền hệ thống thể Bảng Khi hệ thống vận hành, báo cáo tuần cấp xã địi hỏi cán nơng nghiệp xã phải thu thập số liệu nhập liệu vào hệ thống, báo cáo lại tổng hợp tự động từ số liệu sơ cấp báo cáo tuần cấp xã Các cấp báo cáo có giao diện tương đối giống Hình thể giao diện báo cáo tuần cấp huyện B Phát triển hệ thống báo cáo số liệu trực tuyến Dựa vào cấu nuôi trồng thủy sản đơn vị hành tỉnh, sở liệu cho hệ thống báo cáo số liệu theo tuần, tháng, năm thiết kế Hình Để tiện lợi việc nạp 68 TẠP CHÍ KHOA HỌC TRƯỜNG ĐẠI HỌC TRÀ VINH, SỐ 28, THÁNG 12 NĂM 2017 KHOA HỌC CÔNG NGHỆ - MÔI TRƯỜNG Hình 3: Mơ hình hệ thống báo cáo số liệu ni trồng thủy sản Hình 4: Mơ hình sở liệu website báo cáo số liệu nuôi trồng thủy sản 69 TẠP CHÍ KHOA HỌC TRƯỜNG ĐẠI HỌC TRÀ VINH, SỐ 28, THÁNG 12 NĂM 2017 KHOA HỌC CÔNG NGHỆ - MÔI TRƯỜNG Bảng 2: Phân quyền truy cập hệ thống báo cáo Hình 5: Giao diện tạo báo cáo tuần cấp huyện Do đặc thù định kì báo cáo nên chiều thời gian phân cấp nhỏ đến cấp tuần mùa vụ, cao tháng mùa vụ năm mùa vụ (mỗi mùa vụ tháng 11 năm trước đến hết tháng 10 năm sau) Chiều giống thiết kế đơn giản nhất, khơng có phân cấp khái niệm chiều Mơ hình sở liệu thiết kế theo lược đồ hình Hình Trong đó, bảng kiện (fact table) liên kết với bảng chiều thơng qua khóa ngoại chứa thông tin thả nuôi, thiệt hại sản lượng hàng tuần địa phương loại giống thả nuôi Dựa cấu trúc đo, data cubes OLAP server (SQL Server Analysis Services) thiết kế để phục vụ nhu cầu truy vấn dựa tiêu chí khác thời gian, địa phương giống Các liệu (datasets) phục vụ cho việc tạo báo cáo vẽ biểu đồ tạo nên nhờ data cubes C Xây dựng kho liệu công cụ báo cáo 1) Mơ hình sở liệu đa chiều: Mơ hình sở liệu đa chiều thể góc nhìn data cube cung cấp cho người dùng Các chiều thêm/bớt co/dãn để trả lời truy vấn từ tổng hợp đến chi tiết Ví dụ ta có u cầu: i) Cho biết số liệu thả ni tơm sú tồn tỉnh năm 2017 ii) Cho biết số liệu thả nuôi tôm sú xã thuộc huyện Cầu Ngang tuần 22 năm 2017 Trong truy vấn thứ i), ta cần số liệu tổng quát, thông tin địa phương thời gian “co” lại đến mức tổng quát năm, số liệu trả kết tổng hợp dựa số liệu tất địa phương năm Trong câu truy vấn thứ ii), dễ thấy chiều thời gian cắt lát tháng chiều địa phương dãn đến cấp xã lọc tên huyện, số liệu trình bày trích chọn từ báo cáo tuần cấp xã Trên thực tế, số liệu báo cáo cần tổng hợp/trích chọn ba chiều: thời gian, địa phương giống Trong đó, địa phương phân theo ba cấp hành xã, huyện tỉnh 2) Công cụ ETL: Chúng thiết kế công cụ ETL để nạp liệu từ sở liệu website báo cáo (QLTS_DB) vào kho liệu 70 TẠP CHÍ KHOA HỌC TRƯỜNG ĐẠI HỌC TRÀ VINH, SỐ 28, THÁNG 12 NĂM 2017 KHOA HỌC CÔNG NGHỆ - MÔI TRƯỜNG mạnh mẽ thân thiện, nhờ đó, người dùng dễ dàng quan sát số liệu lập báo cáo theo nhu cầu cụ thể mà không cần phải thực thủ cơng việc tìm kiếm tổng hợp số liệu Với thao tác tương tự tạo PivotTable, để quan sát cách trực quan biến động tình hình thả ni thiệt hại, so sánh tiêu chí, người dùng sử dụng cơng cụ PivotChart Hình biểu đồ so sánh diện tích thả ni với diện tích bị thiệt hại tơm sú tồn tỉnh năm 2015-2016, chi tiết hóa đến tháng sử dụng PivotChart excel Để tăng tính kết nối, số liệu biểu đồ báo cáo cần xuất lên web Chúng sử dụng dịch vụ báo cáo SQL Server Reporting Services 2017 để tạo trang báo cáo trực quan, hỗ trợ hiển thị giao diện điện thoại di động Trang web báo cáo thiết kế dạng bảng thông tin điều khiển (dashboard) để truy cập, cán cấp quản lí có báo cáo tổng qt tình hình thả ni, thiệt hại địa phương thể dạng biểu đồ trực quan bảng số liệu Hình 10 bảng thơng tin thể tình hình nuôi tôm sú từ đầu vụ 2016-2017, biểu đồ thể tình hình thả ni so sánh với tình hình thiệt hại, bảng liệu chi tiết thể để chi tiết hóa biểu đồ Thao tác trực quan hóa số liệu ni trồng thủy sản từ liệu tổng hợp kết xuất từ kho liệu có ý nghĩa lớn, đặc biệt công tác cảnh báo dịch bệnh Tùy thuộc nhu cầu nắm bắt thơng tin cán quản lí, biểu đồ khác tạo để so sánh, thể xu hướng, cảnh báo nguy hiểm tình hình thả ni thủy sản địa bàn Trong tình hình diễn biến phức tạp loại dịch bệnh thủy sản, việc hiển thị tỉ lệ thiệt hại so với thả nuôi loại thủy sản có giá trị cao tơm sú, tơm chân trắng, cá tra, cá lóc có ý nghĩa quan trọng Các loại biểu đồ cảnh báo giúp cho cán quản lí nhanh chóng nắm bắt tình hình chung thiệt hại để có định chiến lược hợp lí Dịch vụ báo cáo SQL Server Reporting Services 2017 có chế phân quyền truy cập cấp độ người dùng khác nhau, nhờ đó, chế phân cấp truy cập, kết xuất báo cáo đảm bảo Nhờ kết cơng cụ kết xuất này, Hình 6: Mơ hình sở liệu đa chiều hệ thống (QLTS_DW) Để đơn giản, sử dụng cơng cụ tích hợp liệu SQL Server Integration Services (SSIS) Cơng cụ kích hoạt tuần để đảm bảo số liệu kho cập nhật Mơ hình luồng liệu cơng cụ ETL thể Hình Hình 7: Lược đồ data flow công cụ ETL 3) Kết xuất báo cáo biểu đồ: Như đề cập mơ hình hệ thống Hình 3, cán quản lí trực tiếp truy vấn liệu công cụ OLAP tích hợp Microsoft Excel xem báo cáo thiết kế sẵn chuyên viên xử lí số liệu thơng qua cổng dịch vụ báo cáo SQL Reporting Services Với Microft Excel, người dùng tạo PivotTable cách kéo thả trường bảng chiều bảng kiện kho liệu để kết xuất số liệu theo dạng bảng hai chiều, liệu chiều lọc, roll-up, drill-down cách dễ dàng Hình thể truy vấn tình hình thả ni giống tồn tỉnh với chiều thời gian lọc mùa vụ 2015-2016, chiều địa phương co giãn đến cấp huyện Tiện ích 71 TẠP CHÍ KHOA HỌC TRƯỜNG ĐẠI HỌC TRÀ VINH, SỐ 28, THÁNG 12 NĂM 2017 KHOA HỌC CƠNG NGHỆ - MƠI TRƯỜNG Hình 8: Kết xuất báo cáo dạng PivotTable từ kho liệu Microsoft Excel Hình 9: Kết xuất báo cáo dạng PivotChart từ kho liệu Microsoft Excel cán quản lí dễ dàng nắm bắt tình hình chung, tổng hợp thơng tin theo nhiều chiều với nhiều tiêu chí khác nhau, nhờ việc tạo lập báo cáo rút ngắn thời gian nâng cao chất lượng Bên cạnh đó, cập nhật tương đối đầy đủ số liệu, dễ dàng thực thao tác khai thác liệu kho (tiên đốn, tìm luật kết hợp, phân lớp liệu, gom cụm liệu, phân tích tương quan ) để rút quy luật, tương quan biến động tình hình ni trồng thủy sản, từ có dự báo để phục vụ cho định quản lí IV KẾT LUẬN Việc ứng dụng công cụ trợ giúp định nghiên cứu sử dụng rộng rãi tổ chức doanh nghiệp Bài báo đề xuất ứng dụng trực tuyến quản lí tập trung việc báo cáo số liệu ni trồng thủy sản tỉnh Trà Vinh Nhờ đó, đảm bảo tính kịp thời, xác cơng tác báo cáo Bên cạnh đó, kho liệu sử dụng sở liệu đa chiều công cụ hỗ trợ phát triển nhằm trả lời truy vấn mang tính tổng hợp phục vụ cho cơng tác quản lí Nhờ tận dụng tiện ích OLAP excel, người dùng dễ dàng thao tác truy vấn liệu sở liệu đa chiều với excel mà không cần phải học sử dụng 72 TẠP CHÍ KHOA HỌC TRƯỜNG ĐẠI HỌC TRÀ VINH, SỐ 28, THÁNG 12 NĂM 2017 KHOA HỌC CÔNG NGHỆ - MƠI TRƯỜNG Hình 10: Báo cáo dạng dashboard sử dụng SQL Reporting Services 2017 công cụ phức tạp khác Các tiện ích trực quan hóa số liệu sử dụng để vẽ biểu đồ tạo dashboard trực quan để hỗ trợ cán quản lí định Mơ hình hệ thống đơn giản, gọn nhẹ, tận dụng công nghệ hỗ trợ hệ quản trị sở liệu Microsoft SQL Server nên dễ cài đặt, dễ triển khai bảo trì Để cung cấp thêm nhiều góc nhìn cho cấp quản lí, tương lai, thu thập đủ số liệu kho liệu hệ thống cập nhật thêm chiều điều kiện tự nhiên, bao gồm thông tin thời tiết, độ mặn, mực nước Nhờ đó, có phân tích dự báo gắn với điều kiện tự nhiên mùa vụ nhằm hỗ trợ tốt công tác quản lí ni trồng thủy sản tỉnh Với tiện ích nêu, mơ hình hệ thống đề xuất nhân rộng để ứng dụng quan nhà nước khác, nhằm đáp ứng nhu cầu quản lí ngày cao lĩnh vực kinh tế xã hội tỉnh [4] [5] [6] [7] [8] [9] CẢM TẠ [10] (**) Nghiên cứu tài trợ từ nguồn kinh phí nghiên cứu khoa học Trường Đại học Trà Vinh TÀI LIỆU THAM KHẢO [1] William H Inmon Building the Data Warehouse 3rd ed John Wiley & Sons, editor; 1992 [2] Jiawei Han, Micheline Kamber Data Mining: Concepts and Techniques 2nd ed.; 2012 [3] Surajit Chaudhuri, Umeshwar Dayal An Overview of Data Warehousing and OLAP Technology ACM SIGMOD Record 1997;26(1):65–74 73 Mickey Yost Data Warehousing and Decision Support at the National Agricultural Journal Social Science Computer Review 2000;18(4):434–441 Aditya Kumar Gupta, Bireshwar Dass Mazumdar Multidimensional schema for agricultural data warehouse International Journal of Research in Engineering and Technology 2013;02(03) Lê Quyết Thắng Nghiên cứu xây dựng hệ thống thông tin hỗ trợ việc phòng chống dịch bệnh trồng thuỷ sản cho vùng kinh tế trọng điểm Bộ Khoa học Công nghệ, Hà Nội; 2010 Phan Quốc Nghĩa, Nguyễn Nhứt Lam Ứng dụng công nghệ OLAP khai thác số liệu dịch hại lúa Trà Vinh Tạp chí Khoa học, Trường Đại học Trà Vinh 2012;6:7–15 Trần Lê, Trương Chí Quang, Lê Văn Thạnh, Võ Quang Minh, Phạm Văn Quỳnh Xây dựng hệ thống thông tin chuyên ngành nông nghiệp phát triển nơng thơn WebGIS Tạp chí Khoa học, Đại học Cần Thơ 2013;Số Công nghệ Thông tin:1–10 Phạm Thị Xuân Lộc Datamart ứng dụng OLAP với kho liệu lúa- tôm- cá Đồng sông Cửu Long Hội thảo Quốc gia lần thứ XV "Một số vấn đề chọn lọc Công nghệ thông tin Truyền thông"; 2013 Bộ Nông nghiệp Phát triển nông thôn Dự án Phát triển Hệ thống Thông tin Quản lý ngành Lâm nghiệp Việt Nam - Giai đoạn II (FORMIS II); 2016 ... HỌC TRÀ VINH, SỐ 28, THÁNG 12 NĂM 2017 KHOA HỌC CÔNG NGHỆ - MƠI TRƯỜNG Hình 3: Mơ hình hệ thống báo cáo số liệu ni trồng thủy sản Hình 4: Mơ hình sở liệu website báo cáo số liệu ni trồng thủy sản. .. warehouse (kho liệu) trực quan hóa liệu cho cơng tác báo cáo số liệu địa tỉnh Trà Vinh II KHOA HỌC CÔNG NGHỆ - MÔI TRƯỜNG dịch trực tuyến (OnLine Transaction Processing – OLTP), kho liệu lại hỗ... sánh với tình hình thiệt hại, bảng liệu chi tiết thể để chi tiết hóa biểu đồ Thao tác trực quan hóa số liệu nuôi trồng thủy sản từ liệu tổng hợp kết xuất từ kho liệu có ý nghĩa lớn, đặc biệt công