CHƢƠNG II MƠ HÌNH TRỰC QUAN HĨA SỰ KIỆN LỊCH SỬ
2.2. Các phƣơng pháp trực quan hóa dữ liệu
2.2.1. Khái niệm
Trực quan hóa (Visualization) là kỹ thuật tạo ra những hình ảnh, biểu đồ để
diễn tả thơng điệp nào đó. Trực quan hóa giúp diễn tả những ý tƣởng trừu tƣợng của con ngƣời một cách cụ thể nhằm tăng cƣờng nhận thức của con ngƣời.
Trực quan hóa đã đƣợc sử dụng trong bản đồ, bản vẽ khoa học, những sơ đồ dữ liệu từ nhiều năm trƣớc. Ngày nay, trực quan hóa đƣợc thực hiện bởi các phần mềm chuyên biệt giúp việc trực quan hóa có những thành tựu đáng kể trong các lĩnh vực nghiên cứu khoa học.
Trực quan hóa đƣợc phân thành nhiều nhánh phát triển, trong đó có một nhánh phát triển quan trọng là trực quan hóa dữ liệu.
Trực quan hóa dữ liệu (Data visualization) là biểu diễn các thống kê đƣợc trình bày bằng đồ họa gắn liền với các thơng tin địa lý hoặc dữ liệu không gian trong các dạng biểu đồ.
Mục tiêu của trực quan hóa dữ liệu là diễn tả thông tin một cách rõ ràng và dễ hiểu cho ngƣời sử dụng thông qua các bảng biểu hoặc biểu đồ. Trực quan hóa một cách hiệu quả giúp cho ngƣời dùng đƣa ra các phân tích đặc biệt nhƣ tạo phép so sánh và áp dụng thiết kế đồ họa (để hiển thị so sánh, nhân quả…) một cách chính xác hơn. Hơn thế nữa, trực quan hóa khiến dữ liệu phức tạp trở thành dễ hiểu và dễ sử dụng.
Trực quan hóa dữ liệu liên hệ gắn với nhiều lĩnh vực nhƣ: trình bày dữ liệu bằng đồ họa, trực quan hóa thơng tin, trực quan hóa khoa học, phân tích khảo sát dữ liệu và thống kê đồ họa. Ngồi ra, trực quan hóa dữ liệu cũng liên kết với trực quan hóa khoa học và trực quan hóa thơng tin để giúp việc trực quan dữ liệu đạt hiểu quả hơn.
Ngày này với những dữ liệu ngày càng lớn nhƣ: camera giao thông, dữ liệu vệ tinh,… dẫn đến tình trạng “Big Data”. Điều này làm cho việc phân tích và liên kết dữ liệu trở nên vô cùng quan trọng và cần thiết. Chính vì vậy, việc áp dụng trực
quan hóa dữ liệu sau này sẽ có sự phát triển mạnh mẽ hơn và điều này trở thành một thách thức lớn cho trực quan hóa dữ liệu.
2.2.2. Kiến trúc và mơ hình trực quan hóa dữ liệu
2.2.2.1. Kiến trúc trực quan hóa dữ liệu
Kiến trúc trực quan hóa dữ liệu (Data Presentation Architecture - DPA) là tập các kỹ năng hƣớng tới việc xác định, định vị, điều khiển, định dạng và biểu diễn dữ liệu theo cách tối ƣu hóa việc truyền tải ý nghĩa và kiến thức.
DPA là sự kết hợp của số học, dữ liệu và thống kê để khám phá ra thông tin có giá trị từ dữ liệu, ngồi ra nó cịn liên kết và tƣơng tác với các hoạt động trực quan hóa dữ liệu, truyền thơng, tổ chức tâm lý và quản lý thay đổi nhằm cung cấp giải pháp kinh doanh thơng minh, tính tốn thời gian phân phối, định dạng các phƣơng thức và chiến lƣợc một tổ chức hay doanh nghiệp.
DPA có 2 đối tƣợng chính:
- Sử dụng dữ liệu để cung cấp kiến thức theo cách hiệu suất nhất: ít nhiễu, hồn thiện và dữ liệu đƣợc đƣa vào nhóm theo sự cần thiết
- Sử dụng dữ liệu để cung cấp kiến thức theo cách hiệu lực nhất có thể: dữ liệu phù hợp, kịp thời và hoàn thiện theo cách rõ ràng, dễ hiểu nhất để truyền đạt những ý nghĩa quan trọng.
Hoạt động thực tế của PDA bao gồm:
- Tạo cơ chế phân phát hiệu quả cho mỗi nhóm thành viên dựa trên vai trị, nhiệm vụ, vị trí và truy cập cơng nghệ.
- Xác định ý nghĩa quan trọng của từng nhóm thành viên cần dựa trên ngữ cảnh.
- Xác định chu kỳ cần thiết để cập nhật dữ liệu - Xác định chính xác thời gian trình bày dữ liệu - Tìm đƣợc dữ liệu chính xác dữ liệu cần thiết
- Tận dụng phù hợp các phân tích, nhóm, trực quan hóa và các dạng trình diễn khác.
2.2.2.2. Mơ hình trực quan hóa dữ liệu
Mơ hình trực quan hóa dữ liệu đƣợc xem nhƣ tập hợp các phân lớp, mỗi phân lớp đều có một nhiệm vụ chính và tƣơng tác với các phân lớp khác trong mơ hình.
Hình 2-1. Mơ hình trực quan hóa dữ liệu
- Mơ hình truyền thơng (Communication Model): Biểu diễn sự tƣơng tác giữa các thành phần hệ thống.
- Mơ hình dữ liệu (Data Model): Biểu diễn sự hiển thị dữ liệu
- Mơ hình tính tốn (Computation Model): Biểu diễn cơng thức tính tốn
- Mơ hình hiển thị (Display Model): Biểu diễn kết quả thực thi các thuật toán biểu diễn dữ liệu.
- Mơ hình tƣơng tác (Interaction Model): Biểu diễn sự tƣơng tác giữa ngƣời dùng và hệ thống trực quan hóa
- Mơ hình ngƣời dùng (User Model): Biểu diễn u cầu
2.2.3. Trực quan hóa dữ liệu theo địa lý và thời gian
2.2.3.1. Trực quan hóa dữ liệu theo địa lý
Trực quan hóa theo địa lý là tập hợp các cơng cụ và kỹ thuật hỗ trợ phân tích dữ liệu theo địa lý thơng qua sử dụng trực quan hóa tƣơng tác nhằm tạo ra kiến thức từ những dữ liệu đƣợc lƣu trữ hoặc đƣợc truyền tải. Để làm đƣợc điều đó, trực quan hóa theo địa lý truyền tải thơng tin theo địa lý bằng cách kết hợp sự hiểu biết của con ngƣời, cho phép khai thác dữ liệu và tạo quyết định.
Chúng ta biết rằng, bản đồ tính có khả năng khai thác giới hạn với sự diễn tả đồ họa gắn bó chặt chẽ với thơng tin địa lý. Mặt khác, hệ thống GIS kết hợp với trực quan hóa địa lý làm cho bản đồ có tính tƣơng tác cao hơn nhƣ phóng to – thu nhỏ bản đồ, thay đổi biểu diễn trực quan của bản đồ, phân tích các lớp bản đồ,…
Choropleth là một trong số loại bản đồ thƣờng sử nhất. Đối với loại bản
đồ này thì màu sắc là thành phần quan trọng. Màu sắc đƣợc gán cho các giá trị dữ liệu và giá trị đó đƣợc sử dụng để tơ màu cho vùng đó.
Hình 2-2. Một ví dụ của bản đồ Choropleth
Cartogram hiển thị bản đồ trực quan thông qua biểu diễn các đối tƣợng
địa lý dạng vùng theo kích thƣớc tƣơng ứng nhƣ dân số, GDP, …
Hình 2-3. Ví dụ về bản đồ dạng Cartogram
Proportional Symbol là một bản đồ sử dụng các hình khối trịn hoặc
định dạng khác nhau giữa một vùng. Kích thƣớc của các khối tròn quan hệ với giá trị dữ liệu.
Hình 2-4. Ví dụ về bản đồ dạng Proportional Symbol
Ngồi ra cịn có rất nhiều các loại bản đồ khác hoặc chúng ta có thể kết hợp các loại biểu đồ này với nhau nhƣ kết hợp phƣơng pháp proportional symbol với cartograms để có một bản đồ lai, phƣơng pháp này tƣơng đối hiệu quả để biểu diễn dữ liệu.
2.2.3.2. Trực quan hóa dữ liệu theo thời gian
Khác với trực quan hóa dữ liệu địa lý, trực quan hóa dữ liệu thời gian hƣớng tới tính logic của thời gian. Tức là chúng ta sẽ quan tâm chủ yếu tới tính trƣớc sau của thời gian. Giả sử chúng ta muốn biểu diễn một dãy các sự kiện theo thời gian. Để có thể trực quan và dễ hiểu nhất, ngƣời ta sẽ biểu diễn các sự kiện theo chiều của thời gian. Việc này giúp chúng ta có thể dễ dàng nhìn nhận, đánh giá thứ tự trƣớc sau của mỗi sự kiện và làm chúng ta dễ nhớ hơn rất nhiều.
Một phƣơng pháp chúng ta hay sử dụng để trực quan hóa thời gian đó chính là timeline (dịng thời gian).Timeline thể hiện một dãy các hoạt động đƣợc trình bày theo các cột mốc thời gian. Nó rất hữu ích cho việc xem xét và sắp xếp các hoạt động chiến lƣợc hay đánh giá, tổng hợp phân tích quy trình hoạt động của các dự án.
Hình 2-5. Một ví dụ về trực quan hóa dữ liệu theo thời gian
2.2.4. Miền ứng dụng
Trực quan hóa theo địa lý đã xâm nhập nhiều lĩnh vực khác nhau do khả năng hỗ trợ ra quyết định và xử lý tạo kiến thức mới của nó. Những lĩnh vực nổi bật ứng dụng trực quan hóa theo địa lý bao gồm: Cứu hỏa tại những vùng hoang dã, quản lý rừng, khảo cổ học, nghiên cứu môi trƣờng, quy hoạch đơ thị,...
Trực quan hóa theo thời gian hiện này cũng đƣợc ứng dụng rất nhiều trong các lĩnh vực khác nhau nhƣ: quản lý dự án, chuỗi các hoạt động của sự kiện hay các sự kiện Lịch sử.
Ngồi ra, cịn có rất nhiều những ứng dụng sử dụng cả trực quan hóa theo địa lý và trực quan hóa thời gian: nhƣ các bản phân tích hacker của cơ quan điều tra mạng, mơ hình hóa các sự kiện lịch sử,…