Lỗi do học sinh, do giáo viên, do chương trình hay do sách giáo khoa,…Hiện nay vẫn chưa có một câu trả lời nào có thể lý giải toàn diện lí do nhưng nhìn chung, dư luận xã hội đều cho rằn
Trang 2LUẬN VĂN THẠC SĨ NGÀNH CÔNG NGHỆ THÔNG TIN
NGƯỜI HƯỚNG DẪN KHOA HỌC: TS NGUYỄN NGỌC HÓA
Hà Nội – 2015
Trang 3Hoàng Thị Vân – K19 HTTT Trang 3
LỜI CẢM ƠN
Luận văn này được thực hiện tại trường Đại học Công Nghệ - Đại Học Quốc gia
Hà Nội dưới sự hướng dẫn của TS Nguyễn Ngọc Hóa Em xin được gửi lời cảm ơn
sâu sắc nhất đến thầy đã định hướng, giúp đỡ, quan tâm và tạo mọi điều kiện thuận lợi trong suốt quá trình nghiên cứu để hoàn thành luận văn này Tôi cũng xin được gửi lời cảm ơn đến các thầy cô trong Bộ môn Hệ thống thông tin cũng như Khoa công nghệ thông tin đã mang lại cho tôi những kiến thức vô cùng quý giá và bổ ích trong quá trình học tập tại trường
Tôi cũng xin gửi lời cảm ơn tới gia đình và bạn bè đã luôn quan tâm và động viên giúp tôi có thêm nghị lực để có thể hoàn thành được luận văn này Cuối cùng xin gửi lời cảm ơn tới các bạn học cùng K19, K20 đã giúp đỡ tôi trong suốt 3 năm học tập vừa qua
Do thời gian và kiến thức có hạn nên luận văn không tránh khỏi những thiếu sót Tôi rất mong nhận được những góp ý quý báu của thầy cô và các bạn
Xin chân thành cảm ơn!
Hà Nội, ngày 15 tháng 12 năm 2015
Học viên
Hoàng Thị Vân
Trang 4Hoàng Thị Vân – K19 HTTT Trang 4
LỜI CAM ĐOAN
Tôi xin cam đoan kết quả đạt được trong luận văn là sản phẩm của riêng cá nhân tôi dưới sự hướng dẫn của TS Nguyễn Ngọc Hóa và không sao chép của bất kỳ ai Những điều được trình bày trong toàn bộ nội dung của luận văn, hoặc là của cá nhân hoặc là được tổng hợp từ nhiều nguồn tài liệu Tất cả các tài liệu tham khảo đều có xuất xứ rõ ràng và được trích dẫn hợp pháp
Tôi xin hoàn toàn chịu trách nhiệm theo quy định cho lời cam đoan của mình
Hà Nội, ngày 15 tháng 12 năm 2015
Người cam đoan
Hoàng Thị Vân
Trang 5Hoàng Thị Vân – K19 HTTT Trang 5
MỤC LỤC
DANH MỤC CÁC KÝ HIỆU VÀ TỪ VIẾT TẮT 7
DANH MỤC CÁC HÌNH VẼ VÀ ĐỒ THỊ 8
DANH MỤC BẢNG 9
MỞ ĐẦU 10
CHƯƠNG I CƠ SỞ DỮ LIỆU KHÔNG GIAN, THỜI GIAN 12
1.1 Cơ sở dữ liệu không gian và GIS 12
1.1.1 Khái niệm 12
1.1.2 Các đặc trưng của CSDL không gian 12
1.1.3 Mô hình dữ liệu không gian 13
1.1.4 Hệ thống thông tin địa lý – GIS 14
1.2 Cơ sở dữ liệu thời gian 18
1.2.1 Khái niệm 18
1.2.2 Mô hình dữ liệu thời gian 19
1.2.3 Truy vấn dữ liệu thời gian 21
1.2.4 CSDL thời gian trong hệ quản trị CSDL quan hệ 21
1.3 Đánh giá một số hệ quản trị CSDL không gian, thời gian 22
1.3.1 PostGreSQL và PostGIS 22
1.3.2 SQL Server và phần mở rộng dữ liệu không gian 25
1.4 Tổng kết chương 27
CHƯƠNG II MÔ HÌNH TRỰC QUAN HÓA SỰ KIỆN LỊCH SỬ 28
2.1 Bài toán thực tiễn 28
2.2 Các phương pháp trực quan hóa dữ liệu 31
2.2.1 Khái niệm 31
2.2.2 Kiến trúc và mô hình trực quan hóa dữ liệu 32
2.2.3 Trực quan hóa dữ liệu theo địa lý và thời gian 33
2.2.4 Miền ứng dụng 36
2.3 Mô hình trực quan hóa sự kiện lịch sử trên nền bản đồ 36
2.3.1 Mô hình hóa sự kiện lịch sử 36
Trang 6Hoàng Thị Vân – K19 HTTT Trang 6
2.3.2 Giải pháp bản đồ trực tuyến 38
2.3.3 Tích hợp ứng dụng trên nền Web 40
2.4 Trực quan hóa sự kiện với công cụ TimeMapper 40
2.4.1 Giới thiệu 40
2.4.2 Các thành phần của TimeMapper 41
2.4.3 Nhược điểm của công cụ TimeMapper 46
2.5 Tổng kết chương 47
CHƯƠNG III XÂY DỰNG ỨNG DỤNG THỬ NGHIỆM 48
3.1 Yêu cầu bài toán 48
3.2 Phân tích, thiết kế hệ thống 48
3.2.1 Mô hình kiến trúc hệ thống 48
3.2.2 Các chức năng hệ thống 49
3.2.3 Thiết kế CSDL 50
3.3 Phát triển ứng dụng 50
3.3.1 Môi trường phát triển 50
3.3.2 Dịch vụ bản đồ nền sử dụng MapServer 50
3.3.3 Tích hợp các thư viện hỗ trợ trực quan hóa sự kiện 54
3.3.4 Thu thập và chuẩn bị dữ liệu sự kiện lịch sử 54
3.4 Kết quả thử nghiệm và đánh giá 55
3.4.1 Kết quả thử nghiệm 55
3.4.2 So sánh với ứng dụng sử dụng TimeMapper 62
3.4.3 Đánh giá 64
3.5 Tổng kết chương 65
CHƯƠNG IV KẾT LUẬN CHUNG 66
4.1 Các đóng góp của luận văn 66
4.2 Một số hướng phát triển 66
TÀI LIỆU THAM KHẢO 67
Trang 7Hoàng Thị Vân – K19 HTTT Trang 7
DANH MỤC CÁC KÝ HIỆU VÀ TỪ VIẾT TẮT
API Application Programming Interface
GIS Geographic Information System
DPA Data Presentation Architecture GIS
Trang 8Hoàng Thị Vân – K19 HTTT Trang 8
DANH MỤC CÁC HÌNH VẼ VÀ ĐỒ THỊ
Hình 1-1 Minh họa CSDL không gian Hình 1-2 Mô hình đối tượng Point Hình 1-3 Mô hình đối tượng Line Hình 1-4 Mô hình đối tượng Polygon Hình 1-5 Các thành phần của hệ thống GIS Hình 1-6 Một ví dụ về mô hình TimeER Hình 1-7 Vị trí của PostGIS trong PostGreSQL Hình 1-8 Mô hình thiết kế của các đối tượng không gian Hình 1-9 Phổ điểm các môn thi THPT quốc gia năm 2015 Hình 2-1 Mô hình trực quan hóa dữ liệu
Hình 2-2 Một ví dụ của bản đồ Choropleth Hình 2-3 Ví dụ về bản đồ dạng Cartogram Hình 2-4 Ví dụ về bản đồ dạng Proportional Symbol Hình 2-5 Một ví dụ về trực quan hóa dữ liệu theo thời gian Hình 2-6 Mô tả trận đánh Đồi Him Lam
Hình 2-7 Giao diện của một sự kiện lịch sử được trực quan hóa Hình 2-8 Minh họa một timeline được tạo từ TimelineJS
Hình 2-9 Mô hình của Recline JS Hình 2-10 Một ví dụ về tương tác bản đồ của Leaflet Hình 3-1 Mô hình kiến trúc hệ thống
Hình 3-2 Biểu đồ ca sử dụng Hình 3-3 Sơ đồ hoạt động của MapServer
Trang 9Hoàng Thị Vân – K19 HTTT Trang 9
Hình 3-4 Quy trình xử lý của Mapserver Hình 3-5 Các sự kiện được lưu trữ trong cơ sở dữ liệu Hình 3-6 Trực quan hóa sự kiện chiến dịch Điên Biên Phủ Hình 3-7 Trực quan hóa sự kiện Hồ Chí Minh đọc bản tuyên ngôn độc lập Hình 3-8 Chức năng phóng to trên bản đồ
Hình 3-9 Chức năng thu nhỏ trên bản đồ Hình 3-10 Các lớp địa lý của bản đồ Hình 3-11 Ảnh vệ tinh
Hình 3-12 Hình ảnh timeline khi sử dụng chức năng thu nhỏ Hình 3-13 Timeline khi sử dụng chức năng phóng to
Hình 3-14 Thời gian diễn ra sự kiện chiến dịch Điên Biên Phủ Hình 3-15 Giao diện chính của ứng dụng quản lý sự kiện lịch sử Hình 3-16 Giao diện hiển thị theo danh mục sự kiện
Hình 3-17 Sự kiện được hiển thị trên bản đồ Hình 3-18 Hiển thị vị trí tọa độ của một địa điểm được chọn Hình 3-19 Chức năng lọc theo tên của sự kiện
Hình 3-20 Chức năng sắp xếp các sựu kiện theo tên sự kiện Hình 3-21 Chức năng đếm số các sự kiện diễn ra trong cùng khu vực Hình 3-22 So sánh bản đồ hiện thị của ứng dụng và của TimeMapper
DANH MỤC BẢNG
Bảng 3-1 Bảng cơ sở dữ liệu các sự kiện Lịch Sử Bảng 3-2 Bảng tổng kết đánh giá ứng dụng thực nghiệm
Trang 10Hoàng Thị Vân – K19 HTTT Trang 10
MỞ ĐẦU
Hiện nay, tình trạng dạy và học Lịch Sử tại các trường học của Việt Nam chưa thực sự được xã hội đánh giá tốt Có rất nhiều những bài báo nói lên thực trạng này của môn Lịch Sử Điển hình nhất là thống kê kết quả thi THPT quốc gia tháng 07/2015 vừa qua của Bộ Giáo Dục và Đào Tạo thì điểm thi môn Lịch Sử của các thí sinh chỉ tập trung chủ yếu ở mức điểm từ 4 đến 6, và có rất nhiều thí sinh được 1 – 2 điểm hoặc bị điểm 0[26] Đây là một kết quả được xem là rất thấp so với các môn cùng khối thi đại học như Địa Lí hay Ngữ Văn Điều này không có gì là mới mẻ bởi tình trạng này đã diễn ra từ năm 2005 khi có đến 58.5% số bài thi môn Lịch Sử dưới 1 điểm, năm 2006 điểm trung bình các bài thi là 1.96 điểm – thấp nhất trong số các môn thi đại học, năm 2007 điểm dưới trung bình chiếm 95.74%[27] Với những số liệu thông kê như ở trên, chúng ta có thể thấy rõ một sự thật là chất lượng môn Lịch Sử ở trường phổ thông hiện nay rất thấp
Câu hỏi đặt ra là: “Tại sao chất lượng môn Lịch Sử lại thấp đến như vậy?” Lỗi do học sinh, do giáo viên, do chương trình hay do sách giáo khoa,…Hiện nay vẫn chưa
có một câu trả lời nào có thể lý giải toàn diện lí do nhưng nhìn chung, dư luận xã hội đều cho rằng học sinh chán học môn Lịch Sử vì một số lí do như sau: môn học này không có giá trị sử dụng, thời lượng dạy trên lớp ít, không được xã hội coi trọng đúng mức,…Trong đó có một lí do là môn học này có phương pháp dạy lạc hậu, không có
sự trực quan liên tưởng, không khơi dậy được sự thích thú hay kích thích tư duy cho học sinh Từ nhiều lí do trên, học sinh thấy nhàm chán, không muốn học làm cho chất lượng môn Lịch Sử ngày càng đi xuống
Timemapper là một công cụ mã nguồn mở mới được nghiên cứu bởi một nhóm chuyên gia chuyên phát triển các mã nguồn mở - Open Knowledge Foundation Labs Đây là một công cụ rất hữu ích cho phép hiển thị các sự kiện lịch sử một cách trực quan và khoa học Việc hiện thị một sự kiện được Timemapper mô hình hóa trên một dòng thời gian và bản đồ, người sử dụng có thể tương tác với các đối tượng này Điều đặc biệt ở công cụ này là nó hoàn toàn miễn phí và người sử dụng có thể lấy mã nguồn về và chỉnh sửa theo ý của mình Tuy nhiên, khi sử dụng Timemapper thì có một vài nhược điểm như: khả năng quản lý dữ liệu chưa tốt, bản đồ chỉ hỗ trợ nguồn dịch vụ từ MapQuest, vị trí của các sự kiện chỉ được mô hình hóa theo một điểm tọa
độ, sử dụng Node.js làm máy chủ nên khả năng tùy biến chưa cao
PostGreSQL là một hệ quản trị cơ sở dữ liệu mã nguồn mở phát triển rất mạnh Hệ quản trị CSDL này có rất nhiều tính năng nổi bật như: độ tin cậy cao, chạy trên nhiều
hệ điều hành, khả năng mở rộng hàm, kiểu dữ liệu, toán tử,…Hơn thế nữa, hệ quản trị CSDL này còn có phần mở rộng PostGIS hỗ trợ tốt cho viêc lưu trữ các đối tượng địa
Trang 11Hoàng Thị Vân – K19 HTTT Trang 11
lý như: Point, Line, Polygon PostGIS cung cấp việc tạo và thao tác với CSDL không gian
Từ ý tưởng của Timemapper, tôi đã tiến hành xây dựng một ứng dụng là hiển thị các sự kiện lịch sử, góp phần khắc phục tình trạng dạy và học Lịch Sử hiện nay Vì vậy, tôi đã chọn đề tài “Trực quan hóa sự kiện lịch sử trên nên bản đồ số” làm đề tài nghiên cứu luận văn của mình
Mục tiêu của luận văn này được hướng đến nghiên cứu và xây dựng mô hình biểu diễn trực quan các sự kiện lịch sử, cả về thời gian lẫn không gian (địa lý), trên nền các dịch vụ bản đồ trực tuyến Việc thử nghiệm mô hình sẽ được tiến hành với chủ đề lịch
sử Việt Nam
Những nội dung chính của đề tài bao gồm:
- Nghiên cứu, tìm hiểu về trực quan hoá dữ liệu nói chung, về cơ sở dữ liệu không gian/thời gian
- Khảo sát, đánh giá và lựa chọn một số chủ đề lịch sử Việt Nam quan trọng đối với học sinh phổ thông, phục vụ quá trình thử nghiệm
- Xây dựng mô hình trực quan hoá dữ liệu lịch sử trên nền bản đồ trực tuyến
- Thiết kế, xây dựng hệ thống thử nghiệm mô hình nêu trên
- Thực nghiệm và đánh giá kết quả
Những kết quả chính đúc kết quả quá trình nghiên cứu được tổng hợp và trình bày trong luận văn qua các chương chính sau:
Chương I - Trình bày những khái niệm chung về cở sở dữ liệu không gian và thời gian, hệ thống thông tin địa lý – GIS và đánh giá một số hệ quản trị cơ sở dữ liệu không gian thời gian như PostGreSQL và SQL Server
Chương II - Đưa ra bài toán thực tiễn về việc dạy và học lịch sử ở các trường THPT, các phương pháp trực quan hóa dữ liệu và phương pháp mô hình hóa các sự kiện lịch sử trên nên bản đồ số Đồng thời giới thiệu về công cụ TimeMapper, một công cụ để mô hình trực quan hóa các sự kiện lịch sử
Chương III – Xây dựng ứng dụng trực quan hóa sự kiện Lịch Sử trên nền bản đồ
số dựa trên ý tưởng và kế thừa các thư viện có sẵn mà TimeMapper, đồng thời so sánh của ứng dụng so với công cụ Timemapper Đưa ra kết quả thử nghiệm và đánh giá Chương IV - Kết luận chung và các đóng góp của luận văn Một số hướng phát triển cho luận văn
Trang 12Hoàng Thị Vân – K19 HTTT Trang 12
CHƯƠNG I CƠ SỞ DỮ LIỆU KHÔNG GIAN, THỜI GIAN
1.1 Cơ sở dữ liệu không gian và GIS
Cơ sở dữ liệu không gian là một cơ sở dữ liệu quan hệ cung cấp các kiểu dữ liệu không gian trong mô hình dữ liệu và ngôn ngữ truy vấn các dữ liệu không gian đó Ngoài việc hỗ trợ các kiểu dữ liệu không gian trong việc thực thi, nó còn cung cấp các kiểu đánh chỉ mục để thực thi truy vấn nhanh nhất từ bảng dữ liệu lớn
Hình 1-1 Minh họa CSDL không gian
Hiện này, có rất nhiều hệ quản trị cơ sở dữ liệu cho phép làm việc với CSDL không gian như: BD2 (phần mở rộng IBM DB2 Spatial Extender), Oracle (Oracle Spatial), Sqlite (phần mở rộng SpatialLite), Microsoft SQL Server phiên bản 2008 trở lên và PostgreSQL (phần mở rộng PostGIS)
1.1.2 Các đặc trưng của CSDL không gian
CSDL không gian cũng có những đặc điểm chung như các cơ sở dữ liệu quan
hệ Tuy nhiên, ngoài những đặc điểm ấy CSDL không gian còn có một số đặc trưng riêng như:
1) CSDL không gian sử dụng cách đánh chỉ mục không gian để tăng tốc độ hoạt động của cơ sở dữ liệu Việc đánh chỉ mục cho dữ liệu là vô cùng quan trọng
vì nó giúp tối ưu hóa truy vấn dữ liệu, giảm thời gian truy vấn, giảm bộ nhớ lưu trữ, …
Trang 13Hoàng Thị Vân – K19 HTTT Trang 13
2) Ngoài các truy vấn SQL điển hình như SELECT, CSDL không gian có thể thực thi đa dạng các thao tác không gian như:
Các phép đo lường không gian: tính khoảng cách giữa các điểm, các vùng, chiều dài các đường, …
Các hàm không gian: ví dụ như sửa đổi các hàm hiện thời để tạo ra những hình mới: hàm tìm điểm hay vùng giao nhau, …
Xác nhận không gian: cho phép thực hiện các truy vấn True/False
Hàm tạo: tạo ra các hình mới, như chỉ ra các điểm nút có thể tạo nên đường, hay nếu đỉnh đầu và đỉnh cuối trùng nhau có thể tạo thành đa giác
Hàm theo dõi: các câu truy vấn trả về thông tin cụ thể như: vị trí tâm của một đường tròn hay điểm đầu, điểm cuối của một đường
1.1.3 Mô hình dữ liệu không gian
Có 3 đối tượng cơ bản trong mô hình dữ liệu không gian là: Point, Line, Polygon
Point: hiển thị một đối tượng mà chỉ có vị trí của nó trong không gian như một quận, huyện, một tòa nhà được mô phỏng như một điểm trong mô hình
mô tả một khu vực rộng lớn về địa lý
Point là tọa độ đơn, không có các phép đo lường về chiều dài, chiều rộng hay diện tích
Hình 1-2 Mô hình đối tượng Point
Line: xác định là một tập hợp dãy các điểm, mô tả đối tượng địa lý dạng tuyến tính
Line là một dãy các cặp tọa độ, có điểm bắt đầu và điểm kết thúc và có các phép đo khoảng cách đối với đường
Trang 14Hoàng Thị Vân – K19 HTTT Trang 14
Hình 1-3 Mô hình đối tượng Line
Polygon: xác định bởi ranh giới các đường thẳng, mô tả cho các đối tượng địa lý có diện tích và được đóng kín hay còn gọi là vùng.Ví dụ: một thành phố, công viên, tòa nhà,…
Polygon được mô tả bởi tập hợp các điểm và đường, đường bao của vùng có thể là một đường hoặc nhiều đường và có phép tính chu vi và diện tích cho vùng
Hình 1-4 Mô hình đối tượng Polygon
1.1.4 Hệ thống thông tin địa lý – GIS
1.1.4.1 Khái niệm
Hệ thống thông tin địa lý - Geographic Information System (GIS) là một nhánh của công nghệ thông tin được hình thành từ những năm 60 của thế kỷ trước và phát triển mạnh mẽ trong những năm gần đây Ngày nay, GIS là công
cụ hỗ trợ quyết định trong nhiều hoạt động kinh tế - xã hội, quốc phòng của nhiều quốc gia trên thế giới Nó có khả năng trợ giúp các cơ quan chính phủ, nhà quản lý đánh giá được hiện trạng của các quá trình, các thực thể tự nhiên, kinh tế - xã hội thông qua chức năng thu thập, quản lý, truy vấn, phân tích và
Trang 15Hoàng Thị Vân – K19 HTTT Trang 15
tích hợp các thông tin được gắn với một nền hình học (bản đồ) nhất quán trên
cơ sở tọa độ của các dữ liệu đầu vào
Có nhiều cách tiếp cận khác nhau liên quan đến định nghĩa về GIS như:
Định nghĩa theo chức năng: GIS là một hệ thống bao gồm 4 hệ con: Dữ
liệu vào, quản trị dữ liệu, phân tích dữ liệu và dữ liệu ra
Định nghĩa theo khối công cụ: GIS là tập hợp phức tạp của các thuật toán Định nghĩa theo mô hình dữ liệu: GIS gồm các cấu trúc dữ liệu được sử
dụng trong các hệ thống khác nhau (cấu trúc dạng Raster và Vecter)
Định nghĩa về mặt công nghệ: GIS là công nghệ thông tin để lưu trữ, phân
tích và trình bày các thông tin không gian và thông tin phi không gian, công nghệ GIS có thể nói là tập hợp hoàn chỉnh các phương pháp và các phương tiện nhằm sử dụng và lưu trữ các đối tượng
Định nghĩa theo sự trợ giúp và ra quyết định: GIS có thể coi là một hệ
thống trợ giúp việc ra quyết định, tích hợp các số liệu không gian trong một cơ chế thống nhất
Tuy có nhiều cách định nghĩa GIS như vậy nhưng đến nay đã thống nhất
quan niệm chung: GIS là một hệ thống kết hợp giữa con người và hệ thống
máy tính cùng các thiết bị ngoại vi để lưu trữ, xử lý, phân tích, hiển thị các thông tin địa lý để phục vụ một mục đích nghiên cứu, quản lý nhất định
1.1.4.2 Các thành phần của GIS
GIS bao gồm 5 thành phần sau: Phần cứng, phần mềm, dữ liệu, con người
và phương pháp quản lý
Trang 16Hoàng Thị Vân – K19 HTTT Trang 16
Hình 1-5 Các thành phần của hệ thống GIS
1) Phần cứng
Phần cứng là hệ thống máy tính mà một hệ GIS hoạt động trên đó Ngày nay, phần mềm GIS có khả năng chạy trên rất nhiều dạng phần cứng, từ máy chủ trung tâm đến các máy trạm hoạt động độc lập hoặc liên kết mạng 2) Phần mềm
Phần mềm GIS cung cấp các chức năng và các công cụ cần thiết để lưu trữ, phân tích và hiển thị thông tin địa lý Các thành phần chính trong phần mềm GIS là:
+ Công cụ nhập và thao tác trên các thông tin địa lý + Hệ quản trị cơ sở dữ liệu (DBMS)
+ Công cụ hỗ trợ hỏi đáp, phân tích và hiển thị địa lý + Giao diện đồ hoạ người - máy (GUI) để truy cập dễ dàng
3) Dữ liệu
Dữ liệu được coi thành phần quan trọng nhất trong một hệ GIS Hệ GIS
sẽ kết hợp dữ liệu không gian với các nguồn dữ liệu khác để tổ chức lưu trữ
và quản lý dữ liệu
4) Con người
Công nghệ GIS sẽ bị hạn chế nếu không có con người tham gia quản lý
hệ thống và phát triển những ứng dụng GIS trong thực tế Người sử dụng GIS có thể là những chuyên gia kỹ thuật, người thiết kế và duy trì hệ thống, hoặc những người dùng GIS để giải quyết các vấn đề trong công việc
Trang 17Hoàng Thị Vân – K19 HTTT Trang 17
5) Phương pháp quản lý
Ðây là phần rất quan trọng để đảm bảo khả năng hoạt động của hệ thống, là yếu tố quyết định sự thành công của việc phát triển công nghệ GIS Hệ thống GIS cần được điều hành bởi một bộ phận quản lý, bộ phận này phải được bổ nhiệm để tổ chức hoạt động hệ thống GIS một cách có hiệu quả để phục vụ người sử dụng thông tin
1.1.4.3 Cấu trúc dữ liệu trong GIS
Cơ sở dữ liệu của GIS gồm hai phần cơ bản là dữ liệu bản đồ và dữ liệu thuộc tính Mỗi một loại dữ liệu có đặc trưng riêng và chúng yêu cầu lưu trữ,
Dữ liệu thuộc tính
Là những thông tin mô tả về đặc tính, đặc điểm và các thông tin liên quan khác gắn liền với đối tượng địa lý xác định Các thông tin của dữ liệu thuộc tính bao gồm:
- Ðặc tính của đối tượng: liên kết chặt chẽ với các thông tin đồ họa, các dữ liệu này được xử lý và phân tích theo ngôn ngữ truy vấn cấu trúc (SQL)
- Dữ liệu tham khảo địa lý: Mô tả các sự kiện hoặc hiện tượng xảy ra tại một vị trí xác định
Trang 18Hoàng Thị Vân – K19 HTTT Trang 18
- Chỉ số địa lý: là các chỉ số về tên, địa chỉ, khối, phương hướng định vị, liên quan đến các đối tượng địa lí, được lưu trữ trong GIS để lựa chọn, liên kết và tra cứu dữ liệu
Hệ thống GIS sử dụng phương pháp chung để liên kết hai loại dữ liệu này thông qua bộ xác định, lưu trữ đồng thời trong các thành phần đồ thị và phi đồ thị Các bộ xác định có thể đơn giản là một số duy nhất liên tục, ngẫu nhiên hoặc là các chỉ báo địa lí hay dữ liệu vị trí lưu trữ Bộ xác định cho một thực thể có thể chứa tọa độ phân bố của nó, số hiệu mảnh bản đồ, mô tả khu vực hoặc là một con trỏ đến vị trí lưu trữ của dữ liệu liên quan
1.1.4.4 Các chức năng của GIS
GIS có các phép xử lý, phân tích của chức năng này dành riêng cho dữ liệu không gian và phi không gian Các chức năng cơ bản của GIS là:
- Chuyển đổi hệ toạ độ, phép chiếu, nắn chỉnh bản đồ
- Thực hiện các phép toán số học, logic, hình học, đại số
- Chồng xếp, làm sạch, làm trơn, tách hoặc hợp các lớp thông tin không gian và phi không gian
- Phân loại các lớp thông tin trên bản đồ
- Nội suy bề mặt cho điểm, đường, tạo bề mặt địa hình từ các đường đồng mức, tạo ảnh phối cảnh ba chiều, tính toán độ dốc
- Tính toán thống kê khoảng cách, mô hình hoá và kết hợp với các hệ chuyên gia
- Xác định chọn lọc vùng theo một tiêu chuẩn bất kỳ
1.2 Cơ sở dữ liệu thời gian
1.2.1 Khái niệm
Cơ sở dữ liệu thời gian là một cơ sở dữ liệu được xây dựng với sự hỗ trợ cho việc xử lý các dữ liệu thời gian bao gồm lưu trữ, truy vấn và cập nhật dữ liệu thời gian Các dữ liệu thời gian này thường được yêu cầu ở một số khía cạnh của CSDL khi tổ chức thông tin Điều này thể hiện sự cần thiết cho việc phát triển một tập hợp các khái niệm thống nhất cho các nhà phát triển ứng dụng sử dụng
Cơ sở dữ liệu thời gian được phát triển từ những ngày đầu khi phát triển cơ sở
dữ liệu Tuy nhiên trong việc phát triển các ứng dụng, CSDL thời gian được phát triển chủ yếu để các nhà phát triển ứng dụng tìm hiểu, xây dựng và thiết kế các chương trình liên quan tới các khái niệm thời gian
Trang 19Hoàng Thị Vân – K19 HTTT Trang 19
Có rất nhiều các ứng dụng thực tế mà khía cạnh thời gian là vô cùng cần thiết
để có thể duy trì các thông tin trong một cơ sở dữ liệu Ví dụ như: các ứng dụng chăm sóc sức khỏe cần lịch sử về thời gian phát bệnh, thời gian điều trị và cấp thuốc,… Các ứng dụng về tài chính yêu cầu các thuộc tính thời gian về sự tăng giảm cổ phiếu, Các ứng dụng ngân hàng cần các lịch sử giao dịch,… Vì vậy, vấn
đề đặt ra là làm thế nào để xây dựng các ứng dụng CSDL có yêu tố thời gian một các hợp lí và hiệu quả
Cụ thể hơn, đối với CSDL thời gian thì khía cạnh thời gian thường rất quan trọng, nó bao gồm: thời gian sống (LifeSpan), thời gian hợp lệ (Valid time), thời gian giao dịch (transaction time) và biteporal hay Life Tran Thời gian hợp lệ là khoảng thời gian mà một sự kiện nào đó sảy ra đúng với thời gian của thế giới CSDL được coi là đúng Còn bitemporal là kết hợp của thời gian hợp lệ và thời gian giao dịch
1.2.2 Mô hình dữ liệu thời gian
Có rất nhiều mô hình đề xuất xây dựng mô hình quan hệ có yếu tố thời gian như TERM, RAKE, MOTAR,… những tiêu biểu nhất là mô hình TimeER Đây là một hướng mở rộng của mô hình ER có yếu tố thời gian
Mô hình TimeER này có hỗ trợ 5 loại thời gian như: Thời gian sống (LifeSpan
- LS), thời gian hợp lệ (Valid Time - VT), Thời gian giao tác (Transaction Time - TT), LS + TT = LT (Life Tran), VT + TT = BT (BiTemptral) Ngoài ra, do một mối quan hệ có thể xem là một tập thực thể hoặc một thuộc tính, vì vậy người thiết
kế có thể xác định các yêu tố thời gian hỗ trợ cho mối quan hệ đó nếu thấy cần thiết
Trang 20Hoàng Thị Vân – K19 HTTT Trang 20
Hình 1-6 Một ví dụ về mô hình TimeER
Các thành phần của mô hình:
- Tập thực thể: trong mô hình TimeER, tập thực thể mạnh (gọi tắt là tập thực thể) thường được biểu diễn bởi hình chữ nhật nét đơn Đối với tập thực thể yếu, người ta sử dụng hình chữ nhật nét đôi Nếu tập thực thể đó có hỗ trợ thời gian sống, hoặc thời gian giao dịch, hoặc cả hai, thì thêm kí hiệu
LS, TT, hoặc LT vào sau tên tập thực thể tương ứng Việc hỗ trợ yếu tố thời gian của tập thực thể yếu là độc lập với thực thể chủ của nó
- Thuộc tính: Thuộc tính đơn trị được biểu diễn bởi hình oval nét đơn, còn thuộc tính đa trị sử dụng hình oval nét đôi Khác với thuộc tính đơn, thuộc tính phức hợp biểu diễn hình oval có các cung nối đến các thuộc tính thành phần của nó
Do một thuộc tính đơn trị và phức hợp gồm n thuộc tính thành phần là
có thể được thay bằng n thuộc tính đơn trị và đơn Vì vậy, các thuộc tính của một tập thực thể hay một thuộc tính phức hợp chỉ có thể là một trong các loại thuộc tính sau: đơn trị và đơn, đa trị và đơn, hoặc đa trị và phức hợp
Nếu thuộc tính có hỗ trợ thời gian hợp lệ, thời gian giao tác, hoặc cả hai thì thêm kí hiệu VT, TT hoặc BT ở bên phải thuộc tính đó Nếu thuộc tính phức hợp có hỗ trợ yếu tố thời gian gì thì các thuộc tính thành phần của nó cũng được hỗ trợ thời gian đó Các tập thực thể có hỗ trợ yếu tố thời gian
Trang 21Hoàng Thị Vân – K19 HTTT Trang 21
hoặc phi thời gian đều có thể có các thuộc tính có yếu tố thời gian và phi thời gian
- Mối quan hệ: Một mối quan hệ được biểu diễn bởi hình thoi Việc đưa yếu tố thời gian vào mối quan hệ tùy thuộc vào người thiết kế CSDL Nếu mối quan hệ có quản lý yếu tố thời gian thì gọi là mối quan hệ có yếu tố thời gian, ngược lại gọi là mối quan hệ phi thời gian
- Mối quan hệ lớp cha/lớp con: Tương tự mô hình ER, trong mô hình này một lớp con thừa kế tất cả các thuộc tính và các hỗ trợ về thời gian từ lớp cha của nó Ngoài ra, còn có thể bổ sung thêm yếu tố thời gian cho các thuộc tính riêng của nó
1.2.3 Truy vấn dữ liệu thời gian
Một ngôn ngữ truy vấn TSQL (Time Structured Query Language) được thiết
kế để cho các truy vấn cơ sở dữ liệu thời gian TSQL được đề xuất bởi S.B.Navathe và R.Ahmed vào năm 1993 TSQL là một ngôn ngữ mở rộng của SQL và được giới thiệu một vài định nghĩa và thành phần cú pháp mới Khi truy vấn, TSQL có cấu trúc mới sau:
- Biểu thức có điều kiện về thời gian sử dụng mệnh đề WHEN
- Lấy các giá trị nhãn thời gian có hoặc không có tính toán
- Lấy những thông tin về thời gian được yêu cầu
- Đặc biệt sử dụng kỹ thuật miền thời gian với mệnh đề TIME – SLICE
- Được thay đổi chức năng tổng hợp và mệnh đề GROUP BY
Cú pháp chính của một câu truy vấn TSQL:
SELECT [FIRST| SECOND| THIRD|….|LAST]
hệ tiêu chuẩn Vì vậy, người ta đã thay đổi và mở rộng một số quan hệ đại số tiêu chuẩn để tạo ra một ngôn ngữ truy vấn có thể kết hợp các hoạt động tại một điểm thời gian và khoảng thời gian diễn ra hoạt động đó Ngoài ra, còn có một tập hợp các phép toán đại số được yêu cầu để hỗ trợ cho truy vấn thời gian như: phép chiếu, chọn và kết nối tự nhiên
1.2.4 CSDL thời gian trong hệ quản trị CSDL quan hệ
Trang 22Hoàng Thị Vân – K19 HTTT Trang 22
Trong các hệ quản trị cơ sở dữ liệu thì CSDL thời gian xuất hiện trong hầu hết các CSDL Tuy nhiên, cơ sở dữ liệu thời gian ở đây chỉ đóng vai trò một cột hoặc nhiều cột trong một quan hệ CSDL quan hệ vẫn hỗ trợ các các kiểu thuộc tính thời gian date hoặc date/time và các truy vấn để truy vấn dữ liệu thời gian
1.3 Đánh giá một số hệ quản trị CSDL không gian, thời gian
1.3.1 PostGreSQL và PostGIS
1.3.1.1 PostGreSQL
PostgreSQL là một hệ quản trị cơ sở dữ liệu mã nguồn mở, dựa trên nền tảng của INGRES do giáo sư Michael Stonebraker của Đại học Califonia phát triển Từ khi ra đời đến này, hệ quản trị cơ sở dữ liệu này đã có hơn 15 năm phát triển, đồng thời được kiểm chứng và tạo lòng tin với người sử dụng, đặc biệt trong cộng đồng những người nghiên cứu Hiện nay, PostgreSQL là một trong những dự án mã nguồn mở phổ biến nhất trên Internet
PostgreSQL là một hệ quản trị cơ sở dữ liệu quan hệ đối tượng, tương thích với chuẩn SQL và có khả năng làm việc trên cơ sở dữ liệu lớn Không những vậy, hệ quản trị cơ sở dữ liệu này còn tạo được lòng tin với người sử dụng về
độ tin cậy, tính toàn vẹn dữ liệu và tính đúng đắn PostgreSQL có thể chạy trên tất cả các hệ điều hành, bao gồm cả Linux, UNIX (AIX, BSD, HP-UX, SGI IRIX,…) và cả Windows Có hỗ trợ đầy đủ các foreign keys, joins, views, triggers và stored procedures (trên nhiều ngôn ngữ) Nó bao gồm các kiểu dữ liệu SQL 2008 như INTERGER, NUMBER, BOOLEAN, CHAR, VARCHAR, DATE INTERVAL, TIMESTAMPs PostgreSQL cũng hỗ trợ lưu trữ các đối tượng có kiểu dữ liệu nhị phân lớn, bao gồm cả hình ảnh, âm thanh hoặc video Hệ quản trị cơ sở dữ liệu này được sử dụng thông qua giao diện của các ngôn ngữ C/ C++, Java, Net, Perl, Python, Ruby, Tcl, ODBC,…
Ngoài ra, PostGreSQL còn hỗ trợ một phần rất lớn SQL chuẩn và cung cấp nhiều tính năng hiện đại như: các truy vấn phức hợp, khóa ngoài, trigger, khung nhìn, tính toàn vẹn của các giao dịch, kiểm tra truy cập đồng thời đa phiên bản Hon nữa, PostGreSQL có thể được mở rộng bởi nhiều người dùng bằng nhiều cách như mỗi người dùng có thể thêm kiểu dữ liệu, hàm, toán tử, hàm tập hợp, phương thức đánh chỉ mục và ngôn ngữ thủ tục
1.3.1.2 PostGIS
PostGIS là một phần mở rộng của hệ quản trị CSDL PostGreSQL để quản
lí các đối tượng của GIS Đây là một dự án mã nguồn mở về CSDL không gian đang được nghiên cứu và phát triển bởi Refractions Research PostGIS được
Trang 23Hoàng Thị Vân – K19 HTTT Trang 23
phát hành theo GNU – General Pubic License Refractions Research đang tiếp tục phát triển PostGIS, bổ sung các công cụ giao diện với người dùng, hỗ trợ các topology cơ bản, chuẩn hóa dữ liệu, chuyển đổi tọa độ, lập trình API và nhiều hơn nữa Trong tương lai, dự án sẽ phát triển để hỗ trợ topo đầy đủ, hỗ trợ raste, tính toán mạng lưới và định tuyến, xây dựng bề mặt ba chiều, các đường cong, uốn khúc và nhiều tính năng khác
Hình 1-7 Vị trí của PostGIS trong PostGreSQL
a) PostGIS có những ưu điểm sau đây:
PostGIS là một CSDL không gian có những ưu điểm để xử lý các thông tin về hình dạng không gian như trả lời các truy vấn về đối tượng ở gần một vị trí nào đó, những đối tượng nằm trong phạm vi hoặc ở một vùng phụ cận của một đối tượng khác, phạm vi của một vùng nơi mà đang có hoạt động nào đó sảy ra, những đối tượng nào nằm bên trong một đối tượng khác
PostGIS có khả năng lưu trữ và thao tác với dữ liệu rất tốt Nó cung cấp những khả năng xử lý thông tin địa lý bên trong một môi trường cơ sở
dữ liệu Những hàm SQL bao gồm: buffer, intersection, within, distance,… Những hàm này lấy dữ liệu trong bảng PostGIS và trả về những hình học mới hoặc những thông tin khác
Cho phép kết nối dễ dàng dữ liệu không gian với dữ liệu phi không gian trong một môi trường dữ liệu không gian và cung cấp đầy đủ sức mạnh của ngôn ngữ SQL để thực hiện các phân tích khác nhau
PostGIS còn hỗ trợ thêm GiST-based và R-Tree spatial indexes, đây là điểm khác biệt của PostGIS so với các hệ quản trị CSDL khác, giúp PostGIS dễ dàng quản lý, lưu trữ, khai thác và tìm kiếm thông tin về không gian
b) Một số đối tượng không gian theo chuẩn của PostGIS
Trang 24Hoàng Thị Vân – K19 HTTT Trang 24
Đối với PostGIS, ta có thể lưu trữ các điểm, đường, vùng, tập hợp điểm, và các thông tin hình học khác OpenGIS định nghĩa hai kiểu chuẩn
để diễn tả đối tượng không gian đó là: Well Known Text (WKT) và Well Known Binary (WKB)
Well Known Text: bao gồm các thông tin về kiểu của đối tượng và các tọa độ dạng đối tượng Ví dụ như:
POINT(0 0) LINESTRING (0 0, 1 1, 1 2) POLYGON((0 0, 4 0, 4 5, 0 5, 00), (1 1, 2 1, 2 2, 1 2, 1 1))
Well Known Binary: lưu trữ các đối tượng hình học ở dạng nhị phân Khi lưu đối tượng vào CSDL, PostGIS sẽ chuyển các đối tượng từ dạng WKT sang WKB để tiện cho việc lưu trữ
POINT(0 0) = 0101000000000000000000F03F0000000000000000 c) Một số hàm trong PostGIS
Trong PostGIS có rất nhiều các hàm truy vấn được chia nhóm như: nhóm hàm điều khiển, nhóm hàm khởi tạo, các hàm trả về kiểu hình học ở đầu ra,… Tuy nhiên, dưới đây chỉ giới thiệu các hàm cơ bản nhất có liên quan trực tiếp tới bài toán của luận văn:
Nhóm hàm điều khiển
AddGeometryColumn(): Hàm thêm cột hình học vào bảng dữ liệu liệu đã tồn tại
- Cú pháp:
AddGeometryColumn(varchar table_name, varchar
column_name, integer srid, varchar type, integer dimension);
- Ví dụ:
SELECT AddGeomtryColumn(„my_schema‟,
„my_spatial_table‟, „the_geom‟,4326, ‟POINT‟, 2);
DropGeometryColumn(): Loại bỏ một cột hình học từ bảng không gian
Trang 25Hoàng Thị Vân – K19 HTTT Trang 25
1.3.2 SQL Server và phần mở rộng dữ liệu không gian
1.3.2.1 Tổng quan về SQL Server
SQL Server là hệ thống quản trị cơ sở dữ liệu quan hệ do Microsoft phát triển, nó sử dụng ngôn ngữ lập trình và truy vấn cơ sở dữ liệu Transact -SQL
để trao đổi dữ liệu giữa máy trạm (Client) và máy chủ (Server)
Transact – SQL dựa trên ngôn ngữ truy vấn có cấu trúc chuẩn (ANSI-SQL:
là ngôn ngữ truy vấn có cấu trúc do học viên quốc gia Hoa Kỳ đưa ra), SQL thường được gọi là SQL, ngôn ngữ này là cách thức chuẩn để giao tiếp với CSDL
ANSI-SQL Server có những tính năng cơ bản sau:
Cho phép quản trị một hệ CSDL lớn, có tốc độ xử lý dữ liệu nhanh, đáp ứng nhu cầu về thời gian
Cho phép nhiều người cùng khai thác trong cùng một thời điểm đối với một CSDL và toàn bộ quản trị CSDL
Sử dụng các câu truy vấn dữ liệu SQL
Có hệ thống phân quyền bảo mật tương thích với hệ thống bảo mật công nghệ NT (Network Technology) hoặc sử dụng hệ thống bảo vệ độc lập của SQL Server
Hỗ trợ trong việc triển khai CSDL phân tán và phát triển ứng dụng trên Internet
Trang 26Hoàng Thị Vân – K19 HTTT Trang 26
Cho phép lập trình kết nối với nhiều ngôn ngữ lập trình khác dùng để xây dụng các ứng dụng đặc thù (Visual Basic, C, C++, ASP, ASP.NET,…)
1.3.2.2 Lưu trữ dữ liệu không gian trên SQL Server
Để lưu trữ dữ liệu không gian, SQL Server giới thiệu 2 kiểu dữ liệu không gian là:
- Kiểu dữ liệu hình học (Geometry): là kiểu dữ liệu không gian cơ bản được sử dụng để biểu diễn các đối tượng trong hệ tọa độ Euclide (tọa độ phẳng)
- Kiểu dữ liệu địa lý (Geography): Là kiểu dữ liệu không gian cơ bản được sử dụng để biểu diễn các đối tượng trong hệ tọa độ trái đất (tọa độ Ellipsoid)
SQL server hỗ trợ 11 kiểu đối tượng dữ liệu địa lý để bạn có thể tạo và làm việc nhanh chóng trong cơ sở dữ liệu Hình 1-7 thể hiện cây phân cấp hình học cho các đối tượng địa lý trong SQL server, các đối tượng được kế thừa các thuộc tính từ lớp cha của nó, ví dụ như LineString kế thừa thuộc tính của đối tượng Curve, Polygon kế thừa thuộc tính có Surface,…
Hình 1-8 Mô hình thiết kế của các đối tượng không gian
Trong SQL Server, các đối tượng hình học cũng được mô tả bởi WKT hoặc WKB như trong PostGIS Với sự hỗ trợ làm việc với các đối tượng không gian, người sử dụng SQL Server có thể thực hiện việc lưu trữ dữ liệu không gian cũng như thực hiện truy vấn không gian mà các hệ quản trị CSDL truyền thống (không chứa thành phần không gian – non spatial database) không thể thực hiện được Tính năng này sẽ cung cấp cho các nhà quản lý trong các lĩnh vực
Trang 27Hoàng Thị Vân – K19 HTTT Trang 27
liên quan đến yếu tố không gian một hệ quản trị CSDL phù hợp, đặc biệt là những nhà quản lý về tài nguyên – môi trường, nhà quản lý giao thông, các hệ thống điện – cấp thoát nước, người nghiên cứu về địa lý, cũng như các nhà quy hoạch phát triển kinh tế
1.4 Tổng kết chương
Chương I trình bày các khái niệm tổng quan về cơ sở dữ liệu thời gian và không gian, về hệ thống GIS Tìm hiểu hai hệ quản trị CSDL hỗ trợ lưu trữ kiểu dữ liệu không gian là PostGreSQL (phần mở rộng PostGIS) và SQL Server
Trang 28Hoàng Thị Vân – K19 HTTT Trang 28
CHƯƠNG II MÔ HÌNH TRỰC QUAN HÓA SỰ KIỆN LỊCH SỬ
2.1 Bài toán thực tiễn
Chúng ta đều biết rằng bộ môn Lịch Sử giữ một vị trí quan trọng trong chương trình đào tạo THPT, vì bộ môn này rất có ưu thế trong việc giáo dục các thế hệ trẻ Tuy nhiên, do chưa nhận thức đầy đủ hoặc phiến diện vai trò, ý nghĩa, chức năng của
bộ môn Lịch Sử, rất nhiều người thậm chí cả giáo viên và học sinh đều tỏ ra coi thường bộ môn này Nhiều nhà quản lí cho rằng, trong thời kì khoa học công nghệ phát triển nhanh chóng, sử học cũng như các khoa học xã hội nhân văn khác không thể có vị trí ngang hàng với khoa học tự nhiên – kĩ thuật Ở phương Tây đã có ý kiến khai tử khoa học lịch sử và biến bộ môn này trong nhà trường thành việc kể chuyện lịch sử
Tại các trường THPT nước ta hiện nay đang nói lên một thực trạng cấp bách về việc dạy và học Lịch Sử Nhiều giáo viên cảm thấy chán nghề vì học sinh và xã hội không còn coi trọng bộ môn này nữa Người giáo viên không còn tâm huyết với nghề, không còn muốn truyền cảm hứng vào bài dạy để nói cho học sinh về truyền thống vẻ vang của cha ông ta Nhiều nhà trường cho rằng đây là môn học thuộc không cần chú trọng và đầu tư nhiều Khi nào tốt nghiệp thì mới cần tăng số tiết, nếu không thì cắt giảm số tiết để nhường cho các môn học khác Để đảm bảo chương trình và nội dung giáo viên chỉ cần cho học sinh chép và học thuộc những nội dung bài trong sách giáo khoa là đủ Đây là một quan điểm phi khoa học đã hình thành thói quen kiểu dạy học đối phó, thi đối phó Nếu tính đến công sức đầu tư cho việc giảng dạy thì giáo viên dạy môn Lịch Sử tốn khá nhiều thời gian Để có những tiết dạy tốt, những giờ dạy hay, ngoài kiến thức cơ bản trong sách giáo khoa, giáo viên cần nhiều thời gian và công sức chuẩn bị sơ đồ, bản đồ, tranh ảnh minh họa, sự cập nhật kiến thức qua internet, máy chiếu, phòng học đa năng, máy tính… Tuy nhiên, ở rất nhiều trường học hiện nay, đều thiếu những công cụ trực quan như trên để giúp học sinh có được những tiết học hay và bổ ích
Mặc khác, học sinh thì chán nản không muốn học Đa số các em hiện nay đều học theo khối và chủ yếu là các khối tự nhiên, các em cảm thấy rằng không cần thiết phải học Lịch Sử, vì theo quan điểm của các em thì môn học này học chẳng để làm gì vì không có ứng dụng thực tiễn Số học sinh khác thì coi thường môn học và nghĩ rằng đây là một môn học phụ không cần thiết Hơn nữa, để học môn này chỉ cần học thuộc lòng không cần tư duy như những môn học khác Số học sinh còn lại thì bị mất gốc từ những lớp dưới nên khi học lên đến bậc THPT cũng không mặn mà với môn học này Những em xác định thi khối C có môn Sử thì chỉ muốn môn Sử khỏi điểm liệt rồi học những môn còn lại để bù lại điểm
Trang 29Hoàng Thị Vân – K19 HTTT Trang 29
Từ rất nhiều những lý do khó nói đã nêu lên một tình trạng báo động về việc dạy
và học Lịch Sử Bắt đầu từ năm 2005 cho đến này, sau mỗi kỳ thi, mọi người đều ngỡ ngàng trước kết quả của môn học này Năm 2005 có 58.5% số bài thi Lịch Sử bị điểm
1 trở xuống, năm 2006 điểm trung bình các bài thi ở một mức điểm vô cùng thấp 1.96 điểm, thấp nhất trong các môn thi đại học Năm 2007, điểm dưới trung bình chiếm 94.74% Vài năm trở lại đây, số thi sinh dự thi đại học khối C – khối có môn Sử rất ít, chỉ chiếm khoảng 5 – 10% [26]
Nhất là từ năm 2014, học sinh có thể lựa chọn 4 môn để thi tốt nghiệp, trong đó có
2 môn bắt buộc và 2 môn tự chọn thì tình trạng môn Lịch Sử trở nên lép vế hơn hẳn Tại trường THPT Lương Thế Vinh (Hà Nội) – ngôi trường ngoài dân lập có lớp đào tạo thuộc top đầu của bậc THPT ở Thủ đô, không có một học sinh nào đăng kí thi môn Lịch Sử Tại tỉnh Hưng Yên trong 3 hội đồng sở giáo dục đến kiểm tra thì có đến
2 hội đồng không có thi sinh nào thi môn Sử, toàn tỉnh có 15/36 hội đồng không có thí sinh thi Sử và rất nhiều hội đồng chỉ có vài ba thí sinh thi Trường THPT Nguyễn Thị Minh Khai (quận 3, TP.HCM) trong giờ thi Sử chỉ có đúng 2 thí sinh dự thi Trường THPT Quang Trung (quận Đống Đa, Hà Nội) chỉ có duy nhất 1 thí sinh thi môn Sử và còn rất nhiều những hội đồng thi trên cả nước cũng chung tình trạng như trên Theo thống kê của bộ giáo dục và đào tạo thì năm 2014 chỉ có 11.52 % thí sinh chọn thi môn Sử, thấp nhất trong tất cả các môn được chọn.[28]
Năm 2015 là năm áp dụng bỏ thi tốt nghiệp để tổ chức kỳ thi THPT quốc gia Tình trạng của môn Sử cũng không khả quan hơn là mấy Theo thống kê có chỉ có khoảng 153.000 thí sinh cả nước đăng kí thi môn Sử, nhưng bất ngờ hơn khi số thí sinh bỏ thi cũng rất nhiều Tại Cần Thơ, có 477/4925 em đăng kí thi môn Sử và có đến 14/28 điểm thi ở tỉnh này không có thí sinh và những điểm khác thì có rất ít thí sinh dự thi Đồng Nai có 299 thí sinh đăng kí thi nhưng không có thí sinh nào thi môn Sử Đà Nẵng chỉ có 5/29 hội đồng thi môn Sử, Huế đóng cửa 19 điểm thi,… Đây là tình trạng chung của rất nhiều các hội đồng thi trên cả nước Nhưng có lẽ những điều trên đây vẫn chưa là gì khi chúng ta nhìn vào kết quả thi của môn học này khi rất nhiều trường đại học có trên 98% bài môn Sử dưới trung bình, thậm chí có trường chỉ có một thí sinh đạt điểm trung bình Còn theo thống kê của bộ giáo dục và đào tạo thì điểm thi môn Lịch Sử của các thí sinh chỉ tập trung chủ yếu ở mức điểm từ 4 đến 6, và có rất nhiều thí sinh được 1 – 2 điểm hoặc bị điểm 0.[27]
Trang 30Hoàng Thị Vân – K19 HTTT Trang 30
Hình 1-9 Phổ điểm các môn thi THPT quốc gia năm 2015
Đây là một tình trạng đáng buồn cho các thế hệ trẻ hiện nay khi không hề có kiến thức về môn Sử Đã có rất nhiều bài báo và phóng sự truyền hình đã đi sâu thực tiễn, phỏng vấn chính các em học sinh đang ngồi trên ghế nhà trường về những câu hỏi rất đơn giản như: „Quang Trung là ai?”, “Tên thật của Bà Trưng và Bà Triệu là gì?”,…
và đa số đều trả lời sai hoặc không biết Tình trạng này khiến các nhà Sử học, giáo viên và toàn xã hội không khỏi băn khoăn, lo lắng
Tại trường THPT Chuyên Hà Nội – Amsterdam, mặc dù là trường chuyên trọng điểm của thành phố Hà Nội và có lớp chuyên Sử Nhưng việc học môn Lịch sử cũng
có rất nhiều điều đáng nói Đa số các học sinh không chuyên thì cũng học môn Sử như những trường hợp đã nêu trên Đối với học sinh chuyên, chỉ bạn nào xác định có
đủ năng lực thi quốc gia mới theo học Sử, còn những bạn khác thì chuyên tâm học vào những môn chính như toán, văn, anh,… Đa số các em đều cảm thấy nhàm chán với môn Sử, một môn mà các em coi như môn thuộc lòng và cảm thấy không có sự yêu thích với môn học này
Đứng trước thực trạng về tình hình học Lịch Sử của các thế hệ trẻ ngày nay, ai cũng không khỏi băn khoăn và đặt ra câu hỏi “Tại sao môn Lịch Sử lại làm học sinh chán như vậy?” Lỗi do giáo viên, học sinh hay chương trình, sách giáo khoa… hay
do tất cả, và nếu là tất cả thì mỗi một yếu tố trên ảnh hưởng cụ thể là như thế nào? Đây là điều mà đã có rất nhiều học giả, giáo viên lên tiếng, nhưng cho đến nay vẫn chưa có một lí giải nào toàn diện Một trong những lí do dẫn đến chất lượng môn Lịch
sử kém là học sinh không cảm thấy hứng thú với môn học, môn học này có phương
Trang 31Hoàng Thị Vân – K19 HTTT Trang 31
pháp dạy lạc hậu, không có sự trực quan, không khơi dậy được sự hứng thú và yêu thích môn học Chính vì vậy, chúng ta cần nghiên cứu tìm cách khắc phục lí do trên
để phần nào có thể hỗ trợ cho việc học Lịch Sử ở các thế hệ học sinh có nhưng đổi mới tích cực hơn
2.2 Các phương pháp trực quan hóa dữ liệu
2.2.1 Khái niệm
Trực quan hóa (Visualization) là kỹ thuật tạo ra những hình ảnh, biểu đồ để
diễn tả thông điệp nào đó Trực quan hóa giúp diễn tả những ý tưởng trừu tượng của con người một cách cụ thể nhằm tăng cường nhận thức của con người
Trực quan hóa đã được sử dụng trong bản đồ, bản vẽ khoa học, những sơ đồ dữ liệu từ nhiều năm trước Ngày nay, trực quan hóa được thực hiện bởi các phần mềm chuyên biệt giúp việc trực quan hóa có những thành tựu đáng kể trong các lĩnh vực nghiên cứu khoa học
Trực quan hóa được phân thành nhiều nhánh phát triển, trong đó có một nhánh phát triển quan trọng là trực quan hóa dữ liệu
Trực quan hóa dữ liệu (Data visualization) là biểu diễn các thống kê được
trình bày bằng đồ họa gắn liền với các thông tin địa lý hoặc dữ liệu không gian trong các dạng biểu đồ
Mục tiêu của trực quan hóa dữ liệu là diễn tả thông tin một cách rõ ràng và dễ hiểu cho người sử dụng thông qua các bảng biểu hoặc biểu đồ Trực quan hóa một cách hiệu quả giúp cho người dùng đưa ra các phân tích đặc biệt như tạo phép so sánh và áp dụng thiết kế đồ họa (để hiển thị so sánh, nhân quả…) một cách chính xác hơn Hơn thế nữa, trực quan hóa khiến dữ liệu phức tạp trở thành dễ hiểu và
Ngày này với những dữ liệu ngày càng lớn như: camera giao thông, dữ liệu vệ tinh,… dẫn đến tình trạng “Big Data” Điều này làm cho việc phân tích và liên kết
dữ liệu trở nên vô cùng quan trọng và cần thiết Chính vì vậy, việc áp dụng trực
Trang 32Hoàng Thị Vân – K19 HTTT Trang 32
quan hóa dữ liệu sau này sẽ có sự phát triển mạnh mẽ hơn và điều này trở thành một thách thức lớn cho trực quan hóa dữ liệu
2.2.2 Kiến trúc và mô hình trực quan hóa dữ liệu
2.2.2.1 Kiến trúc trực quan hóa dữ liệu
Kiến trúc trực quan hóa dữ liệu (Data Presentation Architecture - DPA) là tập các kỹ năng hướng tới việc xác định, định vị, điều khiển, định dạng và biểu diễn dữ liệu theo cách tối ưu hóa việc truyền tải ý nghĩa và kiến thức
DPA là sự kết hợp của số học, dữ liệu và thống kê để khám phá ra thông tin
có giá trị từ dữ liệu, ngoài ra nó còn liên kết và tương tác với các hoạt động trực quan hóa dữ liệu, truyền thông, tổ chức tâm lý và quản lý thay đổi nhằm cung cấp giải pháp kinh doanh thông minh, tính toán thời gian phân phối, định dạng các phương thức và chiến lược một tổ chức hay doanh nghiệp
DPA có 2 đối tượng chính:
- Sử dụng dữ liệu để cung cấp kiến thức theo cách hiệu suất nhất: ít nhiễu, hoàn thiện và dữ liệu được đưa vào nhóm theo sự cần thiết
- Sử dụng dữ liệu để cung cấp kiến thức theo cách hiệu lực nhất có thể:
dữ liệu phù hợp, kịp thời và hoàn thiện theo cách rõ ràng, dễ hiểu nhất
để truyền đạt những ý nghĩa quan trọng
Hoạt động thực tế của PDA bao gồm:
- Tạo cơ chế phân phát hiệu quả cho mỗi nhóm thành viên dựa trên vai trò, nhiệm vụ, vị trí và truy cập công nghệ
- Xác định ý nghĩa quan trọng của từng nhóm thành viên cần dựa trên ngữ cảnh
- Xác định chu kỳ cần thiết để cập nhật dữ liệu
- Xác định chính xác thời gian trình bày dữ liệu
- Tìm được dữ liệu chính xác dữ liệu cần thiết
- Tận dụng phù hợp các phân tích, nhóm, trực quan hóa và các dạng trình diễn khác
2.2.2.2 Mô hình trực quan hóa dữ liệu
Mô hình trực quan hóa dữ liệu được xem như tập hợp các phân lớp, mỗi phân lớp đều có một nhiệm vụ chính và tương tác với các phân lớp khác trong
mô hình
Trang 33Hoàng Thị Vân – K19 HTTT Trang 33
Hình 2-1 Mô hình trực quan hóa dữ liệu
- Mô hình truyền thông (Communication Model): Biểu diễn sự tương tác giữa các thành phần hệ thống
- Mô hình dữ liệu (Data Model): Biểu diễn sự hiển thị dữ liệu
- Mô hình tính toán (Computation Model): Biểu diễn công thức tính toán
- Mô hình hiển thị (Display Model): Biểu diễn kết quả thực thi các thuật toán biểu diễn dữ liệu
- Mô hình tương tác (Interaction Model): Biểu diễn sự tương tác giữa người dùng và hệ thống trực quan hóa
- Mô hình người dùng (User Model): Biểu diễn yêu cầu
2.2.3 Trực quan hóa dữ liệu theo địa lý và thời gian
2.2.3.1 Trực quan hóa dữ liệu theo địa lý
Trực quan hóa theo địa lý là tập hợp các công cụ và kỹ thuật hỗ trợ phân tích dữ liệu theo địa lý thông qua sử dụng trực quan hóa tương tác nhằm tạo ra kiến thức từ những dữ liệu được lưu trữ hoặc được truyền tải Để làm được điều đó, trực quan hóa theo địa lý truyền tải thông tin theo địa lý bằng cách kết hợp sự hiểu biết của con người, cho phép khai thác dữ liệu và tạo quyết định Chúng ta biết rằng, bản đồ tính có khả năng khai thác giới hạn với sự diễn
tả đồ họa gắn bó chặt chẽ với thông tin địa lý Mặt khác, hệ thống GIS kết hợp với trực quan hóa địa lý làm cho bản đồ có tính tương tác cao hơn như phóng
to – thu nhỏ bản đồ, thay đổi biểu diễn trực quan của bản đồ, phân tích các lớp bản đồ,…
Đối với trực quan hóa dữ liệu địa lý thì việc sử dụng bản đồ là quan trọng nhất Trong thực tế có rất nhiều các loại bản đồ khác nhau như:
Trang 34Hoàng Thị Vân – K19 HTTT Trang 34
Choropleth là một trong số loại bản đồ thường sử nhất Đối với loại bản
đồ này thì màu sắc là thành phần quan trọng Màu sắc được gán cho các giá trị dữ liệu và giá trị đó được sử dụng để tô màu cho vùng đó
Hình 2-2 Một ví dụ của bản đồ Choropleth
Cartogram hiển thị bản đồ trực quan thông qua biểu diễn các đối tượng
địa lý dạng vùng theo kích thước tương ứng như dân số, GDP, …
Hình 2-3 Ví dụ về bản đồ dạng Cartogram
Proportional Symbol là một bản đồ sử dụng các hình khối tròn hoặc
định dạng khác nhau giữa một vùng Kích thước của các khối tròn quan
hệ với giá trị dữ liệu