Làm sạch và chuẩn hóa các cơ sở dữ liệu

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu xây dựng cơ sở dữ liệu nấm lớn phục vụ công tác bảo tồn tại vườn quốc gia tam đảo, tỉnh vĩnh phúc (Trang 68)

Từ các bảng dữ liệu trên, có th dễ dàng nhận thấy, việc làm sạch và chuẩn hóa các cơ sở dữ liệu về nấm lớn là rất cần thiết, do các thông tin đầu vào dƣới dạng thô, nhiều thông tin trùng lặp, không cần thiết.

Hai mục đích chính của việc chuẩn hóa dữ liệu đó là: Giảm thi u dƣ thừa dữ liệu; loại bỏ các bất thƣờng khi cập nhật cơ sở dữ liệu.

Đ chuẩn hóa các dữ liệu, cụ th là dữ liệu về không gian, ta cần đổi tọa độ từ dạng giờ, phút, giây sang dạng thập phân theo công thức nhƣ sau:

Tọa độ dạng thập phân = Giờ + (Phút/60) + (Giây/3600)

Từ công thức trên, nhập tọa độ vị trí phân bố của nấm và đổi sang định dạng thập phân thông qua phần mềm Microsoft Excel. Ta có bảng quy đổi, chuẩn hóa tọa độ vị trí phân bố của nấm lớn tại VQG Tam Đảo (Bảng 3.3 và 3.4).

Bảng 3.3. Chuẩn hóa tọa độ vị trí phân bố của Chi nấm Polyporus tại VQG Tam Đảo, tỉnh Vĩnh Phúc

STT Tên loài Ký hiệu mẫu

Vĩ độ Kinh độ

Giờ Phút Giây Tọa độ thập phân

Giờ Phút Giây Tọa độ thập phân 1 Polyporus adutus A4 21 23 15,00 21,3875 105 42 52,00 105,71444 A26 21 23 14,00 21,38722 105 42 52,00 105,71444 2 Polyporus affinis A8 21 23 19,00 21,38861 105 42 53,00 105,71472 A17 21 23 25,00 21,39028 105 42 46,00 105,71278 A74 21 27 44,20 21,46228 105 38 46,50 105,64625 A92 21 27 40,55 21,46126 105 38 46,30 105,64619 A99 21 27 40,00 21,46111 105 38 55,50 105,64875 3 Polyporus arcularius A49 21 27 37,00 21,46028 105 38 50,00 105,64722 4 Polyporus badius A43 21 23 36,30 21,39342 105 42 53,00 105,71472 A53 21 27 37,80 21,4605 105 38 47,90 105,64664 5 Polyporus chrysoloma A9 21 23 20,00 21,38889 105 42 53,00 105,71472 A27 21 23 14,00 21,38722 105 42 52,00 105,71444 A61 21 27 40,60 21,46128 105 38 46,00 105,64611 6 Polyporus A54 21 27 37,80 21,4605 105 38 47,90 105,64664

58 cinnabarinus 7 Polyporus fissilis A7 21 23 16,00 21,38778 105 42 52,00 105,71444 8 Polyporus leptocephalus A100 21 27 39,00 21,46083 105 38 50,50 105,64736 9 Polyporus perennis A13 21 23 20,00 21,38889 105 42 54,00 105,715 A25 21 23 12,50 21,38681 105 42 52,00 105,71444 10 Polyporus sanguineus A2 21 23 11,00 21,38639 105 42 50,00 105,71389 11 Polyporus vinosus A10 21 23 20,00 21,38889 105 42 53,00 105,71472 A11 21 23 20,50 21,38903 105 42 53,00 105,71472 12 Polyporus xanthopus A14 21 23 20,50 21,38903 105 42 54,00 105,715 A18 21 23 26,00 21,39056 105 42 44,00 105,71222 A20 21 23 36,00 21,39333 105 42 53,00 105,71472 A90 21 27 40,55 21,46126 105 38 46,30 105,64619

Bảng 3.4. Chuẩn hóa tọa độ vị trí phân bố của nhóm nấm Linh chi (Ganoderma) tại VQG Tam Đảo, tỉnh Vĩnh Phúc

STT Tên loài

hiệu mẫu

Vĩ độ Kinh độ

Giờ Phút Giây Tọa độ thập phân

Giờ Phút Giây Tọa độ thập phân 1 Ganoderma fulvellum M4 21 26 36,25 21,4434 105 38 3,70 105,63436 2 Ganoderma adspersum M8 21 26 36,90 21,44358 105 38 8,61 105,63573 3 Amauroderma subresinoum M3 21 26 49,64 21,44712 105 38 11,39 105,6365 4 Ganoderma resinaceum M1 21 26 40,25 21,44451 105 38 11,70 105,63658 5 Fomitopsis officinalis M21 21 26 37,13 21,44365 105 38 9,99 105,63611 6 Ganoderma sp1 M5 7 Ganoderma sp2 M6 21 26 42,60 21,44517 105 38 12,84 105,6369 8 Ganoderma M19 21 26 39,60 21,44433 105 38 11,32 105,63648

59 sp3 9 Ganoderma sp4 M14 21 26 42,21 21,44506 105 38 16,90 105,63803 10 Amauroderma sp5 M9 21 23 11,00 21,38639 105 42 50,00 105,71389

Ngoài việc chuẩn hóa dữ liệu về không gian, công việc chính trong bƣớc này đó là tách từng mẩu thông tin thành các phần nhỏ nhất, cụ th và cô đọng nhất. Ví dụ nhƣ: Các đặc đi m hình bên ngoài của nấm có th tách thành: Mũ nấm, thịt nấm, cuống nấm, lỗ nấm, vân nấm... Sau đó sẽ mô tả thông tin chi tiết hơn. Cụ th , mũ nấm sẽ đƣợc mô tả về: Hình dạng, kích thƣớc, màu sắc, bề mặt... Các thông tin này có th đƣợc dựa trên Mẫu phiếu mô tả nấm, các kết quả tổng hợp từ những nghiên cứu trƣớc đó đ đƣợc ki m chứng và thông qua. Sau khi xác định đƣợc những thông tin, dữ liệu cần thiết nhất, loại bỏ những thông tin thừa, ta tiến hành sắp xếp, phân chia thông tin vào bảng dữ liệu theo Khung cơ sở dữ liệu nấm.

Bƣớc này có th đƣợc lồng ghép thực hiện cùng quá trình xây dựng khung cơ sở dữ liệu nấm lớn đ tiết kiệm thời gian. Tuy nhiên, đòi hỏi ngƣời thực hiện phải có kiến thức chuyên môn về nấm, tránh việc bỏ sót những thông tin cần thiết hoặc tổng hợp những thông tin dƣ thừa.

3.2.3. Xây dựng khung cơ sở dữ liệu nấm

Khung cơ sở dữ liệu nấm lớn sẽ lƣu trữ các dữ liệu về đối tƣợng, các thông tin mô tả về hình thái bên ngoài, hình thái hi n vi, vị trí phân bố, hình ảnh...

Khung cơ sở dữ liệu này đƣợc xây dựng trên Phần mềm Microsoft Excel 2007, bằng cách nhập thông tin mô tả đ đƣợc làm sạch và chuẩn hóa (Hình 3.9 và 3.10). Cách nhập thủ công này g y khó khăn trong công tác nhập liệu, do quá trình xây dựng khung đòi hỏi chúng tôi phải đầu tƣ nhiều thời gian và công sức. Tuy nhiên, đ y là bƣớc không th thiếu trong quy trình xây dựng cơ sở dữ liệu.

60

Hình 3.8. Khung Cơ sở dữ liệu nấm lớn – VQG Tam Đảo, tỉnh Vĩnh Phúc (các thông tin về dữ liệu không gian, thông tin mô tả về đặc điểm bên ngoài)

61

62

Khung cơ sở dữ liệu nấm lớn sau khi xây dựng xong sẽ đƣợc tích hợp vào bản đồ nền đ x y dựng, dƣới dạng các đi m vị trí phân bố, kèm theo tên hi n thị của các loài nấm lớn đ tổng hợp trong file excel, thông qua lệnh Add Data trong ArcGIS. Sau khi thêm các dữ liệu từ file excel, chúng ta vẫn hoàn toàn có th ch nh sửa, thêm trƣờng thông tin, bổ sung, cập nhật các dữ liệu mới một cách dễ dàng.

3.3. Mô tả về cơ sở dữ liệu nấm lớn tại VQG Tam Đảo, tỉnh Vĩnh Phúc

Các dữ liệu đƣợc hi n thị trên bản đồ bằng nhiều phƣơng pháp khác nhau với 2 chế độ hi n thị dữ liệu: Data View và Layout View. Trong đó, chế độ Data View phù hợp với việc ch nh sửa và biên tập dữ liệu, Layout View thì phù hợp với việc trình bày đ chuẩn bị in ra giấy thành sản phẩm bản đồ.

Trong chế độ Layout View, trên màn hình, ngoài thanh công cụ Tools sẽ hi n thị thêm thanh công cụ Layout:

Thanh công cụ Layout cũng có các công cụ nhƣ: Phóng to, thu nhỏ. Tuy nhiên, cần phân biệt các công cụ này với các công cụ cùng tên trên thanh công cụ Tools:

- Các công cụ trên thanh Layout: Thay đổi tỷ lệ của trang giấy nhƣng không thay đổi tỷ lệ của bản đồ

- Các công cụ trên thanh Tools: Thay đổi tỷ lệ bản đồ nhƣng không thay đổi tỷ lệ trên trang giấy.

Đ chọn các đối tƣợng trong chế độ Layout View, sử dụng công cụ Select Elements trên thanh Tools (Hình 3.11)

63

Hình 3.10. Giao diện Layout view

Hình 3.11. Giao diện Data view

Chế độ xem Data view cho phép ch nh sửa bản đồ, thêm lớp cơ sở dữ liệu nấm lớn, đặt kí hiệu nấm là . Khi xem bằng chế độ này, việc ch nh sửa bản đồ sẽ phù hợp hơn do đầy đủ công cụ và dễ dàng phóng to, thu nhỏ bản đồ.

Sau khi tích hợp khung cơ sở dữ liệu nấm lớn đ xây dựng vào bản đồ nền địa l VQG Tam Đảo, t nh Vĩnh Ph c, vị trí phân bố sẽ đƣợc hi n thị trên bản đồ (Hình 3.13). K m theo đó có th tắt/ bật tên của nấm ở bên cạnh mỗi

64

bi u tƣợng nấm. Đồng thời, có th tra cứu, truy vấn thông tin thuộc tính, các dữ liệu không gian một cách dễ dàng, trực quan. Các thông tin có th hi n thị bao gồm: Các thông tin mô tả bên ngoài của nấm (hình dạng, kích thƣớc, màu sắc, bề mặt của mũ nấm, cuống nấm, thịt nấm, các đƣờng vân...); các thông tin mô tả về hình thái hi n vi (hình dạng, kích thƣớc, màu sắc của các bào tử, hệ sợi).

Hình 3.12. Vị trí phân bố của nấm khi hiển thị trên bản đồ

Hiện cơ sở dữ liệu nấm lớn đƣợc xây dựng trong luận văn này là tổng hợp thông tin thuộc tính và các dữ liệu không gian của Chi nấm Polyporus

(12 loài), Ganoderma (10 loài) và một số loài nấm lớn khác (5 loài). Với tổng số đi m vị trí phân bố trên bản đồ là 40 vị trí.

65

Khi thực hiện lệnh truy vấn thông tin thuộc tính của nấm, nhấn bi u tƣợng trên thanh công cụ và chọn loài nấm cần truy vấn (Hình 3.14 và 3.15). Khi đó, các trƣờng thông tin đ nhập về thông tin thuộc tính sẽ đƣợc hi n thị bao gồm: các thông tin về hình thái bên ngoài (kích thƣớc, hình dạng, màu sắc của mũ nấm, cuống nấm, lỗ nấm...) và các thông tin về hình thái hi n vi (kích thƣớc, hình dạng, màu sắc của bào tử, thông tin về hệ sợi...).

66

Đồng thời, cơ sở dữ liệu nấm lớn cũng cho phép ngƣời dùng truy vấn hình ảnh của nấm, bằng cách ấn bi u tƣợng trên thanh công cụ và chọn loài nấm cần tra cứu (Hình 3.15).

Hình 3.15. Thư mục hình ảnh của loài nấm cần tra cứu

Từ các thông tin thuộc tính cùng với CSDL, vị trí phân bố của nấm trên giao diện của ArcMap ch ng tôi đ đƣa ra đƣợc bản đồ vị trí phân bố nấm lớn tại VQG Tam Đảo (Hình 3.16). Trên cơ sở bản đồ vị trí phân bố nấm lớn này, chúng ta có th thấy đƣợc sự xuất hiện của nấm trên bản đồ. Từ đó, khoanh v ng đƣợc các khu vực xuất hiện nhiều nấm, vị trí phân bố của các loài nấm quý/ hiếm, đề xuất khu vực ƣu tiên bảo tồn. Đ y là một công cụ kỹ thuật rất hiệu quả phục vụ trực tiếp cho công tác quản lý và bảo tồn đa dạng sinh học nấm lớn.

Cùng với nghiên cứu này khi VQG Tam Đảo có thêm dữ liệu của nấm lớn khi đƣợc bổ sung hàng năm có th bổ sung và cập nhật vào CSDL. Đồng thời, có th chồng ghép các lớp bản đồ chuyên đề về nấm lớn qua từng năm đ thấy đƣợc sự thay đổi của các vị trí phân bố này theo thời gian. Từ đó, đƣa ra đƣợc những dự đoán, cũng nhƣ biện pháp bảo tồn hợp l đối với những loài

67

Hình 3.16. Bản đồ vị trí phân bố nấm lớn tại VQG Tam Đảo, tỉnh Vĩnh Phúc (khoanh vùng khu vực đề xuất ưu tiên bảo tồn)

68

KẾT LUẬN

Đề tài đ nghiên cứu một cách tƣơng đối toàn diện những nội dung nhƣ: Hiện trạng bảo tồn đa dạng sinh học nấm lớn tại VQG Tam Đảo, t nh Vĩnh Ph c; nghiên cứu cơ sở khoa học, các phƣơng pháp và quy trình x y dựng cơ sở dữ liệu nấm lớn tại khu vực nghiên cứu; xây dựng hệ thống cơ sở dữ liệu nấm lớn, tích hợp cơ sở dữ liệu về không gian, xây dựng bản đồ phân bố nấm lớn, từ đó đề xuất khu vực ƣu tiên bảo tồn. Nội dung và kết quả nghiên cứu là hoàn toàn phù hợp với yêu cầu của thực tiễn.

Hiện trạng bảo tồn Điều tra hiện trạng bảo tồn đa dạng sinh học nấm lớn đƣợc tổng hợp dựa trên kết quả điều tra x hội học đối với 2 đối tƣợng: Nhà quản l và ngƣời d n.

Ch ng tôi đ đƣa ra đƣợc các phƣơng pháp sử dụng đ x y dựng cơ sở dữ liệu nấm lớn cũng nhƣquy trình x y dựng cơ sở dữ liệu nấm lớn.

Áp dụng thử nghiệm thành công mô hình cấu tr c dữ liệu nền địa l và cơ sở dữ liệu lớp chuyên đề nấm từ bản đồ tỷ lệ 1/25.000 của VQG Tam Đảo, t nh Vĩnh Ph c. Ph hợp với yêu cầu và xu thế phát tri n hiện nay đó là ứng dụng công nghệ GIS trong việc ph n tích, đánh giá dữ liệu phục vụ công tác quản l , bảo tồn và các vấn đề khác liên quan đến đa dạng sinh học. Chức năng chính của cơ sở dữ liệu đƣợc thực hiện trong quá trình x y dựng bao gồm: lƣu trữ, truy xuất, tìm kiếm dữ liệu dƣới dạng bảng bi u, bản đồ ph n bố,.. dƣới định dạng file khác nhau phục vụ cho mục tiêu bảo tồn, theo dõi, nghiên cứu về nấm lớn. Việc x y dựng và khai thác, sử dụng cơ sở dữ liệu này sẽ phục vụ cho công tác quản l , bảo tồn nấm và các vấn đề khác có liên quan.

69

KIẾN NGHỊ

Việc ứng dụng công nghệ thông tin trong hoạt động nghiên cứu, tổng hợp ngày càng đƣợc đẩy mạnh, nâng cao. Chính vì vậy đòi hỏi ngƣời thiết kế, sử dụng cơ sở dữ liệu có trình độ chuyên môn đ phục vụ việc xây dựng và phát tri n cơ sở dữ liệu nói chung, và cơ sở dữ liệu nấm lớn nói riêng.

Cần mở rộng nghiên cứu công nghệ xây dựng cơ sở dữ liệu nấm lớn đ n ng cao độ chính xác, đáp ứng yêu cầu xây dựng cơ sở dữ liệu nấm lớn ở các tỷ lệ lớn hơn, đầy đủ và hoàn thiện hơn.

Cần nghiên cứu nhiều hơn nữa về nấm lớn tại VQG Tam Đảo đ bổ sung, cập nhật dữ liệu về nấm lớn, phục vụ công tác bảo tồn. Từ đó chuy n giao CSDL này cho ban quản l VQG Tam Đảo cũng nhƣ cung cấp thêm cho CSDL bảo tồn ĐDSH quốc gia.

Trong tƣơng lai, việc chia sẻ dữ liệu sẽ trở thành một trong những vấn đề cấp thiết đối với các hoạt động nghiên cứu cũng nhƣ bảo tồn đa dạng sinh học nói chung và nấm lớn nói riêng, do đó cần thiết phải cải tiến cơ sở dữ liệu trực tuyến, có th ch nh sửa, cập nhật trực tiếp qua mạng internet. Do vậy, cần tiếp tục nghiên cứu hoàn ch nh cơ sở dữ liệu về nấm lớn, đặc biệt là bổ sung, cập nhật và hoàn ch nh dữ liệu đầu vào, cũng nhƣ các chức năng của cơ sở dữ liệu.

70

TÀI LIỆU THAM KHẢO Tài liệu tiếng Việt

1. Hoàng Thị Ngọc Ánh (2018), Xác định thành phần loài của chi nấm Polyporus tại Vườn quốc gia Tam Đảo, tỉnh Vĩnh Phúc, Đại học Tài nguyên và Môi trƣờng Hà Nội

2. Trịnh Tam Bảo, Trịnh Tam Kiệt (2011), Đa dạng nấm lớn Việt Nam và giá trị tài nguyên của chúng, Báo cáo Khoa học Hội nghị toàn quốc lần thứ nhất hệ thống Bảo tàng thiên nhiên Việt Nam.

3. Lê Bá Dũng (1977), “Nghiên cứu họ Polyporaceae miền Bắc Việt Nam”

4. Nguyễn Đức Kháng (2001), Vƣờn quốc gia Tam Đảo, Nhà xuất bản Nông nghiệp.

5. Trịnh Tam Kiệt (1965), Bước đầu điều tra bộ Aphyllophorales vùng Hà Nội

6. Trịnh Tam Kiệt (1966), Sơ bộ điều tra nghiên cứu các loài nấm ăn và nấm độc chính ở một số vùng miền Bắc Việt Nam

7. Trịnh Tam Kiệt (1978), “Những dẫn liệu về hệ nấm sống trên gỗ vùng Nghệ An”

8. Trịnh Tam Kiệt (2011 - 2012), Nấm lớn ở Việt Nam, Tập I & II, NXB Khoa học tự nhiên và Công nghệ, Hà Nội.

9. Trịnh Tam Kiệt (2014), Danh lục nấm tại Việt Nam, nhà xuất bản Nông nghiệp, Hà Nội

10.Nguyễn Thành Long, Nguyễn Công Sơn, Nguyễn Mỹ Linh, Trần Thu Hiền, Lê Văn Mạnh (2018), Khảo sát tính đa dạng sinh học, sự phân bố của nhóm nấm Linh chi (Ganoderma ataceae), Trƣờng Đại học Tài nguyên và Môi trƣờng Hà Nội.

11.Lê Văn Liễu (1977), “Một số nấm ăn được và nấm độc ở rừng”

71

13.Trƣơng Văn Năm (1965), Nghiên cứu nấm sống trên gỗ ở lâm trường Hữu Lũng

14.Nguyễn Thị Hữu Phƣơng (2011), Xây dựng cơ sở dữ liệu GIS phục vụ công tác quản lý lớp phủ rừng tỉnh Quảng Ninh, Trƣờng Đại học Khoa học Tự nhiên.

15.Nguyễn Văn Tuyên, Sinh thái và môi trƣờng, NXB Giáo dục, Hà Nội, 2000.

Tài liệu tiếng nƣớc ngoài

16.C. Rea (1922), A handbook to the larger British fungi, British Basidiomycetae.

17.Kirk, P.M.; Cannon, P.F.; Minter, D.W.; Stalpers, J.A. 2008. Dictionary of

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu xây dựng cơ sở dữ liệu nấm lớn phục vụ công tác bảo tồn tại vườn quốc gia tam đảo, tỉnh vĩnh phúc (Trang 68)

Tải bản đầy đủ (PDF)

(85 trang)