Hiểu một cách đơn giản khác, Khoa học dữ liệu là khoa học về việc quản trị và phân tích dữ liệu, trích xuất các giá trị từ dữ liệu để tìm ra các hiểu biết, các trithức hành động, các quy
Trang 1Tiểu Luận Khoa Học Dữ Liệu LÊ DANH CẦN |
TRƯỜNG ĐẠI HỌC MỎ - ĐỊA CHẤT
KHOA CÔNG NGHỆ THÔNG TIN
_* _
TIỂU LUẬN
MÔN KHOA HỌC DỮ
LIỆU
KHOA HỌC DỮ LIỆU TRONG QUẢN LÝ TÀI
NGUYÊN VÀ MÔI TRƯỜNG
Sinh viên thực hiện :
1 Lê Bá Minh An 6 Nguyễn Tuấn Phú
2 Lê Danh Cần 7 Phạm Văn Trà
3 Nguyễn Quý Cường 8 Nguyễn Văn Vinh
4 Nguyễn Huy Hoàng 9 Nguyễn Thị Vui
5 Nguyễn Hồng Khanh
Lớp DCCTKH66 – K66
Giáo viên hướng dẫn: Truong Xuan Binh THDC
Hà Nội, tháng 12 năm 2021
Trang 2MỤC LỤC
CHƯƠNG 1 TỔNG QUAN VỀ NGÀNH KHOA HỌC DỮ LIỆU 4
I Khoa Học Dữ Liệu Là Gì ? 4
1 Định nghĩa : 4
2 Sự phát triển và cần thiết của khoa học dữ liệu: 4
3 Sự phát triển của khoa học dữ liệu: 5
4 Sự cần thiết của khoa học dữ liệu 5
CHƯƠNG 2: VAI TRÒ CỦA KHOA HỌC DỮ LIỆU TRONG LĨNH VỰC QUẢN LÍ TÀI NGUYÊN VÀ MÔI TRƯỜNG 7
1 SỰ PHÁT TRIỂN CỦA CÔNG NGHỆ VÀ LĨNH VỰC TÀI NGUYÊN VÀ MÔI TRƯỜNG 7
1.1 Sự Phát Triển Của Công Nghệ 7
1.2 Các Lĩnh Vực Khdl Trong Qudn Lý Tài Nguyên, Môi Trường 14
2 SỰ CẦN THIẾT CỦA KHDL TRONG LĨNH VỰC QUẢN LÍ TÀI NGUYÊN , MÔI TRƯỜNG 18
2.1 Vì sao cần nghiên cứu Khoa học dữ liệu 18
2.2 Ứng dụng Khoa học dữ liệu trong lĩnh vực qudn lý tài nguyên và môi trường 20
CHƯƠNG 3: NHỮNG DẪN CHỨNG VÀ NHẬN ĐỊNH CỤ THỂ 21
I NHỮNG LĨNH VỰ TRONG QUẢN LÍ TÀI NGUYÊN VÀ MÔI TRƯỜNG CÓ THỂ CẦN ĐẾN KHDL 21
II ĐƯA RA CÁC DẪN CHỨNG , MINH CHỨNG VỀ SỰ CẦN THIẾT CỦA KHDL ĐỐI VỚI LĨNH VỰC QUẢN LÍ TÀI NGUYÊN VÀ MÔI TRƯỜNG 22
1 22
2 23
3 23
4 24
5 25
6 25
CHƯƠNG 4 : TÓM LƯỢC: 28
I Vấn đề bạn nhìn nhận, tìm hiểu và xác định vai trò của KHDL cũng như sự định hướng bdn thân nghiên cứu trong lĩnh vực này 28
2
Trang 4CHƯƠNG 1 TỔNG QUAN VỀ NGÀNH KHOA
và CNTT mà đại diện tiêu biểu là các chuyên
ngành thống kê hay machine learning KHDL
được phân tách thành 3 công đoạn: tạo ra và
quản trị hệ thống dữ liệu, phân tích dữ liệu thu
thập được
nhiều loại hình KHDL là việc tìm hiểu dữ
liệu mình có, lấy được những thông tin giá
trị Nhờ đó, người ta hiểu hơn về nội tại cũng như các yếu tố khách quan xungquanh lĩnh vực mình đang làm, đưa ra được những quyết định quan trọng, có íchcho bản thân, doanh nghiệp, tổ chức hay xã hội
Hiểu một cách đơn giản khác, Khoa học dữ liệu là khoa học về việc quản trị
và phân tích dữ liệu, trích xuất các giá trị từ dữ liệu để tìm ra các hiểu biết, các trithức hành động, các quyết định dẫn dắt hành động
2 Sự phát triển và cần thiết của khoa học dữ liệu:
“Khoa học dữ liệu - nghề hấp dẫn nhất thế kỷ 21”
Đó là nhận định của giới khoa học Mỹ trên tạp chí Harvard BusinessReview Đánh giá này tiếp tục chứng minh sức nặng của ngành khoa học dữ liệu -mảnh đất phải có để bắt đầu 'gieo trồng' trí tuệ nhân tạo (AI), vạn vật kết nốiInternet (IoT)
Trang 53 Sự phát triển của khoa học dữ liệu:
KHDL được tạp chí Harvard Business Review gọi là “Nghề nghiệp quyến rũnhất thế kỷ 21” Thuật ngữ “Khoa học Dữ liệu” đã trở thành một từ khóa “nóng”trên các phương tiện thông tin đại chúng Tại Hoa Kỳ, Khoa học Dữ liệu đứng đầutrong số 25 nghề tốt nhất, đứng thứ 16 về mức lương và đứng đầu trong số 10 ngànhnghề được tuyển dụng nhiều nhất hiện nay
Cũng theo nhận định và
phân tích của các chuyên gia, cuộc
cách mạng công nghiệp 4.0 đang
phát triển với tốc độ cấp số mũ Nó
sẽ tạo ra sự thay đổi mạnh mẽ về
phân bố nguồn lực sản xuất, cách
thức sản xuất và tiêu dùng nhờ vào
sự phát triển mạnh mẽ của khoa học
công nghệ Nền sản xuất “tự động”
đặc trưng của cách mạng công
nghiệp lần thứ 3 sẽ sớm chuyển
sang nền sản xuất “thông minh”
4 Sự cần thiết của khoa học dữ liệu
Trong cuộc chạy đua công nghệ số, trên các đường đua doanh nghiệp trongmọi lĩnh vực muốn cuộc gọi là người làm chủ được lớn dữ liệu nguồn Chính vìvậy nếu doanh nghiệp được lập đầy đủ nguồn dữ liệu lớn, họ có thể tạo ra chiếnlược kinh doanh hiệu quả quản lý hơn và giới thiệu sản phẩm đến đúng với khách
5
Hnh 1.1.2.2: Robot trí tuệ nhân tạo trợ giảng đầu tiên của Việt
Nam Hnh 1.1.2.1 Những ngành có nhu cầu tuyển dụng cao nhất
Trang 6hàng mục tiêu Điều này thật tuyệt vời vì nó sẽ mang lại nhiều lợi ích cho doanhnghiệp.
Hiện nay trong lĩnh vực công nghiệp như cầu lớn đối với các nhà khoa họctốt nghiệp và được cấp chứng chỉ Họ là một trong những chuyên gia được nhậnlương cao nhất trong các công việc thuộc ngành công nghệ thông tin, Tại các quốcgia phát triển như Mỹ, công việc tốt nhất là một nhà khoa học dữ liệu với mứclương trung bình hàng năm up to 110.000 đô la Còn lại trên toàn thế giới, mộttrưởng tăng trưởng rất lớn trong lĩnh vực Internet vạn vật có 90% dữ liệu đã đượctạo ra trong đại thế giới Theo kế hoạch mỗi ngày có 2,5 triệu byte dữ liệu được tạo
ra và nó được tăng tốc với sự phát triển của vạn vật Internet This data to from thesource as:
- Các biến cảm ứng được sử dụng trong trung tâm mua sảm để thu thậpthông tin của người mua hàng
- Thông tin đăng trên các kênh truyền thông và nhận phần hồi từ khách hàngGiao dịch trao đổi bán trên các trang thương mại điện tử
- Hình ảnh và video kỹ thuật số được ghi lại nhân
KHDL gồm ba phần chính: Tạo ra và quản trị dữ liệu, phân tích dữ liệu, vàchuyển kết quả phân tích thành giá trị của hành động Có thể hình dung bước thứnhất là về số hóa và bước thứ hai là về dùng dữ liệu Việc phân tích và dùng dữ liệulại dựa vào ba nguồn tri thức: toán học (thống kê toán học), công nghệ thông tin(máy học) và tri thức của lĩnh vực ứng dụng cụ thể Như vậy Khoa học dữ liệu làmột lĩnh vực mới, mang tính đa ngành, được hình thành trong bối cảnh của cuộccách mạng công nghiệp 4.0
* Tài liệu tham khảo từ Internet:
https://vi.wikipedia.org/wiki/Khoa_h%E1%BB%8Dc_d%E1%BB%AF_li
%E1%BB%87u?fbclid=IwAR3XsrtjxTMCzotPPuUzM_q5dSO-J4_eYvFML7sUR7tbBNJh1ZPFvFk47sY
6
Trang 7CHƯƠNG 2: VAI TRÒ CỦA KHOA HỌC DỮ LIỆU TRONG LĨNH VỰC QUẢN LÍ TÀI NGUYÊN VÀ MÔI TRƯỜNG
1 SỰ PHÁT TRIỂN CỦA CÔNG NGHỆ VÀ LĨNH VỰC TÀI NGUYÊN VÀ MÔI TRƯỜNG
1.1 Sự Phát Triển Của Công Nghệ.
1.1.1 Công nghệ là gì?
Công nghệ (có nguồn gốc từ technologia, hay τεχνολογια, trong tiếng HyLạp; techno có nghĩa là thủ công và logia có nghĩa là "châm ngôn") là một thuậtngữ rộng ám chỉ đến các công cụ và mưu mẹo của con người Tùy vào từng ngữcảnh mà thuật ngữ công nghệ có thể được hiểu:
• Công cụ hoặc máy móc giúp con người giải quyết các vấn đề;
• Các kỹ thuật bao gồm các phương pháp, vật liệu công cụ , và các tiến trình
để giải quyết một vấn đề;
• Các sản phẩm được tạo ra phải hàng loạt và giống nhau
• Sản phẩm có chất lượng cao và giá thành hạ
Liên Hợp Quốc (ESCAP): Công nghệ là kiến thức có hệ thống về quy trình và kỹthuật dùng để chế biến vật liệu và thông tin Nó bao gồm kiến thức, thiết bị, phươngpháp và các hệ thống dùng trong việc tạo ra hàng hóa và cung cấp dịch vụ Công nghệ (tiếng Anh: technology) là sự phát minh, sự thay đổi, việc sửdụng, và kiến thức về các công cụ máy móc kỹ thuật, , , kỹ năng nghề nghiệp, hệthống, và phương pháp tổ chức, nhằm giải quyết một vấn đề, cải tiến một giải pháp
đã tồn tại, đạt một mục đích, hay thực hiện một chức năng cụ thể đòi hỏi hàm lượngchất xám cao Công nghệ ảnh hưởng đáng kể lên khả năng kiểm soát và thích nghicủa con người cũng như của những động vật khác vào môi trường tự nhiên củamình Nói một cách đơn giản, công nghệ là sự ứng dụng những phát minh khoa họcvào những mục tiêu hoặc sản phẩm thực tiễn và cụ thể phục vụ đời sống con người,đặc biệt trong lĩnh vực công nghiệp hoặc thương mại [1] Thuật ngữ công nghệ cóthể được dùng theo nghĩa chung hay cho những lĩnh vực cụ thể, ví dụ như "côngnghệ xây dựng", "công nghệ thông tin"
1.1.2 Các thành phần của công nghệ
Công nghệ đều bao gồm 4 thành phần chính:
7
Trang 8- Kỹ thuật (T): bao gồm các máy móc thiết bị Thành phần kỹ thuật là cốt
lõi của bất kỳ công nghệ nào Nhờ máy móc, thiết bị, phương tiện mà conngười tăng được sức mạnh cơ bắp và trí tuệ trong hoạt động sản xuất
- Con người (H): Bao gồm kiến thức, kinh nghiệm, kỹ năng do học hỏi,
tích luỹ được trong quá trình hoạt động, nó cũng bao gồm các tố chất củacon người như tính sáng tạo, sự khôn ngoan, khả năng phối hợp, đạo đứclao động
- Thông tin (I): Bao gồm các dữ liệu về phần kỹ thuật, về con người và tổ
chức Các thông số về đặc tính của thiết bị, số liệu về vận hành thiết bị,
để duy trì và bảo dưỡng, dữ liệu để nâng cao và dữ liệu để thiết kế các bộphận của phần kỹ thuật Thành phần thông tin biểu hiện các tri thức đượctích luỹ trong công nghệ, nó giúp trả lời câu hỏi "làm cái gì" và "làm nhưthế nào"
- Tổ chức.
1.1.3 Sự phát triển của công nghệ qua từng giai đoạn
200 năm trước có ai nghĩ được chúng ta có thể trò chuyện với nhau trực tiếpvới một người cách chúng ta nữa vòng trái đất, có ai tưởng tượng được chiếc máyảnh sẽ như thế nào? Tất cả cứ như là những điều hoang tưởng ở thời điểm đó.Trong thời kỳ phát triển như hiện nay thì khoa học công nghệ chiếm vị trícực kỳ quan trọng trong guồng máy vận hành của nhiều lĩnh vực: kinh tế, tài chính,giải trí, du lịch, dịch vụ, giao thông vận tải
Tại các nền kinh tế phát triển ,dữ liệu đã trở thành một tài sản then chốt được
ví như “dầu mỏ trong thế kỷ 21 ” và khoa học dữ liệu là một phương tiện chuyểnhoá nguồn “dầu mỏ ” dữ liệu thành tiền Tuy nhiên ,khoa học dữ liệu và chuyển hoá
dữ liệu thành tiền gặp một số thách thức không nhỏ bài viết này cung cấp một sốnội dung cơ bản về tài sản dữ liệu ,tiền hoá dữ liệu ,khoa học dữ liệu và một số liên
hệ với việt nam một chính sách khoa học dữ liệu phù hợp với khả năng đưa doanhnghiệp việt nam tham gia xứng đáng vào chuỗi giá trị toàn cầu
Hãy cùng điểm lại quá trình hoạt động của công nghệ trong 7 lĩnh vực cơ bảnsuốt 200 năm qua bằng Infographic dưới đây
Trang 9https://khoahoc.tv/su-phat-trien-cua-cong-nghe-theo-dong-thoi-gian-5837https://vi.wikipedia.org/wiki/C%C3%B4ng_ngh%E1%BB%87
Trang 101.2 Các Lĩnh Vực KHDL Trong Qudn Lý Tài Nguyên, Môi Trường
Khoa học dữ liệu áp dụng trong quản lí tài nguyên ,môi trường ngày càngphát triển trên thế giới và dần dầ hội nhập vào việt nam ,trong đó ứng dụng GIStrong lĩnh vực khoa học dữ liệu đang rất được chú trọng
Ứng dụng và xu thế phát triển của GIS nhìn từ tương lai và sự phát triển củacông nghệ này vào các ứng dụng trong đời sống xã hội, khoa học ngày càng rộngvới mức độ quan tâm ngày càng lớn
1.2.1 Ứng dụng GIS trong qudn lí tài nguyên ,môi trường
Ngày nay khi khoa học công nghệ ngày càng phát triển, nhu cầu của conngười ngày một cao hơn thì GIS cũng đuợc áp dụng vào phát triển kinh tế – xã hộithêm phần cấp thiết hơn truớc Cho đến nay GIS đã được xây dựng hoàn chỉnh vớikhả năng lưu trữ, quản lý, truy cập, xử lý phân tích và cung cấp thông tin cần thiết
để thực thi những quyết định trong nhiều lĩnh vự dịch vụ công cộng, GIS đuợc ápdụng trong hầu hết các lĩnh vực khoa học công nghệ, phục vụ những nhu cầu rất cấpthiết của con người Mặc dù rất đa dạng và phong phú, các ứng dụng GIS có thểđuợc phân thành ba nhóm:
công tác kiểm kê các đối tuợng nghiên cứu tại khu vực đã lực chọn (chẳnghạn các loại rừng, thủy văn, sử dụng đất…)
kiểm kê
dựng mô hình ở mức độ cao hơn sẽ hỗ trợ cho các quyết định của các nhàquản lý, lãnh đạo các ban ngành và các cấp chính quyền
Tại Việt Nam, ứng dụng của GIS đuợc thực hiện rất rộng rãi trong quản lý vàquy hoạch lãnh thổ, quản lý di sản văn hóa thế giới, trong phát triển đô thị, trongcác ngành kinh tế xã hội, trong công tác quản lý, trong giảng dạy và nghiên cứu…Tại thành phố Hồ Chí Minh, một ứng dụng mang tính hiệu quá cao trongviệc sử dụng công nghệ GIS đó là quản lý và điều hành hệ thống xe buýt trên toàn
10
Trang 11thành phố, với việc sử dụng công nghệ GIS, trung tâm có thể cùng một lúc điềuhành và giám sát toàn bộ các tuyến xe buýt trên phạm vi toàn lãnh thồ thành phố HồChí Minh.
1.2.2 Ứng dụng của GIS trong thành lập mô hình số độ cao
Lưu trữ DL bản đổ số địa hình trong các CSDL quốc gia
Giải quyết tính toán , đào đắp đất trong thiết kế đường và các dự án kĩ thuậtBiểu thị 3 chiều trực quan điều kiện địa hình có mục đích quân sự
Phân tích tầm quan sát xuyên địa hình
Nắn ảnh trực giao trong công nghệ xử lý ảnh số
Nội suy các đường bình độ hay các đường đẳng trị
Tạo các bản đồ chuyên đề từ DEM
Mô phỏng địa hình phục vụ cho mục đích quân sự và dân sự
DEM được sử dụng như 1 phương tiện phục vụ cho các công tác khảo sát,thiết kế, tính toán khối lượng đào lấp trong thiết kế các công trình, thiết kế đường
sá, quy hoạch thủy lợi, khu công nghiệp…
Sử dụng DEM để mô hình hóa các đối tượng k gian trong các ngành khoahọc về trái đất:địa chất thủy văn; khai thác mỏ, nghiên cứu đại dương…
Ứng dụng rộng rãi trong các ngành du lịch, quy hoạch, kiến trúc, thủy điện,nn…
1.2.3 Ứng dụng của GIS trong đánh giá xói mòn đất
Xây dựng các dữ liệu đầu vào cho tính toán mô hình xói mòn đất
Sử dụng các công cụ phân tích không gian và các công cụ xây dựng mô hìnhtính toán tự động các tham số tham gia vào mô hình xói mòn
Xây dựng các mô hình, giải quyết các kịch bản đánh giá xói mòn đất, biếnđổi sử dụng đất liên quan đến xói mòn, đánh giá ô nhiễm nguồn nước do xói mòn.Nhìn chung công nghệ GIS có khả năng hỗ trợ rất hiệu quả cho đánh giá xói mòn
11
Trang 12đất từ cung cấp dữ liệu đầu vào đến phân tích các nhân tố và tính toán mô hình tổnghợp
1.2.4 Ứng dụng GIS trong đánh giá tác động môi trường
Xác định các tác động k gian của các tác nhân gây hại liên quan đến thực thể.Xác định vị trí để thiết lập 1 nhân tố hoặc 1 CSHT nào đó
Xác định đường đi ngắn nhất cho quá trình thải chất thải lỏng dọc kênh dẫnnước
Chồng xếp bản đồ lên bản đồ thực thể và đánh giá tác động
Giám sát và dự báo sự cố môi trường:
chịu ảnh hưởng của lũ lụt dựa vào cấu trúc của từng vùng để đưa ra cácphương án đề phòng Ngoài ra GIS còn được dùng để tính toán những thiệthại có thể xảy ra: ước tính thiệt hại tài chính,sự phá hủy CSHT; những ảnhrhưởng của vùng không có lũ do thiệt hại từ các ảnh hưởng dịch vụ
tích độ dốc,địa chất và độ ổn định của đất => xác định được những vùng chịuảnh hưởng.Khi những vùng này được định danh, những thông tin này sẽ hiệuchỉnh để kế hoạch phát triển và xây dựng, củng cố cấu trúc của các côngtrình để bảo vệ những vùng có nguy cơ cao
quả do núi lửa, động đất gây ra nhờ quá trình định danh địa hình , kĩ thuật
Xây dựng bản đồ động đất
vùng, quy hoạch sử dụng đất , phân phối tài nguyên
- Trong kiểm soát ô nhiễm không khí : Hỗ trợ kiểm soát ônhiễm không khí; Dự báo ảnh hưởng của ô nhiễm không khí đối với sự pháttriển của thực vật
12
Trang 13- Trong giám sát sự phân bố và định lượng chất gây ô nhiễmnước: GIS có thể dùng để giám sát sự phân bố và định lượng chất gây ônhiễm khác nhau ở 1 khu vực
1.2.5 Ứng dụng GIS trong quy hoạch môi trường
Quy hoạch môi trường là sự vạch định , quy định sắp xếp bố trí các đối
tượng mt theo không gian lãnh thổ hoặc theo không gian vật thể môi trường, nhằm đảm bảo môi trường sống tốt đẹp cho con người và bảo vệ môi trường bền vững trong sự thống nhất với hệ phát triển bền lâu của KT-XH theo các định hướng; mục tiêu và time của kế hoạch, phù hợp với trnh độ phát triển nhất định.
Ứng dụng GIS trong quy hoạch môi trường là sử dụng các phần mềm GIScùng công cụ máy tính để thu thập xử lý tích hợp dữ liệu nhằm xây dựng bản đồchuyên đề và các kết quả khách nhằm giúp các nhà quy hoạch đưa ra các quyết địnhđúng và vạch ra các quy định sắp xếp bố trí các đối tượng MT theo không gian lãnhthổ hoặc theo không gian vật thể môi trường để phù hợp với các dự án quy hoạch
Dữ liệu đầu vào của GIS có thể đa dạng nhưng GIS có khả năng xử lý cácthông tin đó 1 cách hợp lý và khoa học nhất với môi trường Thông tin được mã hóatheo 1 chuẩn riêng
Trong bước cập nhật thông tin cần phải thực sự lưu ý đến độ chính xác của
cơ sở toán học vì đây là điều kiện không thể thiếu để giải quyết các bài toán khônggian
Các lớp thông tin phải cùng có 1 cơ sở toán học để quản lý các lớp thông tinđồng bộ và có thể chồng xếp trong trong hợp cần thiết,khi muốn tạo 1 bản đồ mới
từ những bản đồ đã có.Thế mạnh của GIS là về khả năng truy vấn hỏi đáp khônggian, tìm kiếm thông tin Việc tìm kiếm thông tin trong GIS thực sự rất thuận tiện,nhanh chóng, chính xác và hiệu quả Kết quả truy vấn có thể tính toán, phân tích và
xử lý theo mục đích sử dụng Những lợi ích như vậy của công nghệ GIS đã giúp choviệc giải quyết các bài toán quy hoạch giảm đi rất nhiều
* Tài liệu tham khảo từ Internet:
13