1. Trang chủ
  2. » Luận Văn - Báo Cáo

Đồ án môn học Đồ án cơ s( khoa học d* liêutên Đề tài

19 0 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Ứng Dụng Khoa Học Dữ Liệu
Tác giả Phạm Thanh Phương, Trần Anh Tú
Người hướng dẫn Dương Minh Tuấn
Trường học Trường Đại Học Nguyễn Tất Thành
Chuyên ngành Công Nghệ Thông Tin
Thể loại Đồ Án
Năm xuất bản 2023 – 2024
Thành phố Thành Phố Hồ Chí Minh
Định dạng
Số trang 19
Dung lượng 569,45 KB

Nội dung

Khoa học dữ liệu tích hợp toán học, thống kê, lập trình chuyên biệt, phân tích nâng cao, trí tuệ nhân tạo AI và máy học với chuyên môn cụ thể về lĩnh vực để khám phá những hiểu biết có t

Trang 1

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC NGUYỄN TẤT THÀNH

Khoa Công Nghệ Thông Tin

ĐỒ ÁN MÔN HỌC

ĐỒ ÁN CƠ S( KHOA HỌC D* LIÊ-U Tên đề tài: C4c 6ng d8ng khoa h:c d; liê -u

SV thực hiện 2 :TRẦN ANH TÚ [2200004984]

Học kỳ 3 Năm 2023 – 2024

Trang 2

LỜI CNM ƠN

Lời đầu tiên, em xin gửi lời cảm ơn sâu sắc đến các thầy cô tại Trường Đại học Nguyễn Tất Thành Nhờ vào sự tận tâm và nhiệt huyết của thầy cô, em và các bạn đã có cơ hội tiếp thu những kiến thức không chỉ trong sách vở mà còn từ kinh nghiệm thực tiễn quý báu Thầy cô đã luôn sẵn sàng hỗ trợ, giải đáp mọi thắc mắc, giúp chúng em vượt qua những khó khăn trong học tập và

cả trong cuộc sống Môi trường học tập tại NTT thật sự là nơi lý tưởng để chúng em phát triển không chỉ về mặt kiến thức mà còn về kỹ năng, thái độ và phẩm chất đạo đức Em xin chân thành cảm ơn sự tận tụy của các thầy cô, những người đã và đang góp phần tạo nên những thế hệ sinh viên đầy tự tin, bản lĩnh Kính chúc thầy cô luôn mạnh khỏe và tiếp tục thành công trong sự nghiệp "trồng người"

Xin cơm ơn thầy Dương Minh Tuấn đã tận tình hướng dẫn và giúp đỡ em trong quá trình nghiên cứu và hoàn thành báo cáo này.

Trong quá trình nghiên cứu và thực hiện đề tài , với vốn kiến thức hạn hẹp cho nên không tránh những thiếu xót cần phải bổ sung và hoàn thiện tốt hơn Rất mong được sự góp ý của thầy cô.

Trang 3

LỜI M( ĐẦU

Khoa học dữ liệu đã và đang cách mạng hóa cách chúng ta tiếp cận, phân tích và xử lý thông tin trong kỷ nguyên số Với những bước tiến vượt bậc trong công nghệ và trí tuệ nhân tạo, dữ liệu không còn chỉ là một tài sản thụ động mà đã trở thành "dầu mỏ mới" của thế kỷ 21 Các doanh nghiệp, tổ chức và chính phủ hiện nay đều nhận thức rõ ràng về tầm quan trọng và giá trị của việc khai thác triệt để nguồn tài nguyên quý giá này Được nuôi dưỡng bởi khối lượng dữ liệu khổng lồ từ các thiết bị kết nối, mạng xã hội, và nhiều nguồn khác, khoa học dữ liệu đã trở thành một phần không thể thiếu trong quá trình ra quyết định, tối ưu hóa hoạt động và dự đoán xu hướng tương lai.

Sự phát triển mạnh mẽ của các công cụ phân tích dữ liệu và khả năng xử lý thông tin phức tạp đã chứng minh vai trò thiết yếu của khoa học dữ liệu trong nhiều lĩnh vực khác nhau, từ kinh tế,

y tế, giáo dục cho đến an ninh quốc gia và bảo vệ môi trường Những công nghệ hiện đại như máy học (machine learning), trí tuệ nhân tạo (AI), và phân tích dữ liệu lớn (big data analytics) đang được áp dụng rộng rãi để giải quyết các vấn đề thực tiễn và nâng cao chất lượng cuộc sống.

Chúng ta chọn nghiên cứu về ứng dụng khoa học dữ liệu không chỉ vì tiềm năng to lớn mà nó mang lại, mà còn vì những tác động sâu sắc mà nó có thể tạo ra đối với xã hội và nền kinh tế toàn cầu Khoa học dữ liệu không chỉ đơn thuần là một xu hướng mà đã trở thành nền tảng cho nhiều đổi mới sáng tạo Trong doanh nghiệp, nó giúp xây dựng các chiến lược dựa trên

Trang 4

dữ liệu, dự đoán hành vi người tiêu dùng và tối ưu hóa quy trình sản xuất Trong lĩnh vực y tế, khoa học dữ liệu hỗ trợ phát hiện bệnh sớm, cá nhân hóa điều trị và dự đoán sự bùng phát dịch bệnh Trong giáo dục, nó giúp tối ưu hóa phương pháp giảng dạy, phân tích hiệu suất học tập và phát hiện các mô hình phát triển của học sinh Hơn nữa, lĩnh vực này còn góp phần cải thiện

an ninh, giảm thiểu rủi ro và tăng cường khả năng ứng phó với thiên tai.

Việc chọn chủ đề ứng dụng khoa học dữ liệu không chỉ giúp chúng ta khám phá những tiến bộ công nghệ mà còn mở ra cánh cửa tới những tác động sâu sắc của chúng đến mọi khía cạnh của cuộc sống Nghiên cứu và hiểu rõ cách các ứng dụng khoa học

dữ liệu hoạt động sẽ giúp chúng ta chuẩn bị tốt hơn cho những thay đổi và thách thức trong tương lai, đồng thời mở ra những

cơ hội mới trong sự nghiệp và nghiên cứu Đây thực sự là một lĩnh vực đầy tiềm năng cho những ai đam mê khám phá cách thức mà dữ liệu có thể biến đổi và cải thiện thế giới xung quanh chúng ta.

Trang 5

MỤC LỤC

Trang 6

Thương mi đin t

Khoa h:c d; liệu là gì?

Khoa học dữ liệu tích hợp toán học, thống kê, lập trình chuyên biệt, phân tích nâng cao, trí tuệ nhân tạo (AI) và máy học với chuyên môn cụ thể về lĩnh vực để khám phá những hiểu biết có thể hành động ẩn trong dữ liệu của một tổ chức Những hiểu biết này có thể cung cấp thông tin cho việc ra quyết định và lập kế hoạch chiến lược

Danh s4ch c4c 6ng d8ng khoa h:c d; liệu

Các ứng dụng khoa học dữ liệu rất đa dạng và liên tục phát triển, biến đổi cách chúng ta sống, làm việc và tương tác với thế giới Sau đây là tổng quan về một số lĩnh vực chính mà khoa học

dữ liệu nổi trội:

Gi4o d8c

Khoa học dữ liệu đã trở thành một phần không thể thiếu của hệ thống giáo dục Với sự tiến bộ nhanh chóng của công nghệ, các tổ chức học thuật hiện tạo ra một lượng dữ liệu đáng kể Điều này bao gồm dữ liệu từ các nền tảng học tập trực tuyến, ứng dụng giáo dục và hệ thống quản lý học tập như Google Classroom Lượng dữ liệu dồi dào này có thể được tận dụng để có được thông tin chi tiết và cải thiện các hoạt động giáo dục

Theo TS Vũ Thành Tự Anh, Hiệu trưởng Trường Chính sách công và Quản lý Fulbright, “Khoa học dữ liệu mở ra một “mỏ vàng” thông tin mới cho các nhà hoạch định chính sách mà trước đây chưa từng có Đó là một bộ công cụ mà nếu chúng ta sử dụng chúng, chúng ta sẽ có thể hiểu được những gì đang diễn ra một cách toàn diện, và quan trọng hơn, nếu có những công cụ thiết thực như vậy mà chúng ta không sử dụng chúng thì đó là một sự lãng phí”

Fulbright đã ứng dụng thành công khoa học dữ liệu vào các nền tảng hỗ trợ giáo dục, chẳng hạn như Open Courseware , bằng cách cung cấp cơ sở dữ liệu có bản quyền bao gồm hàng trăm chủ

đề khoa học cho sinh viên các ngành khoa học tự nhiên và xã hội, lịch sử, nghệ thuật, kinh tế, quản lý, toán học, v.v

Trang 7

Giá trị quan trọng của nguồn học liệu mở này là khả năng tiếp cận rộng rãi Không chỉ phục vụ cộng đồng sinh viên Fulbright, mà các giảng viên từ nhiều trường đại học khác cũng thường xuyên sử dụng Giáo trình mở của Fulbright để cập nhật bài giảng của họ Sinh viên có thể sử dụng các tài liệu này để hướng dẫn các hoạt động học tập và nghiên cứu độc lập Khả năng cập nhật và truy cập miễn phí là các nguyên tắc của nguồn học liệu mở của Fulbright Tất cả các môn học, bài giảng và bài tập đều được cập nhật, điều chỉnh và đổi mới hàng năm Điều này giúp duy trì tính cập nhật của nguồn học liệu mở của trường, ngăn chúng trở nên lỗi thời như một thư viện

cổ xưa và cho phép những người học Fulbright ở xa nhà cập nhật kiến thức của họ bất cứ lúc nào

Chăm sóc s6c khỏe

Một số yếu tố khiến khoa học dữ liệu trở nên không thể thiếu đối với chăm sóc sức khỏe ngày nay, quan trọng nhất là nhu cầu ngày càng tăng về thông tin chi tiết trong thị trường y tế Thu thập dữ liệu bệnh nhân thông qua các kênh phù hợp có thể cải thiện chất lượng dịch vụ chăm sóc sức khỏe mà người tiêu dùng nhận được Từ bác sĩ đến nhà cung cấp bảo hiểm y tế đến các tổ chức, tất cả đều dựa vào dữ liệu thực tế và phân tích chính xác để đưa ra quyết định sáng suốt về tình hình sức khỏe của bệnh nhân

Công nghệ khoa học dữ liệu cũng có thể phát hiện những thay đổi trong các chỉ số sức khỏe của bệnh nhân và dự đoán các rối loạn có thể xảy ra Là một phần của mạng lưới IoT, nhiều thiết bị đeo được và thiết bị gia đình sử dụng phân tích thời gian thực để dự báo liệu bệnh nhân có gặp phải bất kỳ vấn đề nào dựa trên tình trạng hiện tại của họ hay không

Thương mại điện tử

Các doanh nghiệp kết hợp khoa học dữ liệu vào thương mại điện tử sẽ có được lợi thế cạnh tranh Họ có thể dự báo nhu cầu, tránh tình trạng hết hàng và cải thiện trải nghiệm mua sắm để đáp ứng kỳ vọng của khách hàng Điều này được thực hiện bằng cách phân tích dữ liệu lịch sử và thông tin thị trường Khoa học dữ liệu cũng đóng vai trò quan trọng trong việc bảo vệ môi trường thương mại điện tử khỏi gian lận bằng cách phân tích cẩn thận các mô hình giao dịch, phát hiện

sự không nhất quán và ngăn chặn các hoạt động gian lận Điều này tạo dựng lòng tin vào các giao dịch trực tuyến cho khách hàng và cung cấp bảo mật cho các công ty Ngoài ra, khoa học dữ liệu rất cần thiết để tối ưu hóa quản lý chuỗi cung ứng trong thương mại điện tử

Hậu cần

Khoa học dữ liệu đóng vai trò quan trọng trong việc xác định các rủi ro tiềm ẩn, chẳng hạn như gián đoạn dòng hàng hóa hoặc chậm trễ trong giao hàng Các tổ chức có thể giảm thiểu hiệu quả các rủi ro này và đảm bảo tính liên tục của hoạt động kinh doanh bằng cách phân tích dữ liệu từ nhiều nguồn khác nhau Hơn nữa, nó cho phép các tổ chức cải thiện quy trình kiểm soát chất lượng, giảm thời gian chết và cuối cùng là giảm thiểu rủi ro mất sản xuất và doanh thu

Trang 8

Khoa học dữ liệu đóng vai trò quan trọng trong ngành tài chính, nơi các tổ chức thường phải vật lộn với gian lận và rủi ro mất mát Tự động hóa phân tích rủi ro mất mát là rất quan trọng để đưa

ra quyết định chiến lược Ngoài ra, các công cụ phân tích khoa học dữ liệu được sử dụng để dự đoán xu hướng trong tương lai, chẳng hạn như giá trị trọn đời của khách hàng và biến động của thị trường chứng khoán

Trên thị trường chứng khoán, khoa học dữ liệu đóng vai trò trung tâm trong việc kiểm tra hành vi trong quá khứ và dự báo kết quả trong tương lai Bằng cách phân tích dữ liệu lịch sử, có thể dự đoán giá cổ phiếu trong tương lai theo các khung thời gian cụ thể

Kinh tế cung cấp kiến thức thiết yếu để thành công trong Ngân hàng và Tài chính Hiểu biết về kinh tế vĩ mô, kinh tế vi mô, thống kê và toán học là rất quan trọng để hiểu được hệ thống tài chính, thị trường tiền tệ, hoạt động ngân hàng, chức năng kinh doanh và các yếu tố liên quan khác

Chuyên ngành Kinh tế tại Đại học Fulbright Việt Nam trang bị cho sinh viên kiến thức để theo đuổi nhiều nghề nghiệp khác nhau, bao gồm ngân hàng và tài chính, kinh doanh quốc tế, ngoại thương, định giá, chứng khoán và đầu tư, bất động sản, quản lý rủi ro, quản lý nguồn nhân lực, quản lý chuỗi cung ứng/hậu cần, kinh tế lượng và thương mại điện tử

Chương trình giảng dạy tích hợp giáo dục nghệ thuật tự do với Kinh tế, thúc đẩy cách tiếp cận giải quyết vấn đề liên ngành và tư duy phản biện Cách tiếp cận này cho phép sinh viên có được kiến thức khoa học xã hội và khoa học nói chung Đại học Fulbright cung cấp cho sinh viên nền tảng kinh tế lý thuyết vững chắc tương tự như các trường đại học chất lượng quốc tế, cùng với những hiểu biết thực tế về nền kinh tế Châu Á và Việt Nam

Chương trình đào tạo của Fulbright cung cấp cho sinh viên nền tảng lý thuyết kinh tế vững chắc, giúp sinh viên hiểu rõ tình hình tài chính tại Việt Nam và quốc tế Với kiến thức và kinh nghiệm của các giảng viên đến từ nhiều quốc gia trên thế giới, các bài giảng của Fulbright cung cấp góc nhìn đa chiều, gắn chặt với thực trạng kinh tế Việt Nam

Hãy liên hệ với chúng tôi qua các trang này để biết thông tin chi tiết liên quan đến chuyên ngành Kinh tế và nhiều thông tin khác:

10 Ứng d8ng của Khoa h:c d; liệu trong cuộc sống thực

Trí tuệ nhân tạo và dữ liệu lớn là hai lĩnh vực chính sẽ thúc đẩy thị trường khoa học dữ liệu toàn cầu trong những năm tới Đó là vì ngày càng nhiều công ty tìm cách hợp lý hóa hoạt động kinh doanh bằng cách khai thác dữ liệu nội bộ cũng như dữ liệu bên ngoài của họ

Khi lượng dữ liệu do con người, máy móc và cảm biến tạo ra tăng nhanh chóng, nhu cầu về các

kỹ thuật tiên tiến để thu thập, hiểu, xử lý và trực quan hóa dữ liệu cũng tăng theo Nghiên cứu trên khắp học viện và ngành công nghiệp đã đóng góp rất lớn cho lĩnh vực này, nơi các thuật toán học máy được thiết kế để tự động hóa các quy trình này

Trang 9

Khoa học dữ liệu có nhiều ứng dụng, chẳng hạn như khai thác văn bản, phân tích bộ gen và phân tích tài chính Tuy nhiên, chỉ một số ít ứng dụng đã đạt đến mức sử dụng chính thống Bài viết này nhằm mục đích xác định các ứng dụng khoa học dữ liệu hàng đầu có tiềm năng lớn nhất để đạt được sự áp dụng rộng rãi trong tương lai

Hãy cùng khám phá nhé!

10 6ng d8ng khoa h:c d; liệu hàng đầu

1 Tài chính – Phát hiện gian lận

"Trong lĩnh vực tài chính, khoa học dữ liệu đóng vai trò quan trọng trong việc phát hiện các hoạt động gian lận Bằng cách phân tích các giao dịch, hành vi của khách hàng và các thông tin liên quan, các ngân hàng và tổ chức tài chính có thể phát hiện các giao dịch bất thường, gian lận thẻ tín dụng, rửa tiền và các hình thức gian lận khác."

C4ch th6c hoạt động của khoa h:c d; liệu trong ph4t hiện gian lận:

1 Thu thập d; liệu

o Dữ liệu tài chính từ các giao dịch, hồ sơ khách hàng, lịch sử tín dụng, và các hoạt động ngân hàng được thu thập từ nhiều nguồn khác nhau, bao gồm cả dữ liệu có cấu trúc (giao dịch ngân hàng) và dữ liệu phi cấu trúc (email, tin nhắn văn bản)

2 Tiền xử lý d; liệu

o Dữ liệu tài chính có thể chứa nhiều thông tin không đầy đủ, trùng lặp hoặc không chính xác Quá trình tiền xử lý sẽ làm sạch và chuyển đổi dữ liệu, giúp tạo ra các tập dữ liệu sẵn sàng cho phân tích

3 Phân tích hành vi

o Khoa học dữ liệu phân tích các hành vi thông thường của người dùng và các giao dịch hợp lệ để tạo ra một mẫu chuẩn Khi một giao dịch không phù hợp với các

mô hình này, nó sẽ được đánh dấu là khả nghi

o Ví d8: Nếu khách hàng thường mua sắm ở một quốc gia và đột nhiên xuất hiện

giao dịch lớn từ một quốc gia khác, hệ thống có thể coi đây là một dấu hiệu của gian lận

4 H:c m4y và c4c mô hình ph4t hiện bất thường

o H:c m4y gi4m s4t (Supervised Learning): Các mô hình học máy có thể được

huấn luyện trên dữ liệu lịch sử về các giao dịch hợp pháp và gian lận, từ đó nhận diện và dự đoán các giao dịch gian lận trong tương lai

Trang 10

H:c m4y không gi4m s4t (Unsupervised Learning): Các thuật toán này có thể

phát hiện các mẫu bất thường trong dữ liệu mà không cần dựa trên các nhãn gian lận trước đó Điều này rất hiệu quả khi có các loại gian lận mới chưa từng xảy ra trước đây

o Ví d8 thuật to4n: Mô hình hồi quy logistic, cây quyết định (Decision Trees),

mạng nơ-ron nhân tạo (Neural Networks), và máy vector hỗ trợ (SVM) thường được sử dụng trong phát hiện gian lận

5 Ph4t hiện thời gian thực

o Khoa học dữ liệu cho phép phân tích dữ liệu giao dịch theo thời gian thực, từ đó giúp phát hiện các giao dịch gian lận ngay lập tức trước khi chúng gây thiệt hại lớn Những mô hình này dựa trên việc liên tục theo dõi và cập nhật các thay đổi trong hành vi giao dịch của khách hàng

o Ví d8: Hệ thống phát hiện gian lận của các công ty thẻ tín dụng như Visa hay

Mastercard sử dụng các mô hình dự báo để phát hiện các giao dịch không bình thường chỉ trong vài giây

6 Phân tích rủi ro

o Khoa học dữ liệu giúp các tổ chức tài chính xây dựng các mô hình phân tích rủi ro nhằm đánh giá mức độ rủi ro của một giao dịch hoặc một khách hàng Bằng cách phân tích các yếu tố như lịch sử tín dụng, hành vi mua sắm, và tương tác trực tuyến, các ngân hàng có thể đưa ra các quyết định chính xác hơn về việc cấp tín dụng và quản lý rủi ro

2 Nhận dạng hình ảnh và nhận dạng giọng nói

"Khoa học dữ liệu, đặc biệt là học sâu và học máy, đã tạo nên những đột phá trong lĩnh vực nhận dạng hình ảnh và giọng nói Các thuật toán học máy có khả năng phân tích hình ảnh, video và âm thanh để thực hiện các tác vụ như nhận diện khuôn mặt, dịch giọng nói, tìm kiếm hình ảnh dựa trên nội dung, và tạo ra các trợ lý ảo thông minh."

Nhận dạng hình ảnh và giọng nói là hai ứng dụng quan trọng của khoa học dữ liệu, đặc biệt trong các lĩnh vực như bảo mật, dịch vụ khách hàng, y tế, và tiếp thị Sự phát triển của trí tuệ nhân tạo (AI) và học máy (machine learning) đã giúp những ứng dụng này ngày càng chính xác và mạnh mẽ hơn, với khả năng phân tích, xử lý và nhận dạng các mẫu hình ảnh và âm thanh

1 Nhận dạng hình ảnh (Image Recognition)

Ngày đăng: 02/01/2025, 22:06