1. Trang chủ
  2. » Luận Văn - Báo Cáo

đồ án cơ sở tìm hiểu khoa học dữ liệu data science

36 0 0
Tài liệu được quét OCR, nội dung có thể không chính xác
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Tìm Hiểu Khoa Học Dữ Liệu (Data Science)
Tác giả Bùi Văn Phúc
Người hướng dẫn ThS. Đặng Như Phú
Trường học Trường Đại Học Nguyễn Tất Thành
Chuyên ngành Công Nghệ Thông Tin
Thể loại Đồ Án Cơ Sở
Năm xuất bản 2023
Thành phố Tp HCM
Định dạng
Số trang 36
Dung lượng 5,12 MB

Cấu trúc

  • 4.1/ Ứng dụng cua Data Science trong nganh ngan hang (13)
  • 4.2/ Ứng dụng của Data Science trong ngành tài chính (14)
  • 4.3/ Ứng dụng của Data Science trong ngành sản xuất (14)
  • 4.4/ Ứng dụng của Data Science trong ngành giao thông vận tải (15)
  • 4.5/ Ứng dụng của Data Science trong ngành y tế - chăm sóc sức khỏe (16)
  • 4.6/ Ứng dụng của Data Science trong ngành E-Commerce (Thương mại điện tử) (16)
  • E- commerce hay thương mại điện tử và ngành công nghiệp bán lẻ cũng là 2 ngành được “hưởng lợi” rất lớn từ Data Science (16)
  • 6 ỨNG DỤNG HỮU ÍCH CỦA DATA SCIENCE (17)
    • 2. Mục đích: Khoa học dữ liệu nhằm mục đích tìm hiểu và trích xuất thông tin từ đữ liệu (26)
    • CHƯƠNG 2./ MACHINE LEARNING TRONG NGÀNH HỌC (27)
  • ARTIFICIAL INTELLIGENCE (29)
  • MACHINE LEARNING (30)
    • CHUONG 3./ CHUONG 3./ KẾT LUẬN (35)
  • TÀI LIỆU THAM KHẢO (36)

Nội dung

Vì vậy, đồ án của nhóm đó là tìm hiểu về “Khoa học dữ liệu Data Science” để có cái nhìn sâu hơn, thực tế hơn về việc ứng dụng hệ thống thông tin trong các lĩnh vực đời sống.. Một Data Sc

Ứng dụng cua Data Science trong nganh ngan hang

Ngân hàng là ngành ứng dụng của Data Science nhiều nhất Big Data và Data Science cho phép các ngân hàng trở nên cạnh tranh nhau hơn trên thị trường Với Data Science, các ngân hàng quản lý nguồn tài nguyên của họ dễ dàng hơn, nhận biết vấn đề trục trặc sớm hơn và quản lý dữ liệu khách hàng hiệu quả hơn

Bằng ứng dụng của Data Science, ngân hàng tìm ra giá trị vòng đời khách hàng, cho phép họ định lượng khách hàng mà họ mong muốn

Ngoài ra, dữ liệu cũng góp phân định hướng ngân hàng phát triển theo nhu cầu của thị trường Đối với vấn đề nhận biết rủi ro, Data Science cung cấp công cụ để nâng cấp thẻ tín dụng, bảo hiểm và kế toán Ngân hàng cũng dùng Data Science nham phan tích các gói cho vay đâu tư và hệ sinh thái khách hàng để khai thác những lợi thế cho doanh nghiệp cũng như khách hàng sử dụng dịch vụ

Trong các phân tích đánh giá thực tế, ngân hàng sử dụng thuật toán Machine Learning để cải thiện chiến lược của họ và đào sâu tìm hiểu nhiều vấn đề tác động đến chất lượng công việc xi

Ứng dụng của Data Science trong ngành tài chính

Data Science đóng vai trò quan trọng trong quy trình tự động hóa nghiệp vụ tài chính kế toán Chẳng hạn như ngành tài chính cũng sử dụng và vận hành hệ thống báo động nguy cơ như các ngân hàng qua Data Science

Ngành tài chính kế toán cân tự động hóa quy trình này để thực hiện các chiến dịch, công việc của mình hiệu quả hơn Sử dụng trí tuệ máy móc, các doanh nghiệp tài chính nhận diện, điều phối và tiếp cận được những nguy cơ để giải quyết chúng

Thuật toán trong Data Science có thể thúc đẩy năng suất làm việc, phát triển công việc theo định hướng bền vững bằng cách chắt lọc những dữ liệu khách hàng sẵn có Tương tự, những nghiên cứu về tài chính cũng sử dụng Machine Learning để đưa ra dự báo trên phân tích

Nó cho phép công ty có thể dự báo giá trị vòng đời khách hàng và thị phần họ đang và có thể chiếm lĩnh

Data Science cũng là chìa khóa để tạo ra giao dịch dựa trên thuật toán

Dựa vào quy trình phân tích dữ liệu cố định, những doanh nghiệp tài chính dễ dàng tìm ra giải pháp cho dữ liệu họ nắm giữ, mang đến trải nghiệm và xây dựng quan hệ khách hàng tốt hơn Đây là bước tiến vượt trội trong việc áp dụng phân tích dữ liệu người dùng qua quy trình cá nhân hóa dữ liệu Những kỹ thuật và thuật toán Machine Learning thúc đẩy tương tác trên truyền thông đa phương tiện, tăng tốc độ tiếp nhận phản hồi, chăm sóc khách hàng để phân tích hiệu quả

Ngoài ra, ngôn ngữ hóa và data mining (khai phá dữ liệu) trong ứng dụng của Data Science cũng giúp ích cho quá trình chuyển đổi từ thông tin sang dạng thức linh động, tiến bộ hơn để tăng lợi nhuận.

Ứng dụng của Data Science trong ngành sản xuất

Trong thế kỷ 21, các Data Scientist là những người tiên phong trong thời đại số Họ nắm giữ vai trò chủ chốt trong nền sản xuất vì bằng các xI ứng dụng của Data Science, nền sản xuất có thể cải thiện được khả năng tạo ra sản phẩm, tối ưu hiệu suất, giảm chỉ phí và tăng lợi nhuận

Hơn nữa, với công cụ hỗ trợ như IoT (Internet of Things), Data Science cho phép những doanh nghiệp dự đoán được vấn đề, điều phối hệ thống và phân tích dòng dữ liệu của họ

Hơn hết, với Data Science, nền sản xuất có thể tiết kiệm được chỉ phí nhiên liệu cũng như thời gian sản xuất của mình

Bằng những phân tích từ đánh giá người tiêu dùng, Data Scientist có thể giúp ngành sản xuất quyết định đúng đắn hơn khi bắt đầu bước cải thiện chất lượng sản phẩm

Một ứng dụng của Data Scientist khác cho ngành sản xuất là tự động hóa (automation) Với sự hỗ trợ của hệ thống tự động hóa, dây chuyền sản xuất trong các nhà máy trở nên hiệu quả và chuẩn xác hơn.

Ứng dụng của Data Science trong ngành giao thông vận tải

Một lĩnh vực ứng dụng của Data Science quan trọng là ngành giao thông vận tải Data Science giúp môi trường giao thông an toàn hơn cho người điều khiển giao thông Data Science giúp các phương tiện giao thông được cải tiến, thêm yếu tố tự động hóa

Hơn nữa, trong lĩnh vực giao thông vận tải, Data Science nhân rộng khái niệm “xe tự lái” - cũng là một bước tiến lớn trong ngành ở thời đại Số

Bằng cách áp dụng các mẫu phân tích tiêu thụ nhiên liệu, hành vi người điều khiển và vận hành máy của phương tiện, Data Science góp phần tạo nên nền tảng cho ngành giao thông vận tải thời đại công nghiệp 4.0 Với những phương tiện có khả năng “tự lái”, các nhà sản xuất xe nói chung đang chạm đến tầm cao mới với nhiều sản phẩm

Ứng dụng của Data Science trong ngành y tế - chăm sóc sức khỏe

Từ khi có ứng dụng của Data Science, ngành y tế và chăm sóc sức khỏe cũng có những bước nhảy vọt quan trọng 5 nhóm lĩnh vực đã áp dụng thành công những ứng dụng của Data Science có thể kể đến như Phân tích hình ảnh y khoa, gen và bộ gen, điều chế thuốc, phân tích và chẩn đoán, ứng dụng phần mềm sức khỏe hay trợ lý sức khỏe tâm lý

Từ các khâu như tiếp nhận thông tin bệnh nhân, đến chẩn đoán hình ảnh, khám chữa bệnh ngày nay đều có sự góp mặt và góp công của Data Science Xử lý và chẩn đoán qua X-ray, MRI, CT-scans giờ đây dễ dàng và còn “thông minh” hơn Còn ở lĩnh vực di truyền học thì MapReduce cũng có thể xem là một nền tảng hỗ trợ đắc lực cho việc dự báo các gen

Không thể không nhắc đến là những ứng dụng của Data Science trong việc điều chế thuốc dựa vào tư liệu người dùng v.v Công tác chẩn đoán bệnh cũng trở nên khoa học và chính xác hơn khi ứng dụng Data Science vào máy móc y khoa

Hoặc cũng có thể bác sĩ sẽ nhờ đến một số công cụ để tính toán phác đồ điều trị phù hợp cho bệnh nhân Hiện nay cũng đã có nhiều phần mềm và ứng dụng trợ lý sức khỏe được xây dựng trên nền tảng ứng dụng của Data Science vào đời sống.

commerce hay thương mại điện tử và ngành công nghiệp bán lẻ cũng là 2 ngành được “hưởng lợi” rất lớn từ Data Science

Để nhận biết nền tảng khách hàng tiềm năng, Data Science được sử dụng và khai thác trên các sản phẩm, dịch vụ của nhà cung cấp, ngoài ra còn phân tích và dự đoán xu thế thị trường Với Data Science, các doanh nghiệp tối ưu được cơ cấu về giá cho phân khúc khách hàng của mình.

Data Science cũng có ý nghĩa đối với phân đoạn thị trường và chọn lọc đối tượng khách hàng mục tiêu ở các doanh nghiệp Sử dụng kỹ thuật Data Science trong các đề xuất nâng cao của hệ thống, nền tảng E- commerce hoàn toàn có thể đưa ra những thông tin giá trị và khả thi đối với doanh nghiệp để họ định hướng chiến lược mua và bán của mình trên thị trường

Cũng tương tự, các doanh nghiệp dùng phương pháp phân tích dựa trên dữ liệu có sẵn các phản hồi của khách hàng để có được những thông tin mà họ muốn Công việc đòi hỏi sử dụng Natural Language Processing để phân tích các câu chữ của khách hàng (cách lọc negative/ positive comment trên facebook) hay kết quả khảo sát Điển hình như Fraud Detection, một trong những công cụ có vai trò chính trong Machine Learning nhằm phát hiện những gian lận trong kinh doanh online, offline.

6 ỨNG DỤNG HỮU ÍCH CỦA DATA SCIENCE

Mục đích: Khoa học dữ liệu nhằm mục đích tìm hiểu và trích xuất thông tin từ đữ liệu

đề hồ trợ quyết định Trong khi đó, máy học nhăm mục đích xây dựng các mô hình dự đoán và học tập tự động từ dữ liệu

3 Các kỹ thuật: Khoa học dữ liệu sử dụng nhiều kỹ thuật phân tích dữ liệu như phân tích thông kê, khai phá dữ liệu, và trực quan hóa dữ liệu Trong khi đó, máy học sử dụng các kỹ thuật học máy, như học có giảm sát, học không giảm sát và học tăng cường

Tóm lại, khoa học dữ liệu tập trung vào việc trích xuất thông tin từ dữ liệu, trong khi máy học tập trung vào việc xây dựng các mô hình dự đoán và học tập tự động từ dữ liệu

10.5./ Điểm khác biệt giữa khoa học dữ liệu và thống kê là gi?

Khoa học dữ liệu và thống kê đều liên quan đến việc phân tích dữ liệu, tuy nhiên có một số điểm khác biệt chính như sau:

Mục đích sử dụng: Thống kê thường được sử dụng để mô tả và suy luận về dữ liệu, trong khi khoa học dữ liệu tập trung vào việc khai thác dữ liệu để tạo ra gia tri va hiểu rõ hơn về dữ liệu

Phương pháp phân tích: Thống kê thường sử dụng các phương pháp thống kê truyền thông như kiểm định giả thuyết, phân tích phương sai, phân tích hồi quy, trong khi khoa học dữ liệu sử dụng các phương pháp khai thác dữ liệu như học máy, khai phá dữ liệu, xử lý ngôn ngữ tự nhiên

Quy mô dữ liệu: Thống kê thường xử lý các tập dữ liệu nhỏ hơn, trong khi khoa học dữ liệu thường xử lý các tập dữ liệu lớn hơn và phức tạp hơn

Mục tiêu: Thống kê thường tập trung vào việc tìm hiểu mối quan hệ giữa các biến, trong khi khoa học dữ liệu tập trung vào việc tìm ra các mẫu và thông tin tiềm ân trong dữ liệu để tạo ra giá trị cho doanh nghiệp.

MACHINE LEARNING TRONG NGÀNH HỌC

Tính đến thời điểm hiện tại, có rất nhiều định nghĩa về machine learning, nếu bạn nào từng google thi han cac ban sẽ biệt Minh đã đọc và tông hợp lại sau đó rút ra khái nệm như sau:

Machine learnng (ML) hay máy học là một nhánh của trí tuệ nhân tạo (AI), nó là một lĩnh vực nghiên cứu cho phép máy tính có khả năng cải thiện chính bản thân chúng dựa trên dữ liệu mâu (trainng data) hoặc dựa vào kinh nghiệm (những gì đã được học)

Machine learning có thê tự dự đoán hoặc đưa ra quyết định mà không cân được lập trình cụ thể

Bài toán machine learning thường được chia làm hai loại là dự đoán (prediction) va phan loại (classification) Các bài toán dự đoán như dự đoán giá nhà, gia xe Các bài toán phân loại như nhận diện chữ viết tay, nhận điện đồ vật

Feature Machine Learning E] Extraction Algorithm Grouping © : œ of Objects © BỊ se (} £ -Oo-g

Hình 2.2 Mỗi liên hệ giữa Trí Tuệ Nhân Tạo với các nhánh học như Máy Học, Biểu Diễn Trị Thức và Suy Luận, Xứ Lý Ngôn Ngữ Tự Nhiên, Thị Gide May Tinh

2./ Sự phát triển của Machine Learning

Machine Learning đã có sự phát triên đáng kề trong những năm gần đây Một số tiễn bộ chính bao gôm:

Deep Learning: Deep Learning là một phần của Machine Learning sử dụng mạng neural với nhiều lớp để học và dự đoán Nó đã được sử dụng trong nhiều ứng dụng, bao gồm nhận dạng hình ảnh và giọng nói

Reinforcement Learning: Reinforcement Learning la mot loai Machine Learning lién quan đên việc một đại lý học cách đưa ra quyết định dựa trên phản hôi từ môi trường của nó Nó đã được sử dụng trong các ứng dụng như chơi game và robot

Transfer Learning: Transfer Learning liên quan đến việc sử dụng kiến thức được học từ một nhiệm vụ đê cải thiện hiệu suât trên một nhiệm vụ khác Nó đã được sử dụng trong các ứng dụng như xử lý ngôn ngữ tự nhiên và thị giác máy tính

AutoML: AutoML la mot tập hợp các kỹ thuật tự động hóa quá trình xây dựng các mô hình Machine Learning No da duoc sur dung dé lam cho Machine Learning tro nén dé tiếp cận hon đôi với những người không chuyên

Tổng thể, Machine Learning đã có sự phát triển đáng kê trong những năm gần đây, và dự kiên sẽ tiệp tục phát triên trong tương lai.

ARTIFICIAL INTELLIGENCE

Hinh 2.3 Sue phat trién cia Machine Learning Cùng với công nghệ máy tính ngày càng phát triển, Máy Học ngày nay không giống như Máy Học của quá khứ nữa Nó được sinh ra từ nhận dạng mau (pattern recognition) va ly thuyết rằng máy tính có thé hoc ma không cần được lập trình đề thực hiện các nhiệm vụ cụ thê; các nhà nghiên cứu quan tâm đến trí tuệ nhân tạo muôn xem liệu máy tính có thê xxvH học từ dữ liệu hay không Khía cạnh lặp đi lặp lại của Máy Học rất quan trọng vì khi các mô hình được tiếp xúc với dữ liệu mới, chúng có thê thích ứng một cách độc lập Chúng học hỏi từ các tính toán trước đó đề đưa ra các quyết định và kết quả rat đáng tin cậy, có thê lặp lại Đây là một ngành khoa học không mới — nhưng lại là một ngành khoa học đã đạt được nhiều bước tiến lớn

3./ Thế nào để có những hệ thống Machine Learning tốt?

- Khả năng chuẩn bị đữ liệu

- Thuật toán — căn bản & nâng cao - Quy trình tự động và quy trình lặp lại - Kha nang scale

- Ensemble modeling 4./ Những đối tượng sử dụng Machine Learning

MACHINE LEARNING

CHUONG 3./ KẾT LUẬN

1./ Môi trường nào cần tới Khoa học Dữ Liệu Data science có thể được sử dụng trong hầu hết các lĩnh vực của cuộc sống, chăng hạn như ngân hàng, công nghệ, chăm sóc sức khỏe, ban lẻ, thương mại điện tử, v.v; và tại bắt kỳ loại hình tổ chức nào, từ các công ty khởi nghiệp nhỏ đến các tập đoàn khống lỏ, tô chức phi lợi nhuận quốc tẾ, v.v

Với một số công ty bán các sản pham hữu hình, khoa học dữ liệu đóng vai tro tu vấn, giúp các nhóm kinh doanh hiểu được dữ liệu của họ và tạo ra các mô hình đề hỗ trợ các chiến lược kinh doanh

Trong môi trường đó, bạn có thể phải đề xuất và đánh giá các trường hợp có thê xảy ra, giải thích cách tiếp cận tốt nhất với từng phương án, cũng như xây dựng mô hình dữ liệu đề dự đoán tình hình tăng trưởng cho tương lai hoặc cho một sản phâm mới

Trong khi đó, tại một công ty công nghệ lớn, nhiều khả năng bạn sẽ tham gia một nhóm rất chuyên biệt, tập trung vào việc tôi ưu hóa một hoặc một vài phan cu thé của mô hình dữ liệu cho một sản phâm hoặc tính năng công nghệ nào đó

2./ Kiến thức rút ra từ ngành Khoa học Dữ liệu

Ngành khoa học dữ liệu cung cấp cho chúng ta những kiến thức và kỹ năng đề thu thập, xử lý, phân tích và hiểu đữ liệu Điều này rất quan trọng trong thời đại số hóa hiện nay, khi mà dữ liệu được tạo ra và tích lũy với tốc độ nhanh chóng Nhờ vào khoa học dữ liệu, chúng ta có thê tìm ra các mỗi quan hệ và xu hướng trong dữ liệu, từ đó đưa ra các quyết xxxI1 định thông minh và hiệu quá Ngoài ra, kiến thức và kỹ nặng từ ngành khoa học dữ liệu còn giúp chúng ta phát triên các thuật toán và mô hình để giải quyết các vẫn đề phức tạp, từ y tế đến kinh doanh và an ninh mạng Tóm lại, ngành khoa học dữ liệu đóng vai trò quan trọng trong việc giải quyết các vẫn đề thực tế và đưa ra các quyết định thông minh trong thể giới số hóa ngày nay.

Ngày đăng: 06/09/2024, 16:47

w