Em xin chân thành cảm ơn Khoa Bộ môn toán kinh tế - Trường Đại học Ngân hàng Thành phố Hồ Chí Minh đã xây dựng nên bộ môn “Nhập ngành Khoa học dữ liệu trong kinh doanh” giúp cung cấp ki
Trang 1
BỘ GIÁO DỤC VÀ ĐÀO TẠO NGÂN HÀNG NHÀ NƯỚC VIỆT NAM
TRƯỜNG ĐẠI HỌC NGÂN HÀNG TP HÒ CHÍ MINH
NHAP NGANH KHOA HOC DU LIEU TRONG KINH DOANH
DE BAI: AP DUNG KHOA HOC DU LIEU TRONG KINH DOANH
Trang 2
NHẠN XÉT VÀ CHAM DIEM
Trang 3
MỤC LỤC
LỜI MỞ ĐẦU 5522122221221 22 211211111111 re 5 CHƯƠNG I TÔNG QUAN VỀ KHOA HỌC DỮ LIỆU TRONG KINH DOANH 7
1 Khái niệm và quy trình khoa học dữ liệu - 0-0 120122111211 21 2x Hay 7
hs nh 4 ằẮẤA.5Á 7
1.2 Quy trình làm việc của khoa học dtr HEU .ceceecceeceeeeeeeeeeeeeeeseseseeeeseesesesseesssensseneee 7
2 Nén tang của khoa học dữ lIỆU oo ee cecceceeeecneceecneeeenneeeeseeeeeseeesneeessneeeesneeessneeesneeenes 8
3, Cac khai mig Linn nan 8
4 Ứng dụng của khoa học dữ liệU - 2-22 ¿+S2S92EÊEEÊEE2EE2E12E1221211211211212212121 2 tr 10
4.1 Trong lĩnh vực ngân hàng ST KT BE Erh 10 4.2 Trong lĩnh vực tài chính - SH HH To kh KH 11 4.3 Trong linh vue giao thong VAN tal .ceeesceeceeeeceeceeeeeceeeeeeteeeeeeesaeeesaetaeeetaecatetanaes 11 4.4 Tromg Tit vue y te ằe 11
So na so n6 :|ÄÄH) 12
CHƯƠNG II ÁP DỤNG KHOA HỌC DỮ LIỆU TRONG KINH DOANH: CƠ HỘI
1 Cơ hội khi áp dụng khoa hoc di liệu trong kinh doanh . cscccecceece 14
II tản ơn on 14
1.2 Tạo lợi thế cạnh tranh và nhảy VỌI: . - 7+2 +2+s++£+£+E+++EzE£eEeeeexersreezereeera 14
1.3 Xác định và giảm thiêu rủi ro trong tương lai: 7- <<<<+ses<s<+s<exeeesz 14 1.4 Nâng cao năng suất và hiệu quả của doanh nghiệp: .- -2- -s<5-==s+s 15
1.5 Tạo ra doanh thu và khai thác cơ hội tiết kiệm chỉ 01-3 15 1.6 Dự đoán tỉnh hình tài chính: - << << +< c2 21 se xxx ke ra 15 1.7 Quảng cáo được tối ưu hÓa: + 552 +22+S+2+2+E+E+teveEeEcevxrkrkerrrrrrererrereree 16 1.8 Nâng cao trải nghiệm khách hàng: - - - - << << 1 HS nh 16
1.9 Dự báo tình hình kinh doanÌ: .- - c << <1 1xx kh kh ket 16
1.10 Tối ưu hóa trải nghiệm của khách hàng: . - 5-2-5252 2 s+s>+<+<ze+eczszezezeeexs 17
1.11 Triển vọng của khoa học dữ lIỆU: - << - S1 ni ng 17
2 Thách thức khi áp dụng khoa học dữ liệu trong kinh doanh ‹- - s5: s55: 18 2.1 Thiếu nguồn nhân lực chuyên mô: . 5-2-2 2+ +<+sz>£+E+EzE++Ezz+e£szxzezzzrzrzse 18 2.2 Văn hóa lãnh đạo: + - 2< - 222B kg ki cu re 18
2c ung 010490) 000 .Ỉ.,.,H, 18
2.4 Khối lượng và độ phức tạp của dữ liệu: cs-c si serirrrerrrrrrrrrrrrrrrree 19 2.5 Hạn chê về công nghỆ: - - - < À1 1 eee HH ok ki BH 19 2.6 Bảo mật và quyên riêng tư: ¿+ 7+ + 2+ +s+t++2+3+eEeEevevEeEexsekxrkrkervrkererrrrrerecee 20
3 Các đề xuất cho doanh ng hiỆp 2-5225 2S SE 2EESEEE2EE2E2EE23E1321212212152121121 712 EE.xxeE 20 9:109)I60008 450000790077 21
1 Tóm tắt nội dung chính - ¿5£ +52 EE+EÊEESEEEEEEE2EEEESEEEE112121511211111.2112121E 111 xe 21 2.Ý nghĩa thực tiễn của bài tiểu luận -: 5: S St SE SE SE E1 SE E151 1151115111 E1EEEEEETEEEEEEESErrrer 21
TÀI LIỆU THAM KHẢO 5-5 2521 2t2E1212E12122121 1122 1111111121011 ereg 23
Trang 3123
Trang 4LỜI CẢM ƠN
Đề hoàn thành bài báo cáo nghiên cứu về đề tài “Áp Dụng Khoa Học Dữ Liệu
trong Kính Doanh: Cơ Hội và Thách Thức” Em xin chân thành cảm ơn Khoa Bộ
môn toán kinh tế - Trường Đại học Ngân hàng Thành phố Hồ Chí Minh đã xây dựng
nên bộ môn “Nhập ngành Khoa học dữ liệu trong kinh doanh” giúp cung cấp kiến thức cũng như cái nhìn tổng quát tổng quát liên quan đến khoa học đữ liệu, một trong những kiến thức vô cùng cần thiết trong thời đại số hóa ngày nay Đặc biệt, em xin
gửi lời cảm ơn sâu sắc đến giảng viên bộ môn - Thây Lê Quang Thái đã trực tiếp hướng dẫn, giảng dạy và truyền đạt những kiến thức về môn Nhập ngành Khoa học dữ
liệu trong kinh doanh
Em đã cố gắng vận dụng những kiến thức mà thầy truyền đạt để hoàn thành bài tiểu luận một cách hoàn thiện nhất Nhưng do kinh nghiệm vả kiến thức của em còn hạn chế nên bài báo cáo này vẫn còn sai sót Rất mong nhận được những lời đóng góp, chia sẻ ý kiến quý báu của thầy để em có thê rút kinh nghiệm và hoàn thiện kiến thức của mình trong lĩnh vực này một cách tốt hơn
Kính chúc thây thật nhiều sức khỏe, niềm vui trong cuộc sống và thành công trên con đường sự nghiệp
Em xin chân thành cảm ơn!
Trang 4123
Trang 5kể đến trong danh sách này là Google, Facebook, Yahoo, Youtube, Sự thành công của các công ty và tổ chức trên thế giới ngày nay đều ít nhiều có liên quan với ngành
“Khoa học dữ liệu” Ngày nay, Khoa học Dữ liệu là xương sống của bất kỳ ngành nào,
và các xu hướng hiện tại cho thấy rằng nó sẽ càng trở nên quan trọng hơn trong tương lai Nếu muốn doanh nghiệp của mình thành công, điều quan trọng là phải dựa vào Khoa học Dữ liệu Tuy tạo ra những cơ hội cho các doanh nghiệp phát triển nhanh
chóng nhưng Khoa học Dữ liệu vẫn còn gặp phải những thách thức lớn
Nhận thức rõ ràng về vấn đề quan trọng này trong cuộc sống thực tế, đề tải tiéu
luận môn Nhp ngành Khoa học dz liệu trong kinh doanh có nội dung là “ÁP DỤNG
KHOA HOC DỮ LIỆU TRONG KINH DOANH: CƠ HỘI VÀ THÁCH THUC”, Điều này không chỉ là cơ hội để phát triển kỹ năng nghiên cứu và phân tích mà còn để
đóng góp vào việc hiểu rõ hơn về tầm quan trọng của khoa học đữ liệu trong ngành kinh doanh đang ngày cảng biến đối
2 Mục đích nghiên cứu
Tìm hiểu, phân tích và đánh giá cơ hội và thách thức của việc áp dụng khoa học
dữ liệu trong lĩnh vực kinh doanh Nghiên cứu này nhằm đưa ra những nhận thức sâu sắc về ảnh hưởng của khoa học dữ liệu đối với quyết định kinh doanh và chiến lược doanh nghiệp
Trang 5123
Trang 63 Pham vi và nội dụng
Cấu trúc Tiểu luận này sẽ giới thiệu những khái niệm cơ bản về khoa học đữ liệu,
cơ hội và thách thức khi áp dụng vào quá trình kinh doanh Tiểu luận được trình bày trong 3 chương:
° Chương |: Giới thiệu những khái niệm cơ bản về khoa học đữ liệu, các khái niệm nền tảng, các ứng dụng của khoa học dữ liệu
° Chương 2: Đi sâu nghiên cứu về cơ hội và thách thức khi ứng dụng Khoa học đữ liệu vào quá trình kinh doanh, trình bày các đề xuất cho doanh nghiệp
° Chương 3: Tóm tắt nội dung và nêu ý nghĩa của nghiên cứu
Trang 6123
Trang 7CHUONG I TONG QUAN VE KHOA HOC DU LIEU TRONG
sử dụng các thuật toán học máy phức tạp để xây dựng các mô hình dự đoán Bước đầu
là đi tìm kiếm nguồn dữ liệu, dữ liệu được sử dụng cho phân tích có thể đến từ nhiều nguồn khác nhau và được trình bày dưới nhiều định dạng khác nhau (có thể dưới dạng cau tric hay phi cau trúc), sau đó là quản trị đữ liệu (làm sạch, lưu trữ, tính toán, ) Cuối cùng là phân tích đữ liệu và sử dụng kết quả ứng dụng vào các lĩnh vực trong đời sống
Đây là sự tiếp nối của một số lĩnh vực phân tích dữ liệu như khoa học thống kê, khai
phá dữ liệu và là công cụ lao động vô cùng quan trọng trong thời kỳ chuyên đôi số 1.2 Quy trình làm việc của khoa học đữ liệu
Quy trình làm việc trong khoa học dữ liệu bao gồm năm giai đoạn khác nhau, mỗi giai đoạn có nhiệm vụ riêng:
Thu thập (Capture): Bao gồm việc thu nhập đữ liệu, nhập liệu, thu sóng và trích xuất đữ liệu Giai đoạn này liên quan đến việc thu thập dữ liệu có cấu trúc và không cau trúc
Bảo dưỡng (Maintain): Bao gồm việc lưu trữ dữ liệu, làm sạch dữ liệu, tạo cấu trúc dữ liệu, xử lý dữ liệu vả kiến trúc đữ liệu Giai đoạn này liên quan đến việc lay dir liệu gốc và biến nó thành dạng có thể sử dụng
Xử lý (Process): Bao gồm việc khai thác đữ liệu, phân cụm/phân loại, mô hình đữ liệu, tóm tắt đữ liệu Nhà khoa học dữ liệu lấy dữ liệu đã chuẩn bị và kiểm tra các mô hình, phạm vi và độ chệch để xác định mức độ hữu ích của nó trong phân tích tiên đoán
Phân tích (Analyze): Bao gồm phân tích dữ liệu theo hướng khám phá/xác nhận, phân tích tiên đoán, hồi quy, khai thác văn bản, phân tích chất lượng Đây là phần quan trọng của chu kỳ làm việc, liên quan đến việc thực hiện các phân tích khác nhau trên dữ liệu
Trang 7123
Trang 8Giao tiép (Communicate): Bao gồm báo cáo dữ liệu, trực quan hóa dữ liệu, thông tin doanh nghiệp, đưa ra quyết định Trong bước cuối cùng này, các nhà phân tích chuẩn bị các phân tích dưới dạng dễ đọc như biểu đồ, đồ thị và báo cáo
2 Nền tảng của khoa học dữ liệu
Học Máy (Machine Learning): Học Máy là lĩnh vực nghiên cứu của Trí tuệ nhân tạo liên quan đến việc xây dựng các mô hình và thuật toán cho phép máy tính tự động học hỏi từ đữ liệu mà không cần lập trình cụ thể Trong Khoa học Dữ liệu, Học Máy gIúp xây dựng các mô hình dự đoán và phân tích dữ liệu
Mô Hình (Modeling): Trong ngữ cảnh Khoa học Dữ liệu, mô hình là một biểu diễn toán học của một hệ thống thực tế Các mô hình này được áp dụng để dự đoán hoặc giải quyết vấn đề dựa trên dữ liệu có săn Chọn đúng mô hình là quan trọng và đòi hỏi hiểu biết vững về tính chất của dữ liệu
Thống Kê (Statistics): Thống kê là một phần quan trọng của Khoa học Dữ liệu Nó liên quan đến việc thu thập, phân tích và giải thích đữ liệu đề hiểu rõ hơn về xu hướng, biến động và mối quan hệ Các phương pháp thống kê giúp đưa ra những kết luận có ý nghĩa từ dữ liệu
Lap Trinh (Programming): Lap trinh trong Khoa hoc Di ligu có nghĩa là sử dụng ngôn ngữ máy tính đề thực hiện các tác vụ phức tạp như xử lý dữ liệu, xây dựng mô hình, và hiên thị kết quả Python và R là hai ngôn ngữ phô biến trong lĩnh vực nảy
Cơ Sở Dữ Liệu (Database): Cơ sở Dữ liệu là nơi lưu trữ đữ liệu một cách có tổ chức để truy xuất và quản lý dữ liệu đễ dàng hơn Trong Khoa học Dữ liệu, hiểu biết
về cách hoạt động của cơ sở dữ liệu giúp nhà Khoa học Dữ liệu trích xuất dữ liệu một cách hiệu quả
3 Các khái niệm liên quan
Cho tới hiện nay nhân loại đã chứng kiến bốn cuộc cách mạng công nghiệp: đầu tiên là cuộc cách mạng công nghiệp lần thứ nhất với phát minh ra máy hơi nước của Jame Watt ở Anh năm 1769, là sự bắt đầu của sản xuất thủ công sang sản xuất công nghiệp Khi điện được phát minh cũng là sự mở đầu cho cuộc cách mạng công nghiệp
Trang 8123
Trang 9lần thứ hai, được ứng dụng mạnh mẽ trong sản xuất cơ khí Tiếp đến là cuộc cách mạng công nghiệp lần thứ ba với sự nhảy vọt khi có máy tính, internet, phô biến công nghệ thông tin, thúc đây mạnh mẽ việc sản xuất hàng loạt Cuối cùng là hiện nay với cuộc cách mạng công nghiệp lần thứ tư với sản phẩm chính là công nghệ số, điện toán đâm mây và trí tuệ nhân tạo, sản xuất hàng hóa được vận hành một cách thông minh,
tự động hóa
Chúng ta đang thừa hưởng các tiện nghị, hiện đại do các cuộc cách mạng công nghiệp mang lại Sức mạnh của chất xám con người là điều kì diệu tuyệt vời không thể phủ nhận Vậy những thành quả của các cuộc cách mạng công nghiệp là vĩ đại thế nào
và nó có liên kết và hỗ trợ cho sự phát triển của Khoa học dữ liệu ra sao, ta sẽ củng tìm hiểu một số công nghệ liên quan:
Điện toán đám mây: là một mô hình cung cấp tài nguyên tính toán, lưu trữ, và dịch
vụ qua Internet Dữ liệu được lưu trữ thường xuyên trên máy chủ và tạm thời trên máy khách, thay vì sở hữu và quản lý cơ sở hạ tầng trong nội bộ, người dùng có thể truy cập và sử dụng các tài nguyên nảy từ các nhà cung cấp dịch vụ đám mây Điều này bao gồm khả năng truy cập từ xa, chia sẻ tài nguyên giữa nhiều người dùng, tính mở rộng linh hoạt và cung cấp dịch vụ tự động Những ứng dụng quen thuộc có thé ké đến nhu Google Drive, Dropbox, One Drive
Chuỗi khối (Blockchain): là một loại cơ sở dữ liệu đặc biệt không aI có quyền kiểm soát thông tin đi vào, trong đó đữ liệu được tô chức thành các khối tuần tự và chỉ thêm (tức là không được chỉnh sửa thông tin đã có mà chỉ được quyền thêm thông tin mới vào) Các khối này liên quan đến các tài sản ảo hoặc vật chất và được kết nối bằng các mã hash, tạo nên một chuỗi ngày càng lớn Việc thêm mới dữ liệu vào blockchain chỉ xảy ra sau khi khối giao dịch được xác minh thông qua cơ chế đồng thuận (nhiều bên khác nhau lưu trữ và thực hiện các bản sao của một bộ hồ sơ gốc) Tóm lại, chuỗi khối là một số cái mật mã phân tán và an toàn, nơi mỗi khối lưu trữ một lịch sử chính xác, cập nhật và không thê thay đối của các giao dịch, mà không cần sự tin tưởng giữa các bên Chuỗi khối có nhiều ứng dụng: Trong ngành công nghiệp 4.0, blockchain đã được sử dụng để tạo và quản lý mạng IIoT, quản lý hiệu quả các quá trình sản xuất Trong tài chính, blockcham đã được sử dụng dé day manh thanh toan xuyén bién gidi, thanh toán bù trừ, tài trợ thương mại, tài chính chuỗi cung ứng, chứng khoán hóa tài sản, số hóa vốn,
Trang 9123
Trang 10Dữ liệu lớn (Big Data): là các tập đữ liệu có khối lượng lớn và phức tạp Độ lớn đến mức các phần mềm xử lý dữ liệu truyền thống không có khả năng thu thập, quản
lý và xử lý dữ liệu trong một khoảng thời gian hợp lý Dữ liệu lớn dựa trên bốn yếu tổ quan trọng: dung lượng, tốc độ, đa dạng, tính xác thực Những tập dữ liệu lớn này có thê bao gồm các dữ liệu có cấu trúc, không có cấu trúc và bán cấu trúc, mỗi tập có thể được khai thác để tìm hiểu ý nghĩa Các giải pháp Big Data cung cấp các công cụ, phương pháp và công nghệ được sử dụng để nắm bắt, lưu trữ, tìn kiếm và phân tích
dữ liệu trong vài giây để tìm mối quan hệ và hiểu biết về cải tiến và lợi ích cạnh tranh
mả trước đây không có
Trí tuệ nhân tạo (AI); đề cập đến công nghệ liên quan đến việc phát triển các máy
và phần mềm thông minh, giúp máy tính có khả năng suy nghĩ và trí tuệ như con người Điều này bao gồm sự phát triển của ứng dụng và hệ thống có khả năng nhận thức, học hỏi, suy luận, tương tác bằng ngôn ngữ con người, giải quyết vấn đề Trí tuệ nhân tạo cung cấp cho người dùng khả năng tự động hóa và cải thiện phức tạp trong việc đự đoán và phân tích mô tả dữ liệu, công việc mà nếu thực hiện bởi con người sẽ tốn nhiều thời gian và công sức Do đó, sự phát triển của trí tuệ nhân tạo có thể ảnh hưởng lớn đến vai trò trong việc xác định cách con người làm việc, giao tiếp và quản
lý doanh nghiệp
4 Ứng dụng của khoa học dữ liệu
Khoa học đữ liệu có tầm anh hưởng đến nên kinh tế, được ứng dụng đa dạng trải dài theo từng lĩnh vực:
4.1 Trong lĩnh vực ngân hàng
Với Data Science, các ngân hàng quản lý nguồn tài nguyên của ho dé dang hon, nhận biết vấn đề trục trặc sớm hơn và quản lý đữ liệu khách hàng hiệu quả hơn Bằng ung dung cua Data Science, ngân hang tỉm ra giá trị vòng đời khách hàng, cho phép họ định lượng khách hàng mà họ mong muốn Đối với vấn đề nhận biết rủi ro và thâm dinh cho vay, Data Science cung cap céng cy dé nang cap thé tin dụng, bảo hiểm và kế toán Ngân hàng cũng dùng Data Science nhằm phân tích các gói cho vay dau tư và hệ sinh thái khách hàng để khai thác những lợi thế cho doanh nghiệp cũng như khách hàng sử dụng dịch vụ Trong các phân tích đánh giá thực tế, ngân hàng sử dụng thuật
Trang 10123
Trang 11toan Machine Learning đề cải thiện chiên lược của họ và đảo sâu tìm hiểu nhiều vân
đề tác động đến chất lượng cơng việc
4.2 Trong lĩnh vực tài chính
Sử dụng mơ hình học máy và các phương pháp khoa học dữ liệu giúp cải thiện khả năng dự đốn giá cơ phiếu và các chỉ số tài chính Các cơng cụ và kỹ thuật khoa học
dữ liệu giúp xử lý lượng lớn đữ liệu tài chính từ nhiều nguồn khác nhau, bao gồm cả
dữ liệu thị trường chứng khốn và dữ liệu tài chính của doanh nghiệp Việc sử dụng các ngơn ngữ lập trình như Python và R, cùng với các thư viện va framework nhu
Pandas và Scikit-learn, giúp tích hợp các mơ hình và phương pháp dé dàng và linh
hoạt Khoa học đữ liệu giúp phân tích các yếu tơ ảnh hưởng đến biến động thị trường,
từ đĩ đưa ra dự đốn và quyết định đầu tư chính xác hơn Sử dụng các cơng cụ trực quan hĩa dữ liệu như Tableau và Power BI giúp tạo ra các bảng điều khiển tương tác, giúp nhà đầu tư và chuyên gia tài chính hiệu rõ hơn về đữ liệu
4.3 Trong lĩnh vực giao thơng vận tải
Khoa học dữ liệu đĩng vai trị quan trọng trong ngành giao thơng vận tải, mang lại nhiều ứng dụng quan trọng Đầu tiên, Khoa học đữ liệu cải thiện an tồn giao thơng và thúc đây sự tự động hĩa trong quản lý phương tiện Với xu hướng "xe tự lái," Data Science mé ra những cơ hội mới trong cơng nghiệp giao thơng vận tải Bằng cách phân tích tiêu thụ nhiên liệu, hành ví người lái, và thơng tin van hanh, Data Science định hình nền tảng cho thế hệ mới của ngành Các hệ thống dự độản lộ trình khoa học
là một sản phẩm của Khoa học dữ liệu, giúp xe tự động nhận biết và đề xuất đường đi thuận lợi dựa trên nhiều biến số Điều này đĩng gĩp vào sự phát triển của giao thơng vận tải thời đại cơng nghiệp 4.0 Cơng ty vận tải như Uber, Grab cũng ứng dụng Khoa học dữ liệu để điều chỉnh giá và nâng cao trải nghiệm khách hàng Các cơng cụ dự đốn, dựa trên dữ liệu như thời tiết, mật độ giao thơng và người dùng, giúp họ tối ưu hĩa chi phi và cung cấp dịch vụ linh hoạt và hiệu quả
4.4 Trong lĩnh vực y tế
Data Science đã mang lại những tiến bộ lớn trong lĩnh vực y tế Các ứng dụng của
nĩ, như phân tích hình ảnh y khoa, nghiên cứu øen, điều chế thuốc, chân đốn bệnh và
Trang 11123