Lời mở đầuTrước sự phát triển không ngừng của công nghệ thông tin thì kỹ năng phân tích dữ liệu và đưa ra quyết định dựa trên những thông tin đang trở thành những trọng điểm và không thể
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC NGOẠI NGỮ - TIN HỌC TP HỒ CHÍ MINH
BÀI TIỂU LUẬN
Môn học: Phương Pháp Học Đại Học
Đề tài: Phân tích dữ liệu và đưa ra quyết định dựa trên dữ liệu
Tên và MSSV sinh viên :
1 Nguyễn Đặng Hoàng Thông – 23DH122012
2 Võ Ngọc Phương Thảo – 23DH121946
HCM, Tháng 12 -2023
Trang 2S
Mc lc
Lời mở đầu 3
Chương 1: Giới thiệu đề tài 4
Chương 2: Phần nền tảng lý thuyết 4
2.1: Phân tích dữ liệu 4
2.2: Tầm quan trọng của việc phân tích dữ liệu 4
Chương 3: Ứng dụng và ví dụ của phân tích dữ liệu 8
3.1 Các ứng dụng của phân tích dữ liệu 8
3.2 Ví dụ minh họa và thực tế 10
3.2.1 Ví dụ minh họa 10
3.2.2 Ví dụ thực tế 11
Chương 4: Thách thức và giải pháp 12
4.1 Thách thức trong việc phân tích dữ liệu 12
4.2 Giải pháp 13
Chương 5: Kết luận 14
Tài liệu tham khảo 15
Trang 3Lời mở đầu
Trước sự phát triển không ngừng của công nghệ thông tin thì kỹ năng phân tích dữ liệu và đưa ra quyết định dựa trên những thông tin đang trở thành những trọng điểm và không thể thiếu trong nhiều lĩnh vực hiện nay Việc thu thập và xử lý thông tin đã trở tành một điều quan trọng và không thể thiếu để cho việc điều chỉnh được chiến lược kinh doanh cho đến khi đưa ra được quyết định chính xác nhất
Dữ liệu chính là cơ sở để hiểu rõ những gì xung quanh chúng ta
Kỹ năng phân tích dữ liệu không chỉ đòi hỏi việc sử dụng các công cụ,
mà nó còn đòi hỏi khả năng hiểu biết sâu rộng và hợp logic
Việc sử dụng dữ liệu và đưa ra những quyết định không chỉ mang lại tính chính xác mà nó còn giúp được tối ưu hóa hiệu suất và tiết kiệm được thời gian hợp lí Việc hiểu rõ được nguồn gốc cũng cần và quan trọng trong việc đảm bảo được nguồn dữ liệu chất lượng
Trong thời đại ngày nay, khả năng biến những dữ liệu thu thập được thành các thông tin là cần thiết cho sự phát triển của các doanh nghiệp để phát triển trong mỗi lĩnh vực riêng Vì vây, hãy theo dõi những phần tiếp theo của “Kỹ năng phân tích dữ liệu và đưa ra quyết định dựa trên dữ liệu đó” để hiểu rõ hơn về kỹ năng được nói đến này
Trang 4Chương 1: Giới thiệu đề tài
Trong công cuộc 4.0 hiện nay, việc phải ngồi để phân tích từng dữ liệu hay từng tải từng tài liệu thủ công thì làm mất thời gian vào việc này mà không thể làm được nhiều việc khác Khi một nhân viên được giao nhiều công việc cùng một lúc nếu ta ngồi đó và tự phân tích dữ liệu mà không nhờ sự giúp đỡ của công nghệ hiện đại thì chúng ta sẽ không thể nào kịp được KPI và sẽ rất dễ
bị chậm tiến độ công việc Nếu chúng ta nhờ đến công nghệ hiện đại, thì chỉ cần trong vài giây hoặc vài phút thì đại đa số các việc phân tích dữ liệu sẽ diễn
ra nhanh chóng và mau lẹ, giúp những người nhân viên sẽ hoàn thành được chỉ tiêu đề ra nhanh chóng và nhanh lẹ
Phân tích dữ liệu và quyết định dựa trên dữ liệu đó sẽ giúp các doanh nghiệp tạo được chiến lược kinh doanh và có khả năng đạt được thành công nhờ dựa trên thông tin và dự đoán có độ chính xác cao Các doanh nghiệp sẽ được nắm giữ lợi thế cạnh tranh và chủ động khắc phục được những sai sót để duy trì hoạt động kinh doanh liền mạch
Chính vì vậy, phân tích dữ liệu và quyết định dữ liệu đó sẽ giúp công việc của chúng ta trở nên nhanh chóng và chính xác hơn
Chương 2: Phần nền tảng lý thuyết 2.1: Phân tích dữ liệu
Phân tích dữ liệu và quyết định dựa trên dữ liệu đó chính là quá trình thu thập, xử lý và phân tích những thông tin thu thập được từ những trang mạng
và các bài báo khác nhau để đưa ra những quyết định hiệu quả và chuẩn xác nhất Việc này bao gồm những các kỹ năng như thống kê, khai thác dữ liệu phì hợp để trích những thông tin có ích từ những dữ liệu đã thu thập được để từ
đó có thể đưa ra những kế hoạch và quyết định chuẩn xác giúp ích cho các doanh nghiệp trong lĩnh vực kinh doanh, những bộ phận y tế, khoa học dữ liệu
và các ngành chuyên môn khác
Khi cần phân tích những dữ liệu đã thu thập được thì những dữ liệu lớn
là những điểm cần phân tích vì nó có đa dạng các tệp và dữ liệu Chúng có các cấu trúc, phi cấu trúc và bán cấu trúc Các dữ liệu lớn thường được đo bằng Terabyte hoặc là Petabyte Những “tập dữ liệu lớn thường chứa khoảng hàng trăm tới hàng triệu Petabyte”
Phân tích dữ liệu lớn thường tuân thủ theo năm bước như:
Trang 5Thu thập dữ liệu: Bước này thường bao gồm những việc xác định và trích xuất những dữ liệu từ những nguồn tài liệu khác nhau
Lưu trữ dữ liệu: Quá trình tổ chức bảo quản thông tin dưới nhiều dạng khác nhau như là dữ liệu, hệ thống tệp tin Lựa chọn hình thức lưu trữ phù hợp thì ta cần xem đến loại dữ liệu nào, khả năng truy xuất và yêu cầu của hệ thống Lưu trữ thông tin thường được để trong các cơ sở dữ liệu uy tín và đáng tin cậy như Google Cloud, Google Drive,
Làm sạch dữ liệu: Quá trình loại bỏ những dữ liệu không cần thiết, quan trọng, hoặc những dữ liệu bị trùng và không chính xác, cần thiết Việc này gồm những việc sửa đổi các dữ liệu không hoàn chỉnh và loại bỏ các dữ liệu mà không cần thiết đẻ có thể tạo ra những dữ liệu cần thiết và chất lượng hơn cho việc phân tích dữ liệu và đưa ra quyết định
Xử lí dữ liệu: Thường những dữ liệu ở dạng thô không đem lại nhiều giá trị và thông tin cho người sử dụng Vì vậy việc xử lí dữ liệu là việc cần thiết để chuyển những thông tin thu thập được thành những dữ liệu có thể sử dụng được Xử lí dữ liệu đóng vai trò quan trọng trong việc cạnh tranh và tăng được lợi ích cho các doanh nghiệp trong kinh doanh Bằng những việc chuyển đổi những dữ liệu từ dạng chữ sang các đồ thị hoặc sơ đồ tư duy để giúp người đọc dễ nhìn và dễ hình dung khi xem những dữ kiện của các doanh nghiệp ấy Phân tích dữ liệu: Quá trình khám phá ra những dữ liệu để tìm ra những
mô hình, và thông tin hữu ích Bao gồm việc đưa ra phương pháp thống kê để hiểu rõ và đưa ra kết luận, dự đoán hoặc quyết định dựa trên dữ liệu đó
2.2: Tầm quan trọng của việc phân tích dữ liệu
Đối với đại đa số các doanh nghiệp là vô cùng quan trọng, quá trình này dẫn đến sự thành bại của doanh nghiệp Việc phân tích những dữ liệu tìm kiếm được sẽ giúp các doanh nghiệp hiểu được những sai sót và rút được những kinh nghiệm và phương hướng giải quyết để có những cơ hội mới phát triển trong doanh nghiệp Thay vì chỉ đưa ra quyết định dựa trên cảm tính hay phán đoán thì ta nên phân tích và sử dụng dữ liệu đó để doanh nghiệp có những phương án và kế hoạch hợp lí thì doanh nghiệp sẽ có những cơ sở dữ liệu khoa học chính xác để đưa ra quyết định chính xác, hợp lí hơn
Những lợi ích mà doanh nghiệp có thể thu về từ việc phân tích dữ liệu: Giúp doanh nghiệp có cái nhìn khách quan về khách hàng: Thu thập thông tin của khách hàng về những hành vi tương tác, thông tin của khách
Trang 6hàng về những việc như mua hàng, lịch sử giao dịch Bao gồm những việc như tìm hiểu về sở thích, tư duy của khách hàng để tạo ra những sản phẩm phù hợp với nhu cầu của từng khách hàng
Nắm rõ được thị trường kinh doanh: Công ty hoặc doanh nghiệp nằm trong lĩnh vực truyền thông thì việc theo dõi những thông tin hằng ngày và phân tích chúng là một điều không thể bỏ lỡ Giúp các công ty hoặc doanh nghiệp đưa ra những kế hoạch nhanh chóng và dễ dàng triển khai các chiến lược phát triển lâu dài trong tương lai
Tiếp cận với những cơ hội tiềm năng: Trong kinh doanh cơ hội thường không đến nhiều lần Chính vì vậy, ta phải tìm kiếm và nắm bắt những cơ hội tiềm năng, dữ liệu có thể là những khách hàng tiềm năng như là lượt tương tác trên Facebook, Instagram,… hay những trang mạng xã hội phổ biến hiện nay Các kênh hoặc trang web tiếp cận đến khách hàng vô cùng đa dạng khiến quá trình thu thập thông tin diễn ra nhanh chóng và có sự bài bản để giúp doanh nghiệp có thể thấy được xu hướng thị trường và từ đó có thể khám phá được
sự tiềm năng của những cơ hội ấy để xâm nhập vào thị trường này
Giúp doanh nghiệp xây dựng mối quan hệ tốt đẹp với khách hàng: Phân tích dữ liệu giúp các doanh nghiệp dự báo những rủi ro, ngăn chặn những vấn
đề ngoài sức tưởng tượng từ phía khách hàng khi xảy ra, từ đó giúp các doanh nghiệp có được mối quan hệ càng bền chặt với khách hàng
Cải thiện được những thiếu sót và chung cấp dịch vụ tốt đến cho khách hàng: Trong quá trình phân tích dữ liệu mà gặp những sai sót về mặt dịch vụ hoặc sản phẩm thì công ty hoặc doanh nghiệp có thể sửa chữa hay thu hồi lại những sản phẩm dịch vụ bị lỗi mà khách hàng đã đánh giá để cải thiện ngày càng tốt hơn
Giúp nhân viên tăng được năng suất làm việc: Trong thời đại công nghệ 4.0 như hiện nay, việc nhờ máy móc hay các phần mềm phân tích dữ liệu không thể thiếu trong cuộc sống ngày nay Giúp nhân viên của các doanh nghiệp có thể tiết kiệm được thời gian và tăng năng suất làm việc, đạt đủ KPI,… Phân tích
dữ liệu ngày càng được phổ biến trong lĩnh vực nhân sự nhằm tăng hiệu suất làm việc tạo ra những thương hiệu uy tín
Giúp theo dõi được đối thủ cạnh tranh: Đối thủ cạnh tranh được xem là một trong những yếu tố quan trọng dẫn đến sự thành công trong lĩnh vực kinh doanh Nhờ vào phân tích dữ liệu mà các doanh nghiệp có thể phân tích và
Trang 7theo dõi các đối thủ cạnh tranh Để từ đó, đoán được các bước đi của đối thủ
và thay đổi chiến lược kinh doanh cho phù hợp với cạnh tranh
Ngoài những lợi ích mà việc phân tích dữ liệu đem lại thì ta còn có một
số phương pháp phổ biến hay được dùng rộng rãi trong việc phân tích dữ liệu,
đó là:
Phân tích thống kê: Tập hợp những công cụ để thu thập và mô tả, giải thích những dữ liệu Bao gồm những phương pháp tính toán, suy luận, diễn giải và phán đoán dữ liệu để có thể đưa ra những kết luận mà có thể áp dụng cho tất cả Mục tiêu chính của phương pháp phân tích thống kê đó là tóm tắt
và dựa trên những gì đã thu được để kết luận dựa trên những dữ liệu đó Phân tích ngữ cảnh: Quá trình hiểu và đánh giá những dữ liệu trong bối cảnh lớn hơn, gồm những yếu tố xã hội, văn hóa, môi trường, Nó còn xem xét những cảnh vật xung quanh chứ không chỉ chăm chăm vào dữ liệu Phân tích ngữ cảnh còn giúp ta làm rõ được ý nghĩa và tác dụng của của các dữ liệu
để có cái nhìn tổng thể và sâu sắc hơn về tác động của dữ liệu đối với môi trường, xã hội, và những yếu tố kinh doanh khác,
Phân tích dữ liệu hình ảnh: Sử dụng các công nghệ và những phương pháp hữu ích để hiểu ra rút ra những tư liệu hoặc thông thông tin từ hình ảnh Chúng bao gồm việc áp dụng những kỹ thuật hiện đại trong thiết bị để phân tích nhận diện được các loại hình ảnh, đối tượng trong hình ảnh Phân tích dữ liệu hình ảnh thường được sử dụng nhiều trong những lĩnh vực quan trọng như an ninh, và y tế,… Ví dụ, trong lĩnh vực y tế được sử dụng phổ biến nhất, khi chẩn đoán một số bệnh thì cần phải dựa trên hình ảnh y khoa
Phân tích chuỗi thời gian: Quá trình nghiên cứu và hiểu rõ các xu hướng, biến đổi dữ liệu theo thời gian Thường được áp dụng cho những việc hay cập nhật dữ liệu thời gian thường xuyên như doanh thu bán hàng hằng này, giá cổ phiếu, hay dự báo thời tiết từng giờ từng ngày,…
Khai phá dữ liệu: Quá trình tìm kiếm những thông tin bí mật, hoặc những tri thức dữ liệu lớn Bao gồm những việc sử dụng phương pháp và những công
cụ khám phá các mối quan hệ, thông tin mà không dễ dàng phát hiện được qua việc quan sát trực tiếp Khai phá dữ liệu cũng thường được áp dụng trong khá nhiều lĩnh vực quan trọng như kinh doanh, khoa học,… vì nó có thể giúp đưa ra thông tin hoặc phát hiện những thông tin quý báu từ những dữ liệu lớn để đưa
ra những dự đoán hoặc những quyết định chính xác nhất
Trang 8Quyết định dựa trên dữ liệu chính là sử dụng những thông tin cơ bản đã thu thập được từ những nguồn khác nhau gom lại để đưa ra quyết định cơ bản
và đúng đắn nhất Nó bao gồm các dữ liệu, thông tin, dẫn người dùng đến các
dữ liệu khác để hỗ trợ trong quá trình giải quyết các quyết định có tính chính xác
Dữ liệu thường được sử dụng cho các doanh nghiệp hoặc công ty với các mục đích khác nhau; giúp cho người người quản lý thông tin hiểu rõ hơn về khách hàng và đạt được các chỉ tiểu mà doanh nghiệp đề ra, đưa ra được những quyết định đúng đắn có tính thuyết phục và sáng suốt hơn để đạt được hiệu quả hơn
Ở một công ty, quyết định dựa trên dữ liệu đó chính là quá trình đưa ra quyết định dựa trên các sự kiện và kế hoạch:
Thường xuyên thu thập khảo sát phản hồi: Xác định được những ý kiến
từ đại đa số khách hàng qua những trang khảo sát Để từ đó xác định được những sản phẩm hay những dịch vụ mà họ muốn, triển khai kế hoạch nhanh chóng và mang đến những tính năng khách hàng mong muốn
Tiến hành bán chạy thử những sản phẩm trước khi cho ra mắt: Quan sát
và thep dõi xem những sản phẩm, chương trình ưu đãi có thu hút được lượng khách hàng nhiều hay không để từ đó các công ty có thể rút ra những kinh nghiệm và phát triển hợp lí hơn
Phân tích những sự thay đổi trong các dữ liệu để xác định được các cơ hội có liên quan đến các dữ liệu mà mình đã tìm được hay chưa, hoặc các mối
đe dọa trong quá trình kinh doanh và mua bán sản phẩm
Khi bản thân bạn không biết phải quyết định như thế nào vì không có nhiều căn cứ Thì việc quyết định dựa trên dữ liệu vô cùng quan trọng và giúp ích được chúng ta rất nhiều Một số bước để có thể dễ dàng đưa ra quyết định dựa trên dữ liệu một cách hiệu quả nhất:
Xác định dữ liệu: Trước khi đưa ra những yêu cầu hay những quyết định quan trọng cho công ty, thì ta nên tìm hiểu thật kỹ tầm nhìn của công ty bạn trong tương lai Điều này, cần phải sử dụng dữ liệu để hình thành các quyết định của mình
Tìm dữ liệu: Sau khi xác định được mục tiêu mà đang hướng tới thì ta bắt đầu thu thập dữ liệu Các nguồn thông tin dữ liệu sẽ phải phụ thuộc chính vào dữ liệu mà mình đang thu thập Một số thành công mà có thể muốn đo
Trang 9lường như: tỷ suất lợi nhuận, lợi ích đầu tư, tổng số khách hàng, năng suất, doanh thu định kì,…
Tổ chức dữ liệu: Việc tổ chức và sử dụng dữ liệu là rất quan trọng vì nó
có thể đưa ra các vấn đề kinh doanh hiệu quả Muốn tổ chức dữ liệu hợp lí thì
ta nên dùng phương pháp thống kê, các phần mềm hỗ trợ quản lý công việc giúp ta có một giao diện hoàn hảo và đánh vào đúng tâm lí người dùng Rút ra kết luận: sau khi chạy phần mềm bạn sẽ nhận được một số kết quả mà bản thân phải kiểm tra lại trước khi hoàn thành và sử dụng kết quả đó Rút ra kết luận, điều này giúp ta có những cách để cải thiện trước khi chia sẻ thông tin với những người khác
Quyết định dựa trên dữ liệu là một điều cực kỳ quan trọng vì nó giúp tăng được tính chính xác và đạt được hiệu quả trong công việc Dữ liệu cung cấp dữ liệu chính là một phần quan trọng để ta hiểu rõ được xu hướng và tình hình hiện tại và giúp đưa ra được phương hướng chứ không chỉ dựa trên những linh cảm dự đoán Việc sử dụng đúng cách có thể nói như: tối ưu hóa hiệu suất, dự đoán và giảm tránh rủi ro, quyết định thông tin nhanh chóng, định hình và chiến lược từng sản phẩm,…
Chương 3: Ứng dụng và ví dụ của phân tích dữ liệu
3.1 Các ứng dụng của phân tích dữ liệu
Việc phân tích dữ liệu lớn (Big data) có thể áp dụng vào nhiều lĩnh vực đời sống hằng ngày, thế nhưng nó thường được sử dụng trong những lĩnh vực cụ thể sau đây:
Chăm sóc sức khỏe: Trong lĩnh vực này, khi mà số lượng bệnh nhân và tuổi thọ trung bình của dân số thế giới ngày một tăng, thì điều này đã đặt ra một thách thức đối với việc chăm sóc cũng như đưa ra phương pháp điều trị Việc phân tích dữ liệu có thể quản lý đồng thời dự đoán các nguy cơ bệnh, phân tích dữ liệu từ các thiết bị giám sát sức khỏe của từng cá nhân nhằm xem xét tình trạng sức khỏe và đưa ra các dự đoán về nguy cơ bệnh mà bệnh nhân
có thể gặp phải Những thông tin này không những giúp các chuyên gia y tế theo dõi tình trạng sức khỏe, mà còn giúp họ đưa ra các phương pháp ngăn ngừa, điều trị tốt nhất và có thể can thiệp một cách kịp thời Bên cạnh đó, việc phân tích dữ liệu còn có thể giúp tối cá nhân hóa các kế hoạch chăm sóc cho từng người, phân tích các thông tin về kế hoạch chăm sóc, từ đó ta có thể đề xuất và điều chỉnh một kế hoạch tối ưu hơn, để đáp ứng nhu cầu chăm sóc sức khỏe cụ thể từng người
Trang 10Quản lý chuỗi cung ứng: Đối với các doanh nghiệp, các dữ liệu về lượng hàng hóa, thời gian giao hàng, và hiệu suất của nhà cung ứng được phân tích một cách thường xuyên để có thể tối ưu hóa lượng hàng tồn kho, dự đoán nhu cầu và giảm thiểu tối đa mức độ thất thoát Việc phân tích dữ liệu có thể đưa
ra các cảnh báo về các nguy cơ thiếu hụt nguồn hàng hoặc lượng hàng tồn kho quá mức, từ đó các doanh nghiệp có thể đưa ra quyết định tốt nhất dựa trên những thông tin đã phân tích ở thời gian thực Việc này không những giúp doanh nghiệp giảm lãng phí những chi phí không cần thiết đồng thời duy trì một chuỗi cung ứng tối ưu, có thể đáp ứng nhu cầu thị trường một cách nhanh chóng
Kinh doanh tài chính: Trong lĩnh vực kinh doanh thì việc phân tích dữ liệu giúp các nhà đầu tư, ngân hàng và các chủ doanh nghiệp đưa ra những quyết định về chiến lược kinh doanh dựa trên những thông tin chính xác đã được thu thập Khi phân tích dữ liệu thì các nhà lãnh đạo có thể dự đoán trước xu hướng thị trường, đánh giá được rủi ro đồng thời tối ưu hóa các danh mục đầu tư mang lợi những lợi ích cho bên liên quan
Trong việc tiếp thị: Sử dụng phân tích dữ liệu giúp cho doanh nghiệp có
sự hiểu biết sâu sắc hành vi mua sắm của khách hàng, tối ưu hóa hiệu suất của các chiến lược quảng cáo cũng như xác định được xu hướng thị trường hiện nay Áp dụng việc phân tích dữ liệu, doanh nghiệp có thể phát triển các chiến dịch quảng cáo trực tuyến một cách hiệu quả, dự đoán nhu cầu và xu hướng thị trường, đồng tạo ra những trải nghiệm cá nhân hóa cho khách hàng
Năng lượng và tài nguyên: Trong lĩnh vực năng lượng, việc phân tích dữ liệu có thể được áp dụng để theo dõi và dự đoán mức độ tiêu thụ năng lượng, quản lý tài nguyên thiên nhiên đồng thời quy trình sản xuất cũng được tối ưu hóa Việc này giúp giảm thiểu tối đa lượng lãng phí, nâng cao hiệu suất đồng thời hỗ trợ chuyển đổi sang dạng năng lượng tái tạo tối ưu
Trong giáo dục: Đối với giáo dục, qua trình phân tích dữ liệu có thể được
sử dụng trong việc đánh giá hiệu suất học tập của học sinh, dự đoán các kết quả trong học tập và đưa ra những phản hồi mang tính cá nhân hóa Các hệ thống quản lý học tập có thể sử dụng những dữ liệu trước đó để cải thiện chất lượng trong việc giảng dạy đồng thời hỗ trợ đưa ra những quyết định tối ưu về chính sách giáo dục
Nghiên cứu khoa học: Trong lĩnh vực nghiên cứu khoa học này, sử dụng phân tích dữ liệu góp phần vào hỗ trợ quá trình nghiên cứu, đánh giá các kết