1. Trang chủ
  2. » Luận Văn - Báo Cáo

Đồ Án Công Nghệ Dữ Liệu Lớn Thống Kê Sự Quan Tâm Của Người Dùng Facebook Đối Với Một Sản Phẩm.pdf

55 1 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Nội dung

Trang 1

TRƯỜNG ĐẠI HỌC TÀI NGUYÊN VÀ MÔI TRƯỜNGTHÀNH PHỐ HỒ CHÍ MINH

KHOA HỆ THỐNG THÔNG TIN VÀ VIỄN THÁM

Giảng viên hướng dẫn : ThS PHẠM TRỌNG HUYNH

TP Hồ Chí Minh, tháng 11 năm 2023

Trang 2

TRƯỜNG ĐẠI HỌC TÀI NGUYÊN VÀ MÔI TRƯỜNGTHÀNH PHỐ HỒ CHÍ MINH

KHOA HỆ THỐNG THÔNG TIN VÀ VIỄN THÁM

Giảng viên hướng dẫn : ThS PHẠM TRỌNG HUYNH

TP Hồ Chí Minh, tháng 11 năm 2023

Trang 3

GIỚI THIỆU

Mạng xã hội Facebook đã trở thành một phần quan trọng trong cuộc sốnghàng ngày của hàng tỷ người trên thế giới Với hơn 2,8 tỷ người dùng hàngtháng tính đến cuối năm 2021, Facebook không chỉ là nơi kết nối với bạn bè vàgia đình mà còn là nền tảng mạnh mẽ để chia sẻ thông tin, ý kiến và đặc biệt làtình bạn.

Trong thời đại kỹ thuật số này, việc hiểu sâu hơn về cách người dùngFacebook tương tác và quan tâm đến sản phẩm ngày càng quan trọng đối vớicác doanh nghiệp và nhà nghiên cứ u Điều này không chỉ giúp họ tối ư u hóa cácchiến dịch tiếp thị truyền thông xã hội mà còn giúp họ hiểu rõ hơn về nhu cầucủa khách hàng và thị trường tiềm năng.

Trong bối cảnh này, chủ đề này tập trung vào số liệu thống kê và phân tíchsự quan tâm của người dùng Facebook đối với các sản phẩm cụ thể Chúng ta sẽđi sâu vào các khía cạnh khác nhau của việc đo lường sự quan tâm, bao gồmmức độ tương tác, ý kiến và cách lan truyền thông tin sản phẩm trên nền tảng.

Mục tiêu của nghiên cứu này không chỉ là xác định mức độ quan tâm màcòn để hiểu rõ hơn về bối cảnh và các yếu t ố ảnh hưởng đến sự quan tâm củangười dùng Chúng tôi sẽ sử dụng các phương pháp thống kê và công cụ phântích dữ liệu để trả lời các câu hỏi quan trọng, chẳng hạn như cách tối ưu hóa cácchiến dịch tiếp thị trên Facebook, cách tăng lượng người dùng và cách phát triểnsản phẩm dựa trên thông tin được thu thập.

Nghiên cứu này sẽ giúp cung cấp thông tin hữu ích cho các doanh nghi ệp,nhà tiếp thị và những người quan tâm đến việc nắm bắt xu hướng quan tâm củangười dùng trên mạng xã hội Chúng tôi hy vọng rằng kết quả của nghiên cứunày sẽ góp phần tìm hiểu cách mạng xã hội ảnh hưởng đến thị trường và cáchngười dùng tương tác với các sản phẩm trong môi trường ngày càng kỹ thuật số.

1

Trang 4

BÁO CÁO CHI TIẾT 7

1 Giới thiệu Big Data .7

1.1 Định nghĩa .7

1.2 Đặc trưng của Big Data 9

1.3 Những vấn đề liên quan 12

2 Bài toán 23

2.1 Mục tiêu nghiên cứu .23

2.2 Câu hỏi nghiên cứu 23

Trang 5

Tên đề tàiTHỐNG KÊ SỰ QUAN TÂM CỦANGƯỜI DÙNG FACEBOOK ĐỐI VỚIMỘT SẢN PHẨM.

• Link Github: Đóng góp của thành viên

Họ vàtênthànhviên 1

Trần Minh Kỳ - 1050080142 Đóng góp: Tìm dữliệu DEMO, làm ppt,thực nghiệm DEMO.Điểm số lần cmt:6.5đ

Số Buổi Vắng: 0 Bài lab cm: Đủ/5bĐiểm tự đánh giácuối kỳ: 6đ

Họ vàtênthànhviên 2

Võ Quốc Bảo - 1050080128 Đóng góp:Tìm t àiliệu nội dung đề tài,Tìm dữ li ệu DEMO,xây dựng DEMO.Điểm số lần cmt:6.5đ

Số Buổi Vắng: 0Bài lab cm: Đủ/5bĐiểm tự đánh gi á cuốikỳ: 6đ

Họ vàTênthànhviên 3

Nguyễn Thị Tú Nhi - 1050080149 Đóng góp: xây dựngnội dung word, ppt;Tìm nội dungDEMO, Thực nghiệmDEMO.

Điểm số lần cmt:6.5đ

Số Buổi Vắng: 03

Trang 6

Bài lab cm: Đủ/5bĐiểm tự đánh giácuối kỳ: 6đ

BÁO CÁO TÓM TẮT

Lý do chọn đề tài

Tầm quan trọng của mạng xã hội trong ti ếp thị và nghiên cứu t hị trường:Mạng xã hội, đặc biệt l à Facebook, đã trở thành một phần quan trọng trong cuộcsống hàng ngày của nhiều người Các doanh nghiệp hiện sử dụng phương tiệntruyền thông xã hội để tiếp cận và tương tác với khách hàng Hiểu cách ngườidùng tương t ác với sản phẩm trên Facebook có thể gi úp tối ưu hóa các chiếndịch tiếp thị và quảng cáo.

Tính phổ biến của vi ệc t hu thập dữ liệu: Mạng xã hội cung cấp nhiều dữ liệuvề hành vi của người dùng Các công cụ phân tích và API của Facebook giúp dễdàng thu thập dữ liệu về sự quan tâm của người dùng đối với các sản phẩm cụthể.

Nhu cầu nâng cao hi ệu quả tiếp thị và quảng cáo: Hiểu rõ hơn về cách ngườidùng tương tác với sản phẩm trên Facebook có thể giúp nâng cao hiệu quả củacác chiến dịch tiếp thị và quảng cáo Điều này giúp ti ết kiệm tài nguyên và cảithiện tỷ lệ chuyển đổi.

Một mô hình ứng dụng trong bài toán xử lý dữ liệu lớn hiện nay chính là môhình đề xuất (User Engagement Prediction Model) đây là một mô hình dự đoánsự tương tác hoặc quan tâm của người dùng đối với một sản phẩm hoặc nộidung cụ thể trên mạng xã hội, như Facebook Điều này có thể bao gồm việc dựđoán số lượt thích, bình luận, chia sẻ hoặc các hoạt động tương tự mà một bàiviết hoặc sản phẩm có thể nhận được trên nền tảng xã hội Hệ thống này đãđược triển khai và phát triển rộng rãi trên nhiều nền tảng trực tuyến, đem lại sựthành công đáng kể trong việc t ối ưu hóa trải nghiệm của ngư ời dùng và tănghiệu quả kinh doanh Các nền tảng như YouT ube, Netflix, Tiki, Amazon, và

Trang 7

nhiều dự án khác đã tận dụng mô hình đề xuất để cung cấp sản phẩm và dịch vụphù hợp nhất cho người dùng.

Bài toán này đặc biệt quan t rọng trên các nền tảng mạng xã hội , trong đóFacebook là một ví dụ nổi bật Facebook không chỉ l à một môi trường để kếtnối bạn bè và gia đình mà còn là một nền tảng m ạnh mẽ để doanh nghiệp tiếpcận khách hàng và tiếp thị sản phẩm Hiểu rõ cách mà người dùng Facebooktương tác và quan tâm đến các sản phẩm cụ thể trên m ạng xã hội có thể giúp tốiưu hóa chiến dịch tiếp thị và tạo sự quan tâm mạnh mẽ hơn đối với sản phẩmhoặc dịch vụ.

Đề tài "Thống kê sự quan tâm của người dùng Facebook đối với một sảnphẩm" xoay quanh việc nghiên cứu và t hống kê cách mà người dùng Facebooktương tác với một sản phẩm cụ thể Bằng cách sử dụng các phương pháp thốngkê và công cụ phân tích dữ liệu, chúng ta có thể t i ếp cận thông tin quý báu vềmức độ quan tâm, tư ơng t ác, và sự lan truyền thông đi ệp về sản phẩm trên mạngxã hội này Điều này có thể giúp doanh nghiệp hiểu rõ hơn về nhu cầu củakhách hàng và đáp ứng chúng một cách hiệu quả.

Nhóm 9 chọn đề tài "Thống kê sự quan tâm của người dùng Facebookđối với một sản phẩm" với mục tiêu tìm hiểu về cách mà người dùng trên nền

tảng mạng xã hội Facebook thể hiện sự quan tâm đối với các sản phẩm cụ thể.Đề tài này lựa chọn Facebook là nền tảng nghiên cứu bởi tính phổ biến củamạng xã hội này và khả năng cung cấp một lượng lớn dữ liệu liên quan đến sựquan tâm của người dùng Các lý do chúng tôi chọn đề tài là như sau:

 Mục tiêu nghiên cứu sự tương tác xã hội: Facebook là một trong những

mạng xã hội phổ biến nhất trên thế giới, nơi mà người dùng t hể hiện sựquan tâm, tương tác và chia sẻ về các sản phẩm, sự kiện và nội dung.Hiểu rõ cách mà ngư ời dùng tương tác trên nền tảng này có thể giúp xácđịnh mức độ quan tâm và sự ảnh hưởng của các sản phẩm.

 Phản ánh xu hướng thị trường: Việc thống kê sự quan tâm của người

dùng đối với sản phẩm trên Facebook có thể cung cấp thông tin về xuhướng thị trường Điều này có thể hữu ích cho các doanh nghiệp và nhàtiếp thị để đảm bảo họ đáp ứng đúng nhu cầu của khách hàng và tận dụngcơ hội thị trường.

 Áp dụng trong tiếp thị trực tuyến: Việc hiểu rõ cách mà người dùng

tương tác với sản phẩm trên Facebook có thể giúp cải thiện chiến dịchtiếp thị trực tuyến Dựa trên thông tin này, các doanh nghiệp có thể tối ưuhóa chiến dịch quảng cáo và nội dung để tạo sự quan tâm và tương tác tốthơn.

 Tối ưu hóa dựa trên dữ liệu: Đề tài này tập trung vào việc sử dụng dữ

liệu từ Facebook để thống kê và phân tích sự quan tâm của người dùng5

Trang 8

đối với sản phẩm Dựa trên thông tin này, chúng tôi có thể phát triển môhình và chiến lược để tối ưu hóa quá t rình quảng cáo và tương tác vớingười dùng.

Nhóm 9 hi vọng rằng đề tài này sẽ cung cấp cái nhìn sâu rộng hơn về cáchmà người dùng Facebook thể hi ện sự quan tâm đối với sản phẩm và giúp cácdoanh nghiệp và nhà nghiên cứu tối ưu hóa chiến dị ch tiếp thị và quảng cáo trênnền tảng này.

 Các nội dung và kết quả  Mô tả bài toán  Giải pháp, mô hình Các công nghệ sử dụng

 Cài đặt Spark và Elasticsearch trênhost local và trên cluster ambari  Demo

 Đánh giá

Trang 9

BÁO CÁO CHI TIẾT

1 Giới thiệu Big Data1.1 Định nghĩa

Big data là các tập dữ liệu rất lớn và phức tạp, rất khó để quản lý, lưu trữvà phân tí ch bằng các công cụ xử lý dữ liệu truyền thống Điều quan trọng củabig data là khả năng phân tích và tìm hiểu thông ti n từ những tập dữ liệu này,vì chúng t hườ ng chứa nhiều thông tin tiềm ẩn và giá trị quan trọng.

Ví dụ như phương pháp cá nhân hóa nội d ung đề xuất cho mỗi ng ười trê ncác nền tảng Spotify, Netflix , Youtube, các nền tảng Thương m ại điện tử nhưShope e, La zada,

Dữ l i ệu lớn thường bao gồm tập hợp dữ liệu với kích thước vượt xa khảnăng của các công cụ phần mềm thông thường để thu thập, hiển thị, quản lý vàxử lý dữ liệu trong một thời gian có thể chấp nhận được Kích thước dữ liệu lớnlà một mục tiêu liên tục thay đổi Như năm 2012 thì phạm vi m ột vài táterabytes tới nhiều pet abyt es dữ liệu Dữ liệu l ớn yêu cầu một t ập các kỹ thuậtvà công nghệ được tích hợp theo hình thức mới để khai phá từ tập dữ liệu đadạng, phức tạp, và có quy mô lớn.

7

Trang 10

Trong báo cáo nghi ên cứu năm 2001 và những diễn gi ả liên quan, METAGroup (bây giờ là Gartner) nhà phân tích Doug Laney định nghĩa những t háchthức và cơ hội tăng dữ liệu như là 3 chiều, tăng giá trị dữ liệu, tốc độ vào ra củadữ liệu (velocity), và khổ giới hạn của kiểu dữ liệu (variety) Gartner, và nhiềungành công nghiệp tiếp tục sử dụng mô hình '3Vs' để mô tả dữ liệu lớn Trongnăm 2012, Gartner đã cập nhật định nghĩa như sau: "Dữ liệu lớn là khối lượnglớn, tốc độ cao và/hoặc loại hình thông tin rất đa dạng m à yêu cầu phương thứcxử lý mới để cho phép tăng cường ra quyết định, khám phá bên trong và xử lýtối ưu" Định nghĩa '3Vs' của Gartner vẫn được sử dụng rộng rãi, và trong phùhợp với định nghĩa đồng thuận.là: "Dữ l i ệu lớn tiêu biểu cho tập t hông tin màđặc đi ểm như khối lượng lớn (Volume), tốc độ cao(Velocity) và đa dạng(Variety) để yêu cầu phương thức phân tích và công

nghệ riêng biệt để biến nó thành có giá trị" Thêm nữa, vài tổ chức đã thêm vàotính xác t hự c(Veracity) để mô tả về nó 3Vs đã được mở r ộng để bổ sung đặctính của dữ liệu lớn

Volume: Khối lượng - dữ liệu lớn không có mẫu; nó chỉ thực hiện và lầntheo những gì diễn ra.

- Big d ata là thu ật ngữ nói về khối lượng dữ liệu lớn, kích thước lớn Xác địnhgiá trị của dữ liệu v à kích thước dữ liệu là rất qu an trọng và cần thiết, nếukhối lượng lớn, đó chính l à B ig data.

- Volume là khối lượng dữ l iệu được các doanh nghiệp thu th ập t ừ các nguồnkhác nhau, như IoT (Internet of Things), video, giao dịch kinh doanh, cácphươn g tiện t ruyền thông xã h ội,

- Khi cô ng nghệ chưa có sự phát triển vượt bậc, việc lưu trữ lượng lớn dữ liệulà một thách thức lớn T uy nhiên ngày nay, các nền tảng lưu trữ giá thành rẻnhư Hadoop và D ata lake xuất hiện, việc lưu trữ đ ã trở nên dễ dàng hơnnhiều.

Velocity: Tốc độ - dữ liệu lớn thường được xử lý thời gian thực.

- Dự a vào tốc độ xử lý của luồng dữ liệu để xác định đó c ó phải là Big datahay không Thường thì tốc độ của l uồng dữ liệu trực tiếp vào bộ nhớ caohơn so với khi được ghi vào đĩa Đặc biệt là ngày nay, với sự phát triển củaIoT, cá c luồng dữ liệu truyền tải với tốc độ cực nhanh và chúng phải đượcxử lý kịp thời.

- Ví dụ: Trên mạng xã hội Facebo ok, các thông báo như status, tweet, đã cũsẽ không được người dùng quan tâm và bị quên lãng nhanh chóng Dữ liệugiờ đây được tính gần như vào thời gian thực và tốc độ c ập nhật thông tindường như giảm xuống đơ n vị mili giây.

Trang 11

Variety: Đa dạng - dữ liệu lớn có thể thu thập từ văn bản, hình ảnh, âmthanh, video, cộng với nó hoàn thành các phần dữ liệu thiếu thông qua tổng hợpdữ liệu.

- Đặc trưng tiếp theo của Big data chính là tính đa dạng, linh h oạt, ở dạng cấutrúc và phi cấ u trúc, bao gồm dữ liệu số, Email, Video, â m thanh, giao dịchtài chính, Tính đa d ạng ảnh hưởng đ ến hiệu suất, đây là mộ t t rong nhữn gvấn đ ề chính mà lĩnh vực Big data cầ n phải giải quyết

Machine Learning: Máy học - dữ liệu lớn thường không hỏi tại sao và đơngiản xác định hình mẫu

- Ma chine learning (ML) hay máy học là một nhá nh của trí tu ệ nhân tạo (AI),nó là một lĩnh vực nghiên cứu cho phép máy tính có khả năng cải thiệnchính bản thân chúng d ựa trên dữ liệu mẫu (training data) hoặc dựa vào kinhnghiệm (những gì đã đ ược học) Machine learning có thể tự dự đoán hoặcđưa ra quyết định mà không cầ n được lập trình cụ thể.

- Bà i toán machine learning thường được chi a làm hai loại là dự đ oán(prediction) và phân loại (classification) Các bài toán dự đoán như dự đo ángiá nhà, giá xe… Các bài toán phân loại như nhận d iện chữ v iết tay, nhậndiện đồ vật…

Digital footprint: Dấu chân kỹ thuật số - dữ liệu lớn thường là phụ sinh miễnphí của quá trình tương tác kỹ thuật số

- Bấ t cứ khi nào bạn sử dụng Internet, b ạn đề u để lại dấu vết thông tin đượcgọi là dấu chân kỹ thuật số của mình Dấu chân kỹ thuật số p hát triển the onhiều cách – ví dụ: đăng lên mạng xã hội, đăng ký nhận bản tin, để lại đánhgiá trực tuyến hoặc mua sắm trực tuyến.

- Đôi khi, không phải lúc nào cũng rõ r àng rằng bạn đang đóng góp vào dấuchân kỹ thuậ t số c ủa mình Ví dụ: các trang web có thể theo dõi ho ạt độngcủa bạn bằng c ách c ài đặt cookie trên thiết bị của bạn và các ứn g dụng cóthể đối chiếu dữ liệu của bạn mà bạn không biế t Khi bạn ch o phép một tổchức truy cập thông tin của mình, h ọ có thể b án hoặc chia sẻ dữ liệu củ a bạnvới bê n thứ ba Tệ hơ n n ữa, thông tin cá nhân của bạn có thể bị xâm phạmdo vi phạm dữ liệu (BIG DATA LÀ GÌ? ĐẶC ĐIỂM & ỨNG DỤNG BIGDATA VÀO CÁC NGÀNH, n.d.) [1]

1.2 Đặc trưng của Big Data

Khi nhắc đến thuật ngữ Big Data người ta sẽ nghĩ đến n gay đặc trưng củanó gắn liền với 5V: Volume, Variety, Velocity, Veracity và Value Theo đ ólần lượt là khối lượng, mức độ đa dạng, tốc độ phân tích xử lý dữ liệu, t ínhxác thực c ủa dữ li ệu và giá trị thông tin.

9

Trang 12

 Volume – Khối lượng kích thước

Khi nói đến big data – dữ liệu lớn thì chữ V đầu tiê n bạn nên biết đó làVolume (Khối lượng).

Trên thực tế, lượng dữ liệu đượ c tạo ra c hỉ trong vài năm năm gần đây đãbằng 90% khối lượng dữ liệu được tạo ra từ thuở sơ khai tính tới 200 3 V àtheo dự báo trong những năm tới lượng dữ liệu còn tăng gấp nhiều lần Lượngdữ liệu được tạo ra đến hết năm 2020 sẽ gấp 50 lần lượng dữ li ệu được tạo 10năm trư ớc đó.

- Thực t ế là l ượn g dữ liệu sẽ si êu siêu lớn khi mà IOT ngày c àng đượcứng dụng rộng rã i hơn với hàng triệ u tỉ cảm biến điện tử được sử dụng.- Những chiếc máy bay có thể tạo ra khoảng 2.5 tỉ Terabyte dữ liệu mỗi

Trang 13

- Dữ liệu sinh ra từ các trang web mạng xã hội như Faceb ook hoặcTwitter, nơi hàng tri ệu người dùng tạo ra và tươ ng tác với các bài đănghàng giây.

- Âm thanh- Hình ảnh- Video- Email- Li ke/ share- …

Đa số dữ liệu là dữ liệu phi cấu trúc Điều này khiến cho dữ liệu trở nên quáđa dạng đến mức phức tạp và tốn kém hơn.

Ví dụ: - Dữ liệu từ cơ sở dữ liệu SQL, dữ liệu JSON, dữ liệu văn bản, hìnhảnh và video.

- Dữ liệu trong lĩnh vực y tế có thể bao gồm hồ sơ bệnh nhân (dữ liệu cấutrúc), hình ảnh chụp cắt (dữ liệu bán cấu trúc), và bài báo y khoa (dữ liệukhông cấu trúc).

Velocity – Tốc độ

Đây là t huật ngữ quan trọng trong big data, nó đề cập tới tốc độ dữ liệuđược tạo ra, lưu trữ, xử lý và truy vấn Trong quá khứ thì dữ liệu được cập nhậtthường xuyên nhưng thời gian phân tích, xử lý và lên báo cáo thường là địnhkỳ Có thể là hàng tuần hoặc hàng tháng m ới thu thập được đầy đủ dữ liệu phụcvụ báo cáo Nhưng hi ện t ại với sự phát triển mạnh mẽ về công nghệ: Lưu trữonline, băng thông internet, tốc độ xử lý của bộ vi xử lý, … dữ liệu đư ợc tạo ra,lưu trữ, xử lý và truy vấn gần như - hay thậm chí - là theo thời gian thực.

Một vài ví dụ về tính chất Velocity của Big Data:

- Theo youtube: Mỗi phút có khoảng 100 giờ video được up lên hệ thống.- Mỗi phút có khoảng 200 triệu thư điện tử được gửi đi.

11

Trang 14

- Theo Flickr: Có khoảng 20 triệu bức ảnh được xem và 30 nghìn ảnhđược tải lên trang Flickr

- Theo Google: Mỗi phút có khoảng 2.5 triệu lượt truy vấn trên toàn hệthống.

Với bằng đó ví dụ, bạn có thể thấy được lượng dữ liệu được tạo ra nhiều vànhanh như thế nào Sự thực là dữ liệu được tạo ra theo cấp số nhân với tốc độchóng mặt.

Ví dụ: - Dữ liệu từ giao dịch tài chính, dữ liệu từ các cảm biến thời tiết, dữliệu từ mạng xã hội.

- Dữ liệu từ các thiết bị IoT trong các thành phố t hông minh, nơi các cảmbiến gửi dữ liệu về giao thông, chất lượng không khí, và nhiều thông tinkhác với tốc độ cao.

Veracity: tính xác thực của dữ liệu

Với xu hướng Social ngày nay và sự gi a tăng mạnh mẽ tính tương tác vàchia sẻ của người dùng làm cho bức tranh xác định về độ tin cậy & chính xáccủa dữ liệu ngày m ột khó khăn hơn Bài toán phân tích và loại bỏ dữ liệu thiếuchính xác và nhiễu đang là tính chất quan trọng của Big Data.

Ví dụ: - Dữ liệu từ nguồn Internet, dữ liệu t ừ các thiết bị cảm biến có thểkhông luôn chính xác.

- Dữ liệu từ các cảm biến trên máy bay thương mại, nơi sự chính xác củadữ liệu là quan trọng để đảm bảo an toàn trong quá trình bay.

Value: Giá trị thông tin

Giá trị là đặc điểm quan trọng nhất của dữ liệu lớn, vì khi bắt đầu triển khaixây dựng dữ liệu lớn thì việc đầu tiên chúng ta cần phải l àm đó l à xác đị nh đư ợcgiá trị của thông tin mang lại như thế nào, khi đó chúng ta mới có quyết định cónên triển khai dữ liệu lớn hay không Nếu chúng ta có dữ liệu lớn mà chỉ nhậnđược 1% lợi ích từ nó, thì không nên đầu tư phát triển dữ liệu lớn.

Ví dụ: - Phân tích dữ liệu để đưa ra quyết định kinh doanh, dự đoán xuhướng thị trường, tối ưu hóa hoạt động sản xuất.

Trang 15

- Dữ liệu khách hàng từ các trang thương mại điện tử có thể được phân tíchđể dự đoán xu hướng mua sắm và tối ưu hóa chiến lược quảng cáo để

1.3 Những vấn đề liên quan

a. Phân tích dữ liệu Big Data

Khi đã có dữ liệu, điều quan trọng nhất là phải phân tích những dữ liệu đóđể chúng thực sự mang lại lợi ích như tăng doanh thu, cải thiện dịch vụ kháchhàng, nâng cao hiệu suất và tăng sức cạnh tranh tổng thể

Việc phân tích dữ liệu bao gồm việc kiểm tra các tập dữ liệu, từ đó đưathông tin chi tiết hoặc rút ra kết luận về xu hướng và dự đoán về hoạt độngtrong tương lai Nhờ đó, dữ li ệu có thể áp dụng vào công việc như lựa chọnthời gian, địa điểm để quảng cáo cho sản phẩm và dịch vụ, điều rất có ích chocác công ty cần những chiến dịch quảng bá sản phẩm theo t hời đi ểm

Phân tích dữ liệu bao gồm:

- Phân tích dữ liệu t hăm dò (để xác định các mẫu và m ối quan hệ trongdữ liệu).

- Phân tích dữ liệu xác nhận (áp dụng các kỹ thuật thống kê để tìm hiểuxem giả định về một tập dữ liệu cụ thể có đúng không).

- Phân tích dữ liệu định lượng (so sánh thống kê).

- Phân tích dữ liệu đị nh tính (tập trung vào dữ liệu phi số như video, hìnhảnh và văn bản)

- Phân tích Đối tượng (Descriptive Analysis):

o Mô tả: Đây là việc sử dụng các phương pháp thống kê và trực quanhóa để mô tả dữ liệu, hiểu cấu trúc và đặc điểm của dữ l i ệu.o Kỹ thuật: Biểu đồ, biểu đồ hộp, biểu đồ đường, bảng thống kê.- Phân tích Tương quan (Correlation Analysis):

o Mô t ả: Xác định mối quan hệ giữa các biến hoặc thuộc tính trongdữ liệu.

o Kỹ thuật: Hệ số tương quan, biểu đồ phân tán, heatmap.- Phân tích Nhóm (Clustering Analysis):

o Mô tả: Phân loại dữ liệu thành các nhóm có tính chất tương đồngnhau.

o Kỹ thuật: K-Means, hierarchical clustering.- Phân tích Chuỗi Thời Gian (Time Series Analysis):

o Mô tả: Phân tích xu hướng và biến động của dữ liệu theo thờigian.

o Kỹ thuật: Dự báo chuỗi thời gian, phân tích suy giảm (decay13

Trang 16

- Phân tích Văn bản (Text Analysis):

o Mô tả: Phân tích và rút trích thông tin từ dữ liệu văn bản.o Kỹ thuật: Phân loại văn bản, phân tích ý kiến, trích xuất thông tin.- Phân tích Đồ thị (Graph Analysis):

o Mô tả: Phân tích mối quan hệ và cấu trúc trong dữ liệu đồ thị.o Kỹ thuật: Độ đo trung tâm (centr al i t y), phân cụm (community

detection), phân tích đồ thị tích lũy.

- Học Máy và Phân loại (Machine Learning and Classification):

o Mô tả: Sử dụng mô hình học máy để dự đoán và phân loại dữ liệu.o Kỹ thuật: Rừng ngẫu nhiên (Random Forest), Support Vector

Machines, Neural Networks.- Phân tích Đồng thời (Real-time Analysis):

o Mô tả: Phân tích dữ li ệu ngay lập tức khi nó được sinh ra, thíchhợp cho các ứng dụng yêu cầu độ trễ thấp.

o Kỹ thuật: Apache Flink, Apache Storm.

- Phân tích Độ lớn và Hiệu suất (Scale and Performance Analysis):o Mô tả: Đảm bảo khả năng mở rộng và hiệu suất của hệ thống phân

tích dữ liệu Big Data.

o Kỹ thuật: Apache Spark, Hadoop MapReduce.

- Phân tích An toàn và Bảo mật (Security and Privacy Analysis):

o Mô t ả: Bảo vệ dữ liệu và đảm bảo an toàn thông tin trong quátrình phân tích.

o Kỹ thuật: Mã hóa dữ liệu, kiểm soát truy cập, giám sát bảo m ật

b. Xây dựng cơ sở hạ tầng Big Data

Muốn sử dụng và khai thác Big Data một cách hiệu quả, điều cần thi ếtlà phải xây dựng cơ sở hạ tầng đủ để t hu thập và lưu trữ dữ liệu, cung cấpquyền truy cập và bảo mật thông tin trong khi lưu trữ và chuyển t i ếp, baogồm các hệ thống lưu trữ và máy chủ, phần mềm quản lý, t í ch hợp dữ liệu,phần mềm phân tích dữ liệu và một số t hành phần khác Điều này có thểđược hiện thực hóa bởi các data center lớn, các dịch vụ điện t oán đám m âycũng góp phần giải quyết bài toán này

Dữ liệu có thể đến từ nhiều nguồn khác nhau như các ứng dụng web,kênh truyền thông xã hội, ứng dụng dành cho thiết bị di động và lưu trữemail, ngoài ra khi IoT trở nên bùng nổ, các cảm biến trong sản phẩm cũnggóp phần tạo dựng và chuyển hóa dữ liệu Để lưu trữ tất cả dữ liệu đến, có

Trang 17

một số lựa chọn phổ biến là kho dữ liệu truyền thống, xây dựng hồ dữ liệuhoặc tận dụng lưu trữ trên đám m ây Ngoài ra, còn cần xây dựng cơ sở hạtầng bảo mật, bao gồm việc mã hóa dữ liệu, xác thực người dùng và cácquyền truy cập, giám sát hệ thống, xây dựng tường lửa, quản lý doanhnghiệp và các sản phẩm khác để bảo vệ hệ thống và dữ liệu.

 Cơ sở hạ tầng IT để hỗ trợ Big Data đóng vai trò quan trọng để xử lý vàquản lý các dữ liệu lớn, phức tạp và đa dạng:

- Hệ thống lưu trữ phân tán: Bao gồm các máy chủ và hệ thống lưu trữ

được kết nối với nhau thông qua mạng Các hệ thống này giúp lưu trữ vàquản lý dữ liệu lớn của Big Data.

- Cụm máy chủ (Cluster): Sử dụng cụm máy chủ làm nơi lưu trữ và xử lý

dữ liệu Cụm máy chủ cho phép mở rộng và mở rộng khả năng xử lý đểđáp ứng yêu cầu của Big Data.

- Công nghệ ảo hóa (Virtualization): Công nghệ ảo hóa giúp tối ưu hóa

sử dụng tài nguyên máy chủ và hỗ trợ trong việc triển khai các ứng dụngBig Data.

- Mạng lưới (Networking): Hỗ trợ kết nối giữa các thành phần hệ thống,

mạng lưới chất lượng cao giúp truyền tải dữ liệu hiệu quả trong môitrường Big Data.

- Bảo mật và an ninh: Cơ sở hạ tầng Big Data cần có các biện pháp bảo

mật và an ninh để đảm bảo tính toàn vẹn, riêng tư và an toàn của dữ liệu.

- Khả năng mở rộng: Cơ sở hạ tầng IT cần thiết phải có khả năng mở

rộng linh hoạt để đáp ứng nhu cầu gia tăng của dữ liệu Big Data theo thờigian.

 Những yếu tố này cùng nhau tạo nên một cơ sở hạ tầng mạnh mẽ để hỗtrợ việc xử lý và phân tích dữ liệu lớn của Big Data, giúp tạo ra những thôngtin hữu ích và giá trị từ dữ liệu đó.

c Sử dụng phần mềm và công cụ hỗ trợ

Các công nghệ đặc biệt dành c ho Big data- Hệ sinh thái Hadoop

- Apache Spark- Data lakes- NoSQL Databases

15

Trang 18

- In-me mory databases

 Hệ thống Hadoop

Hadoop l à hệ sinh thái được xem là phổ biến và có sự liên quan mật thiếtvới Big data Apache Hadoop là dự án phát triển phần mềm mã nguồn mở dànhcho máy tính, có khả năng mở rộng và phân tán.Thư viện phần mềm Hadoop -nơi cho phép xử lý khối lượng dữ liệu lớn trên các nhóm máy tính sử dụng môhình lập trình đơn giản Công nghệ này giúp mở rộng từ một máy chủ sang hàngngàn máy khác, mỗi máy lưu trữ cục bộ và cung cấp tính toán Dự án này baogồm nhiều phần:

- Hadoop Common: Các tiện ích và thư vi ện phổ biến hỗ trợ các mô đun

Apache Spark thuộc một phần trong hệ sinh thá i Hadoop, đây là khuônmẫu tính toán cụm n guồn mở được sử dụng nhằm xử lý Big data tron gHadoop Apache Spark hiện đã trở thành một trong những khuôn mẫu xử lýBig data phổ biến và quan trọng, có thể đượ c triển khai theo nh iều cách khácnhau.

Data lakes

Data Lakes là nơi chứa một khối lượng dữ liệu thô cực kỳ lớn ở định dạnggốc Sự phát triể n của IoT và phong trào chuyển đổi số đã giúp Data lakestăng trưởng mạnh mẽ Công nghệ này được thiết kế giúp người dùng dễ dàngtruy cập vào một lượng lớn dữ liệu bất cứ khi nào họ có nhu cầu.

NoSQL Databases

Công nghệ n ày là hệ thống quản lý dữ liệu không yêu cầu m ột sơ đồ cốđịnh, được xem là l ựa chọn hoàn hảo đ ối với những dữ liệu lớn, thô và phicấu t rúc NoSQL có nghĩa là “không chỉ SQL”, các cơ sở dữ liệu n ày có thểxử lý nhiều mô hình dữ liệu k hác nhau một cách l inh hoạt.

In-memory databases

Trang 19

In-me mory d atabases (IMDB - Cơ sở dữ liệu trong bộ nhớ) là hệ thốngquản lý cơ sở dữ liệu thường dựa vào Ram thay vì HDD để lưu trữ dữ liệu Cơsở dữ liệu trong đĩa không thể nhanh bằng cơ sở dữ liệu trong bộ nhớ, do đó,đây l à một điểm quan trọ ng để phân tích Big data và tạo ra các siêu dữ liệu,kho dữ liệu k hổng lồ.

d Các trường hợp cần sử dụng Big Data

Big D ata có thể được sử dụng trong nhi ều trường hợp khác nhau, từ cácdoanh nghiệp và tổ chức đến c ác cơ quan chính phủ và lĩnh vực công cộng.Dưới đây là một số trường hợp cần sử dụn g Big Data phổ biến:

• Cải thiệ n trải nghiệm khách hàng: Big Data có thể được sử dụngđể thu t hập thông tin về khách hàng, chẳng hạn như lịch sử mua hàng,thói quen duyệt web và sở thích Thông t in nà y có thể được sử dụng đểcá nhân hóa trải n ghiệm của khách hàng, chẳng hạn như đề xuất sả nphẩm hoặc dịch vụ phù hợp hơn.

• Tăng h iệu quả hoạt động: B ig Data có thể đ ược sử dụng để t ựđộng hóa các quy trình, tiết kiệm thời gian và chi phí Ví dụ, Big Datacó thể được sử dụng để phân tích dữ liệu b án hàng để xác định các xuhướng và điều chỉnh giá cả ho ặc quảng cáo.

• Đưa ra quyết định sáng suốt: Big Data có thể được sử dụng đểphân tích dữ liệu lịch s ử để đưa ra quyết định sá ng suốt Ví d ụ, BigData có thể được sử dụng để dự đoá n nhu cầu của khách hàng, xác địnhrủi r o hoặc phát hiện gian lận.

• Nghiên cứu và phát triển: Big Dat a có thể được sử dụng để thu thập vàphân tích dữ liệu từ các nguồn khác nhau, chẳng hạn như thí nghiệm khoahọc, dữ liệu sức khỏe hoặc dữ liệu môi trường Thông t in này có thể được sửdụng để thúc đẩy nghi ên cứu và phát triển mới

Lĩ nh vực ứng dụng tốt nh ất Big data:- Ngân hàng

- Giáo dục- Ngành bán lẻ- Y tế

- Truyền thông và giải trí- Digital Marketing- Ngành công nghiệp- Giao thông vận tải- Dịch vụ khách hàng- Ngành công nghệ

17

Trang 20

Ứng dụng Big dat a vào hoạt động giúp các ngân hàng đưa ra quyết địnhquan trọng, chẳng hạn:

- Hê thống phân tích có thể xác định các địa điểm xây dựng chi nhánh mới- nơi tâ p trung các khách hàng tiềm năng.

- Dự đoán số lượng tiền mặt cần thiết để cung ứng tại một địa điểm giaodịch cụ thể.

- Đặc biệt là các ngân hàng số, dữ liệu chính là xương sống của họ.- Học máy, Ai được sử dụng để phát hiện các hành vi gian lận và kịp thời

báo cáo cho các chuyên viên làm nhiệm vụ.

Trang 21

 Giáo dục

Trong ngành gi áo dục, việc xử lý các dữ liệu bảo mật, thông tin về học sinh,sinh viên, giảng vi ên, tài liệu, đều phải được xử lý nhanh gọn Do đó, Big dataứng dụng vào giáo dục mang lại nhiều chức năng hữu ích, bao gồm:

- Phân tí ch, lưu trữ, quản lý các bộ dữ liệu lớn bao gồm hồ sơ của sinhviên, học sinh.

- Sử dụng hê thống quản lý Big data có khả năng trí ch xuất phân cấp đểduy trì tính bảo mật.

- Cung cấp các dữ l i ệu cần thiết về các hoạt động trong lớp và giúp đưa raquyết định cho giáo viên, người tham gia giảng dạy.

- Giúp các bộ đề kiểm tra không thể bị lộ.

 Ngánh bán lẻ

19

Trang 22

Trong ngành bán lẻ, một khối lượng dữ liệu l ớn luôn cần được xử lý, nhữngdữ liệu này được các doanh nghiệp bán l ẻ thu thập để đưa ra chiến lược pháttriển sản phẩm, các chiến dịch Marketing,…

Ứng dụng Big data trong ngành bán lẻ bao gồm những chức năng như sau:- Giúp nhà quản lý xây dựng mô hình chi tiêu của mỗi khách hàng.- Với các phân tích dự đoán, có thể nắm bắt và so sánh được tỷ lệ cung -

cầu, đồng thời tránh các sản phẩm không phù hợp với nhu cầu thị trường.- Xác định được vị trí bày trí các sản phẩm lên kệ dựa vào thói quen và nhu

cầu mua sắm của khách hàn.

- Kết hợp phân tích các dữ liệu về thời điểm, truyền t hông xã hội, giaodịch, để xác định các sản phẩm phù hợp nhằm cung ứng cho kháchhàng.

 Y tế

Một hệ thống kém hiệu quả có t hể kìm hãm những lợi ích chăm sóc sứckhỏe tốt hơn Điều này xảy ra khi dữ liệu điện tử không đủ hoặc không có sẵn.Big data sẽ đóng góp nhiều chức năng hữu ích trong ngành Y tế Tại Việt Nam,ngành Y tế đang sử dụng các dữ liệu thu thập được từ ứng dụng điện thoại vềnhững bệnh nhân bị Covid để quản lý và đưa ra những thông tin kịp thời.

Hoặc tại m ột số bệnh viện hiện nay sử dụng Big data để thu thập dữ liệuthông tin người khám bệnh, đặt lịch hẹn với bác sĩ thông qua ứng dụng điệnthoại Một số chức năng của Big data trong ngành Y tế bao gồm:

- Cho phép người quản lý ca biết được bác sĩ cụ t hể vào những thời điểmkhác nhau.

Trang 23

- Dựa vào hồ sơ sức khỏe điện tử để theo dõi tình trạng của bệnh nhân.- Đánh giá tình trạng bệnh t hông qua các triệu chứng và xác định một số

bệnh ở giai đoạn đầu.

- Sử dụng các thiết bị kỹ thuật số như vòng đeo tay thông minh, hệ thốngBig data có thể dựa vào đó để theo dõi tình trạng bệnh và gửi báo cáo chobác sĩ.

- Lưu trữ những hồ sơ nhạy cảm, có tính bảo mật cao một cách hiệu quả.- Ứng dụng Big data cũng có thể báo các khu vự c có nguy cơ bùng phát

dịch như sốt rét, sốt xuất huyết, Covid-19,

 Truyền thông và giải trí

Các công t y truyền thông và giải trí cần đẩy mạnh chuyển đổi số để phânphối sản phẩm và nội dung nhanh nhất đến thị trường Big data có nhiều ứngdụng hữu ích như.

- Xác định thiết bị và thời gian có hiệu quả nhất thông qua việc phân tíchcác dữ liệu

- Các công ty truyền thông, nghệ sĩ hoặc người phụ trách truyền thông cóthể chọn địa điểm tần suất phân phối.

- Xem xét mức độ phổ biến, nghệ sĩ có thể chọn thiết bị, hệ điều hành đểphân phối các sản phẩm, nội dung của mình.

21

Trang 24

Để hiểu cách thức các phương tiện truyền thông sử dụng dữ liệu lớn như thếnào, trước tiên cần hi ểu rõ một số ngữ cảnh trong cơ chế sử dụng cho quá tr ì nhtruyền thông Nick Couldry và Joseph Turow đề xuất rằng các học viên trongngành Truyền thông và Quảng cáo cần tiếp cận dữ liệu lớn như là nhiều điểmthông tin về hàng triệu cá nhân Ngành công nghiệp dường như đang chuyểnhướng từ cách tiếp cận truyền thống bằng cách sử dụng các môi trường truyềnthông cụ thể như báo chí, tạp chí hoặc chương trình truyền hình và thay vào đólà những người tiêu dùng với công nghệ tiếp cận những ngư ời này được nhắmmục tiêu vào những thời điểm tối ưu ở những vị trí tối ưu Mục đích cuối cùnglà để phục vụ hoặc truyền tải, một thông điệp hoặc nội dung (theo cách thốngkê) phù hợp với suy nghĩ của người tiêu dùng.

Ví dụ, môi t rường xuất bản ngày càng làm cho các thông điệp ( quảng cáo)và nội dung (bài viết) được cải thiện để t hu hút người tiêu dùng đã được thuthập độc quyền thông qua các hoạt động khai thác dữ liệu khác nhau.

- Nhắm đến người tiêu dùng mục tiêu (đối với quảng cáo của các nhà tiếpthị).

- Thu thập dữ liệu.

- Dữ l i ệu trong báo chí: nhà xuất bản và nhà báo sử dụng các công cụ dữliệu lớn để cung cấp thông tin chi tiết và các bản đồ họa chi tiết độc đáovà sáng tạo Kênh 4, một kênh phát thanh truyền hình công cộng củaAnh, đang dẫn đầu trong lĩnh vực dữ liệu lớn và phân tích dữ liệu.

 Digital Marketing

Giờ đây, dường như bất kỳ doanh nghiệp nào cũng cần đến DigitalMarketing để đưa sản phẩm / dịch vụ của mình đến gần và rộng hơn với ngườitiêu dùng Big data đã góp một phần lớn cho Digital Marketing phát triển mạnhmẽ như hiện tại, ví dụ:

Trang 25

- Phân tích thị trường và các đối thủ cạnh tranh Đồng thời đánh giá m ụctiêu kinh doanh của doanh nghiệp, xác định đâu là cơ hội, đâu là tháchthức để tiếp tục tiến hành các kế hoạch kinh doanh khác.

- Xác định người dùng trên các phương tiện truyền thông xã hội, dựa vàonhân khẩu học như giới t í nh, tuổi tác, sở thích, thu nhập, để xác địnhkhách hàng mục tiêu.

- Xác định các chủ đề, nội dung được người dùng tìm kiếm nhiều để xâydựng chiến lược nội dung SEO trên công cụ tìm kiếm.

- Tạo các đối tượng tương tự thông qua việc sử dụng các cơ sở dữ liệu đốitượng hiện có để nhắm mục tiêu đến các khách hàng tương tự , từ đó kiếmđược lợi nhuận.

 Ngành công nghiệp

- Phát triển phần mềm sản phẩm: Các công ty sử dụng Big Data để xây

dựng các mô hình dự đoán cho các sản phẩm và dịch vụ mới Họ phân loại các thuộc tính chính của sản phẩm/dịch vụ trong quá khứ và hiện t ại , sau đó mô hình hóa mối quan hệ giữa các thuộc tính và phát triển thành phần mềm hoàn chỉnh.

- Tăng trải nghiệm khách hàng: Big Data cho phép bạn thu thập dữ liệu từ

các phương tiện truyền thông xã hội, lịch sử web, nhật ký cuộc gọi và cácnguồn khác Nhờ đó, doanh nghiệp hiểu rõ khách hàng của mình hơn qua chính hành vi thực tế của khách hàng.

- Máy học (Machine Learning): Máy học là một bước tiến của công nghệ

hiện đại và Big Data góp phần lớn trong sự phát triển của máy học Hiện nay máy móc có thể tự học từ dữ liệu lịch sử thay vì con ngư ời phải l ập trình, các dữ liệu lịch sử này được thu thập đầy đủ vào Big Data.

- Thúc đẩy sự cải tiến mới: Big data cung cấp dữ liệu về thông t i n sản

phẩm, lịch sử phát triển của mọi lĩnh vực, ngành nghề Qua đó, nhà quản lý có thể xác định được những điểm cần cải tiến, phát triển để công nghệ mới đem lại sự sáng tạo, mới mẻ, hữu ích cho các ngành công nghi ệp.

 Giao thông vận tải

Ngoài chất lượng sản phẩm, dịch vụ tốt là điều mà khách hàng kỳ vọng nhiều nhất Trong giai đoạn mới tham gia vào thị trường, Big data sẽ giúp chủ doanh nghiệp tìm ra những giải pháp và những đề xuất tối ưu để hiểu được khách hàng và tìm ra lợi thế cạnh tranh.

Cách thức ứng dụng Big Data vào dịch vụ khách hàng:

- Xác định yêu cầu khách hàng, tập trung thực hiện các nhu cầu và kỳ vọng để làm hài lòng họ.

23

Trang 26

- Phân tích hành vi, sự quan tâm của khách hàng để tạo ra các sản phẩm/ dịch vụ khách hàng phù hợp, đồng thời thiết kế mô hình tiếp thịtối ưu.

- Nắm được sự tương đồng giữa khách hàng và nhu cầu, kỳ vọng của họ, từ đó có thể xây dựng các chiến dịch quảng cáo chính xác và manglại hiệu quả cao.

Ngành công nghệ

Từ năm 2015, dữ liệu lớn trở nên nổi bật trong hoạt động kinh doanh nhưmột công cụ để giúp nhân viên làm việc hiệu quả hơn cũng như tối ưu hóaviệc thu thập và chia sẻ thông tin Việc sử dụng dữ liệu lớn để giải quyết cácvấn đề thu thập dữ liệu và CNTT trong một doanh nghiệp được gọi là ITOperations Analytics (ITOA) Bằng cách áp dụng các nguyên tắc dữ liệu lớnvào các khái niệm về trí thông minh của máy móc và tính toán sâu, các bộphận CNTT có thể dự đoán các vấn đề tiềm ẩn và đư a ra các giải pháp trướckhi vấn đề xảy ra Vào thời điểm này, các doanh nghiệp ITOA cũng bắt đầuđóng vai trò quan trọng trong việc quản lý hệ thống bằng cách cung cấp cácnền tảng mang các dữ liệu cá nhân riêng biệt và tạo ra những hiểu biết sâusắc từ toàn bộ hệ thống chứ không phải từ các dữ liệu riêng lẻ.

- EBay sử dụng hai kho dữ liệu với tốc độ 7.5 petabyte và 40PB cũngnhư một cụm 40PB Apache Hadoop để tìm kiếm, khuyến nghị ngườitiêu dùng và bán hàng.

- Amazon.com xử lý hàng triệu hoạt động back-end hàng ngày, cũngnhư các truy vấn từ hơn nửa triệu người bán hàng bên thứ ba Côngnghệ cốt lõi mà Amazon hoạt động dựa trên Linux và đến năm 2005họ có ba cơ sở dữ liệu Linux lớn nhất thế gi ới , với dung lượng 7,8 TB,18,5 TB và 24,7 TB.

Trang 27

- Facebook xử lý 50 tỷ hình ảnh từ cơ sở người dùng của nó.

- Google đã xử lý khoảng 100 tỷ lượt tìm kiếm mỗi tháng vào tháng 8năm 2012.

- Cơ sở dữ liệu Oracle NoSQL đã được kiểm tra để vượt qua mốc 1triệu xử lý mỗi giây với 8 nhân và đạt tốc độ 1.2 triệu xử lý mỗi gi âyvới 10 nhân (BIG DATA (DỮ LIỆU L ỚN) LÀ GÌ? TẦM QUANTRỌNG VÀ ỨNG DỤNG CỦA BIG DATA T RONG THỰC TIỄN,n.d.) [ ]2

2 Bài toán

2.1 Mục tiêu nghiên cứu

Mục ti êu chính của đề tài này là thực hiện một cuộc nghiên cứu để thống kêvà phân tích sự quan tâm của người dùng Facebook đối với một sản phẩm cụthể Để đạt được mục tiêu này, chúng tôi đã xác định những mục ti êu cụ t hể sau:

- Xác định cách mà người dùng Facebook tương tác với bài viết hoặcquảng cáo liên quan đến sản phẩm.

- Phân tích dữ liệu về lượt thích, bình luận, chia sẻ, và các hoạt động khácđể hiểu mức độ quan tâm của người dùng.

- Xác định các yếu tố ảnh hưởng đến sự quan tâm của người dùng đối vớisản phẩm, như thời gian đăng bài , loại nội dung, và nền tảng thiết bị sửdụng.

2.2 Câu hỏi nghiên cứu

Trong quá trình nghiên cứu, chúng tôi sẽ trả lời các câu hỏi sau:

- Làm t hế nào để đo lường mức độ quan t âm của người dùng Facebook đốivới sản phẩm?

- Các yếu tố nào ảnh hưởng đến việc người dùng tương tác với sản phẩmtrên nền tảng Facebook?

- Làm thế nào để tối ưu hóa quảng cáo và nội dung để tạo sự quan tâmmạnh mẽ từ người dùng?

2.3 Phương pháp tiếp cận

Để thực hiện nghiên cứu, chúng tôi sẽ sử dụng phương pháp thống kê vàphân tích dữ liệu từ nhiều nguồn khác nhau, bao gồm dữ liệu về lượt thích, bìnhluận, chia sẻ, và sự tương tác trên nền tảng Facebook Chúng tôi cũng có thể sửdụng các công cụ phân tích dữ liệu để tạo biểu đồ, tính toán tỷ l ệ tương tác, vàxây dựng mô hình dự đoán.

25

Ngày đăng: 27/06/2024, 19:09

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w