Các sản phẩm của họ bao gồm các thiết bị theo dõi hoạt động, đồng hồ thông minh, thiết bị không dây có hỗ trợ công nghệ đeo được để đo dữ liệu, chẳng hạn như số bước đã đi bộ, nhịp tim,
Trang 1TỔNG LIÊN ĐOÀN LAO ĐỘNG VIỆT NAM
TRƯỜNG ĐẠI HỌC TÔN ĐỨC THẮNG
KHOA QUẢN TRỊ KINH DOANH
&
BÁO CÁO CUỐI KÌ ỨNG DỤNG PHÂN TÍCH DỮ LIỆU LỚN TRONG QUẢN LÝ CHỦ ĐỀ: NGHIÊN CỨU BIG DATA ÁP DỤNG TẠI FITBIT GVHD: THS TRẦN THỊ PHI PHỤNG Nhóm lớp: THỨ 5 CA 12 NHÓM: Massive D Sinh viên thực hiện: Trần Đình Duy (NT) 71801753
Nguyễn Thị Thu Thảo 71902010
Trần Thị Huệ 71505188
Nguyễn Thị Thùy Trang 71801607
Nguyễn Thị Tuyết 71801615
Trần Quỳnh Giang 71801706
Đặng Võ Phương Nam 71900475
Nguyễn Võ Thanh Thảo 71900576
Nguyễn Bá Lộc 71902001
Đỗ Quang Huy 71704300
TP Hồ Chí Minh, ngày 08 tháng 01 năm 2022
Trang 202 Nguyễn Thị Thùy Trang Viết mục V 90% Trễ deadline
04 Trần Đình Duy Phân công, sửa
cáo, sửa bài 110% Hỗ trợ NT sửa bài
NHẬN XÉT CỦA GIÁO VIÊN
Trang 3………
………
………
………
………
………
………
………
………
………
………
.………
………
………
………
………
………
………
………
………
………
………
………
………
………
………
MỤC LỤC
Trang 4BẢNG ĐÁNH GIÁ 2
NHẬN XÉT CỦA GIÁO VIÊN 3
I GIỚI THIỆU CASE STUDY 5
1 Giới thiệu về FitBit 5
2 Ứng dụng Big Data của FITBIT qua Case Study 5
II TỔNG QUAN VỀ THỰC TRẠNG CASE STUDY 5
1 Bối cảnh Case Study 6
2 Những vấn đề đặt ra trong Case Study 6
III PHÂN TÍCH CHI TIẾT CÁC THÔNG TIN TRONG CASE STUDY 7
1 Trong thực tế, FITBIT đã áp dụng Big Data như thế nào? 7
1.2 Áp dụng thông qua việc chia sẻ dữ liệu với các công ty thứ ba 8
2 Kết quả đạt được 9
3 Dữ liệu được sử dụng 9
4 Kỹ thuật được sử dụng 10
IV PHÂN TÍCH MỐI LIÊN HỆ DỮ LIỆU TRONG CASE STUDY 15
1 Tình trạng của FitBit 15
2 Các chính sách bảo mật dữ liệu và thông tin khách hàng 17
3 Database mà FitBit thu thập 19
4 Sự kết hợp giữa FitBit và Machine Learning của Google 20
V KẾT LUẬN LỢI ÍCH VÀ HẠN CHẾ 20
1 Lợi ích 20
2 Hạn chế 22
I GIỚI THIỆU CASE STUDY
Trang 51 Giới thiệu về FitBit
Fitbit là một công ty điện tử tiêu dùng và thể dục của Mỹ có trụ sở chính tại SanFrancisco, California Các sản phẩm của họ bao gồm các thiết bị theo dõi hoạt động,đồng hồ thông minh, thiết bị không dây có hỗ trợ công nghệ đeo được để đo dữ liệu,chẳng hạn như số bước đã đi bộ, nhịp tim, chất lượng giấc ngủ, số bước đã leo và các chỉ
số cá nhân khác liên quan đến thể dục giúp người dùng có một cuộc sống khỏe mạnhhơn
Vào năm 2019, Google đã công bố ý định mua lại Fitbit với giá 2,1 tỷ đô la Mỹ vàgiao dịch này đã kết thúc vào cuối năm 2020 Theo một báo cáo của IDC được công bốvào ngày 10 tháng 3 năm 2020, Fitbit được coi là công ty thiết bị đeo lớn thứ năm vềlượng hàng xuất xưởng tính đến năm 2019 với mức tăng trưởng 14,8% so với năm 2018sau Xiaomi và Apple Fitbit báo cáo đã bán được hơn 100 triệu thiết bị và có 28 triệungười dùng
Thành công của Fitbit dựa trên quan điểm rằng những người có hiểu biết sẽ đưa ranhững lựa chọn lối sống thông minh hơn Do đó, các thiết bị của Fitbit khuyến khích mọingười ăn uống lành mạnh và tập thể dục nhiều hơn bằng cách giúp họ theo dõi và cảithiện thói quen của mình
2 Ứng dụng Big Data của FITBIT qua Case Study
Bằng việc thông qua các thiết bị, Fitbit theo dõi các hoạt động thường ngày củangười dùng Chỉ với một thiết bị thông minh được kết nối với điện thoại hoặc máy tínhcủa người dùng, họ có quyền truy cập thông tin thời gian về thói quen và các số liệuthống kê được đồng bộ hóa với nhau, giúp người dùng có thể theo dõi được tình trạng sứckhỏe hiện tại của mình
Bên cạnh đó, với sự cho phép của người dùng Fitbit tổng hợp dữ liệu về thống kêthói quen và sức khỏe để chia sẻ với các đối tác chiến lược nhằm tạo ra những lợi íchchung cho người dùng
II TỔNG QUAN VỀ THỰC TRẠNG CASE STUDY
1 Bối cảnh Case Study
Trang 6Qua Case Study, ta có thể thấy được bối cảnh thế giới với sự bùng nổ của Internet
of Things vào 2009 và sự khởi đầu của cuộc cách mạng công nghiệp thứ tư Big Data và
sự phát triển của công nghệ thông tin đã chứng minh sức mạnh của nó trong lĩnh vực theodõi và chăm sóc sức khoẻ
Fitbit cũng không nằm ngoài cuộc chơi trên, những thiết bị đeo họ cung cấp đềunằm trong hệ sinh thái IOT Đó là những thiết bị có thể kết nối với nhau và có khả năngđồng bộ hóa cũng như chia sẻ dữ liệu cho những mục đích cụ thể Chỉ trong vòng mộtthập kỉ kể từ khi xây dựng và phát triển, thương hiệu Fitbit có mặt ở nhiều quốc gia trênthế giới và được rất nhiều người dùng tin tưởng lựa chọn Có thể xem đây là một trongnhững thương hiệu hàng đầu trong lĩnh vực thiết bị đeo tay theo dõi sức khỏe
2 Những vấn đề đặt ra trong Case Study
Dữ liệu người dùng tự thu thập không đáng tin cậy:
Việc khuyến khích các chuyên gia y khoa sử dụng dữ liệu do người dùng củaFitBit tự thu thập Những dữ liệu như vậy có độ tin cậy khá thấp khi chúng không đượcthu thập hoặc xác minh trực tiếp bởi các chuyên gia y tế, không được thu thập theo mộtphương pháp khoa học được kiểm chứng hoặc đơn giản là bản thân người dùng cũngkhông ý thức được họ đang cung cấp thông tin cho ngành y tế Tuy nhiên khi chuyểnhướng việc sử dụng những dữ liệu tự thu thập bởi người dùng sang hành động ngăn ngừabệnh tật thay vì điều trị khi chúng phát sinh có thể sẽ là phương án khả thi hơn cho những
dữ liệu như trên
Thông tin về sức khoẻ rất nhạy cảm
Vào tháng 2 năm 2015, vụ đánh cắp dữ liệu liên quan đến chăm sóc sức khỏe lớnnhất từ trước đến nay đã diễn ra khi tin tặc đánh cắp hồ sơ liên quan đến 80 triệu bệnhnhân từ Anthem, công ty bảo hiểm y tế lớn thứ hai của Mỹ Tuy rằng chúng chỉ lấy thôngtin nhận dạng như tên và địa chỉ còn thông tin chi tiết về tình trạng bệnh và phương phápđiều trị không bị lộ ra ngoài nhưng thái độ cuẩ nước Mỹ với sự kiện này nói chung đãchứng minh rằng không có dữ liệu nào mang tính cá nhân hơn dữ liệu y tế và sức khỏe
Vì vậy, các biện pháp bảo vệ an toàn tuyệt đối phải được thực hiện để đảm bảothông tin chỉ đến được với những người được xem chúng
Trang 7 Thị trường ngày càng đông đúc
Fitbit phải đối mặt với một thách thức khác cho tương lai: sự cạnh tranh gay gắt từApple, Garmin, Huawei và rất nhiều thương hiệu công nghệ lớn khác đang lăm le thamgia thị trường màu mỡ này Fitbit đang có được lợi thế của người dẫn đầu nhưng họ sẽcần phải tiếp tục phát triển và tìm kiếm các thị trường mới nếu vẫn muốn giữ vững thịphần
III PHÂN TÍCH CHI TIẾT CÁC THÔNG TIN TRONG CASE STUDY
1 Trong thực tế, FITBIT đã áp dụng Big Data như thế nào?
1.1 Áp dụng thông qua việc thu thập dữ liệu trên các thiết bị của Fibit.
Fitbit theo dõi thời gian hoạt động hằng ngày, việc tập luyện thể dục, lượngcalo nạp vào và kể cả thời lượng giấc ngủ của người sử dụng Ngoài ra, người dùng còn
có quyền truy cập thông tin thời gian thực về những thói quen của họ và các số liệu thống
kê này được đồng bộ hóa từ các thiết bị của Fitbit với điện thoại thông minh hoặc máytính cá nhân của người dùng Tất cả những số liệu thống kê này sẽ được thể hiện ở mụcDashboard trên màn hình chính của ứng dụng Fitbit, cho phép người dùng kiểm tra cũngnhư theo dõi tiến trình của họ Tất cả các thiết bị Fitbit sẽ tự động đồng bộ hóa với Fitbit'sonline Dashboard và ứng dụng Fitbit, từ đó cung cấp cho người dùng nhiều loại thông tin
và các phân tích chẳng hạn như biểu đồ và đồ thị về tiến trình luyện tập của họ Nền tảngnày sẽ giúp người dùng duy trì động lực tập thể dục, giữ gìn sức khỏe thông qua các tínhnăng xã hội, những thử thách và các huy hiệu ảo Ngoài ra Fitbit cũng cung cấp các dịch
vụ cao cấp trên cơ sở đăng ký bao gồm huấn luyện ảo thông qua các kế hoạch tập thể dụctùy chỉnh và trải nghiệm tập thể dục dựa trên các video tương tác trên điện thoại thôngminh và máy tính
Một thiết bị góp phần lớn cho việc thu thập thông tin sức khỏe người dùng chính
là cân thông minh Aria của Fitbit, nó có thể theo dõi được cân nặng, chỉ số thể trọng
Trang 8(BMI), khối lượng nạc và tỷ lệ phần trăm mỡ cơ thể của người dùng Aria có thể nhậndạng tối đa đến 8 người dùng cá nhân (vì vậy cả gia đình có thể sử dụng chung cân thôngminh Aria) và giữ kết quả của từng thành viên một cách tách biệt, riêng tư Các số liệuthống kê cũng sẽ được đồng bộ hóa với mạng không dây (Wi-Fi) tại nhà của người dùng
và cũng có thể được đồng bộ hóa với các thiết bị đeo tay (tracker, smartwatch, etc) củaFitbit Các số liệu này cũng sẽ được thể hiện ở mục Dashboard của ứng dụng Fitbit giúpngười dùng đặt ra mục tiêu và theo dõi, kiểm tra tiến trình của họ
Fitbit cũng đã và đang bán các thiết bị theo dõi sức khỏe và phần mềm theo dõiđặc biệt của họ cho người dùng của các công ty như BP America, để họ có thể theo dõimức độ làm việc cũng như sức khỏe của nhân viên ( với sự cho phép của các nhân viên)
1.2 Áp dụng thông qua việc chia sẻ dữ liệu với các công ty thứ ba.
Chúng ta cũng thấy, rõ ràng dữ liệu sức khỏe như thế này mang lại rất nhiều thôngtin và cực kỳ có giá trị, ngay cả đối với người dùng cá nhân Fitbit còn tổng hợp dữ liệu
về thói quen luyện tập thể dục và các chỉ số sức khỏe để chia sẻ với các đối tác chiến lượccủa họ Các dữ liệu cá nhân cũng có thể được chia sẻ với sự cho phép của người dùng Ví
dụ như Dịch vụ HealthVault của Microsoft cho phép người dùng đăng tải và chia sẻ dữliệu từ thiết bị theo dõi sức khỏe của họ với các chuyên gia y tế, từ đó có thể cung cấpcho các bác sĩ một cách tổng thể hơn về sức khỏe và thói quen của bệnh nhân trước đây
so với những thông tin chỉ thu thập được thông qua việc tư vấn sức khỏe và khám bệnh.Việc thu thập và chia sẻ các dữ liệu này là tương đối phức tạp do liên quan đến các thôngtin cá nhân của người dùng, tuy nhiên một vài công ty bảo hiểm như John Hancock đã cóchương trình giảm giá cho những khách hàng mua bảo hiểm đeo thiết bị Fitbit Các chủhợp đồng có thể chia sẻ dữ liệu Fitbit của họ để đổi lấy các phần thưởng liên quan đếncác hoạt động thể chất và chế độ ăn uống của họ Điều này cho thấy khách hàng có xuhướng sẽ sẵn sàng “giao dịch” dữ liệu cá nhân của họ để đổi lấy các sản phẩm, dịch vụhoặc các đãi ngộ, phần thưởng của Fitbit
Fitbit đã rất thành công trong việc tận dụng xu hướng ngày càng tăng của ngườidùng để theo dõi các hoạt động hằng ngày của họ trong thời đại công nghệ này Nhữngngười dùng ngày càng hiểu rõ hơn về công nghệ và họ muốn theo dõi quá trình tập luyện,
Trang 9thói quen ngủ, dinh dưỡng và sức khỏe của họ, và một điều không thể thiếu đó chính làchia sẻ những thông tin, hiệu suất, các thử thách mà họ đạt được lên các trang phươngtiện truyền thông xã hội.
có được thông tin về cơ thể tốt hơn và duy trì được sức khỏe của họ Việc Fitbit tiến vàothị trường dành riêng cho các doanh nghiệp cho thấy công ty có hiểu biết sâu sắc về sứcmạnh của dữ liệu liên quan đến sức khỏe ngoài người dùng cá nhân mà còn quan trọngcho các lao động trong doanh nghiệp
3 Dữ liệu được sử dụng
Khi sử dụng FitBit: Họ sẽ thu thập các chỉ số bao gồm: đếm số bước, đoạn đườngđạt được khi chạy, lượng calo đã nạp vào cơ thể, lượng calo đã đốt, người dùng đã hoạtđộng bao nhiêu phút mỗi ngày, nhịp tim, chu kỳ ngủ, lượng oxy trong máu để có thểđưa ra kế hoạch, lộ trình phù hợp với mỗi người dùng
Khi truy cập trang web, FitBit sẽ thu thập dữ liệu về định vị vị trí của ngườidùng để đảm bảo người dùng có được những thông tin phù hợp với họ vànơi họ cứ trú
Khi cài đặt ứng dụng, nếu người dùng cho phép họ kết nối với vị trí, nó sẽ
có tính năng thể hiện hoặc lập bản đồ chạy, hoạt động cho người dùngthông qua sử dụng dữ liệu về vị trí Đồng nghĩa FitBit sẽ sử dụng mộtlượng lớn dữ liệu về tín hiệu GPS, thông tin các điểm truy cập Wifi, các IDcủa tháp sóng di động, các thiết bị có cảm biến xung quanh đó
Trang 10Ngoài những dữ liệu phức tạp như trên thì FitBit cũng thu thập các dữ liệu bán cấutrúc như thông tin về nhân khẩu học (chiều cao, cân nặng, giới tính, tuổi, ) nhằm cánhân hóa và tăng độ chính xác cho mỗi người dùng hơn Bên cạnh đó, Fitbit cũng sẽ lưutrữ các dữ liệu liên quan đến thông tin liên lạc với người dùng như địa chỉ để giao hànghoặc email, số điện thoại để có thể thông báo hoặc liên lạc khi cần thiết.
Một số tính năng như có thể lưu trữ và phát nhạc của FitBit cho thấy FitBit có thểcác dữ liệu nhạc số đủ lớn để thúc đẩy người dùng sử dụng cho mục đích vận động
4 Kỹ thuật được sử dụng
Fitbit không công khai chi tiết kho dữ liệu về Big Data của họ, nhưng khi nhìn vàogiấy tờ, ta có thể biết được họ có lẽ đã làm việc với công nghệ dữ liệu là các ngôn ngữ lậptrình như SQL, Hadoop, Python và Java
5 Liên hệ với thực tiễn áp dụng vào Big data vào thiết bị FitBit
Mô tả:
Nghiên cứu được thực hiện tại một trường đại học Yuan Ze, các nhà nghiên cứuthu thập và theo dõi các chỉ số về sức khỏe để dùng Hệ thống trực vi hóa hành vi(BVS) đã phát triển để minh họa lối sống và hành vi của sinh viên
o Dữ liệu được lưu trữ trong hệ thống đám mây của FitBit ,sau đó được sao chép dữ liệu chuyển sang ứng dụng Hadoop
Trang 11Hình 1 Cho thấy 19 yếu tố được đo, tần suất lấy mẫu và tổng số lượng
dữ liệu được ghi nhận từ 30 sinh viên.
Theo dõi thu thập dữ liệu
Ngôn ngữ lập trình Java được sử dụng để thiết kế chương trình và truy cập dữ liệuthông qua thiết bị đeo được API đám mây (Giao diện lập trình ứng dụng) cho truy cập dữliệu an toàn Đầu tiên, dữ liệu từ thiết bị đeo được đã được cập nhật bằng điện thoại diđộng sử dụng phiên bản Bluetooth 4.0 Tiếp theo, ứng dụng khách được chuyển hướngđến trang ủy quyền trình theo dõi để xác thực thu thập dữ liệu Một người mã thông báođược lấy từ URL gọi lại và được áp dụng để đồng bộ hóa dữ liệu đám mây Khi ở trên cácbước đã hoàn thành, một chương trình truy xuất dữ liệu bắt đầu thu thập dữ liệu qua địnhdạng trao đổi JSON và lưu trữ nó trong nền tảng kho dữ liệu
Xử lí dữ liệu
Trong nghiên cứu này, dữ liệu liên quan đến các hoạt động hàng ngày của học sinhđược hiển thị bằng cách sử dụng BVS theo dữ liệu quy trình xử lý được hiển thị trongHình 1
Trang 12Quy trình truyền dữ liệu từ tracker đến BVS như sau:
Bước 1: Dữ liệu về các hoạt động hàng ngày của sinh viên được thu thập bởi bộ theo dõi
và được đồng bộ hóa với đám mây
Bước 2: BVS cung cấp quyền và thu thập dữ liệu từ đám mây cho sao chép vào kho dữ
liệu
Bước 3: Các công cụ trực quan hóa được triển khai bằng kỹ thuật JavaFX đã được áp
dụng trong BVS để minh họa dữ liệu về hoạt động và phong cách sống trong các biểu đồ(đường, thanh, phân tán) theo chuỗi thời gian và chuỗi người dùng BVS cũng cung cấp
số liệu thống kê mô tả để phân tích cá nhân hoặc nhóm Đối với phân tích nâng caoquảng cáo, BVS cho phép lọc dữ liệu bằng cài đặt tiêu chí, sau đó xuất thành tệp văn bảncho phân tích sâu hơn
Hồ sơ hoạt động
BVS cung cấp các tùy chọn hiển thị và lập hồ sơ khác nhau, bao gồm trình bày dữliệu hàng giờ, trực quan hóa các hoạt động hàng ngày và thống kê hàng tuần
Trang 13Hình 2 cho thấy một biểu đồ đường thể hiện các hoạt động hàng giờ từ 0 đến 23 giờ chomỗi người dùng và cho tất cả người dùng trên một ngày Hệ thống cũng cho phép lựachọn người dùng, hoạt động và ngày tháng; một biểu đồ đường sau đó được tạo ra và sosánh giữa hai hoạt động là có thể.
Hình 3 cho thấy cách các hoạt động hàng ngày có thể được hình dung dưới dạng dữ liệuhoạt động thu được trong khoảng thời gian đo lường khi học sinh tham gia lớp học; BVS
Trang 14có thể minh họa biểu đồ hoạt động của một người dùng đã chọn hoặc giá trị trung bìnhcủa tất cả người dùng Hệ thống này cũng hỗ trợ lọc dữ liệu dựa trên số giờ, được điềuchỉnh bởi dữ liệu nhịp tim của người dùng mỗi giờ và độ dài đeo mỗi ngày Người dùngBVS có thể đặt ngưỡng làm mới kết quả được hiển thị để quan sát cấu hình thay đổi củabiểu đồ và dữ liệu đã lọc có thể được xuất dưới dạng tệp CSV để phân tích thêm.
Hình 4 cho thấy hành vi của các đối tượng mỗi ngày trong một tuần Công cụ này có thểđược sử dụng để trình bày dữ liệu cho từng người dùng hoặc dữ liệu cho tất cả ngườidùng cho từng hoạt động được đo lường Tuy nhiên, pin của thiết bị cần được sạc lại saumột vài ngày và các lý do khác cũng có thể dẫn đến thiếu dữ liệu; do đó, một bộ lọc chothời gian mặc mỗi ngày là bắt buộc
Thống kê mô tả
Sử dụng mô-đun thống kê, công cụ được phát triển có thể được sử dụng để tínhtoán các chỉ tiêu thống kê mô tả khác nhau như phương tiện và độ lệch chuẩn của mọihoạt động của từng người dùng hoặc của tất cả người dùng trong thời gian nghiên cứu.Một lần nữa, công cụ này có khả năng lọc dựa trên khoảng thời gian thu được dữ liệunhịp tim mỗi ngày và Hình 5 cho thấy dữ liệu có thể được xuất để nghiên cứu thêm