1. Trang chủ
  2. » Luận Văn - Báo Cáo

báo cáo giữa kỳ aws academy lab project cloud data pipeline builder

34 0 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

D li u clickstream là m t ngu n thông tin vô cùngệc thu thập và phân tích dữ liệu ữ liệu ệc thu thập và phân tích dữ liệu ột trở nên quan trọng hơn bao giờ hết với ồn thông tin vô cùngh

Trang 1

TRƯỜNG ĐẠI HỌC PHENIKAANG Đ I H C PHENIKAAẠI HỌC PHENIKAAỌC PHENIKAA

AWS Academy Lab Project - Cloud DataPipeline Builder

Gi ng viên hảng viên hướng dẫnướng dẫnng d nẫn: Ph m Kim Thànhạm Kim Thành

Sinh viên: Nguy n Đ c H i - 21010560ễn Đức Hải - 21010560ức Hải - 21010560ảng viên hướng dẫn

L p tín ch ớng dẫnỉ : Tích h p và phân tích d li u l n -1-3-ợp và phân tích dữ liệu lớn -1-3-ữ liệu lớn -1-3- ệu lớn -1-3-ớng dẫn23(N01)

Hà N i, tháng 01/2024ội, tháng 01/2024

Trang 2

Tóm t tắt

Trong th i đ i s hóa, vi c thu th p và phân tích d li uời đại số hóa, việc thu thập và phân tích dữ liệu ại số hóa, việc thu thập và phân tích dữ liệu ố hóa, việc thu thập và phân tích dữ liệu ệc thu thập và phân tích dữ liệu ập và phân tích dữ liệu ữ liệu ệc thu thập và phân tích dữ liệuclickstream (dòng nh p chu t) tr nên quan tr ng h n bao gi h t v iấp chuột) trở nên quan trọng hơn bao giờ hết với ột) trở nên quan trọng hơn bao giờ hết với ở nên quan trọng hơn bao giờ hết với ọng hơn bao giờ hết với ơn bao giờ hết với ời đại số hóa, việc thu thập và phân tích dữ liệu ết với ớicác doanh nghi p D li u clickstream là m t ngu n thông tin vô cùngệc thu thập và phân tích dữ liệu ữ liệu ệc thu thập và phân tích dữ liệu ột) trở nên quan trọng hơn bao giờ hết với ồn thông tin vô cùngh u ích v thói quen s d ng d ch v c a ngữ liệu ề thói quen sử dụng dịch vụ của người dùng, giúp doanh ử dụng dịch vụ của người dùng, giúp doanh ụng dịch vụ của người dùng, giúp doanh ịch vụ của người dùng, giúp doanh ụng dịch vụ của người dùng, giúp doanh ủa người dùng, giúp doanh ười đại số hóa, việc thu thập và phân tích dữ liệui dùng, giúp doanhnghi p t i u hóa tr i nghi m ngệc thu thập và phân tích dữ liệu ố hóa, việc thu thập và phân tích dữ liệu ư ải nghiệm người dùng và gia tăng doanh thu Tuy ệc thu thập và phân tích dữ liệu ười đại số hóa, việc thu thập và phân tích dữ liệui dùng và gia tăng doanh thu Tuynhiên, vi c x lý lệc thu thập và phân tích dữ liệu ử dụng dịch vụ của người dùng, giúp doanh ượng lớn dữ liệu clickstream đòi hỏi hệ thống có khảng l n d li u clickstream đòi h i h th ng có khới ữ liệu ệc thu thập và phân tích dữ liệu ỏi hệ thống có khả ệc thu thập và phân tích dữ liệu ố hóa, việc thu thập và phân tích dữ liệu ải nghiệm người dùng và gia tăng doanh thu Tuynăng x lý và phân tích d li u l n, đáp ng yêu c u v th i gian th c.ử dụng dịch vụ của người dùng, giúp doanh ữ liệu ệc thu thập và phân tích dữ liệu ới ứng yêu cầu về thời gian thực ầu về thời gian thực ề thói quen sử dụng dịch vụ của người dùng, giúp doanh ời đại số hóa, việc thu thập và phân tích dữ liệu ực.Hi n t i, có nhi u hệc thu thập và phân tích dữ liệu ại số hóa, việc thu thập và phân tích dữ liệu ề thói quen sử dụng dịch vụ của người dùng, giúp doanh ướing ti p c n đ gi i quy t v n đ này nh sết với ập và phân tích dữ liệu ể giải quyết vấn đề này như sử ải nghiệm người dùng và gia tăng doanh thu Tuy ết với ấp chuột) trở nên quan trọng hơn bao giờ hết với ề thói quen sử dụng dịch vụ của người dùng, giúp doanh ư ử dụng dịch vụ của người dùng, giúp doanhd ng Hadoop, Spark ho c các d ch v đám mây nh AWS, Google Cloud,ụng dịch vụ của người dùng, giúp doanh ặc các dịch vụ đám mây như AWS, Google Cloud, ịch vụ của người dùng, giúp doanh ụng dịch vụ của người dùng, giúp doanh ưAzure M i hỗi hướng tiếp cận đều có ưu và nhược điểm riêng ướing ti p c n đ u có u và nhết với ập và phân tích dữ liệu ề thói quen sử dụng dịch vụ của người dùng, giúp doanh ư ượng lớn dữ liệu clickstream đòi hỏi hệ thống có khảc đi m riêng.ể giải quyết vấn đề này như sử

V i nh ng ki n th c t n i dung đã h c, tôi quy t đ nh l a ch nới ữ liệu ết với ứng yêu cầu về thời gian thực ừ nội dung đã học, tôi quyết định lựa chọn ột) trở nên quan trọng hơn bao giờ hết với ọng hơn bao giờ hết với ết với ịch vụ của người dùng, giúp doanh ực ọng hơn bao giờ hết vớibài t p lab s d ng các công c AWS đ xây d ng pipeline d li u choập và phân tích dữ liệu ử dụng dịch vụ của người dùng, giúp doanh ụng dịch vụ của người dùng, giúp doanh ụng dịch vụ của người dùng, giúp doanh ể giải quyết vấn đề này như sử ực ữ liệu ệc thu thập và phân tích dữ liệud li u clickstream T i sao l i là AWS ? Lý do r t đ n gi n: AWS là n nữ liệu ệc thu thập và phân tích dữ liệu ại số hóa, việc thu thập và phân tích dữ liệu ại số hóa, việc thu thập và phân tích dữ liệu ấp chuột) trở nên quan trọng hơn bao giờ hết với ơn bao giờ hết với ải nghiệm người dùng và gia tăng doanh thu Tuy ề thói quen sử dụng dịch vụ của người dùng, giúp doanht ng l n nh t cung c p m t lo t các d ch v x lý, th ng kê và theo dõiải nghiệm người dùng và gia tăng doanh thu Tuy ới ấp chuột) trở nên quan trọng hơn bao giờ hết với ấp chuột) trở nên quan trọng hơn bao giờ hết với ột) trở nên quan trọng hơn bao giờ hết với ại số hóa, việc thu thập và phân tích dữ liệu ịch vụ của người dùng, giúp doanh ụng dịch vụ của người dùng, giúp doanh ử dụng dịch vụ của người dùng, giúp doanh ố hóa, việc thu thập và phân tích dữ liệud li u m nh mẽ và linh ho t nh CloudWatch, EC2, giúp xây d ng vàữ liệu ệc thu thập và phân tích dữ liệu ại số hóa, việc thu thập và phân tích dữ liệu ại số hóa, việc thu thập và phân tích dữ liệu ư ực.qu n lý pipeline d li u m t cách d dàng Bên c nh đó, m t trang webải nghiệm người dùng và gia tăng doanh thu Tuy ữ liệu ệc thu thập và phân tích dữ liệu ột) trở nên quan trọng hơn bao giờ hết với ễ dàng Bên cạnh đó, một trang web ại số hóa, việc thu thập và phân tích dữ liệu ột) trở nên quan trọng hơn bao giờ hết vớihoàn ch nh trên máy ch EC2 đã đỉnh trên máy chủ EC2 đã được cung cấp sẵn như một nguồn tài ủa người dùng, giúp doanh ượng lớn dữ liệu clickstream đòi hỏi hệ thống có khảc cung c p s n nh m t ngu n tàiấp chuột) trở nên quan trọng hơn bao giờ hết với ẵn như một nguồn tài ư ột) trở nên quan trọng hơn bao giờ hết với ồn thông tin vô cùngnguyên, khi n cho vi c th c hành bài t p lab tr nên d dàng h n.ết với ệc thu thập và phân tích dữ liệu ực ập và phân tích dữ liệu ở nên quan trọng hơn bao giờ hết với ễ dàng Bên cạnh đó, một trang web ơn bao giờ hết với

Nh ng thao tác chính c n th c hi n trong bài t p lab tữ liệu ầu về thời gian thực ực ệc thu thập và phân tích dữ liệu ập và phân tích dữ liệu ươn bao giờ hết vớing đ iố hóa, việc thu thập và phân tích dữ liệuđ n gi n V n đ kỹ thu t ch y u n m vi c chuy n đ i d li u theoơn bao giờ hết với ải nghiệm người dùng và gia tăng doanh thu Tuy ấp chuột) trở nên quan trọng hơn bao giờ hết với ề thói quen sử dụng dịch vụ của người dùng, giúp doanh ập và phân tích dữ liệu ủa người dùng, giúp doanh ết với ằm ở việc chuyển đổi dữ liệu theo ở nên quan trọng hơn bao giờ hết với ệc thu thập và phân tích dữ liệu ể giải quyết vấn đề này như sử ổi dữ liệu theo ữ liệu ệc thu thập và phân tích dữ liệudõi clickstream sang các d ng d li u đ n gi n h n, t ng quát và tr cại số hóa, việc thu thập và phân tích dữ liệu ữ liệu ệc thu thập và phân tích dữ liệu ơn bao giờ hết với ải nghiệm người dùng và gia tăng doanh thu Tuy ơn bao giờ hết với ổi dữ liệu theo ực.quan h n thông qua công c AWS CloudWatch T đó, chúng ta thi t kơn bao giờ hết với ụng dịch vụ của người dùng, giúp doanh ừ nội dung đã học, tôi quyết định lựa chọn ết với ết vớicác dashboard giúp mô hình hóa các d li u này và bi u di n thông tinữ liệu ệc thu thập và phân tích dữ liệu ể giải quyết vấn đề này như sử ễ dàng Bên cạnh đó, một trang webc a chúng thông qua các b ng bi u ủa người dùng, giúp doanh ải nghiệm người dùng và gia tăng doanh thu Tuy ể giải quyết vấn đề này như sử

Trang 3

Đóng góp chính c a bài lab là vi c áp d ng thành công các d ch vủa người dùng, giúp doanh ệc thu thập và phân tích dữ liệu ụng dịch vụ của người dùng, giúp doanh ịch vụ của người dùng, giúp doanh ụng dịch vụ của người dùng, giúp doanhc a AWS đ xây d ng m t pipeline d li u hi u qu cho d li uủa người dùng, giúp doanh ể giải quyết vấn đề này như sử ực ột) trở nên quan trọng hơn bao giờ hết với ữ liệu ệc thu thập và phân tích dữ liệu ệc thu thập và phân tích dữ liệu ải nghiệm người dùng và gia tăng doanh thu Tuy ữ liệu ệc thu thập và phân tích dữ liệuclickstream Bài t p lab chính là m t minh ch ng cho kh năng x lý vàập và phân tích dữ liệu ột) trở nên quan trọng hơn bao giờ hết với ứng yêu cầu về thời gian thực ải nghiệm người dùng và gia tăng doanh thu Tuy ử dụng dịch vụ của người dùng, giúp doanhphân tích d li u l n c c kỳ hi u qu c a các công c AWS, đ ng th iữ liệu ệc thu thập và phân tích dữ liệu ới ực ệc thu thập và phân tích dữ liệu ải nghiệm người dùng và gia tăng doanh thu Tuy ủa người dùng, giúp doanh ụng dịch vụ của người dùng, giúp doanh ồn thông tin vô cùng ời đại số hóa, việc thu thập và phân tích dữ liệucung c p cho ngấp chuột) trở nên quan trọng hơn bao giờ hết với ười đại số hóa, việc thu thập và phân tích dữ liệui dùng cái nhìn sâu s c v phân tích hành khách hàngắc về phân tích hành khách hàng ề thói quen sử dụng dịch vụ của người dùng, giúp doanhthông qua d li u clickstream.ữ liệu ệc thu thập và phân tích dữ liệu

3

Trang 4

M c l cục lục ục lụcL i cam k tời cam kếtết

Tóm t tắtM c l cục lục ục lục

Chương 1 Giới thiệu bài Labng 1 Gi i thi u bài Labớng dẫnệu lớn

-1-3-1.1 Đ t v n đặc các dịch vụ đám mây như AWS, Google Cloud, ấp chuột) trở nên quan trọng hơn bao giờ hết vớiề thói quen sử dụng dịch vụ của người dùng, giúp doanh

1.2 M c tiêu và ph m viụng dịch vụ của người dùng, giúp doanhại số hóa, việc thu thập và phân tích dữ liệu1.3 Đ nh hịch vụ của người dùng, giúp doanhướing gi i phápải nghiệm người dùng và gia tăng doanh thu Tuy

1.4 Ướic tính đ n giá trong 12 thángơn bao giờ hết với

Chương 1 Giới thiệu bài Labng 2 Phát tri n và tri n khai kỹ thu tển và triển khai kỹ thuậtển và triển khai kỹ thuậtật

2.1 Thi t k t ng quanết với ết với ổi dữ liệu theo2.2 Tri n khai kỹ thu tể giải quyết vấn đề này như sửập và phân tích dữ liệu

2.2.1 Phase 1: Phân tích trang web và xác nh n d li u weblogập và phân tích dữ liệuữ liệu ệc thu thập và phân tích dữ liệu2.2.2 Phase 2: Cài đ t ặc các dịch vụ đám mây như AWS, Google Cloud, CloudWatch agent và thi t l p file cài đ tết với ập và phân tích dữ liệuặc các dịch vụ đám mây như AWS, Google Cloud,2.2.3 Phase 3: Truy c p ập và phân tích dữ liệu CloudWatch agent

2.2.4 Phase 4: Th ng kê, vẽ bi u đ trong AWS CloudWatchố hóa, việc thu thập và phân tích dữ liệuể giải quyết vấn đề này như sửồn thông tin vô cùng2.2.5 Phase 5: Thi t l p màn hình theo dõi (dashboard)ết với ập và phân tích dữ liệu

Chương 1 Giới thiệu bài Labng 3 K t lu nếtậtTài li u tham kh oệu lớn -1-3-ảng viên hướng dẫnPh l cục lục ục lục

Trang 5

Chương 1 Giới thiệu bài Labng 1Gi i thi u bài Labớng dẫnệu lớn

-1-3-Trong su t các khóa h c t i AWS Academy, sinh viên đã hoànố hóa, việc thu thập và phân tích dữ liệu ọng hơn bao giờ hết với ại số hóa, việc thu thập và phân tích dữ liệuthành r t nhi u các bài t p lab - bài th c hành khác nhau Sinh viên đãấp chuột) trở nên quan trọng hơn bao giờ hết với ề thói quen sử dụng dịch vụ của người dùng, giúp doanh ập và phân tích dữ liệu ực.đượng lớn dữ liệu clickstream đòi hỏi hệ thống có khảc cung c p ki n th c đ s d ng các d ch v và tính năng khác nhauấp chuột) trở nên quan trọng hơn bao giờ hết với ết với ứng yêu cầu về thời gian thực ể giải quyết vấn đề này như sử ử dụng dịch vụ của người dùng, giúp doanh ụng dịch vụ của người dùng, giúp doanh ịch vụ của người dùng, giúp doanh ụng dịch vụ của người dùng, giúp doanhc a công c AWS, t đó xây d ng nhi u gi i pháp cho các tình hu ng xủa người dùng, giúp doanh ụng dịch vụ của người dùng, giúp doanh ừ nội dung đã học, tôi quyết định lựa chọn ực ề thói quen sử dụng dịch vụ của người dùng, giúp doanh ải nghiệm người dùng và gia tăng doanh thu Tuy ố hóa, việc thu thập và phân tích dữ liệu ử dụng dịch vụ của người dùng, giúp doanhlý d li u có th x y ra trong th c t ữ liệu ệc thu thập và phân tích dữ liệu ể giải quyết vấn đề này như sử ải nghiệm người dùng và gia tăng doanh thu Tuy ực ết với

Trong bài lab này, sinh viên đượng lớn dữ liệu clickstream đòi hỏi hệ thống có khảc yêu c u s d ng các d ch v AWSầu về thời gian thực ử dụng dịch vụ của người dùng, giúp doanh ụng dịch vụ của người dùng, giúp doanh ịch vụ của người dùng, giúp doanh ụng dịch vụ của người dùng, giúp doanhquen thu c, cũng nh tìm hi u các d ch v AWS hoàn toàn m i m đột) trở nên quan trọng hơn bao giờ hết với ư ể giải quyết vấn đề này như sử ịch vụ của người dùng, giúp doanh ụng dịch vụ của người dùng, giúp doanh ới ẻ để ể giải quyết vấn đề này như sửxây d ng m t gi i pháp th ng nh t và hi u qu nhi u ph n c a dực ột) trở nên quan trọng hơn bao giờ hết với ải nghiệm người dùng và gia tăng doanh thu Tuy ố hóa, việc thu thập và phân tích dữ liệu ấp chuột) trở nên quan trọng hơn bao giờ hết với ệc thu thập và phân tích dữ liệu ải nghiệm người dùng và gia tăng doanh thu Tuy Ở nhiều phần của dự ề thói quen sử dụng dịch vụ của người dùng, giúp doanh ầu về thời gian thực ủa người dùng, giúp doanh ực.án, hướing d n t ng bẫn từng bước chi tiết không được cung cấp một cách có ý ừ nội dung đã học, tôi quyết định lựa chọn ướic chi ti t không đết với ượng lớn dữ liệu clickstream đòi hỏi hệ thống có khảc cung c p m t cách có ýấp chuột) trở nên quan trọng hơn bao giờ hết với ột) trở nên quan trọng hơn bao giờ hết vớiđ Nh ng ph n c th này c a d án nh m thách th c nhóm th c hànhồn thông tin vô cùng ữ liệu ầu về thời gian thực ụng dịch vụ của người dùng, giúp doanh ể giải quyết vấn đề này như sử ủa người dùng, giúp doanh ực ằm ở việc chuyển đổi dữ liệu theo ứng yêu cầu về thời gian thực ực.các kỹ năng mà sinh viên đã h c đọng hơn bao giờ hết với ượng lớn dữ liệu clickstream đòi hỏi hệ thống có khảc trong su t quá trình h c trố hóa, việc thu thập và phân tích dữ liệu ọng hơn bao giờ hết với ướic dực.án này Trong m t s trột) trở nên quan trọng hơn bao giờ hết với ố hóa, việc thu thập và phân tích dữ liệu ười đại số hóa, việc thu thập và phân tích dữ liệung h p, sinh viên có th bu c ph i t h c cácợng lớn dữ liệu clickstream đòi hỏi hệ thống có khả ể giải quyết vấn đề này như sử ột) trở nên quan trọng hơn bao giờ hết với ải nghiệm người dùng và gia tăng doanh thu Tuy ực ọng hơn bao giờ hết vớikỹ năng, ki n th c m i.ết với ứng yêu cầu về thời gian thực ới

Đ n cu i d án này, nhóm đã có th th c hi n nh ng đi u sau:ết với ố hóa, việc thu thập và phân tích dữ liệu ực ể giải quyết vấn đề này như sử ực ệc thu thập và phân tích dữ liệu ữ liệu ề thói quen sử dụng dịch vụ của người dùng, giúp doanh● Tri n khai m t pipeline phân tích d li u trên AWS h tr vi cể giải quyết vấn đề này như sử ột) trở nên quan trọng hơn bao giờ hết với ữ liệu ệc thu thập và phân tích dữ liệu ỗi hướng tiếp cận đều có ưu và nhược điểm riêng ợng lớn dữ liệu clickstream đòi hỏi hệ thống có khả ệc thu thập và phân tích dữ liệu

phân tích d li u clickstream t trang web.ữ liệu ệc thu thập và phân tích dữ liệu ừ nội dung đã học, tôi quyết định lựa chọn

● Bi n đ i d li u clickstream trết với ổi dữ liệu theo ữ liệu ệc thu thập và phân tích dữ liệu ướic khi nó đ n t ng tr c quan hóa.ết với ầu về thời gian thực ực.● S d ng các d ch v AWS đ phân tích d li u clickstream.ử dụng dịch vụ của người dùng, giúp doanh ụng dịch vụ của người dùng, giúp doanh ịch vụ của người dùng, giúp doanh ụng dịch vụ của người dùng, giúp doanh ể giải quyết vấn đề này như sử ữ liệu ệc thu thập và phân tích dữ liệu

● Thi t k c ch báo cáo b ng đi u khi n cho vi c phân tích dết với ết với ơn bao giờ hết với ết với ải nghiệm người dùng và gia tăng doanh thu Tuy ề thói quen sử dụng dịch vụ của người dùng, giúp doanh ể giải quyết vấn đề này như sử ệc thu thập và phân tích dữ liệu ữ liệuli u clickstream.ệc thu thập và phân tích dữ liệu

● Đi u ch nh pipeline phân tích d li u.ề thói quen sử dụng dịch vụ của người dùng, giúp doanh ỉnh trên máy chủ EC2 đã được cung cấp sẵn như một nguồn tài ữ liệu ệc thu thập và phân tích dữ liệu

1

Trang 6

1.1 Đ t v n đặt vấn đề ấn đềề

AnyCompany Café bán các m t hàng tráng mi ng và cà phê thôngặc các dịch vụ đám mây như AWS, Google Cloud, ệc thu thập và phân tích dữ liệuqua trang web c a h H có các quán cà phê nhi u thành ph trên thủa người dùng, giúp doanh ọng hơn bao giờ hết với ọng hơn bao giờ hết với ở nên quan trọng hơn bao giờ hết với ề thói quen sử dụng dịch vụ của người dùng, giúp doanh ố hóa, việc thu thập và phân tích dữ liệu ết vớigi i Công ty mu n hi u rõ h n v doanh nghi p c a mình b ng cách sới ố hóa, việc thu thập và phân tích dữ liệu ể giải quyết vấn đề này như sử ơn bao giờ hết với ề thói quen sử dụng dịch vụ của người dùng, giúp doanh ệc thu thập và phân tích dữ liệu ủa người dùng, giúp doanh ằm ở việc chuyển đổi dữ liệu theo ử dụng dịch vụ của người dùng, giúp doanhd ng d li u v cách mà m i ngụng dịch vụ của người dùng, giúp doanh ữ liệu ệc thu thập và phân tích dữ liệu ề thói quen sử dụng dịch vụ của người dùng, giúp doanh ọng hơn bao giờ hết với ười đại số hóa, việc thu thập và phân tích dữ liệu ươn bao giờ hết vớii t ng tác v i trang web Công ty dới ực.đ nh phân tích xu hịch vụ của người dùng, giúp doanh ướing d li u clickstream đ đ a ra quy t đ nh thôngữ liệu ệc thu thập và phân tích dữ liệu ể giải quyết vấn đề này như sử ư ết với ịch vụ của người dùng, giúp doanhminh h n v vi c đ u t AnyCompany Café đã thuê công ty t v n c aơn bao giờ hết với ề thói quen sử dụng dịch vụ của người dùng, giúp doanh ệc thu thập và phân tích dữ liệu ầu về thời gian thực ư ư ấp chuột) trở nên quan trọng hơn bao giờ hết với ủa người dùng, giúp doanhnhóm đ d n d t n l c này Nhóm là chuyên gia tích h p d li u và làmể giải quyết vấn đề này như sử ẫn từng bước chi tiết không được cung cấp một cách có ý ắc về phân tích hành khách hàng ỗi hướng tiếp cận đều có ưu và nhược điểm riêng ực ợng lớn dữ liệu clickstream đòi hỏi hệ thống có khả ữ liệu ệc thu thập và phân tích dữ liệuvi c v i m t nhóm các kỹ s d li u, nhà phân tích d li u và nhà phátệc thu thập và phân tích dữ liệu ới ột) trở nên quan trọng hơn bao giờ hết với ư ữ liệu ệc thu thập và phân tích dữ liệu ữ liệu ệc thu thập và phân tích dữ liệutri n web.ể giải quyết vấn đề này như sử

D li u nh t ký clickstream t trang web c a quán cà phê bao g mữ liệu ệc thu thập và phân tích dữ liệu ập và phân tích dữ liệu ừ nội dung đã học, tôi quyết định lựa chọn ủa người dùng, giúp doanh ồn thông tin vô cùngm t m c cho m i l n nh p mà khách hàng ti m năng th c hi n khiột) trở nên quan trọng hơn bao giờ hết với ụng dịch vụ của người dùng, giúp doanh ỗi hướng tiếp cận đều có ưu và nhược điểm riêng ầu về thời gian thực ấp chuột) trở nên quan trọng hơn bao giờ hết với ề thói quen sử dụng dịch vụ của người dùng, giúp doanh ực ệc thu thập và phân tích dữ liệuduy t trang web Nhi m v c a nhóm là thi t k và t o ra m t pipelineệc thu thập và phân tích dữ liệu ệc thu thập và phân tích dữ liệu ụng dịch vụ của người dùng, giúp doanh ủa người dùng, giúp doanh ết với ết với ại số hóa, việc thu thập và phân tích dữ liệu ột) trở nên quan trọng hơn bao giờ hết vớiphân tích d li u đ thu th p d li u clickstream Nhóm cũng sẽ t o m tữ liệu ệc thu thập và phân tích dữ liệu ể giải quyết vấn đề này như sử ập và phân tích dữ liệu ữ liệu ệc thu thập và phân tích dữ liệu ại số hóa, việc thu thập và phân tích dữ liệu ột) trở nên quan trọng hơn bao giờ hết vớib ng đi u khi n phân tích đ ch quán cà phê có th nhanh chóng quanải nghiệm người dùng và gia tăng doanh thu Tuy ề thói quen sử dụng dịch vụ của người dùng, giúp doanh ể giải quyết vấn đề này như sử ể giải quyết vấn đề này như sử ủa người dùng, giúp doanh ể giải quyết vấn đề này như sửsát hành vi c a khách hàng Nhóm mu n hi u rõ h n v hành vi c aủa người dùng, giúp doanh ố hóa, việc thu thập và phân tích dữ liệu ể giải quyết vấn đề này như sử ơn bao giờ hết với ề thói quen sử dụng dịch vụ của người dùng, giúp doanh ủa người dùng, giúp doanhngười đại số hóa, việc thu thập và phân tích dữ liệui dùng trên trang web và sau đó s d ng nh ng hi u bi t đó đ t pử dụng dịch vụ của người dùng, giúp doanh ụng dịch vụ của người dùng, giúp doanh ữ liệu ể giải quyết vấn đề này như sử ết với ể giải quyết vấn đề này như sử ập và phân tích dữ liệutrung vào các n l c qu ng cáo Công ty th m chí có th s d ng d li uỗi hướng tiếp cận đều có ưu và nhược điểm riêng ực ải nghiệm người dùng và gia tăng doanh thu Tuy ập và phân tích dữ liệu ể giải quyết vấn đề này như sử ử dụng dịch vụ của người dùng, giúp doanh ụng dịch vụ của người dùng, giúp doanh ữ liệu ệc thu thập và phân tích dữ liệuđ quy t đ nh n i m thêm các đ a đi m.ể giải quyết vấn đề này như sử ết với ịch vụ của người dùng, giúp doanh ơn bao giờ hết với ở nên quan trọng hơn bao giờ hết với ịch vụ của người dùng, giúp doanh ể giải quyết vấn đề này như sử

1.2 M c tiêu và ph m vi ục lụcạm Kim Thành

K t qu bài lab đáp ng các yêu c u sau:ết với ải nghiệm người dùng và gia tăng doanh thu Tuy ứng yêu cầu về thời gian thực ầu về thời gian thực.

● Thi t k và t i u hóa chi phí cho gi i pháp trết với ết với ố hóa, việc thu thập và phân tích dữ liệu ư ải nghiệm người dùng và gia tăng doanh thu Tuy ướic khi xâyd ng.ực.

● Đ m b o r ng gi i pháp ho t đ ng.ải nghiệm người dùng và gia tăng doanh thu Tuy ải nghiệm người dùng và gia tăng doanh thu Tuy ằm ở việc chuyển đổi dữ liệu theo ải nghiệm người dùng và gia tăng doanh thu Tuy ại số hóa, việc thu thập và phân tích dữ liệu ột) trở nên quan trọng hơn bao giờ hết với● Bi n đ i d li u.ết với ổi dữ liệu theo ữ liệu ệc thu thập và phân tích dữ liệu

Trang 7

● Phân tích và tr c quan hóa d li u.ực ữ liệu ệc thu thập và phân tích dữ liệu● T o ra thông tin chi ti t.ại số hóa, việc thu thập và phân tích dữ liệu ết với

Ngoài ra bài lab sẽ đượng lớn dữ liệu clickstream đòi hỏi hệ thống có khảc th c hi n trên n n t ng AWS Academyực ệc thu thập và phân tích dữ liệu ề thói quen sử dụng dịch vụ của người dùng, giúp doanh ải nghiệm người dùng và gia tăng doanh thu Tuyv i không gi i h n th i gian Tuy nhiên sẽ v n có gi i h n với ới ại số hóa, việc thu thập và phân tích dữ liệu ời đại số hóa, việc thu thập và phân tích dữ liệu ẫn từng bước chi tiết không được cung cấp một cách có ý ới ại số hóa, việc thu thập và phân tích dữ liệu ề thói quen sử dụng dịch vụ của người dùng, giúp doanhbudget t i đa khi th c hi n bài lab không quá $80 ố hóa, việc thu thập và phân tích dữ liệu ực ệc thu thập và phân tích dữ liệu

1.3 Đ nh hịnh hướng giải phápướng dẫnng gi i phápảng viên hướng dẫn

Nhóm đã l a ch n s d ng AWS CloudWatch Agent đ truy v n dực ọng hơn bao giờ hết với ử dụng dịch vụ của người dùng, giúp doanh ụng dịch vụ của người dùng, giúp doanh ể giải quyết vấn đề này như sử ấp chuột) trở nên quan trọng hơn bao giờ hết với ữ liệuli u t access_log c a web server Apache Đây là m t gi i pháp hi u quệc thu thập và phân tích dữ liệu ừ nội dung đã học, tôi quyết định lựa chọn ủa người dùng, giúp doanh ột) trở nên quan trọng hơn bao giờ hết với ải nghiệm người dùng và gia tăng doanh thu Tuy ệc thu thập và phân tích dữ liệu ải nghiệm người dùng và gia tăng doanh thu Tuyđ thu th p, theo dõi và phân tích d li u log t các ngu n khác nhauể giải quyết vấn đề này như sử ập và phân tích dữ liệu ữ liệu ệc thu thập và phân tích dữ liệu ừ nội dung đã học, tôi quyết định lựa chọn ồn thông tin vô cùngtrên môi trười đại số hóa, việc thu thập và phân tích dữ liệung AWS và on-premises c a b n.ủa người dùng, giúp doanh ại số hóa, việc thu thập và phân tích dữ liệu

Sau khi thu th p d li u, nhóm s d ng các truy v n đ phân tíchập và phân tích dữ liệu ữ liệu ệc thu thập và phân tích dữ liệu ử dụng dịch vụ của người dùng, giúp doanh ụng dịch vụ của người dùng, giúp doanh ấp chuột) trở nên quan trọng hơn bao giờ hết với ể giải quyết vấn đề này như sửd li u và vẽ ra các bi u đ trên dashboard Đi u này giúp nhóm có cáiữ liệu ệc thu thập và phân tích dữ liệu ể giải quyết vấn đề này như sử ồn thông tin vô cùng ề thói quen sử dụng dịch vụ của người dùng, giúp doanhnhìn tr c quan v d li u và d dàng nh n bi t các xu hực ề thói quen sử dụng dịch vụ của người dùng, giúp doanh ữ liệu ệc thu thập và phân tích dữ liệu ễ dàng Bên cạnh đó, một trang web ập và phân tích dữ liệu ết với ướing và mô hìnhhành vi c a ngủa người dùng, giúp doanh ười đại số hóa, việc thu thập và phân tích dữ liệui dùng.

Cu i cùng, nhóm đã chuy n file access_log t i S3 đ sao l u.ố hóa, việc thu thập và phân tích dữ liệu ể giải quyết vấn đề này như sử ới ể giải quyết vấn đề này như sử ưAmazon S3 là m t d ch v l u tr đám mây đáng tin c y, giúp nhóm l uột) trở nên quan trọng hơn bao giờ hết với ịch vụ của người dùng, giúp doanh ụng dịch vụ của người dùng, giúp doanh ư ữ liệu ập và phân tích dữ liệu ưtr và b o v d li u quan tr ng.ữ liệu ải nghiệm người dùng và gia tăng doanh thu Tuy ệc thu thập và phân tích dữ liệu ữ liệu ệc thu thập và phân tích dữ liệu ọng hơn bao giờ hết với

Tóm l i, nhóm đã xây d ng m t gi i pháp đ thu th p, phân tích vàại số hóa, việc thu thập và phân tích dữ liệu ực ột) trở nên quan trọng hơn bao giờ hết với ải nghiệm người dùng và gia tăng doanh thu Tuy ể giải quyết vấn đề này như sử ập và phân tích dữ liệul u tr d li u clickstream Gi i pháp này không ch giúp nhóm hi u rõư ữ liệu ữ liệu ệc thu thập và phân tích dữ liệu ải nghiệm người dùng và gia tăng doanh thu Tuy ỉnh trên máy chủ EC2 đã được cung cấp sẵn như một nguồn tài ể giải quyết vấn đề này như sửh n v hành vi c a ngơn bao giờ hết với ề thói quen sử dụng dịch vụ của người dùng, giúp doanh ủa người dùng, giúp doanh ười đại số hóa, việc thu thập và phân tích dữ liệui dùng mà còn đ m b o an toàn và tính s n sàngải nghiệm người dùng và gia tăng doanh thu Tuy ải nghiệm người dùng và gia tăng doanh thu Tuy ẵn như một nguồn tàic a d li u Nhóm đã t n d ng t t các d ch v c a AWS và áp d ngủa người dùng, giúp doanh ữ liệu ệc thu thập và phân tích dữ liệu ập và phân tích dữ liệu ụng dịch vụ của người dùng, giúp doanh ố hóa, việc thu thập và phân tích dữ liệu ịch vụ của người dùng, giúp doanh ụng dịch vụ của người dùng, giúp doanh ủa người dùng, giúp doanh ụng dịch vụ của người dùng, giúp doanhthành công chúng vào vi c gi i quy t v n đ th c t ệc thu thập và phân tích dữ liệu ải nghiệm người dùng và gia tăng doanh thu Tuy ết với ấp chuột) trở nên quan trọng hơn bao giờ hết với ề thói quen sử dụng dịch vụ của người dùng, giúp doanh ực ết với

3

Trang 8

1.4Ướng dẫnc tính đ n giá trong 12 thángơng 1 Giới thiệu bài Lab

c tính đ n giá cho 12 tháng sẽ r i vào kho ng $298.80 ( ~Ưới ơn bao giờ hết với ơn bao giờ hết với ải nghiệm người dùng và gia tăng doanh thu Tuy

$25/tháng) Các d ch v c n chi tr ch y u là máy ch EC2 (t3.medium)ịch vụ của người dùng, giúp doanh ụng dịch vụ của người dùng, giúp doanh ầu về thời gian thực ải nghiệm người dùng và gia tăng doanh thu Tuy ủa người dùng, giúp doanh ết với ủa người dùng, giúp doanhvà AWS CloudWatch (dùng ít nh t 2 Dashboard) Đ t i u chi phí có thấp chuột) trở nên quan trọng hơn bao giờ hết với ể giải quyết vấn đề này như sử ố hóa, việc thu thập và phân tích dữ liệu ư ể giải quyết vấn đề này như sửchi tr trải nghiệm người dùng và gia tăng doanh thu Tuy ướic ti n máy ch EC2 trề thói quen sử dụng dịch vụ của người dùng, giúp doanh ủa người dùng, giúp doanh ướic 1 năm ( chi phí 1 năm sẽ còn$281.28 ) ho c tr trặc các dịch vụ đám mây như AWS, Google Cloud, ải nghiệm người dùng và gia tăng doanh thu Tuy ướic 3 năm ( chi phí 1 năm sẽ còn $175.81 ) Th nênết vớinhóm khuy n khích tr trết với ải nghiệm người dùng và gia tăng doanh thu Tuy ướic cho 3 năm.

Đ i v i AWS CloudWatch không có chính sách tr trố hóa, việc thu thập và phân tích dữ liệu ới ải nghiệm người dùng và gia tăng doanh thu Tuy ướic th nênết vớichi phí hàng tháng đ i v i m c dùng trong bài ố hóa, việc thu thập và phân tích dữ liệu ới ứng yêu cầu về thời gian thực ướic tính c đ nh $3.ố hóa, việc thu thập và phân tích dữ liệu ịch vụ của người dùng, giúp doanh

Trang 10

Chương 1 Giới thiệu bài Labng 2Phát tri n và tri n khai kỹ thu tển và triển khai kỹ thuậtển và triển khai kỹ thuậtật

2.1 Thi t k t ng quanếtết ổng quan

Hình 2 Ví d thi t k góiụng dịch vụ của người dùng, giúp doanhết với ết với

2.2 Tri n khai kỹ thu t ển và triển khai kỹ thuậtật

2.2.1 Phase 1: Phân tích trang web và xác nh n d li u weblogậtữ liệu lớn ệu lớn

-1-3-● Task 1: Phân tích và hi u môi trể giải quyết vấn đề này như sử ười đại số hóa, việc thu thập và phân tích dữ liệung phòng thí nghi mệc thu thập và phân tích dữ liệu

đây, ta có m t phiên b n EC2 đang ch y trong m ng con côngỞ nhiều phần của dự ột) trở nên quan trọng hơn bao giờ hết với ải nghiệm người dùng và gia tăng doanh thu Tuy ại số hóa, việc thu thập và phân tích dữ liệu ại số hóa, việc thu thập và phân tích dữ liệu

c ng và m ng con này thu c v m t VPC, có tên là Lab VPC Có m tột) trở nên quan trọng hơn bao giờ hết với ại số hóa, việc thu thập và phân tích dữ liệu ột) trở nên quan trọng hơn bao giờ hết với ề thói quen sử dụng dịch vụ của người dùng, giúp doanh ột) trở nên quan trọng hơn bao giờ hết với ột) trở nên quan trọng hơn bao giờ hết vớiSecurity Group sẽ ki m soát quy n truy c p vào phiên b n EC2 (g i làể giải quyết vấn đề này như sử ề thói quen sử dụng dịch vụ của người dùng, giúp doanh ập và phân tích dữ liệu ải nghiệm người dùng và gia tăng doanh thu Tuy ọng hơn bao giờ hết vớitrười đại số hóa, việc thu thập và phân tích dữ liệung h p) này Ngoài ra, đã có m t s d ch v đi kèm đ theo dõi nh tợng lớn dữ liệu clickstream đòi hỏi hệ thống có khả ột) trở nên quan trọng hơn bao giờ hết với ố hóa, việc thu thập và phân tích dữ liệu ịch vụ của người dùng, giúp doanh ụng dịch vụ của người dùng, giúp doanh ể giải quyết vấn đề này như sử ập và phân tích dữ liệuký Vì v y, ta sẽ không c n th c hi n nhi m v kỹ thu t nào trong bập và phân tích dữ liệu ầu về thời gian thực ực ệc thu thập và phân tích dữ liệu ệc thu thập và phân tích dữ liệu ụng dịch vụ của người dùng, giúp doanh ập và phân tích dữ liệu ướicnày.

Trang 11

● Task 2: Đi u ch nh security group và ki m tra l i webề thói quen sử dụng dịch vụ của người dùng, giúp doanh ỉnh trên máy chủ EC2 đã được cung cấp sẵn như một nguồn tài ể giải quyết vấn đề này như sử ại số hóa, việc thu thập và phân tích dữ liệuapplication

Ta ph i cho phép l u lải nghiệm người dùng và gia tăng doanh thu Tuy ư ượng lớn dữ liệu clickstream đòi hỏi hệ thống có khảng TCP trong Security Group và nó ph i ải nghiệm người dùng và gia tăng doanh thu Tuy ở nên quan trọng hơn bao giờ hết vớitrên c ng 80 Ch n Security Group và ch n ổi dữ liệu theo ọng hơn bao giờ hết với ọng hơn bao giờ hết với “Edit inbound rules” ở nên quan trọng hơn bao giờ hết vớiActions Ti p đó n ch n ết với ấp chuột) trở nên quan trọng hơn bao giờ hết với ọng hơn bao giờ hết với “Add rule” l a ch nực ọng hơn bao giờ hết với “Custom TCP”, ch n ọng hơn bao giờ hết với “80”và “Save rules”.

Quay l i ại số hóa, việc thu thập và phân tích dữ liệu “Instances” ch n vào ọng hơn bao giờ hết với EC2 đang ch y, copy ại số hóa, việc thu thập và phân tích dữ liệu Public IPv4 mở nên quan trọng hơn bao giờ hết với

đười đại số hóa, việc thu thập và phân tích dữ liệung d n “ẫn từng bước chi tiết không được cung cấp một cách có ý http://public-ip/cafe” (trong đó public-ip là Public IPv4 v aừ nội dung đã học, tôi quyết định lựa chọncopy)

(L u ý: M i l n kh i ch y lab, giá tr ư ỗi hướng tiếp cận đều có ưu và nhược điểm riêng ầu về thời gian thực ở nên quan trọng hơn bao giờ hết với ại số hóa, việc thu thập và phân tích dữ liệu ịch vụ của người dùng, giúp doanh Public IPv4 sẽ khác nhau)

● Task 3: Tìm và back-up httpd access_log

Truy c p vào AWS Cloud9 và m ập và phân tích dữ liệu ở nên quan trọng hơn bao giờ hết với Cloud9 IDE ch y dòng l nh:ại số hóa, việc thu thập và phân tích dữ liệu ệc thu thập và phân tích dữ liệu

whereis httpd

Sau khi th y đấp chuột) trở nên quan trọng hơn bao giờ hết với ượng lớn dữ liệu clickstream đòi hỏi hệ thống có khảc v trí c a httpd, ta dùng l nh “tail” đ theo dõi cácịch vụ của người dùng, giúp doanh ủa người dùng, giúp doanh ệc thu thập và phân tích dữ liệu ể giải quyết vấn đề này như sửthay đ i trong file “access_log” bên trong th m c “httpd”:ổi dữ liệu theo ở nên quan trọng hơn bao giờ hết với ở nên quan trọng hơn bao giờ hết với ư ụng dịch vụ của người dùng, giúp doanh

sudo tail -f /etc/httpd/logs/access_log

Ta back-up “access_log”, đây ta sẽ th c hành back-up nó vào môiở nên quan trọng hơn bao giờ hết với ực.trười đại số hóa, việc thu thập và phân tích dữ liệung đang làm vi c:ệc thu thập và phân tích dữ liệu

7

Trang 12

● /etc/httpd/logs/access_log : V trí mu n copyịch vụ của người dùng, giúp doanh ố hóa, việc thu thập và phân tích dữ liệu

● /home/ec2-user/environment/initial_access_log : v trí mu n l u t i.ịch vụ của người dùng, giúp doanh ố hóa, việc thu thập và phân tích dữ liệu ư ới

2.2.2 Phase 2: Cài đ t CloudWatch agent và thi t l p file cài đ tặt vấn đềết ậtặt vấn đề

● Task 1: Cài đ t CloudWatch agent lên web serverặc các dịch vụ đám mây như AWS, Google Cloud,Ch y comment cài đ t Amazon CloudWatch Agent (ACG):ại số hóa, việc thu thập và phân tích dữ liệu ặc các dịch vụ đám mây như AWS, Google Cloud,

sudo yum install -y amazon-CloudWatch-agent

● Task 2: T o file cài đ tại số hóa, việc thu thập và phân tích dữ liệu ặc các dịch vụ đám mây như AWS, Google Cloud,T i file config.json t AWS:ải nghiệm người dùng và gia tăng doanh thu Tuy ừ nội dung đã học, tôi quyết định lựa chọn

sudo wget 200-ACCAP4-1-79925/capstone-4-clickstream/s3/config.json

https://aws-tc-largeobjects.s3.us-west-2.amazonaws.com/CUR-TF-Ti p đó di chuy n file config.json vào trong folder c a ACG:ết với ể giải quyết vấn đề này như sử ủa người dùng, giúp doanh

sudo mv config.json /opt/aws/amazon-CloudWatch-agent/bin/

● Task 3: C u hình httpd.conf dấp chuột) trở nên quan trọng hơn bao giờ hết với ưới ại số hóa, việc thu thập và phân tích dữ liệui d ng JSONTìm file “httpd.conf” b ng cách dùng l nh bên dằm ở việc chuyển đổi dữ liệu theo ệc thu thập và phân tích dữ liệu ướii.

sudo find /etc -name httpd.conf

Trang 13

Ta thu đượng lớn dữ liệu clickstream đòi hỏi hệ thống có khảc đười đại số hóa, việc thu thập và phân tích dữ liệung d n t i file c n tìm :ẫn từng bước chi tiết không được cung cấp một cách có ý ới ầu về thời gian thực./etc/httpd/conf/httpd.conf

Ta c n ph i backup file:ầu về thời gian thực ải nghiệm người dùng và gia tăng doanh thu Tuy

sudo cp /etc/httpd/conf/httpd.conf /home/ec2-user/environment/httpd.conf

Bây gi ta có th th y đời đại số hóa, việc thu thập và phân tích dữ liệu ể giải quyết vấn đề này như sử ấp chuột) trở nên quan trọng hơn bao giờ hết với ượng lớn dữ liệu clickstream đòi hỏi hệ thống có khảc file httpd.conf xu t hi n menu bênấp chuột) trở nên quan trọng hơn bao giờ hết với ệc thu thập và phân tích dữ liệu ở nên quan trọng hơn bao giờ hết vớiph iải nghiệm người dùng và gia tăng doanh thu Tuy

Ta c n ch nh s a file httpd.conf trên AWS Cloud9:ầu về thời gian thực ỉnh trên máy chủ EC2 đã được cung cấp sẵn như một nguồn tài ử dụng dịch vụ của người dùng, giúp doanh

sudo ln -s /etc/httpd/conf /home/ec2-user/environment/httpdconfsudo chown -R ec2-user /etc/httpd/conf

T gi ta có th d dàng m file httpd.conf ngay trên giao di nừ nội dung đã học, tôi quyết định lựa chọn ời đại số hóa, việc thu thập và phân tích dữ liệu ể giải quyết vấn đề này như sử ễ dàng Bên cạnh đó, một trang web ở nên quan trọng hơn bao giờ hết với ệc thu thập và phân tích dữ liệuCloud9

Ti p đó s a n i dung file theo ph l c đi kèm bên dết với ử dụng dịch vụ của người dùng, giúp doanh ột) trở nên quan trọng hơn bao giờ hết với ụng dịch vụ của người dùng, giúp doanh ụng dịch vụ của người dùng, giúp doanh ướii L u s aư ử dụng dịch vụ của người dùng, giúp doanhđ i.ổi dữ liệu theo

● Task 4: C p nh t file config t i ập và phân tích dữ liệu ập và phân tích dữ liệu ới CloudWatch agent

9

Trang 14

Đ u tiên ta c n t o v trí th m c ch a các file log c a agent:ầu về thời gian thực ầu về thời gian thực ại số hóa, việc thu thập và phân tích dữ liệu ịch vụ của người dùng, giúp doanh ư ụng dịch vụ của người dùng, giúp doanh ứng yêu cầu về thời gian thực ủa người dùng, giúp doanh

sudo mkdir -p /var/log/www/error

sudo chown -R apache:apache /var/log/wwwsudo mkdir -p /var/log/www/access

sudo chown -R apache:apache /var/log/www

Kh i đ ng l i httpd và tìm v trí config CloudWatch.jsonở nên quan trọng hơn bao giờ hết với ột) trở nên quan trọng hơn bao giờ hết với ại số hóa, việc thu thập và phân tích dữ liệu ịch vụ của người dùng, giúp doanh

sudo systemctl restart httpd

sudo find / -name '*CloudWatch*json*'2/dev/null

N p config vào agent theo câu l nh dại số hóa, việc thu thập và phân tích dữ liệu ệc thu thập và phân tích dữ liệu ướii đây và kh i đ ng l i:ở nên quan trọng hơn bao giờ hết với ột) trở nên quan trọng hơn bao giờ hết với ại số hóa, việc thu thập và phân tích dữ liệu

sudo /opt/aws/amazon-CloudWatch-agent/bin/amazon-CloudWatch-agent-ctl -afetch-config -m ec2 -s -c file:/opt/aws/amazon-CloudWatch-agent/doc/amazon-CloudWatch-agent-schema.json

sudo systemctl start amazon-CloudWatch-agent.service

Ki m tra tr ng thái agent, k t qu nh hình thì đã thi t l p thànhể giải quyết vấn đề này như sử ại số hóa, việc thu thập và phân tích dữ liệu ết với ải nghiệm người dùng và gia tăng doanh thu Tuy ư ết với ập và phân tích dữ liệucông:

service amazon-CloudWatch-agent status

Trang 15

2.2.3 Phase 3: Truy c p CloudWatch agentật

V c b n, d ch v AWS CloudWatch đã có th xem đề thói quen sử dụng dịch vụ của người dùng, giúp doanh ơn bao giờ hết với ải nghiệm người dùng và gia tăng doanh thu Tuy ịch vụ của người dùng, giúp doanh ụng dịch vụ của người dùng, giúp doanh ể giải quyết vấn đề này như sử ượng lớn dữ liệu clickstream đòi hỏi hệ thống có khảc nh t kýập và phân tích dữ liệutruy c p đập và phân tích dữ liệu ượng lớn dữ liệu clickstream đòi hỏi hệ thống có khảc máy ch apache l u l i trên chính giao di n web c aủa người dùng, giúp doanh ư ại số hóa, việc thu thập và phân tích dữ liệu ệc thu thập và phân tích dữ liệu ủa người dùng, giúp doanhAWS Công vi c t bệc thu thập và phân tích dữ liệu ừ nội dung đã học, tôi quyết định lựa chọn ướic này sẽ là th ng kê các lố hóa, việc thu thập và phân tích dữ liệu ượng lớn dữ liệu clickstream đòi hỏi hệ thống có khảt truy c p/l i và sập và phân tích dữ liệu ỗi hướng tiếp cận đều có ưu và nhược điểm riêng ử dụng dịch vụ của người dùng, giúp doanhd ng công c có s n c a AWS CloudWatch đ l p thành các b l c, bi uụng dịch vụ của người dùng, giúp doanh ụng dịch vụ của người dùng, giúp doanh ẵn như một nguồn tài ủa người dùng, giúp doanh ể giải quyết vấn đề này như sử ập và phân tích dữ liệu ột) trở nên quan trọng hơn bao giờ hết với ọng hơn bao giờ hết với ể giải quyết vấn đề này như sửđ tồn thông tin vô cùng ươn bao giờ hết vớing ng.ứng yêu cầu về thời gian thực.

Task 1: Quan sát file amazon-CloudWatch-agent.logTrướic tiên ta c n tìm v trí c a file:ầu về thời gian thực ịch vụ của người dùng, giúp doanh ủa người dùng, giúp doanh

sudo find / -name amazon-CloudWatch-agent.log 2/dev/null

sudo cat /opt/aws/amazon-CloudWatch-agent/logs/amazon- CloudWatch-agent.log

Task 2: Quan sát trên file nh t ký (log) trên CloudWatchập và phân tích dữ liệu

11

Trang 16

M CloudWatch, truy c p vào apache/access:ở nên quan trọng hơn bao giờ hết với ập và phân tích dữ liệu

Ch n Log stream:ọng hơn bao giờ hết với

Trang 17

Tuy nhiên, đ th ng kê m t cách tr c quan, sát v i th c t nh t taể giải quyết vấn đề này như sử ố hóa, việc thu thập và phân tích dữ liệu ột) trở nên quan trọng hơn bao giờ hết với ực ới ực ết với ấp chuột) trở nên quan trọng hơn bao giờ hết vớisẽ c n ph i truy c p b ng tay r t nhi u l n và t nhi u máy khác nhau.ầu về thời gian thực ải nghiệm người dùng và gia tăng doanh thu Tuy ập và phân tích dữ liệu ằm ở việc chuyển đổi dữ liệu theo ấp chuột) trở nên quan trọng hơn bao giờ hết với ề thói quen sử dụng dịch vụ của người dùng, giúp doanh ầu về thời gian thực ừ nội dung đã học, tôi quyết định lựa chọn ề thói quen sử dụng dịch vụ của người dùng, giúp doanhĐi u này sẽ khá t n th i gian R t may trong bài lab này ta đã có chu nề thói quen sử dụng dịch vụ của người dùng, giúp doanh ố hóa, việc thu thập và phân tích dữ liệu ời đại số hóa, việc thu thập và phân tích dữ liệu ấp chuột) trở nên quan trọng hơn bao giờ hết với ẩnb trịch vụ của người dùng, giúp doanh ướic m t file m u t AWS Vi c bây gi là đi u ch nh cho AWSột) trở nên quan trọng hơn bao giờ hết với ẫn từng bước chi tiết không được cung cấp một cách có ý ừ nội dung đã học, tôi quyết định lựa chọn ệc thu thập và phân tích dữ liệu ời đại số hóa, việc thu thập và phân tích dữ liệu ề thói quen sử dụng dịch vụ của người dùng, giúp doanh ỉnh trên máy chủ EC2 đã được cung cấp sẵn như một nguồn tàiCloudWatch tr t i file m u này và ta sẽ th c hành phân tích th ng kê raỏi hệ thống có khả ới ẫn từng bước chi tiết không được cung cấp một cách có ý ực ố hóa, việc thu thập và phân tích dữ liệunh ng s li u mà ta mong mu n.ữ liệu ố hóa, việc thu thập và phân tích dữ liệu ệc thu thập và phân tích dữ liệu ố hóa, việc thu thập và phân tích dữ liệu

Đ uầu về thời gian thực tiên d ngừ nội dung đã học, tôi quyết định lựa chọn CloudWatch Agent:

sudo /opt/aws/amazon-CloudWatch-agent/bin/amazon-CloudWatch-agent-ctl -m ec2 -a stopsudo service amazon-CloudWatch-agent status

Copy file access_log.log trong samplelogs vào folder đượng lớn dữ liệu clickstream đòi hỏi hệ thống có khảc thi t l pết với ập và phân tích dữ liệutrong config.json c a CloudWatch Agent ( ủa người dùng, giúp doanh ở nên quan trọng hơn bao giờ hết với đây là/var/log/www/access/*):

sudo cp /home/ec2-user/environment/samplelogs/access_log.log /var/log/www/access/access_log

13

Ngày đăng: 25/06/2024, 15:37

Xem thêm:

w