Việc nắm vững cách xử lý và phân tích Big Data có thể giúp bạn tận dụng sức mạnh của thông tin đối với công việc và nghiên cứu. Đối với nhiều tổ chức và doanh nghiệp, việc làm việc với
Trang 1KHOA KỸ THUẬT MẠNG MÁY TÍNH & TRUYỀN THÔNG
ĐỒ ÁN NHÓM MÔN HỌC: TIN HỌC ỨNG DỤNG
Tên đề tài:
TÌM HIỂU DỮ LIỆU LỚN (BIG DATA) ỨNG DỤNG TRONG EXCEL
Giáo viên hướng dẫn: NGUYỄN TRÍ TÂM
Thành viên 1 : Văn Võ Song Toàn - 9209 Thành viên 2 : Phạm Công Thịnh - 9758 Thành viên 3 : Ngô Đức Trọng - 2165 Thành viên 4 : Nguyễn Đức Thịnh - 5144
Trang 2MỞ ĐẦU
Lý do chọn đề tài:
Excel là một ứng dụng rất phổ biến và được sử dụng rộng rãi trong doanh nghiệp, tổ chức, và cá nhân Nhiều người đã có kiến thức về Excel và sử dụng nó hàng ngày dàng cho người dùng đã quen thuộc với nó Trong đó Big Data
là một phần không thể thiếu
Big Data là các tập dữ liệu có khối lượng lớn và phức tạp Độ lớn đến mức các phần mềm xử lý dữ liệu truyền thống không có khả năng thu thập, quản lý
và xử lý dữ liệu trong một khoảng thời gian hợp lý Vì thế Việc tìm hiểu cách làm việc với Big Data trong Excel có thể là một cách tiếp cận dễ Big Data đã trở thành một phần quan trọng của thế giới kỹ thuật số Việc nắm vững cách xử lý và phân tích Big Data có thể giúp bạn tận dụng sức mạnh của thông tin đối với công việc và nghiên cứu
Đối với nhiều tổ chức và doanh nghiệp, việc làm việc với Big Data đã trở thành một yếu tố quan trọng để đưa ra quyết định kinh doanh
Big data và phân tích có thể được áp dụng trong nhiều vấn đề kinh doanh và nhiều trường hợp sử dụng khác nhau Dữ liệu lớn (Big Data) trên thực tế đang được ứng dụng vào rất nhiều lĩnh vực của nền kinh tế, tạo những chuyển biến
ấn tượng, giúp tăng hiệu quả và năng suất của doanh nghiệp Excel là công cụ quản
lý dữ liệu và tính toán được sử dụng rộng rãi, vì vậy việc tích hợp Big Data vào Excel có thể giúp cải thiện quy trình công việc và ra quyết định dựa trên dữ liệu một cách hiệu quả Nắm vững kỹ năng làm việc với Big Data trong Excel có thể là một lợi thế lớn trong sự nghiệp của bạn Có nhiều cơ hội việc làm liên quan đến xử lý dữ liệu lớn, và kiến thức về cách làm việc với Big Data có thể giúp bạn cạnh tranh mạnh mẽ trên thị trường lao động Excel là một công cụ linh hoạt và có khả năng tùy chỉnh, cho phép bạn xử lý và hiển thị dữ liệu một cách theo ý muốn Việc tích hợp Big Data vào Excel có thể giúp bạn tạo ra các báo cáo và biểu đồ tùy chỉnh dựa trên nhu cầu cụ thể của bạn
Tóm lại: việc tìm hiểu Big Data trong Excel có thể mang lại nhiều lợi ích cho cá nhân và tổ chức, từ việc tối ưu hóa công việc hàng ngày đến phát triển kỹ năng và
cơ hội nghề nghiệp Từ những ứng dụng trên đây, có thể nói, Big Data tạo nên ảnh hưởng rộng lớn đến đời sống của tất cả con người trong thời đại số Nhiều ngành kinh tế như ngân hàng, giao thông vận tải, thương mại điện tử hay chăm sóc sức khỏe đã có những bước nhảy vọt, cải tiến công nghệ, sản phẩm của mình.Cùng với Internet vạn vật (IoT), Trí tuệ nhân tạo (AI) và Điện toán đám mây (Cloud), Big data tiếp tục là một trong những lĩnh vực đang nổi lên cho tất cả các ngành công nghiệp & có mặt ở khắp mọi nơi
Trang 3Mục tiêu: Biết và hiểu về các khái niệm, chức năng và lợi ích của Big Data Sử dụng những kỹ năng soạn thảo văn bản để làm ĐACN/ĐAN trên MS Word và file báo cáo ĐACN/ĐAN bằng MS PowerPoint Sử dụng được một số công cụ, hàm tích hợp Big Data để giải một số bài tập trong Excel
Đối tượng nghiên cứu, tìm hiểu: Dữ liệu lớn (Big Data) MS Office: Word, Excel và PowerPoint, giới thiệu và rộng mở kiến thức về Big Data để Big Data trở thành một công cụ ngày càng quan trọn không thể thiếu trong đời sống sống và làm vệc đạt hiệu quả cao
Bố cục trình bày:
Đồ án gồm phần mở đầu, phần kết luận và 03 chương:
Chương 1 Tổng quan về Big Data Chương này đã giới thiệu một cái nhìn tổng quan
về Big Data, một lĩnh vực công nghệ đang được đề cập đến việc xử lý và phân tích lượng dữ liệu lớn và phức tạp số điểm quan trọng trong chương này: Volume (lượng), Velocity (tốc độ) và Variety (đa dạng)
Chương 2 Tìm hiểu Big Data trong MS Excel Chương này nhằm mục đích giới thiệu cách Big Data có thể cải thiện và tối ưu hóa việc sử dụng Microsoft Excel, một trong những ứng dụng văn phòng phổ biến nhất trên thế giới Đồng thời tìm hiểu tìm hiểu về một số ứng dụng của Big Data trong MS Exel
Chương 3 Triển khai & Thực nghiệm Chương này, sẽ vận dụng một số hàm hay công cụ tích hợp Big Data để giải quyết một số yêu cầu bài tập như quản lý, xử lý
dữ liệu trong excel
Chương 1
Tổng quan về Big Data
Ngày nay, sự phát triển không ngừng của khoa học kỹ thuật, tiêu biểu như sự ra đời của Internet và các thiết bị điện thoại, máy tính cá nhân, đã mang lại những đổi thay lớn lao trên mọi lĩnh vực đời sống Trong kỷ nguyên của IoT2 với việc ứng dụng và tích hợp sâu rộng các thiết bị di động như điện thoại di động, ô tô, và máy móc công nghiệp góp phần vào việc tạo và chuyển dữ liệu, dẫn đến sự bùng nổ của
dữ liệu có thể thu thập được Trong dòng thác dữ liệu liên tục được tạo ra từng giây, thuật ngữ Big Data (Dữ liệu lớn) được sử dụng để chỉ những bộ dữ liệu khổng lồ, chủ yếu không có cấu trúc, được thu thập từ nhiều nguồn khaác nhau Tuy nhiên, Big Data lại chứa trong mình rất nhiều thông tin quý giá mà nếu trích xuất thành công, nó sẽ giúp rất nhiều cho việc kinh doanh, nghiên cứu khoa học, dự đoán các dịch bệnh sắp phát sinh và thậm chí là cả việc xác định điều kiện giao thông theo thời gian thực Trong công tác nghiên cứu khoa học, Big Data đang mang lại các nhà nghiên cứu cơ hội tiếp cận và giải quyết rất nhiều vấn đề hóc búa mà trước đây không thể hoặc rất khó thực hiện Qua bài viết này, chúng tôi muốn giới thiệu về
Trang 4khái niệm Big Data đang ngày càng phổ biến và những ứng dụng của nó trong đời sống hiện nay
Định nghĩa Big Data Big Data hay “dữ liệu lớn” là thuật ngữ chỉ về các tập dữ liệu khổng lồ và phức tạp, đến mức khó có thể xử lý được bằng các phương pháp truyền thống Doanh nghiệp sử dụng lượng dữ liệu khổng lồ này để phân tích, chuyển hóa thành thông tin quan trọng để giải quyết các vấn đề liên quan
2 Đặc điểm của Big Data - Volume (khối lượng dữ liệu): Doanh nghiệp thu thập dữ liệu cho Big Data từ nhiều nguồn khác nhau, từ các giao dịch, thiết bị thông minh, thiết bị công nghiệp, video, hình ảnh, âm thanh, phương tiện truyền thông xã hội, Trước đây, việc lưu trữ tất cả dữ liệu đó sẽ rất tốn kém nhưng hiện nay việc lưu trữ
đã rẻ hơn nhờ sử dụng các hồ sơ dữ liệu, dữ liệu đám mây để giảm bớt gánh nặng - Velocity (vận tốc xử lý): Với sự phát triển của Internet of Things, tốc độ truyền dữ liệu vào các doanh nghiệp vô cùng nhanh và phải được xử lý kịp thời Thẻ RFID, cảm biến và đồng hồ thông minh đang thúc đẩy nhu cầu xử lý các luồng dữ liệu này trong thời gian gần thực - Variety (dữ liệu đa dạng): Dữ liệu được thu thập ở nhiều định dạng khác nhau từ dữ liệu số, có cấu trúc trong cơ sở dữ liệu truyền thống đến tài liệu văn bản phi cấu trúc, email, video, âm thanh, dữ liệu mã chứng khoán và các giao dịch tài chính
3 Quá trình hình thành Big Data Big Data thực chất đã hình thành từ khoảng thập
kỷ 80 - 90 của thế kỷ XX Năm 1984, tập đoàn Teradata đưa ra thị trường hệ thống
xử lý dữ liệu song song DBC 1012 Các hệ thống xử lý của Teradata là một trong những hệ thống đầu tiên lưu trữ và phân tích đến 1 terabyte dữ liệu vào năm 1992
Ổ đĩa cứng cũng đạt mức dung lượng 2,5GB vào năm 1991 Năm 2000, Seisint Inc (nay là Tập đoàn LexisNexis) đã phát triển một khung chia sẻ tệp dựa trên cấu cấu trúc C++ để lưu trữ và truy vấn dữ liệu Hệ thống này lưu trữ và phân phối dữ liệu
có cấu trúc, bán cấu trúc, và phi cấu trúc trên nhiều máy chủ Năm 2004, Google xuất bản một bài báo về quá trình MapReduce, cung cấp một mô hình xử lý song song và phát hành những ứng dụng liên quan để xử lý lượng dữ liệu khổng lồ Năm
2005, nhiều doanh nghiệp đã bắt đầu nhận ra số lượng người dùng được tạo ra thông qua Youtube, Facebook và các dịch vụ trực tuyến khác là rất lớn Cùng năm
đó, Hadoop (một framework open source được tạo riêng với nhiệm vụ lưu trữ và phân tích Big Data) đã được phát triển và NoSQL cũng bắt đầu trở nên phổ biến Sự phát triển của các framework ví dụ như Hadoop (hoặc gần đây là Spark) là cần thiết cho sự phát triển của Big Data, chúng khiến cho Big Data hoạt động dễ dàng hơn và lưu trữ rẻ hơn Hiện nay, nhờ có Internet of Things mà khối lượng Big Data ngày càng lớn với tốc độ nạp vô cùng nhanh chóng Lý do là vì dữ liệu ngày nay không chỉ do con người tạo ra mà còn do máy móc tạo tự động Big Data đã trở thành một tài nguyên quý giá đối với các doanh nghiệp, đặc biệt là các doanh nghiệp thương mại điện tử, giúp doanh nghiệp tăng lợi thế cạnh tranh và phục vụ khách hàng tốt hơn
Vai trò của Big Data là gì ?
Trang 5Vai trò của Big Data
Big Data làm được gì hay tại sao lại cần đến Big Data chắc hẳn là những câu hỏi được nhiều người quan tâm Nhìn chung, những lợi ích của Big Data bao gồm:
Cắt giảm chi phí: Áp dụng công nghệ phân tích Big Data trên tất cả các quy trình trong tổ chức không chỉ giúp doanh nghiệp tự động loại bỏ sai sót mà còn có thể triển khai các giải pháp nhanh chóng, hiệu quả, tiết kiệm chi phí
Tiết kiệm thời gian: Việc tổng hợp, phân tích một lượng dữ liệu khổng lồ đòi hỏi nhiều thời gian và chi phí, đồng thời có độ trễ nhất định nếu xử lý thủ công Big Data có khả năng thu thập, xử lý dữ liệu với tốc độ nhanh hơn, dễ dàng hơn, tiết kiệm thời gian đáng kể
Tối ưu hóa sản phẩm: Thông qua Big Data, các công ty có thể phân tích được mức giá có lợi nhuận tối đa trong những viễn cảnh kinh doanh khác nhau Để làm hài lòng khách hàng và thu lại lợi nhuận, các công ty cần có những cải tiến sản phẩm phù hợp theo xu hướng của thị trường Big Data tạo điều kiện cho họ thực hiện các thay đổi ấy
Hỗ trợ con người đưa ra quyết định: Nhờ vào khả năng khai thác, xử lý lượng dữ liệu khổng lồ, Big Data có thể xác định nhu cầu, dự đoán xu hướng, giúp cho việc đưa ra quyết định đúng đắn, kịp thời
Nhờ những lợi ích trên, hiện nay có rất nhiều doanh nghiệp hoạt động trong các lĩnh vực khác nhau đã, đang ứng dụng công nghệ Big Data
Nếu để ý một chút, chúng ta sẽ thấy khi mua sắm trên eBay, Amazon hoặc những sàn thương mại điện tử, chúng sẽ đưa ra những sản phẩm gợi ý tương tự Ví dụ khi tìm kiếm áo thun, trang web sẽ tự động gợi ý chúng ta quần, phụ kiện liên quan
Từ đâu mà những trang web này có thể đưa ra gợi ý như vậy? Đó là dữ liệu của khách hàng thao tác hàng ngày trên những trang web ấy Doanh nghiệp khai thác hiệu quả Big Data không chỉ giúp tăng lợi nhuận cho chính mình mà còn tăng trải nghiệm mua sắm của người dùng
Trang 6Ngoài ra, Big Data cũng có thể được ứng dụng bởi các tổ chức, chính phủ trong việc dự đoán tỷ lệ thất nghiệp, xu hướng nghề nghiệp hiện tại và tương lai để đầu tư cho những hạng mục đó, cắt giảm chi tiêu, kích thích tăng trưởng kinh tế, thậm chí
là ra phương án phòng ngừa trước một dịch bệnh nào đó,
Tại các thành phố lớn trên thế giới, Big Data cũng được tích hợp vào trung tâm điều hành thông minh (IOC), hệ thống giám sát xử phạt, Nhờ đó, nhà quản lý thành phố dễ dàng giám sát, đưa ra quyết định trong trường hợp khẩn cấp, đời sống của cư dân cũng được đảm bảo an toàn, hiện đại hơn
1 Lợi ích của Big Data đem lại với ngành thương mại điện tử
Trong cuộc cách mạng 4.0 hiện nay, doanh nghiệp nào nắm giữ được chiếc chìa khóa công nghệ thì doanh nghiệp đó thành công Không ngoài xu thế đó, doanh nghiệp thương mại điện tử muốn thành công thì việc ứng dụng công nghệ để thành công là yếu tố tất yếu Với ngành Thương mại điện tử, yếu tố quan trọng là nguồn
dữ liệu lớn, từ đó các doanh nghiệp nắm bắt được thông tin khách hàng quan tâm tới từng phân khúc sản phẩm, có chiến dịch quảng cáo phù hợp, dự báo những biến động trong tương lai gần, tình hình nhập/ xuất hàng hóa phù hợp, phân bổ các mặt hàng cho từng thị trường theo thị hiếu…
Big Data - Dữ liệu lớn là thuật ngữ để chỉ tập hợp dữ liệu có kích thước vô cùng lớn hoặc vô cùng phức tạp vượt xa khả năng của các công cụ phần mềm xử lý dữ liệu truyền thống Kích cỡ của Big Data đang từng ngày tăng lên, tính đến năm 2012 mỗi ngày có 2,5 exabyte dữ liệu được sinh ra (exabyte bằng 1 tỷ gigabyte) và đến năm 2025 IDC dự đoán số liệu này sẽ là 163 zettabyte (zettabyte bằng 1 nghìn exabyte) Dữ liệu lớn ở đây được đặc trưng bởi 3Vs đó là: Volume - Khối lượng dữ liệu, Velocity - Tốc độ xử lý dữ liệu, Variety - Đa dạng dữ liệu Đây là những lợi ích
mà Big Data mang lại với doanh nghiệp thương mại điện tử
Thứ nhất, dự báo nhu cầu sản phẩm Việc khai thác dữ liệu lớn từ thói quen mua hàng, thời tiết, văn hóa tiêu dùng, tình hình chính trị, sự kiện văn hóa sắp diễn ra… các công ty thương mại điện tử có thể dự đoán được tại từng khu vực địa lý khác nhau, sản phẩm nào sẽ có nhu cầu cao trong thời gian tới, chuẩn bị hàng ngay từ khi khách hàng còn chưa có ý định mua và tạo thế chủ động cho mình trong các chiến dịch cạnh tranh
Thứ hai, tối ưu giá cả Hiện nay, yếu tố quan trọng nhất để thu hút người mua hàng tìm đến các trang mua sắm là phải thường xuyên tung ra những chiến dịch giảm giá, chiết khấu như Black Friday online, mừng sinh nhật, ngày 11/11, ngày 12/12…
Trang 7Thông thường, người mua thích giảm giá trực tiếp trên sản phẩm hơn là tích điểm
và nhận quà Tất nhiên, thông tin giảm giá phải chính xác Trường hợp website đưa
ra chiết khấu lừa đảo, nếu bị phát hiện, lòng tin của người mua dành cho thương hiệu sẽ vơi dần, khách hàng sẽ lựa chọn trang web khác Vì vậy, các trang thương mại điện tử sẽ thông qua nguồn dữ liệu lớn, nhà cung cấp có thể phân tích, so sánh các số liệu trong quá khứ, so sánh với các trang web bán hàng khác để đưa đến cho khách hàng giá cả thật của sản phẩm
Thứ ba, marketing online hiệu quả Chiến dịch marketing online là một phần quan trọng của thương mại điện tử Tuy nhiên không phải mọi chiến dịch marketing đếu mang lại hiệu quả như mong muốn Một số khách hàng than phiền về việc bị làm phiền quá nhiều bởi những quảng cáo sản phẩm họ không quan tâm, làm họ có ấn tượng không tốt với các website đó Các trang thương mại điện tử sẽ sử dụng các dữ liệu lớn từ những tìm kiếm của khách hàng, thời gian truy cập, sự kiện sắp diễn ra, điều kiện tài chính để đưa ra những chiến dịch quảng cáo sản phẩm phù hợp với nhu cầu và thời gian truy cập của khách hàng để đem lại hiệu quả tối đa
Thứ tư, chống gian lận Một số khách hàng vẫn chưa có niềm tin vào các sản phẩm được bán trên các trang web bán hàng trực tuyến vì e dè sản phẩm giả, sản phẩm không rõ nguồn gốc xuất xứ hoặc sai lệch so với thông tin quảng cao Tuy nhiên, qua phân tích dữ liệu có thể giúp các tổ chức xác định các hoạt động khả nghi và các mẫu có thể chỉ ra hành vi gian lận và giúp giảm thiểu rủi ro Đưa đến cho khách hàng những sản phẩm chính hãng, có nguồn gốc xuất xứ rõ ràng, thông tin sản phẩm chính xác
Thứ năm, phân tích khách hàng Kênh thông tin khách hàng là vô cùng quan trọng đối với thương mại nói chung và thương mại điện tử nói riêng Các công ty thương mại điện tử có thể kiểm tra dữ liệu khách hàng để nâng cao trải nghiệm của khách hàng, cải thiện tỉ lệ chuyển đổi và giữ khách hàng tốt hơn, đưa ra những quảng cáo
và ưu đãi phù hợp với đối tượng khách hàng, nhắm đến các đối tượng khách hàng tiềm năng
Thứ sáu, phân tích hoạt động Phân tích Big data về hoạt động doanh nghiệp, mối quan hệ khách hàng, quản lý tài sản sẽ nâng cao hiệu quả hoạt động của doanh nghiệp, vận hành linh hoạt các chiến lược kinh doanh và sử dụng tối ưu nguồn tài nguyên doanh nghiệp, nâng cao hiệu suất làm việc
1 Xây dựng chiến lược Big Data
Trang 8Ở cấp độ cao, chiến lược Big Data là một kế hoạch được thiết kế để giúp bạn giám sát và cải thiện cách thu thập, lưu trữ, quản lý, chia sẻ và sử dụng dữ liệu cho doanh nghiệp Khi phát triển chiến lược Big Data, điều quan trọng là phải xem xét các mục tiêu và sáng kiến trong hiện tại, tương lai của doanh nghiệp Điều này đòi hỏi việc doanh nghiệp phải coi Big Data giống như là một tài sản kinh doanh có giá trị thay
vì chỉ là một công cụ thông thường
2 Xác định các nguồn Big Data
- Dữ liệu truyền trực tiếp: dữ liệu từ Internet of Things (IoT) và các thiết bị được kết nối truyền vào hệ thống công nghệ thông tin từ thiết bị như điện thoại thông minh, ô
tô thông minh Bạn có thể phân tích Big Data khi nó được truyền đến, quyết định dữ liệu nào nên giữ hoặc không giữ và dữ liệu nào cần phân tích thêm
- Social Media (Facebook, YouTube, Instagram, ): Big Data ở dạng hình ảnh, video, giọng nói, văn bản và âm thanh, rất hữu ích cho chức năng tiếp thị, bán hàng
và hỗ trợ Dữ liệu này thường ở dạng phi cấu trúc hoặc bán cấu trúc, vì vậy nó đặt
ra một thách thức riêng cho việc tiêu thụ và phân tích
- Dữ liệu có sẵn được công bố: là các thông tin, dữ liệu được công bố rộng rãi và công khai như các trang web chính thức của Chính phủ các nước
- Khác: một số nguồn dữ liệu khác đến từ khách hàng, nhà cung cấp hoặc dữ liệu đám mây
3 Truy cập, quản lý và lưu trữ Big Data
Các hệ thống máy tính hiện đại cung cấp tốc độ, sức mạnh và tính linh hoạt cần thiết để nhanh chóng truy cập số lượng lớn và các loại dữ liệu lớn Cùng với khả năng truy cập đáng tin cậy, các công ty cũng cần có các phương pháp tích hợp dữ liệu, xây dựng đường ống dẫn dữ liệu, đảm bảo chất lượng dữ liệu, cung cấp khả năng quản lý và lưu trữ dữ liệu cũng như chuẩn bị dữ liệu để phân tích Một số dữ liệu lớn có thể được lưu trữ tại chỗ trong kho dữ liệu truyền thống nhưng cũng có các tùy chọn linh hoạt, chi phí thấp để lưu trữ và xử lý dữ liệu lớn thông qua các giải pháp đám mây, hồ dữ liệu, đường ống dữ liệu và Hadoop
4 Tiến hành phân tích dữ liệu
Trang 9Với các công nghệ hiệu suất cao như điện toán lưới hoặc phân tích trong bộ nhớ, các tổ chức, doanh nghiệp có thể chọn sử dụng tất cả dữ liệu lớn của họ để phân tích Một cách tiếp cận khác là xác định trước dữ liệu nào có liên quan trước khi phân tích Dù bằng cách nào, phân tích dữ liệu lớn là cách các công ty thu được giá trị và thông tin chi tiết từ dữ liệu Ngày nay, nguồn cấp dữ liệu lớn cung cấp các nỗ lực phân tích nâng cao như trí tuệ nhân tạo (AI) và máy học
5 Dựa trên dữ liệu, đưa ra quyết định
Dữ liệu đáng tin cậy, được quản lý tốt dẫn đến các phân tích đáng tin cậy và các quyết định sáng suốt Để duy trì tính cạnh tranh, các doanh nghiệp cần nắm bắt toàn
bộ giá trị của dữ liệu lớn và hoạt động theo hướng dữ liệu để đưa ra quyết định dựa trên dữ liệu đã được chứng minh rõ ràng Các tổ chức, doanh nghiệp dựa trên dữ liệu sẽ hoạt động tốt hơn, dễ dự đoán hơn và sinh nhiều lợi nhuận hơn
Ứng dụng Big Data của một số trang bán hàng trực tuyến trên thế giới, Đông Nam
Á và Việt Nam như thế nào?
2.1 Các ứng dụng trên thế giới
Trước tiên phải kể đến Amazon, người khổng lồ trong lĩnh vực bán lẻ trực tuyến và cũng là công ty đi đầu trong lĩnh vực ứng dụng Big data vào các hoạt động thương mại của mình Amazon là một công ty thương mại điện tử đa quốc gia tập trung vào các lĩnh vực thương mại điện tử, điện toán đám mây và trí tuệ nhân tạo Amazon là một trong Big4 của công nghệ cùng với các hãng như Google, Apple, Facebook Tính đến năm 2005, Amazon từng sở hữu 3 cơ sở dữ liệu Linux lớn nhất thế giới với dung lượng 7,8TB, 18,5TB và 24,7TB Theo nghiên cứu của IDC, nhờ Big Data, năm 2013 Amazon đạt doanh thu tới 74 tỉ USD Trang bán lẻ trực tuyến Amazon đã sử dụng trí tuệ nhân tạo và Big Data để tăng doanh thu lên nhiều lần
Amazon xây dựng hệ thống khuyến nghị cá nhân từ những dữ liệu về sản phẩm bạn đã mua, giỏ hàng của bạn, những sản phẩm bạn tìm kiếm nhiều nhất và
dữ liệu của những khách hàng đã mua sản phẩm tương tự để đề xuất thêm những sản phẩm bổ xung Hoạt động này mang lại 35% lợi nhuận cho Amazon hàng năm
Amazon còn sử dụng mô hình vận chuyển dự đoán, tối ưu hóa chuỗi cung ứng từ kho dữ liệu lớn Amazon nắm được nhu cầu với một số mặt hàng đặc biệt ở từng địa phương, và tính toán các số liệu về kho hàng, tuyến đường và nhóm sản phẩm tốt nhất để vận chuyển chúng đến kho hàng tối ưu nhất Và một khi khách hàng đặt hàng, sản phẩm được vận chuyển đến bạn một cách nhanh chóng, mà chi phí vận chuyển lại tiết kiệm từ 10 đến 40%, điều này mang đến sự hài lòng cho khách hàng
Trang 10Phương thức thứ ba mà Amazon áp dụng là tối ưu hóa về giá Giá cả thường được thay đổi cứ sau 10 phút dữ liệu lớn được cập nhật và phân tích Do đó Amazon thường giảm giá cho các mặt hàng bán chạy nhất, thu hút người mua hàng và từ đó kiếm thêm lợi nhuận cho cả những mặt hàng ít phổ biến hơn Hoạt động này đem lại lợi nhuận trung bình 25% năm cho Amazon
Amazon còn cung cấp dịch vụ Web Amazon, dịch vụ điện toán đám mây này của Amazon cung cấp cho các công ty bán lẻ phân tích nhân khẩu học của khách hàng, thói quen chi tiêu, thông tin thích hợp khác cho sản phẩm của công ty Đem lại lợi ích rất lớn cho các công ty đối tác của Amazon và chính bản thân Amazon Một gã khổng lồ trong lĩnh vực thương mại nữa là trang bán lẻ trực tuyến Ebay Ebay đã sử dụng 2 trung tâm dữ liệu lớn đến 40 petabyte để chứa những truy vấn, tìm kiếm, đề xuất cho khách hàng cũng như thông tin về hàng hóa của mình Nhà bán lẻ online
xử lý hàng triệu hoạt động mỗi ngày cùng những yêu cầu từ khoảng nửa triệu đối tác bán hàng
Tập đoàn bán lẻ hàng đầu Trung Quốc Alibaba cũng đã bắt đầu khai thác mỏ vàng Big Data này Alibaba cho biết đã bỏ 103 triệu đôla để mua lại startup Data
Artisans Công ty khởi nghiệp có trụ sở tại Berlin chuyên cung cấp hệ thống phân phối và dịch vụ truyền dữ liệu quy mô lớn cho các doanh nghiệp Ông lớn trong lĩnh vực bán lẻ trực tuyến này đang từng bước khai thác hệ thống dữ liệu lớn và cung cấp hạ tầng đám mây nhằm tăng lợi nhuận cho hoạt động thương mại điện tử của mình
Ứng dụng tại thị trường Đông Nam Á
Đông Nam Á hiện là một thị trường tiềm năng phát triển thương mại điện tử Đông Nam Á là thị trường Internet phát triển nhanh nhất thế giới, với dân số 600 triệu người đã có 330 triệu người dùng Internet Theo dự báo của Google đến năm 2020,
dự báo sẽ tăng lên 480 triệu người, trong đó cao nhất sẽ là Indonesia với 215 triệu người dùng, thứ 2 là Philipines với 93 triệu người dùng, Việt Nam dự báo tầm 82 triệu người dùng Thời gian truy cấp Internet trong một ngày của một số nước như Thái Lan, Indonesia, Philipines lên tới 8h mỗi ngày Năm 2018, kinh tế internet trong khu vực đã cán mốc 72 tỷ USD và dự báo năm 2025 lên tới 200 tỷ USD Nhìn vào một vài số liệu điều tra có thể thấy thương mại điện tử ở khu vực Đông Nam Á đang vươn lên mạnh mẽ và trở thành mỏ vàng tỷ đô Trong đó có thể kể đến tập đoàn bán lẻ hiện chiếm thị phần lớn nhất Đông Nam Á là Lazada Tính đến năm
2018, Lazada đang hoạt đông trên 6 quốc gia Đông Nam Á là: Singapore, Malaysia, Thái Lan, Indonesia, Phippines, Việt Nam Lazada đã sử dụng dữ liệu thu thập được
để xác định sản phẩm phù hợp với từng phân khúc khách hàng Ví dụ, khách hàng Thái Lan thích mua tã giấy trong hộp đặc biệt, trong khi người Malaysia thích hàng được đóng trong từng gói nhỏ Lazada dự định sử dụng khoa học dữ liệu để giúp