Dữ liệu có thể đến từ rất nhiều nguồn khác nhau như dữ liệu từ các ứng dụng, cơ sở dữ liệu quan hệ giao dịch mua/bán hàng từ một hệ thống bán lẻ, giao dịchgửi tiền vào ngân hàng…, hoặc d
Trang 1TRƯỜNG ĐẠI HỌC KINH TẾ - ĐẠI HỌC ĐÀ NẴNG
KHOA THƯƠNG MẠI ĐIỆN TỬ
- - - - -
BÀI BÁO CÁO GIỮA KỲ
BỘ MÔN: NHẬP MÔN DỮ LIỆU LỚN
Đề tài: Nghiên cứu Database với Microsoft Azure - Cơ sở dữ liệu SQL Giáo viên hướng dẫn: Nguyễn Văn Chức
Nhóm thực hiện: Nhóm 8 - Lớp 46K29.1 Thành viên:
1 Huỳnh Thị Cẩm
2 Trần Thị Hoài Ly
3 Phạm Lê Ngọc Uyên
4 Vũ Tuấn Minh
Trang 2MỤC LỤC
I TÓM TẮT NỘI DUNG BÁO CÁO
II TỔNG QUAN VỀ NHẬP MÔN DỮ LIỆU LỚN (BIG DATA)
1.1 Khái niệm Microsoft Azure
1.2 Dịch vụ Microsoft Azure cung cấp
1.3 Ưu điểm Microsoft Azure
1.4 So sánh các nền tảng Big Data Framework: AWS, Azure, Google Cloud
2 Azure Database
2.1 Khái niệm Azure Database
2.2 Các tính năng chính của Azure SQL Database
2.3 Tại sao lại sử dụng Azure Database ?
IV ỨNG DỤNG AZURE DATABASE VÀO PHÂN TÍCH THỰC TẾ
1 Ứng dụng Azure Database vào phân tích thực tế
2 Hướng dẫn sử dụng Azure Database đơn giản
2.1 Các bước đăng ký Microsoft Azure for Student free 100$
2.2 Các bước khởi tạo Azure Server và Azure Database
2.3 Giới thiệu về dataset
2.4 Hướng dẫn sử dụng dataset
Trang 3I TÓM TẮT NỘI DUNG BÁO CÁO:
Điện toán đám mây là một xu hướng mới ngày nay Thuật ngữ điện toán đám mây
ra đời không phải để nói về một trào lưu mới mà để khái quát lại các hướng đi của
cơ sở hạ tầng thông tin vốn đã và đang diễn ra từ những năm qua Các nguồn thông tin và tính toán khổng lồ sẽ nằm tại các máy chủ ảo (đám mây) truy cập thông qua Internet thay vì trong máy tính gia đình và văn phòng để mọi người kết nối sử dụng khi cần
Điện toán đám mây là khái niệm hoàn chỉnh cho một xu hướng không mới bởi nhiều doanh nghiệp hiện không có máy chủ riêng mà chỉ có máy tính với một
số phần mềm cơ bản,còn tất cả đều phụ thuộc vào đám mây Với các dịch vụ có sẵntrên Internet, doanh nghiệp không phải mua và duy trì hàng trăm, hàng nghìn máy tính cũng như các phần mềm kèm theo mà họ chỉ cần tập trung công việc của mình bởi đã có người khác lo cơ sở hạ tầng và công nghệ thay họ
Với việc nghiên cứu điện toán đám mây, cụ thể là công nghệ Azure của Microsoft, khoá luận này tập trung tìm hiểu những khái niệm cơ bản về điện toán đám mây nói chung, công nghệ Azure nói riêng và ứng dụng vào phân tích, xây dựng thử nghiệm một hệ thống học từ tiếng Anh Hệ thống đã hoạt động và người sử dụng có thể dùng thử những chức năng cơ bản đặt ra từ những năm qua Các nguồn thông tin và tính toán khổng lồ sẽ nằm tại các máy chủ ảo (đám mây) truy cập thông qua Internet thay vì trong máy tính gia đình và văn phòng để mọi người kết nối sử dụng khi cần
II TỔNG QUAN VỀ NHẬP MÔN DỮ LIỆU LỚN (BIG DATA):
1 Khái niệm:
Theo Wikipedia: Dữ liệu lớn (Big data) là một thuật ngữ chỉ bộ dữ liệu lớn hoặc phức tạp mà các phương pháp truyền thống không đủ các ứng dụng để xử lý dữ liệu này.Theo Gartner: Dữ liệu lớn là những nguồn thông tin có đặc điểm chung khối lượng lớn, tốc độ nhanh và dữ liệu định dạng dưới nhiều hình thức khác nhau, do đó muốn khai thác được đòi hỏi phải có hình thức xử lý mới để đưa ra quyết định, khám phá và
Trang 4tối ưu hóa quy trình.
2 Lịch sử:
Big Data thực chất đã hình thành từ khoảng thập kỷ 80 - 90 của thế kỷ XX Năm
1984, tập đoàn Teradata đưa ra thị trường hệ thống xử lý dữ liệu song song DBC
1012 Các hệ thống xử lý của Teradata là một trong những hệ thống đầu tiên lưu trữ vàphân tích đến 1 terabyte dữ liệu vào năm 1992 Ổ đĩa cứng cũng đạt mức dung lượng 2,5GB vào năm 1991
Năm 2000, Seisint Inc (nay là Tập đoàn LexisNexis) đã phát triển một khung chia sẻ tệp dựa trên cấu cấu trúc C++ để lưu trữ và truy vấn dữ liệu Hệ thống này lưu trữ và phân phối dữ liệu có cấu trúc, bán cấu trúc, và phi cấu trúc trên nhiều máy chủ Năm
2004, Google xuất bản một bài báo về quá trình MapReduce, cung cấp một mô hình
xử lý song song và phát hành những ứng dụng liên quan để xử lý lượng dữ liệu khổng lồ
Năm 2005, nhiều doanh nghiệp đã bắt đầu nhận ra số lượng người dùng được tạo ra thông qua Youtube, Facebook và các dịch vụ trực tuyến khác là rất lớn Cùng năm đó, Hadoop (một framework open source được tạo riêng với nhiệm vụ lưu trữ và phân tíchBig Data) đã được phát triển và NoSQL cũng bắt đầu trở nên phổ biến Sự phát triển của các framework ví dụ như Hadoop (hoặc gần đây là Spark) là cần thiết cho sự phát triển của Big Data, chúng khiến cho Big Data hoạt động dễ dàng hơn và lưu trữ rẻ hơn
Hiện nay, nhờ có Internet of Things mà khối lượng Big Data ngày càng lớn với tốc độ nạp vô cùng nhanh chóng Lý do là vì dữ liệu ngày nay không chỉ do con người tạo ra
mà còn do máy móc tạo tự động Big Data đã trở thành một tài nguyên quý giá đối vớicác doanh nghiệp, đặc biệt là các doanh nghiệp thương mại điện tử, giúp doanh nghiệptăng lợi thế cạnh tranh và phục vụ khách hàng tốt hơn
3 Kiến trúc:
Too long to read on your phone? Save
to read later on your computer
Save to a Studylist
Trang 5Data Sources (dữ liệu nguồn): nơi dữ liệu được sinh ra, bao gồm dữ liệu có cấu trúc (structure), dữ liệu phi cấu trúc (un-structure) cũng như dữ liệu bán cấu trúc (semi-structure) Dữ liệu có thể đến từ rất nhiều nguồn khác nhau như dữ liệu từ các ứng dụng, cơ sở dữ liệu quan hệ (giao dịch mua/bán hàng từ một hệ thống bán lẻ, giao dịchgửi tiền vào ngân hàng…), hoặc dữ liệu file được tạo ra bởi các log của ứng dụng…Data Storage (lưu trữ dữ liệu): được thiết kế để lưu trữ khối lượng lớn dữ liệu với các định dạng khác nhau được sinh ra bởi Data Source trong mô hình xử lý dữ liệu theo lô(Batch Processing) Có các hệ thống lưu trữ file phân tán trên nhiều node khác nhau trong 1 cụm (cluster).
Batch Processing (xử lý dữ liệu theo lô): cho phép xử lý một lượng lớn dữ liệu thông qua việc đọc dữ liệu từ file nguồn, lọc dữ liệu theo các điều kiện nhất định, tính toán trên dữ liệu, và ghi kết quả xuống file đích Có thể sử dụng Spark, Hive,
Analytical Data Store (lưu trữ dữ liệu phân tích): chịu trách nhiệm lưu trữ dữ liệu đã
xử lý theo định dạng theo cấu trúc để phục vụ cho các công cụ phân tích dữ liệu (BI Tools)
Trang 6Analysis and Reporting (lớp phân tích và báo cáo): đáp ứng việc tự khai thác dữ liệu data self-service Cho phép người dùng cuối trực quan hóa dữ liệu (data visualization),phân tích dữ liệu, cũng như kết xuất các báo cáo.
Orchestration (điều phối): điều đối các công việc trong một hệ thống Bigdata để đảm bảo luồng xử lý dữ liệu được thông suốt
4 Đặc trưng:
Nói chung khách hàng không cần sở hữu cơ sở hạ tầng, họ sẽ chỉ phải trả cho những gì họ sử dụng Việc chia sẻ giữa nhiều người thuê giúp tận dụng nguồntài nguyên máy tính và giảm phí tổn
Một số nhà cung cấp bao gồm Amazon, Google và Yahoo Gần đây, Microsoft cũng giới thiệu dịch vụ điện toán đám mây mới là Windows Azure Những dịch vụ này có thể được truy cập nhờ Microsoft Visual Studio bằng cách cài đặt
Windows Azure SDK và Windows Azure Tools cho Visual Studio
5 Ứng dụng:
5 ứng dụng mà doanh nghiệp ứng dụng thực tế thường xuyên:
● Cơ sở dữ liệu đám mây
● Dịch vụ lưu trữ Website an toàn
● Sao lưu, khôi phục dữ liệu nhanh chóng
● Ứng dụng quản lý doanh nghiệp
● Lưu trữ và chia sẻ dữ liệu hiệu quả
● Cơ sở dữ liệu đám mây
Nếu doanh nghiệp bạn có ngân sách hạn chế hoặc đang muốn tiết kiệm chi phí đầu tư cho công nghệ đồng thời không có đội ngũ vận hành có chuyên môn cao Nhưng cần
sử dụng đến một lượng lớn dữ liệu thì việc áp dụng công nghệ điện toán đám mây là lựa chọn vô cùng sáng suốt Phương án này giúp bạn giải quyết vấn đề một cách tối
ưu nhất
Dữ liệu luôn an toàn khi được lưu trữ trên công nghệ điện toán đám mây
Cơ sở dữ liệu được lưu trữ bằng công nghệ điện toán đám mây luôn hoạt động một cách mạnh mẽ mà doanh nghiệp đó có thể tiết kiệm được khoản chi phí mua máy chủ vật lý để lưu trữ và vận hành Ngoài ra, bạn không phải lo lắng điều gì bởi đội ngũ kỹ thuật của nhà cung cấp sẽ đảm bảo tính ổn định của hệ thống cơ sở dữ liệu trong suốt quá trình vận hành
Dịch vụ lưu trữ Website an toàn
Việc lưu trữ Website luôn được xem là vấn đề quan trọng và thực sự cần thiết khi hệ thống của doanh nghiệp không đáp ứng được sự tăng trưởng liên tục của doanh
Trang 7nghiệp Áp dụng công nghệ điện toán đám mây thì mọi vấn đề liên quan sẽ giải quyết
ổn thỏa
Ngoài ra, doanh nghiệp chỉ phải thanh toán theo nhu cầu thực tế khi sử dụng dịch vụ lưu trữ nhưng vẫn luôn đảm bảo hệ thống an ninh được xuyên suốt và trọn vẹn.Sao lưu, khôi phục dữ liệu nhanh chóng Sao lưu lại nguồn dữ liệu trong quá trình hoạt động rất quan trọng Khi có sự cố xảy ra, người dùng vẫn có thể tự động khôi phục dữ liệu nhanh chóng
Trước khi xuất hiện công nghệ điện toán đám mây, mỗi cá nhân, doanh nghiệp phải tự sao lưu thủ công Tuy nhiên khi áp dụng ứng dụng này thì tất cả mọi dữ liệu đều được sao lưu hoàn toàn tự động để đảm bảo sự tiện lợi đến mức tối đa trong suốt quá trình
sử dụng Bạn sẽ không bao giờ phải lo lắng mất hết dữ liệu nếu chẳng may quên nhấn Save
Doanh nghiệp có thể Backup dữ liệu nhanh chóng nhờ công nghệ điện toán đám mâyỨng dụng quản lý doanh nghiệp
Khi đưa các dữ liệu lên hệ thống lưu trữ đám mây, các doanh nghiệp có thể dễ dàng kiểm soát và quản lý dữ liệu một cách hiệu quả nhất Hầu hết các nền tảng chuyên phân tích dữ liệu đều sử dụng hình thức này và chúng đều có khả năng xử lý dữ liệu
có cấu trúc hoặc không có cấu trúc một cách trọn vẹn
Lưu trữ và chia sẻ dữ liệu hiệu quả
Chỉ cần có Internet, người dùng có thể hoàn toàn sao lưu và truy xuất dữ liệu ở khắp mọi nơi và bất cứ khi nào họ cần Những ứng dụng trên nền tảng điện toán đám mây được sử dụng phổ biến tính đến nay đó là: Google Drive, Dropbox, One Drive…
III NỀN TẢNG BIG DATA FRAMEWORK - NGHIÊN CỨU AZURE
DATABASE:
1 Microsoft Azure:
1.1 Khái niệm Microsoft Azure:
Microsoft Azure là một hệ thống tổng hợp các dịch vụ điện toán đám mây; giúp bạn xây dựng, quản lý và triển khai hiệu quả từ các ứng dụng di động đơn giản đến các giải pháp có quy mô lớn
1.2 Dịch vụ Microsoft Azure cung cấp:
● Dịch vụ máy tính Azure
Azure cung cấp dịch vụ cho các sản phẩm ở cấp độ xây dựng hoặc đang phát triển, xác định việc thực thi một ứng dụng được triển khai trong nền tảng Azure cung cấp.Máy ảo Azure: Là môi trường cho phép người dùng có trải nghiệm tương tự như khi
Trang 8và quản lý vòng đời của một ứng dụng.
Dịch vụ đám mây Azure: Tập trung vào các ứng dụng và hỗ trợ Java, PHP, Python, Ruby,…
Ứng dụng web Azure: Tạo và triển khai các ứng dụng web trên quy mô rất nhanh.Azure Mobile App: Sử dụng để xây dựng và lưu trữ phần phụ trợ cho bất kỳ ứng dụngnào trên thiết bị di động
Ứng dụng API: được sử dụng để xây dựng các API đám mây một cách dễ dàng.Azure Search: Cung cấp các dịch vụ tìm kiếm được quản lý hoàn toàn
Trung tâm thông báo: Được sử dụng để gửi thông báo đẩy đến bất kỳ nền tảng nào từ chương trình phụ trợ
- Ứng dụng Azure Logic: Đây là một dịch vụ đám mây sẽ giúp bạn tự động hóa quy trình làm việc, quy trình kinh doanh,…
- Azure Event Hub: Đây là tập hợp các sự kiện có thể lưu trữ
Trang 9Azure Virtual Network: Thực hiện cách ly và phân đoạn mạng lưới với các bộ lọc địnhtuyến lưu lượng, bao gồm Azure Connect cho phép thiết lập trình quản lý lưu lượng dựa trên IP.
Azure Load Balancer: Cân bằng tải lưu lượng truy cập đến các máy ảo và cô lập lưu lượng bên ngoài với một máy ảo khác
Azure Express Route: Cho phép bạn mở rộng mạng lưới hiện tại vào đám mây của Microsoft thông qua kết nối riêng tư
Azure CDN: Cải thiện việc phân phối nội dung và cho phép truyền tải nội dung bằng cách sử dụng vị trí của các địa điểm khác nhau được phân phối khắp các quốc gia.Azure VPN Gateway: Gửi lưu lượng được mã hóa qua một kết nối công cộng
● Dịch vụ lưu trữ Azure
Azure cung cấp các giải pháp lưu trữ bền hơn và bạn có thể xây dựng các ứng dụng quy mô lớn mà vẫn có thể mở rộng được quy mô lớn hơn nếu cần Kho lưu trữ của Azure tự cân bằng dữ liệu dựa trên lưu lượng truy cập
Azure Blob Storage: Azure tuân theo lưu trữ dưới dạng các đối tượng lớn nhị phân vớidịch vụ Blob, cung cấp cho bạn khả năng mô tả dữ liệu
Azure Queue Storage: Cho phép các ứng dụng giao tiếp thông qua việc trao đổi tin nhắn trên một hàng đợi, tránh trường hợp các tin nhắn bị mất hoặc không được xử lý.Azure File Storage: Cung cấp tính năng chia sẻ tệp trên đám mây bằng giao thức tiêu chuẩn
Azure Table Storage: Lưu trữ dữ liệu NoSQL bán cấu trúc trên đám mây
● Dịch vụ cơ sở dữ liệu Azure
Cơ sở dữ liệu Azure là một dịch vụ cơ sở dữ liệu quan hệ đáng tin cậy và an toàn, đồng thời mang lại hiệu suất cao mà bạn không phải lo lắng về bất kỳ cơ sở hạ tầng nào
➔ Azure Cosmos DB là dịch vụ cơ sở dữ liệu đa mô hình, được phân phối toàn cầu, độc quyền của Microsoft "để quản lý dữ liệu ở quy mô hành tinh" Azure Cosmos DB là kết quả của quá trình phát triển và nâng cấp từ Azure
DocumentDB: Một cơ sở dữ liệu NoSQL dưới dạng một quá trình trao đổi không có dữ liệu lược đồ, truy vấn phong phú và xử lý truy vấn
Trang 10➔ Azure Cosmos DB for MongoDB sẽ giúp bạn dễ dàng sử dụng Cosmos DB như thể nó chính là một cơ sở dữ liệu MongoDB Từ đó bạn có thể tận dụng kiến thức, trải nghiệm MongoDB của mình và tiếp tục sử dụng các trình điều khiển, SDK và công cụ MongoDB yêu thích của mình bằng cách sử dụng API
để kết nối với tài khoản MongoDB
➔ Azure SQL: Đây là một cơ sở dữ liệu quan hệ được lưu trữ trong Azure và được xây dựng trên các công nghệ máy chủ SQL, cung cấp cơ sở dữ liệu có thể
mở rộng, khả dụng cao và có khả năng chịu lỗi
➔ SQL Server: Là một máy chủ cơ sở dữ liệu, nó là một sản phẩm phần mềm có chức năng chính là lưu trữ và truy xuất dữ liệu theo yêu cầu của các ứng dụng phần mềm khác
➔ SQL Database: Cơ sở dữ liệu SQL hoặc cơ sở dữ liệu quan hệ là một tập hợp các bảng có cấu trúc cao, trong đó mỗi hàng phản ánh một thực thể dữ liệu và mỗi cột xác định một trường thông tin cụ thể Cơ sở dữ liệu quan hệ được xây dựng bằng ngôn ngữ truy vấn có cấu trúc (SQL) để tạo, lưu trữ, cập nhật và truy xuất dữ
➔ Azure Database for MySQL servers: Dễ dàng xây dựng hoặc di chuyển khối lượng công việc của bạn sang Cơ sở dữ liệu Azure cho MySQL Thiết lập, quản
lý và tự động hóa việc bảo trì máy chủ cơ sở dữ liệu của bạn, bao gồm cập nhậtđịnh kỳ, sao lưu và bảo mật Đạt được tổng chi phí sở hữu 1 thấp hơn 48 phần trăm và tiết kiệm với các phiên bản có thể bùng nổ hoặc khả năng dừng khởi động, chỉ trả tiền cho dung lượng lưu trữ khi cơ sở dữ liệu của bạn ngừng hoạt động
➔ Azure Database for MariaDB servers là một dịch vụ cơ sở dữ liệu quan hệ dựa trên công cụ Máy chủ MariaDB nguồn mở Đó là một cơ sở dữ liệu được quản
lý hoàn toàn dưới dạng dịch vụ cung cấp có thể xử lý khối lượng công việc quan trọng với hiệu suất có thể dự đoán được và khả năng mở rộng linh hoạt
➔ Azure Database for PostgreSQL servers là một dịch vụ cơ sở dữ liệu quan hệ dựa trên công cụ cơ sở dữ liệu mã nguồn mở Postgresql Đó là một cơ sở dữ liệu dưới dạng dịch vụ được quản lý hoàn toàn, có thể xử lý khối lượng công việc quan trọng với hiệu suất, bảo mật, tính sẵn sàng cao và khả năng mở rộng linh hoạt có thể dự đoán được
➔ Dedicated SQL pools ( trước đây Azure SQL Data Warehouse): lưu trữ dữ liệu
Trang 11trong các bảng quan hệ với lưu trữ dạng cột Định dạng này giảm đáng kể chi phí lưu trữ dữ liệu và cải thiện hiệu suất truy vấn Sau khi dữ liệu được lưu trữ, bạn có thể chạy phân tích ở quy mô lớn So với các hệ thống cơ sở dữ liệu truyền thống, các truy vấn phân tích kết thúc sau vài giây thay vì vài phút hoặc vài giờ thay vì vài ngày.
➔ Azure Synapse Analytics: một dịch vụ phân tích kết hợp kho dữ liệu doanh nghiệp và phân tích dữ liệu lớn Nó cho phép bạn tự do truy vấn dữ liệu theo điều kiện của mình, sử dụng các tùy chọn không có máy chủ hoặc chuyên dụng
—ở quy mô lớn Azure Synapse kết hợp những thế giới này lại với nhau bằng một trải nghiệm hợp nhất để thu thập, khám phá, chuẩn bị, chuyển đổi, quản lý
và cung cấp dữ liệu cho nhu cầu học máy và BI ngay lập tức
➔ Azure Database Migration Services: Dịch vụ di chuyển cơ sở dữ liệu Azure
là một công cụ giúp bạn đơn giản hóa, hướng dẫn và tự động hóa quá trình dichuyển cơ sở dữ liệu sang Azure Dễ dàng di chuyển dữ liệu, lược đồ và đối tượng của bạn từ nhiều nguồn sang đám mây trên quy mô lớn
➔ Azure Cache for Redis:Đây là một cấu trúc cơ sở dữ liệu thực hiện khóa giá trị với độ bền tùy chọn
➔ SQL Server stretch databases: là cơ sở dữ liệu kéo dài máy chủ SQL Cho phép bạn đưa cơ sở dữ liệu Stretch di chuyển dữ liệu lạnh của bạn một cách minh bạch và an toàn sang đám mây Microsoft Azure
➔ Data factories: dịch vụ ETL trên đám mây của Azure để mở rộng quy mô tổng hợp dữ liệu mà không cần máy chủ và chuyển đổi dữ liệu
➔ SQL elastic pools: một giải pháp đơn giản, hiệu quả về chi phí để quản lý và thay đổi quy mô nhiều cơ sở dữ liệu có nhu cầu sử dụng khác nhau và không thể đoán trước
➔ Virtual clusters: Cụm ảo là môi trường biệt lập chạy trong cụm Azure Kubernetes vật lý, tương tự như cách máy ảo chạy trong hệ thống ảo
➔ Managed databases: Xây dựng các ứng dụng gốc trên đám mây hoặc hiện đại hóa các ứng dụng hiện có với cơ sở dữ liệu linh hoạt, được quản lý đầy đủ Tậptrung vào phát triển ứng dụng, không phải quản lý cơ sở dữ liệu
➔ Elastic Job agents: Bạn có thể tạo và lên lịch các công việc đàn hồi có thể được
Trang 12thực thi định kỳ đối với một hoặc nhiều Azure SQL Database để chạy các truy vấn Transact-SQL (T-SQL) và thực hiện các tác vụ bảo trì.
➔ SQL managed instances: Là một phần của dòng Azure SQL, là một dịch vụ cơ
sở dữ liệu đám mây thông minh kết hợp khả năng tương thích rộng nhất của công cụ SQL Server với các lợi ích của một nền tảng cập nhật, được quản lý hoàn toàn dưới dạng một dịch vụ
➔ SQL virtual machines: một phần của Azure SQL Family Giảm tổng chi phí sở hữu (TCO)1 của bạn và nhận được tính năng quản lý tự động và bảo mật tích hợp sẵn miễn phí khi bạn đăng ký các máy ảo (VM) của mình với tiện ích mở rộng Đại lý IaaS của SQL Server mà không phải trả thêm phí
1.3 Ưu điểm Microsoft Azure
Ứng dụng lý tưởng cho bộ phận phát triển
Để có thể phát triển thành công một ứng dụng hay phần mềm cần trải qua rất nhiều công đoạn phức tạp Microsoft Azure sẽ là công cụ hữu ích giúp quá trình phát triển trở nên dễ dàng hơn Các plugin được tích hợp trong Microsoft Azure sẽ là giải pháp tuyệt vời cho các sản phẩm trên máy tính lẫn điện thoại Nhất là khi hệ thống bạn đang
sử dụng không có máy chủ hỗ trợ, Microsoft Azure sẽ giúp cải thiện năng suất, hạn chế quá tải và đẩy nhanh tiến độ
Plugin: là một phần mềm được viết ra để tích hợp vào trong website WordPressCác công cụ hỗ trợ trong Microsoft Azure liên tục được cập nhật và làm mới để bắt kịp tiến độ phát triển của công nghệ thời đại Một ưu điểm nữa là Azure có thể chạy trên bất kỳ stack nào, phù hợp hầu hết với các nền tảng phổ biến
Ví dụ, Azure thậm chí còn cung cấp trải nghiệm thiết bị chéo ngay cả trên nền tảng di động
Đám mây duy nhất bạn có thể tin tưởng
Một trong những nỗi lo nhất đối với các phần mềm từ bên thứ ba là bảo mật Microsoft Azure làm yên tâm người dùng với quy trình bảo mật vô cùng nghiêm khắc.Bạn có biết rằng, 90% công ty thuộc Fortune 500 quyết định lựa chọn Microsoft Azure nhờ ưu điểm này Trung tâm bảo mật Azure đảm bảo mọi liên lạc và giao dịch của bạn đều riêng tư
Tất cả công đoạn triển khai đều được Azure công khai minh bạch trước người dùng Azure cũng được công nhận là đám mây uy tín và đáng tin tưởng nhất tại các tổ chức
Trang 13chính phủ Hoa Kỳ Ngày càng cải thiện quy trình hoạt động, Microsoft Azure đang từng bước chạm đến những lĩnh vực công nghệ hiện đại mới, đạt được sự tin tưởng của phần lớn người dùng.
1.4 So sánh các nền tảng Big Data Framework: AWS, Azure, Google Cloud 1.4.1 Amazon Web Services (AWS):
● Người dùng của AWS:
Coursera: nhờ AWS, bạn có thể hỗ trợ quá trình giảng dạy và học tập, kết nối cộng đồng, đưa ra quyết định dựa trên dữ liệu để tiết kiệm tiền bạc và tài nguyên cũng như tăng tốc nỗ lực nghiên cứu
Netflix: nhờ AWS tạo ra hệ thống quản lý chi phí Netflix có một bảng điều khiển đóng vai trò như một vòng phản hồi cho các nhà sản xuất dữ liệu và người tiêu dùng đây là nguồn trung thực tổng thể duy nhất về chi phí và xu hướng sử dụng của người tiêu dùng dữ liệu của Netflix Họ chia nhỏ chi phí thành “đơn vị tài nguyên có ý nghĩa(bảng, chỉ mục, công việc…)” Tiếp đến là phân loại dữ liệu thanh toán AWS theo dịch vụ, chẳng hạn Amazon EC2 (Elastic Compute Cloud: tận dụng tối đa nguồn tài nguyên) và Amazon S3 (Simple Storage Service) Ở đây có thể tùy chỉnh mức độ chi tiết hơn cho mỗi cách
và mạng phân phối nội dung (CDN) đã được thêm vào hỗn hợp
● Dịch vụ điện toán đám mây:
VM (Phiên bản điện toán): EC2
*EC2: tận dụng tối đa nguồn tài nguyên
Trang 14PaaS: AWS Elastic Beanstalk ( dịch vụ dễ sử dụng để triển khai và nhân rộng các ứng dụng và dịch vụ web được phát triển bằng Java, NET, PHP, Node.js, Python, Ruby,
Go hoặc Docker trên các máy chủ quen thuộc như Apache, Nginx, Pasbah và IIS Bean Beanalk)
*PaaS cho phép người dùng lựa chọn các phần mềm mong muốn, triển khai
và sử dụng mà không cần quan tâm tới việc cập nhật các phiên bản mới, RAM,CPU,…
Container: AWS Elastic Container/ Dịch vụ Kubernetes
Serverless Functions: AWS lambda
* Hàm Serverless: là hàm lập trình được viết bởi nhà phát triển phần mềm → Được các công ty điện toán đám mây lưu trữ và duy trì trên cơ sở hạ tầng → Công ty này sẽ bảo trì và thực thi mã để nhà phát triển có thể tạo ra mã mới một cách nhanh chóng và
dễ dàng
* AWS lambda: nơi bạn có upload code lên → dịch vụ AWS lambda sẽ chạy code đó bằng cách sử dụng tài nguyên của AWS → Tạo một cái lambda function → AWS sẽ cung cấp và quản lý các server mà bạn sử dụng để chạy code
● Công cụ Clouding chính:
Trí tuệ nhân tạo và học máy: đã phát hành Gluon Thư viện học sâu mã nguồn mở này cho phép các nhà phát triển và những người không phải là nhà phát triển xây dựng mạng lưới thần kinh mà không cần có kiến thức trước về AI DeepLens là một máy ảnh hỗ trợ AI có thể tạo và triển khai các thuật toán máy học để nhận dạng ký tự quang học, nhận dạng hình ảnh và nhận dạng đối tượng
● Giá:
Đối với phiên bản nhỏ nhất: AWS tính phí khoảng 69 đô la Mỹ mỗi tháng cho phiên bản chính với hai CPU ảo và 8 gigabyte RAM
Đối với phiên bản lớn nhất: Phiên bản AWS đắt nhất, với 3,84 TB RAM và 128 CPU,
sẽ tiêu tốn của bạn khoảng 3,97 USD/giờ
● Ưu điểm và nhược điểm
Ưu điểm: Cung cấp hầu hết các dịch vụ, từ kết nối mạng đến robot, trưởng thành nhất,được coi là tốt nhất cho độ tin cậy và bảo mật, khả năng tính toán cao hơn Azure và GCP
Nhược điểm: Tất cả các nhà cung cấp phần mềm lớn cung cấp ứng dụng của họ trên
Trang 15dịch vụ hỗ trợ Nhà phát triển/Doanh nghiệp của AWS đều phải được thanh toán, số lượng lớn các dịch vụ và tùy chọn có sẵn có thể khiến người mới sử dụng choáng ngợp, có tương đối ít lựa chọn thay thế đám mây lai.
1.4.2 Microsoft Azure:
● Khái niệm:
Là nền tảng đám mây công cộng cung cấp các giải pháp cơ sở hạ tầng dưới dạng dịch
vụ (IaaS), nền tảng dịch vụ (PaaS) và phần mềm dưới dạng dịch vụ (SaaS) để phân tích, điện toán ảo, lưu trữ, kết nối mạng và các dịch vụ khác Nó có thể nâng cao hoặc thay thế máy chủ ngay lập tức
* IaaS chuyên cung cấp các tính năng cơ bản nhất như mạng, máy tính ảo,
không gian lưu trữ dữ liệu, CPU, RAM, HDD/SSD, Khi sử dụng dịch vụ này, người dùng đã có một máy chủ ảo trên không gian đám mây để làm việc Họ không cần phải quan tâm tới các khía cạnh khác như máy chủ nằm ở trung tâm dữ liệu nào, sử dụng mạng viễn thông nào,…
* PaaS cho phép người dùng lựa chọn các phần mềm mong muốn, triển khai
và sử dụng mà không cần quan tâm tới việc cập nhật các phiên bản mới, RAM,CPU,…
* SaaS (viết tắt cho Software As A Service), được gọi là Dịch vụ phần mềm.Với SaaS, Azure sẽ cung cấp cho bạn quyền truy cập vào phần mềm của ứngdụng Bạn không cần phải quan tâm về việc cài đặt, thiết lập hay thử nghiệmứng dụng, phần mềm Tất cả những điều đó sẽ được Dịch vụ phần mềm thựchiện và bạn chỉ cần kiếm khách hàng để trải nghiệm ứng dụng
● Người dùng của Microsoft Azure:
Bosch (Robert Bosch GmbH): đây là một trong những công ty công nghệ lớn nhất thế giới Tập đoàn Bosch tồn tại trên thị trường Việt Nam chủ yếu trong lĩnh vực sản phẩm gia dụng thiết bị nhà bếp
Audi: đây là hãng xe đến từ nước Đức Sử dụng AWS để tạo ra gói công nghệ “driver assistance systems”, hệ thống này bao gồm nhiều tính năng hỗ trợ người lái, giữ làn đường, tự động phanh, tự động đỗ xe Trong đó hệ thống lái trên 4 bánh đóng vai trò quan trọng trong những tình huống đỗ xe nơi chật hẹp khi kết hợp cùng cảm biến, camera, tín hiệu radar
Starbucks
Walmart
HP
…
Trang 16● Lịch sử:
Ban đầu được gọi là Azure, được thành lập vào năm 2010 để cung cấp các doanh nghiệp nền tảng đám mây Sau đó đến năm 2014, Azure được đổi tên thành “MicrosoftAzure”
● Dịch vụ điện toán đám mây:
VM: máy ảo Azure
PaaS: dịch vụ ứng dụng
Container: dịch vụ Azure Kubernetes (AKS)
* Dịch vụ Azure Kubernetes (AKS) dùng để phát triển và triển khai các ứng dụng gốc trên đám mây trong Azure, trung tâm dữ liệu hoặc ở vùng biên với các đường ống dẫn
mã đến đám mây và lan can bảo vệ được tích hợp sẵn Nhận quản lý và quản trị thống nhất cho các cụm Kubernetes tại chỗ, biên và đa đám mây Tương tác với các dịch vụ bảo mật, nhận dạng, quản lý chi phí và di chuyển của Azure
Serverless Functions: chức năng Azure
● Công cụ Clouding chính:
Dịch vụ nhận thức: API tìm kiếm trên web Bing, API khuôn mặt, API thị giác máy tính và Dịch vụ thị giác tùy chỉnh nằm trong số các dịch vụ nhận thức có sẵn Microsoft cung cấp nhiều dịch vụ và chức năng quản lý và phân tích IoT cũng như giải pháp điện toán không có máy chủ
Hỗ trợ phần mềm MSFT: Azure bao gồm một số giải pháp hỗ trợ các sản phẩm của Microsoft được cài đặt tại chỗ Windows Server Backup trong Windows Server 2012 R2 và Windows Server 2016 được liên kết với Azure Backup Các dự án Visual Studiođược lưu trữ trên Azure bởi Visual Studio Team Services
● Ưu điểm và nhược điểm:
Ưu điểm: Việc tích hợp và di chuyển các dịch vụ hiện tại của Microsoft rất đơn giản, nhiều tùy chọn có thể truy cập được, bao gồm các dịch vụ phân tích, học máy và trí tuệ nhân tạo tốt nhất trong lớp, hầu hết các dịch vụ đều ít tốn kém hơn khi so sánh với