1. Trang chủ
  2. » Luận Văn - Báo Cáo

MÔN CLOUD COMPUTING đ tài AWS comprehend

42 2 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề AWS Comprehend
Tác giả Huỳnh Tấn Lộc, Huỳnh Nguyễn Tấn Nhạc, Nguyễn Ngọc Gia Minh
Người hướng dẫn Cô Trương Thị Ngọc Phượng
Trường học Trường Đại Học Sư Phạm Kỹ Thuật Tp. Hồ Chí Minh
Chuyên ngành Công Nghệ Thông Tin
Thể loại báo cáo
Năm xuất bản 2021
Thành phố Tp. Hồ Chí Minh
Định dạng
Số trang 42
Dung lượng 1,91 MB

Cấu trúc

  • 1. Lý do chọn đề tài (0)
  • 2. Tổng quan đề tài (0)
  • 3. Phương pháp nghiên cứu (6)
    • 1.1 Khái ni m ........................................................................................... 5 ệ (8)
    • 1.2 L i ích s d ng AWS Comprehend ................................................. 5 ợ ử ụ (8)
    • 1.3 Các tr ườ ng h p s d ng AWS Comprehend ................................... 6 ợ ử ụ Ch ươ ng 2 Cách th c ho t đ ng c a AWS Comprehend ................................. 6ứạộủ (10)
    • 2.1 Các tr ườ ng h p s d ng AWS Comprehend ................................... 7 ợ ử ụ (12)
    • 2.2 Các tính năng (12)
    • 2.3 Các cách th c hi n v i AWS Comprehend ...................................... 7 ự ệ ớ (12)
    • 2.4 Các ngôn ng đ ữ ượ c h tr trong AWS Comprehend ...................... 7 ỗ ợ Ch ươ ng 3 Th c hành s d ng Amazon Comprehend t o chựử ụạ ươ ng tình phân tích văn b n ................................................................................................................ 8ả (12)
    • 3.1 Ch y th các d ch v c a Amazon Comprehend .................................. 8 ạ ử ị ụ ủ (14)
    • 3.2 Cài đ t AWS SDK cho python ............................................................... 12 ặ (22)
    • 3.3 T o bucket trên Amazon S3 đ l u tr t p tin ..................................... 17 ạ ể ư ữ ậ (32)
    • 3.4 Cài đ t boto3 và s d ng d ch v Amazon Comprehend ặ ử ụ ị ụ và Amazon S3 (34)

Nội dung

Phương pháp nghiên cứu

Khái ni m 5 ệ

Amazon Comprehend s d ng x lý ngôn ng t nhiên (NLP) đ trích xu t thông tin chi ti t ử ụ ử ữ ự ể ấ ế v n i dung c a tài li u Amazon Comprehend x lý b t kỳ t p văn b n nào đ nh d ng UTF- ề ộ ủ ệ ử ấ ệ ả ở ị ạ

8 và các tài liệu bán cấu trúc, như tài liệu PDF và Word, phát triển những hiểu biết sâu sắc về các yếu tố như thể thức, cảm xúc và các yếu tố phổ biến khác trong một tài liệu Sử dụng Amazon Comprehend giúp tạo ra sản phẩm mới dựa trên sự hiểu biết về cấu trúc của tài liệu.

Sử dụng Amazon Comprehend, bạn có thể tìm kiếm các nguồn cấp dữ liệu mạng xã hội để thu thập thông tin liên quan đến sản phẩm, đồng thời quét toàn bộ kho tài liệu để phát hiện các cảm tính chính Amazon Comprehend bao gồm các thành phần như phân tích ngữ nghĩa, nhận diện thực thể, và phân loại văn bản.

● Thực thể - Amazon Comprehend trả về danh sách các thực thể, chẳng hạn như người, địa điểm và vị trí, được xác định trong tài liệu

● Cụm từ khóa - Amazon Comprehend trích xuất các cụm từ khóa xuất hiện trong tài liệu

Amazon Comprehend sử dụng công nghệ phân tích tài liệu để nhận diện thông tin cá nhân (PII) có thể dẫn đến việc xác định danh tính cá nhân, bao gồm các dữ liệu như địa chỉ, số tài khoản ngân hàng và số điện thoại.

● Ngôn ngữ - Amazon Comprehend xác định ngôn ngữ chính trong tài liệu và có thể xác định lên tới 100 ngôn ngữ.

● Cảm xúc – Amazon Comprehend xác định cảm xúc của một tài liệu,có thể tích cực, tiêu cực hoặc hỗn hợp.

● Cú pháp - Amazon Comprehend phân tích cú pháp từng từ trong tài liệu của bạn và xác định phần lời nói của từ đó.

L i ích s d ng AWS Comprehend 5 ợ ử ụ

M t s l i ích c a vi c s d ng AWS Comprehend bao g m : ộ ố ợ ủ ệ ử ụ ồ

Tích hợp khả năng xử lý ngôn ngữ tự nhiên vào ứng dụng của bạn với Amazon Comprehend, giúp đơn giản hóa việc phân tích văn bản thông qua một API dễ sử dụng Bạn không cần có kiến thức chuyên môn về phân tích văn bản để khai thác thông tin chi tiết mà Amazon Comprehend cung cấp.

AWS Comprehend is a powerful natural language processing service that uses machine learning to uncover insights and relationships in text It enables users to analyze large volumes of unstructured data, extracting key phrases, entities, and sentiment By leveraging AWS Comprehend, businesses can enhance their data-driven decision-making processes and improve customer experiences through better understanding of feedback and interactions Its integration capabilities with other AWS services streamline workflows, making it an essential tool for organizations looking to harness the power of cloud computing for text analysis.

Lambda cho phép lưu trữ tài liệu trong Amazon S3 và phân tích dữ liệu thời gian thực với Kinesis Data Firehose Tính năng hỗ trợ AWS Identity và Access Management (IAM) giúp bạn kiểm soát quyền truy cập an toàn vào các hoạt động của Amazon Bằng cách sử dụng IAM, bạn có thể tạo và quản lý người dùng cũng như nhóm AWS, từ đó cấp quyền truy cập phù hợp cho các nhà phát triển và người dùng cuối.

Amazon S3 cho phép mã hóa tài liệu đầu vào, trong khi Amazon Comprehend mở rộng khả năng này bằng cách sử dụng khóa KMS riêng Bạn có thể mã hóa không chỉ kết quả đầu ra của công việc mà còn cả dữ liệu lưu trữ liên quan đến phiên bản máy tính xử lý công việc phân tích, từ đó nâng cao đáng kể khả năng bảo mật.

● Chi phí thấp — Với Amazon Comprehend, bạn chỉ trả tiền cho các tài liệu mà bạn phân tích Không có phí tối thiểu hoặc cam kết trả trước.

Các tr ườ ng h p s d ng AWS Comprehend 6 ợ ử ụ Ch ươ ng 2 Cách th c ho t đ ng c a AWS Comprehend 6ứạộủ

- Khai thác n i dung phân tích t ng đài ộ ổ

Phát hi n c m xúc và phân tích các t ệ ả ươ ng tác c a khách hàng đ c i thi n s n ph m và d ch ủ ể ả ệ ả ẩ ị v c a b n ụ ủ ạ

- L p ch m c và tìm ki m các bài đánh giá s n ph m ậ ỉ ụ ế ả ẩ

T p trung vào ng c nh b ng cách trang b cho công c tìm ki m c a b n kh năng l p ch ậ ữ ả ằ ị ụ ế ủ ạ ả ậ ỉ m c các c m t , th c th và c m nghĩ quan tr ng, ch không ch là t khóa ụ ụ ừ ự ể ả ọ ứ ỉ ừ

T đ ng phân lo i các tài li u h tr g i đ n, ch ng h n nh đánh giá s n ph m và trích xu t ự ộ ạ ệ ỗ ợ ử ế ẳ ạ ư ả ẩ ấ thông tin liên quan đ gi i quy t v n đ c a khách hàng nhanh h n ể ả ế ấ ề ủ ơ

Các tài liệu về tài chính có thể được phân loại thành nhiều loại khác nhau, bao gồm thông tin chuyên sâu và dữ liệu liên quan Việc đào tạo các thực thể tùy chỉnh giúp trích xuất thông tin một cách hiệu quả từ các nguồn tài liệu tài chính, bao gồm báo giá, báo hiểm và các gói dịch vụ.

Ch ươ ng 2: Cách th c ho t đ ng c a AWS Comprehend ứ ạ ộ ủ

AWS Comprehend is a powerful tool for natural language processing that enables users to extract insights from text By leveraging machine learning, it can identify key phrases, sentiments, and entities within documents, making it easier to analyze large volumes of data This service is particularly beneficial for businesses looking to enhance their data analysis capabilities and improve decision-making processes With AWS Comprehend, organizations can gain a deeper understanding of customer feedback, social media interactions, and other textual data, ultimately driving better outcomes.

Các tr ườ ng h p s d ng AWS Comprehend 7 ợ ử ụ

Amazon Comprehend là một mô hình học máy được đào tạo để kiểm tra và phân tích dữ liệu học tập từ các tài liệu, nhằm thu thập thông tin chi tiết Mô hình này hoạt động liên tục trên một phần lớn văn bản mà không cần cung cấp dữ liệu đào tạo bổ sung Amazon Comprehend có khả năng kiểm tra và phân tích tài liệu bằng nhiều ngôn ngữ khác nhau, tùy thuộc vào tính năng cụ thể của nó.

Các tính năng

V i Amazon Comprehend, b n có th th c hi n nh ng vi c sau trên tài li u c a mình: ớ ạ ể ự ệ ữ ệ ệ ủ

- Phát hiện ngôn ngữ trọng yếu

- Phát hiện các cụm từ chính

- Phát hiện thông tin nhận dạng cá nhân

- Mô hình hoá chủ đề

Các cách th c hi n v i AWS Comprehend 7 ự ệ ớ

M i thao tác có th đ ỗ ể ượ c x lý theo m t s cách: ử ộ ố

- Xử lý một tài liệu - gọi Amazon Comprehend với một tài liệu duy nhất và nhận được phản hồi đồng bộ

- Xử lý đồng bộ nhiều tài liệu - gọi Amazon Comprehend với bộ sưu tập lên đến 25 tài liệu và nhận được phản hồi đồng bộ

Xử lý hàng loạt không đồng bộ cho phép bạn đặt một bộ sưu tập tài liệu vào nhóm Amazon S3 và khởi động quy trình phân tích tài liệu một cách không đồng bộ Kết quả của quá trình phân tích sẽ được trả về trong bucket S3.

Các ngôn ng đ ữ ượ c h tr trong AWS Comprehend 7 ỗ ợ Ch ươ ng 3 Th c hành s d ng Amazon Comprehend t o chựử ụạ ươ ng tình phân tích văn b n 8ả

AWS Comprehend is a powerful cloud-based natural language processing (NLP) service that enables users to analyze and understand text data It utilizes machine learning to identify key phrases, sentiments, and language, making it easier for businesses to extract insights from large volumes of unstructured data By leveraging AWS Comprehend, organizations can enhance their data-driven decision-making processes and improve customer experiences through better understanding of customer feedback and trends This service is scalable and integrates seamlessly with other AWS services, providing a comprehensive solution for text analysis in various applications.

Ch ươ ng 3: Th c hành s d ng Amazon Comprehend t o ch ự ử ụ ạ ươ ng trình phân tích văn b n ả

Ch y th các d ch v c a Amazon Comprehend 8 ạ ử ị ụ ủ

T i trang Amazon Comprehend ch n Launch Amazon Comprehend ạ ọ

T o file TestComprehend.txt sau đó t i trang Amazon S3 ch n Upload ạ ạ ọ

AWS Comprehend is a powerful natural language processing (NLP) service offered by Amazon Web Services (AWS) that enables users to analyze and understand text data By leveraging machine learning, AWS Comprehend can identify key phrases, sentiment, entities, and language within documents, facilitating better data insights This service is particularly beneficial for businesses looking to extract valuable information from unstructured text, such as customer feedback or social media interactions Additionally, AWS Comprehend supports multiple languages, making it a versatile tool for global applications With its scalable architecture, organizations can easily integrate it into their existing workflows to enhance decision-making and improve customer experiences.

Ch n Add files -> Upload đ t i file TestComprehend.txt lên ọ ể ả

T i Dashboard bên trái c a Amazon Comprehend ch n Analysis jobs -> Create job ạ ủ ọ

AWS Comprehend is a powerful cloud computing service that utilizes natural language processing (NLP) to extract insights from text It enables businesses to analyze and understand large volumes of unstructured data efficiently By leveraging machine learning, AWS Comprehend can identify key phrases, sentiments, and topics, helping organizations make data-driven decisions This service is highly scalable and integrates seamlessly with other AWS services, making it a valuable tool for enhancing data analysis capabilities.

Ch n file input t S3 và n i output ọ ừ ơ

AWS Comprehend is a powerful cloud-based natural language processing (NLP) service that enables users to uncover insights and relationships in text By leveraging machine learning, AWS Comprehend can analyze text to identify key phrases, sentiment, and entities, making it an essential tool for businesses seeking to enhance their data analysis capabilities With its ability to process large volumes of text efficiently, AWS Comprehend supports various applications, from customer feedback analysis to content categorization This service not only improves decision-making but also enhances customer experiences by providing deeper insights into their needs and preferences.

N u quá trình phân tích hoàn thành thì t i c t status s hi n ch Completed ế ạ ộ ẽ ệ ữ

AWS Comprehend is a powerful cloud computing service that leverages natural language processing (NLP) to analyze and interpret text data It enables businesses to gain insights from unstructured data, such as customer feedback and social media interactions By utilizing machine learning algorithms, AWS Comprehend can identify key phrases, sentiments, and entities within text, enhancing data-driven decision-making This service is scalable and integrates seamlessly with other AWS offerings, making it an ideal solution for organizations looking to harness the power of data analytics in their operations.

Sau khi download và gi i nén thì s th y đ ả ẽ ấ ượ c k t qu phân tích ế ả

Cài đ t AWS SDK cho python 12 ặ

1.1 Tạo khóa truy cập của tài khoảnTrong options c a tài kho n ch n ủ ả ọ Security credentials

AWS Comprehend is a powerful cloud computing service that enables users to analyze and understand text data It utilizes machine learning to identify key phrases, sentiments, and entities within documents, making it an essential tool for businesses looking to extract valuable insights from their data With its ability to process large volumes of text efficiently, AWS Comprehend supports various applications, including customer feedback analysis, content categorization, and more By leveraging this service, organizations can enhance their decision-making processes and improve customer experiences.

T i trang Your ạ Security Credentials ch n ọ Access keys (access key ID and secret access key)

-> Create New Access Key -> Show Access Key ho c ặ Download Key File đ xem thông tin ể v Access Key ID và Secret Access Key ề

Amazon Web Services (AWS) Comprehend is a powerful natural language processing (NLP) service that enables users to analyze and understand text data By leveraging machine learning, AWS Comprehend can identify key phrases, sentiment, entities, and language within documents, providing valuable insights for businesses This service streamlines the process of extracting meaningful information from large volumes of text, enhancing decision-making and improving customer experiences With its scalability and integration capabilities, AWS Comprehend is an essential tool for organizations looking to harness the power of cloud computing and data analysis.

B ướ c 1 đi n User name và tích vào ô Access key – Programmatic -> Next: Permissions ề

AWS Comprehend is a powerful natural language processing service that enables users to analyze and understand text data By leveraging machine learning, it can identify key phrases, sentiment, entities, and language, making it an essential tool for businesses looking to extract insights from unstructured data With AWS Comprehend, organizations can enhance their data analytics capabilities, streamline processes, and improve decision-making by uncovering valuable information from vast amounts of text This service is scalable, cost-effective, and easy to integrate with other AWS services, providing a comprehensive solution for text analysis in the cloud.

AWS Comprehend is a powerful cloud computing service that utilizes natural language processing to analyze and understand text It enables users to extract insights and identify key phrases, entities, and sentiments from large volumes of unstructured data By leveraging machine learning, AWS Comprehend helps organizations enhance their data-driven decision-making processes Additionally, it offers features such as topic modeling and language detection, making it a versatile tool for businesses looking to gain deeper insights from their textual information.

B ướ c 5 t o user thành công ch n Download csv đ l u thông tin v user ạ ọ ể ư ề

AWS Comprehend is a powerful tool within cloud computing that enables users to analyze and understand text data It utilizes natural language processing (NLP) to extract insights, identify key phrases, and classify documents efficiently By leveraging machine learning, AWS Comprehend helps businesses gain valuable insights from their unstructured data, enhancing decision-making processes This service is scalable and integrates seamlessly with other AWS offerings, making it an essential resource for organizations looking to harness the power of data analytics in the cloud.

T o bucket trên Amazon S3 đ l u tr t p tin 17 ạ ể ư ữ ậ

Truy c p d ch v Amazon S3, ch n Create bucket ậ ị ụ ọ

Nh p tên bucket và khu v c sau đó ch n Create bucket ậ ự ọ

AWS Comprehend is a powerful tool in cloud computing that enables users to analyze and understand natural language By leveraging machine learning, AWS Comprehend can extract insights from text, identify sentiment, and categorize content effectively This service is essential for businesses looking to enhance their data processing capabilities and improve decision-making With its scalable architecture, AWS Comprehend supports various applications, making it a valuable asset for organizations aiming to harness the power of data analytics.

Cài đ t boto3 và s d ng d ch v Amazon Comprehend ặ ử ụ ị ụ và Amazon S3

S d ng l nh “pip install boto3” đ cài đ t package boto3 ử ụ ệ ể ặ

T i file ch ạ ươ ng trình, g i các hàm c a package boto3 đ s d ng d ch v c a Amazon ọ ủ ể ử ụ ị ụ ủ

Các API của Amazon Comprehend bao gồm: detect_dominant_language() để nhận diện ngôn ngữ của văn bản, detect_entities() để nhận diện các thực thể trong văn bản, detect_key_phrases() để nhận diện các cụm từ chính của văn bản, và detect_pii_entities() để nhận diện các thông tin cá nhân có trong văn bản.

AWS Comprehend is a powerful cloud computing service that utilizes natural language processing to analyze and understand text It enables businesses to extract valuable insights from their data, such as sentiment analysis, entity recognition, and key phrase extraction By leveraging machine learning, AWS Comprehend can process large volumes of text efficiently, helping organizations make data-driven decisions This service is essential for enhancing customer experiences and optimizing business operations through actionable insights derived from textual data.

Sentiment Score: hi n th s đi m c m xúc c a văn b n ể ị ố ể ả ủ ả Entities: hi n th danh sách th c th , lo i th c th , v trí b t đ u và k t thúc c a các th c th ể ị ự ể ạ ự ể ị ắ ầ ế ủ ự ể trong văn b n ả

Trong danh sách các thông tin chính của văn bản, vị trí bắt đầu và kết thúc của các từ khóa cần được xác định rõ ràng Điều này giúp người đọc dễ dàng nhận diện các loại thông tin liên quan đến con người, từ đó cải thiện khả năng tìm kiếm và tối ưu hóa nội dung cho SEO Việc sắp xếp và trình bày thông tin một cách hợp lý sẽ nâng cao trải nghiệm người dùng và tăng cường hiệu quả truyền tải thông điệp của văn bản.

Syntax: hi n th danh sách các ký t , lo i ký t , v trí b t đ u và k t thúc c a các ký t cú ể ị ự ạ ự ị ắ ầ ế ủ ự pháp trong văn b n ả

AWS Comprehend is a powerful cloud computing service that enables users to analyze and understand text data By leveraging natural language processing (NLP), it can identify key phrases, sentiments, and entities within documents, making it an essential tool for businesses looking to gain insights from their data With its ability to process large volumes of text efficiently, AWS Comprehend enhances data-driven decision-making and supports various applications, from customer feedback analysis to content categorization This service exemplifies the capabilities of modern cloud computing, providing scalable and flexible solutions for organizations of all sizes.

Các file d li u đ u ra s đ ữ ệ ầ ẽ ượ ư ạ c l u t i th m c c a ng d ng ư ụ ủ ứ ụ

AWS Comprehend is a powerful cloud computing service that utilizes natural language processing to analyze and understand text It enables users to extract insights, such as sentiment, key phrases, and entities, from large volumes of unstructured data By leveraging machine learning, AWS Comprehend helps organizations enhance their data-driven decision-making processes This service is ideal for businesses looking to improve customer experience and optimize operations through advanced text analysis With its scalable and flexible architecture, AWS Comprehend can efficiently handle diverse data sources, making it a valuable tool for modern enterprises.

Các file đã đ ượ c upload lên Amazon S3

AWS Comprehend is a powerful cloud computing service that utilizes natural language processing to analyze and understand text It enables users to extract insights, identify key phrases, and determine sentiment from large volumes of unstructured data By leveraging machine learning, AWS Comprehend helps businesses enhance their data analysis capabilities, improve customer engagement, and make informed decisions based on textual information This service is essential for organizations looking to harness the potential of their data and gain a competitive edge in today's digital landscape.

Ngày đăng: 24/12/2023, 10:37

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w