Lấy dữ liệu thu thập được trên twitter tiến hành phân độ tích cực tiêu cực từ tweet

Một phần của tài liệu PHÂN TÍCH dữ LIỆU MẠNG xã hội và WEBSITE để xây DỰNG bộ DANH SÁCH NHỮNG địa điểm DU LỊCH TIỀM NĂNG và AN TOÀN (Trang 30 - 38)

từ tweet.

Lấy dữ liệu từ Twitter bằng ngôn ngữ python trên Google Colab:

Lấy 100 tweet của 10 nước có tầng số xuất hiện nhiều nhất trên các bài báo liên quan đến du lịch.

Bước 1: Lấy API Twitter

Để thiết lập các API, đăng nhập tài khoản của bạn tại Twiter và truy cập https://apps.twitter.com/app/new.

Hình 3. 17 Bước 1 Lấy API Twitter

Đồng ý với Điều khoản và điều kiện rồi và nhấp vào “Tạo ứng dụng Twitter của bạn”

Hình 3. 18 Bước 2 lấy API Twitter

Twiter sẽ thơng báo các khố API kết nối. Lưu lại Consumer Key (Key API) và Consumer Secret cẩn thận để sử dụng sau này.

Hình 3. 19 Bước 3 lấy API Twitter

Bước 2: Sử dụng Google Colab với ngôn ngữ Python để lấy bộ dữ liệu Tweet về các địa điểm

Hình 3. 20 Code lấy tweet

- Kết quả thu được:

Hình 3. 21 Bộ dữ liệu thu được từ Twitter

Hình 3. 22 Dữ liệu thu được

Bước 3: Thống kê lại những ý tích cực và tiêu cực

Với kết quả thu được, chúng tôi tiến hành làm sạch dữ liệu và chỉnh sửa những lỗi trước khi tiến hành đánh giá bộ dữ liệu. Ngơn ngữ sử dụng Eclipse

Hình 3. 23 Code làm sạch dữ liệu

Hình 3. 24 Dữ liệu sau khi làm sạch

Hình 3. 25 Code đánh giá và thống kê

- Kết quả thu được:

 Tweet về America

Hình 3. 26 Kết quả đánh giá America

 Tweet về Australia

Hình 3. 27 Kết quả đánh giá Australia

 Tweet về Brazil

Hình 3. 28 Kết quả đánh giá Brazil

 Tweet về Canada

Hình 3. 29 Kết quả đánh giá Canada

 Tweet về France

Hình 3. 30 Kết quả đánh giá France

 Tweet về Iceland

Hình 3. 31 Kết quả đánh giá Iceland

 Tweet về india

Hình 3. 32 Kết quả đánh giá India

 Tweet về Spain

Hình 3. 33 Kết quả đánh giá Spain

 Tweet về UK

Hình 3. 34 Kết quả đánh giá UK

Một phần của tài liệu PHÂN TÍCH dữ LIỆU MẠNG xã hội và WEBSITE để xây DỰNG bộ DANH SÁCH NHỮNG địa điểm DU LỊCH TIỀM NĂNG và AN TOÀN (Trang 30 - 38)

Tải bản đầy đủ (DOCX)

(46 trang)
w