Kết quả thu được bộ dữ liệu 3848 địa điểm.
Nhóm đã sử dụng excel để thống kê các địa điểm và sắp xếp theo thứ tự giảm dần số lượt nhắc đến.
Chúng tơi thực hiện chỉnh sửa một số sai sót và kết quả tạo ra được bộ dữ liệu các địa điểm và số lượt được nhắc đến.
Hình 3. 10 Thống kê các địa điểm du lịch trong các bài báo bằng excel
Bước 5: Sử dụng R để wordcloud dữ liệu và tiến hành vẽ biểu đồ những địa điểm được nhắc tới nhiều nhất
Code R – wordcloud bộ dữ liệu
Hình 3. 12 Code R – wordcloud bộ dữ liệu
Kết quả thu được:
Chúng tôi tiến hành export ra file PDF để tiện lưu lại và phục vụ q trình phân tích tiếp theo.
Hình 3. 14 Kết quả wordcloud các địa điểm
Có thể dễ dàng nhận thấy những địa điểm được nhắc đến nhiều nhất sau khi wordcloud bộ dữ liệu thu được.
Top các địa điểm được nhắc đến nhiều nhất Island America Heathrow England Atlantic Gatwick France Britain Ireland Europe London UK 0 20 40 60 80 100 120 140 Series1
Hình 3. 15 Biểu đồ top địa điểm được nhắc đến nhiều nhất
Biểu đồ độ phủ của 5 quốc gia được nhắc đến nhiều nhất.
Độ phủ của 5 nước được nhắc đến nhiều nhất
10% 13% 46% 14% 17% UK Ireland
Hình 3. 16 Biểu đồ độ phủ của 5 quốc gia được nhắc đến nhiều nhất
Từ bộ dữ liệu và thông tin thu được sau khi tiến hành wordcloud, chúng tôi lọc lấy 10 nước được nhắc đến nhiều nhất và tiến hành lấy Tweet về các địa điểm đó.
Từ các biểu đồ trên có thể nhận thấy được những địa điểm được mọi người quan nhất, trong đó UK được nhắc đến nhiều nhất với 46%