Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 89 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
89
Dung lượng
3,11 MB
Nội dung
ĐẠI HỌC QUỐC GIA TP HCM TRƯỜNG ĐẠI HỌC BÁCH KHOA - NGUYỄN BÌNH LONG NHẬN DIỆN CÁC VIDEO CĨ YẾU TỐ CHÍNH TRỊ VIỆT NAM TRÊN MẠNG XÃ HỘI TIKTOK Chuyên ngành: Khoa Học Máy Tính Mã số: 8.48.01.01 LUẬN VĂN THẠC SĨ TP HỒ CHÍ MINH, tháng năm 2022 CƠNG TRÌNH ĐƯỢC HỒN THÀNH TẠI: TRƯỜNG ĐẠI HỌC BÁCH KHOA –ĐHQG -HCM Cán hướng dẫn khoa học 1: PGS.TS Đặng Trần Khánh Cán hướng dẫn khoa học 2: PGS.TS Lê Hồng Trang Cán chấm nhận xét 1: TS Đặng Trần Trí Cán chấm nhận xét 2: PGS.TS Nguyễn Tuấn Đăng Luận văn thạc sĩ bảo vệ Trường Đại học Bách Khoa, ĐHQG Tp Hồ Chí Minh ngày 21 tháng năm 2022 Thành phần Hội đồng đánh giá luận văn thạc sĩ gồm: PGS.TS Trần Minh Quang - Chủ tịch TS Phan Trọng Nhân - Thư ký TS Đặng Trần Trí - GV Phản biện PGS.TS Nguyễn Tuấn Đăng - GV Phản biện PGS.TS Lê Hồng Trang - Ủy viên Xác nhận Chủ tịch Hội đồng đánh giá LV Trưởng Khoa quản lý chuyên ngành sau luận văn sửa chữa (nếu có) CHỦ TỊCH HỘI ĐỒNG TRƯỞNG KHOA KHOA HỌC VÀ KỸ THUẬT MÁY TÍNH ĐẠI HỌC QUỐC GIA TP.HCM TRƯỜNG ĐẠI HỌC BÁCH KHOA CỘNG HOÀ XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập – Tự – Hạnh phúc NHIỆM VỤ LUẬN VĂN THẠC SĨ Họ tên học viên: Nguyễn Bình Long Ngày, tháng, năm sinh: 03/05/1992 Chuyên ngành: Khoa học máy tính MSHV: 1870570 Nơi sinh: Quảng Ngãi Mã số: 8.48.01.01 I TÊN ĐỀ TÀI: Nhận diện video có yếu tố trị Việt Nam mạng xã hội Tiktok / Identifying Viet Nam politcal video contents on TikTok social Network II NHIỆM VỤ VÀ NỘI DUNG: Thực việc thu thập liệu gồm video có yếu tố trị phi trị, tìm hiểu cơng trình nghiên cứu sử dụng mơ hình học sâu kết hợp đa mơ hình để phân loại video Đề xuất, xây dựng thử nghiệm mơ hình học sâu phù hợp để giải toán đề tài III NGÀY GIAO NHIỆM VỤ: 14/02/2022 IV NGÀY HOÀN THÀNH NHIỆM VỤ: 30/06/2022 V CÁN BỘ HƯỚNG DẪN: PGS.TS Đặng Trần Khánh – PGS.TS Lê Hồng Trang CÁN BỘ HƯỚNG DẪN I CÁN BỘ HƯỚNG DẪN II (Họ tên chữ ký) (Họ tên chữ ký) PGS.TS Đặng Trần Khánh Tp Hồ Chí Minh, ngày tháng năm 2022 CHỦ NHIỆM BỘ MƠN ĐÀO TẠO (Họ tên chữ ký) PGS.TS Lê Hồng Trang TRƯỞNG KHOA KHOA HỌC & KỸ THUẬT MÁY TÍNH (Họ tên chữ ký) i LỜI CẢM ƠN Đầu tiên, tơi xin bày tỏ lịng biết ơn sâu sắc tới PGS.TS Đặng Trần Khánh PGS.TS Lê Hồng Trang, người hướng dẫn tơi suốt q trình thực luận văn đề cương Nhờ có dẫn góp ý thầy mà tơi hồn thành tốt đề tài luận văn Tôi xin gửi lời cảm ơn đến quý thầy cô khoa Khoa học Kỹ thuật máy tính truyền thụ kiến thức, kinh nghiệm quý báu cho hai năm qua Xin gửi lời tri ân đến tất thành viên nhóm DSTAR LAB thầy Khánh giúp đỡ hỗ trợ suốt trình học tập thực luận văn Cuối cùng, xin gửi lời cảm ơn chân thành đến gia đình bạn bè, người động viên, ủng hộ suốt thời gian học Cao học Tp Hồ Chí Minh, ngày tháng năm 2022 ii TÓM TẮT LUẬN VĂN Với việc đời luật “An ninh mạng Việt Nam năm 2018”, chủ đề nhà quản lý quan tâm phân loại tự động video thành danh mục trị chủ đề khác để bước đầu xử lý nắm bắt xảy mạng internet nói chung mạng xã hội Tiktok nói riêng Các video chứa đựng nhiều đặc trưng như: hình ảnh, văn bản, âm đặc trưng chứa thơng tin có giá trị Để nâng cao khả phân loại, điều cần thiết phải phân tích hiệu tất thơng tin trích xuất từ đặc trưng khác nhau, hầu hết mô hình học tập bỏ qua số đặc trưng tập trung vào phương thức Trong đề tài này, trình bày framework kết hợp đa mơ hình học tập có giám sát dựa nhiều đặc trưng để phân loại hiệu video có yếu tố trị Trong đó, sử dụng kỹ thuật Word Embedding FastText để phân tích văn bản, mơ hình CNN huấn luyện trước gồm: Inception-V3, MTCNN, VGG-Face để trích xuất đặc trưng hình ảnh gương mặt, sau đó, kỹ thuật kết hợp chậm dựa mơ hình Light GBM sử dụng để tổng hợp thông tin phân loại cấp độ video Framework phân loại video đặc trưng bị thiếu cách sử dụng đặc trưng lại Framework áp dụng cho tập liệu chứa 10.000 videos trị phi trị thu thập từ Tiktok Các kết thử nghiệm framework cho kết tốt so với số mơ hình dựa đặc trưng riêng lẻ, phương pháp kết hợp thông thường Cụ thể độ xác tốt framework đạt 0.93, phương pháp kết hợp sử dụng logistic regression đạt 0.92, mơ hình dựa đặc trưng văn bản, gương mặt, hình ảnh 0.88, 0.68, 0.88 iii ABSTRACT With the introduction of “Law On Cybersecurity 2018”, the most concerned topic of the managers is political video classification system, gasping the activities on the internet as we as Tiktok These videos contain a lot of features like images, texts, and audio Each of these features is very informative To improve the classification, the effective usage of all features is required However, most of current systems only make use of only one feature In this thesis, I propose a framework that utilizing multiple model based on different features to effectively classify political video We have used Word Embedding for text analysis, CNN models that included Inception-V3, MTCNN, and VGG-Face for facial and image feature extraction, after that slow fusion based on Light GBM is used for information aggregation and classification Framework can analyze a video when some features are missing by using the remaining features Framework has been applied to a dataset with 10,000 political and non-political video collected from TikTok The results of framework are shown to be better than some models based on a single feature as well as traditional combination method The accuracy of framework is 0.93, while the accuracy of logistic regression is 0.92 and the models based on text, facial, and image feature is 0.88, 0.68, and 0.88 respectively iv LỜI CAM ĐOAN Tôi xin cam đoan luận văn “Nhận diện video có yếu tố trị Việt Nam mạng xã hội Tiktok” kết nghiên cứu tơi hướng dẫn, góp ý PGS.TS Đặng Trần Khánh PGS.TS Lê Hồng Trang Những thông tin tham khảo từ cơng trình khác có liên quan ghi rõ luận văn Nội dung nghiên cứu kết tơi thực hiện, khơng chép hay lấy từ nguồn khác Tơi xin chịu tồn trách nhiệm lời cam đoan Tp Hồ Chí Minh, ngày Học Viên tháng Nguyễn Bình Long v năm 2022 MỤC LỤC NHIỆM VỤ LUẬN VĂN THẠC SĨ i LỜI CẢM ƠN ii TÓM TẮT LUẬN VĂN iii ABSTRACT iv LỜI CAM ĐOAN v DANH MỤC HÌNH VẼ ix DANH MỤC BẢNG x DANH MỤC MÃ CHƯƠNG TRÌNH xi DANH MỤC CHỮ VIẾT TẮT xii GIỚI THIỆU 1.1 Tổng quan đề tài 1.2 Tính ứng dụng đề tài 1.3 Mục tiêu giới hạn đề tài 1.3.1 Mục tiêu 1.3.2 Giới hạn đề tài 1.4 Cấu trúc luận văn KIẾN THỨC NỀN TẢNG 2.1 Mạng nơron nhân tạo (Artificial Neural Network – ANN) 2.1.1 Giới thiệu 2.1.2 Các hàm kích hoạt (Activation function) 10 2.1.3 Hàm chi phí mát 12 2.1.4 Các kỹ thuật xử lý với mạng nơ ron 13 2.2 Mạng nơ ron tích chập (Convolutional Neural Network - CNN) 15 2.2.1 Lớp tích chập – Convolution layer 15 2.2.2 Lớp gộp – Pooling layer 16 2.2.3 Lớp kết nối đầy dủ – Fully connected layer 16 2.3 Kiến trúc mô hình mạng chuyển đổi đa tác vụ (Multi-task Cascaded Convolutional Networks - MTCN) 17 2.4 Tổng quan kiến trúc mơ hình xác minh khuôn mặt DeepFace 21 2.5 Tổng quan kiến trúc mơ hình Inception-V3 22 2.6 Mơ hình Word Embedding 27 2.6.1 Mơ hình Word2Vec 29 2.6.2 CBOW model 30 vi 2.6.3 Skip-gram model 30 2.6.4 Mô hình FastText 31 2.7 Các chiến lược kết hợp nhiều mơ hình phân loại video 32 CÁC CƠNG TRÌNH LIÊN QUAN 34 3.1 Phân loại video quy mô lớn với mạng nơ ron tích chập (CNN) 34 3.2 Phân loại video quy mô lớn dựa đặc trưng văn 36 3.3 Phương pháp kết hợp nhiều mơ hình học sâu để phân loại video 37 PHƯƠNG PHÁP THỰC HIỆN 40 4.1 Phương pháp thu thập xử lý liệu 40 4.1.1 Phương pháp thu thập liệu 40 4.1.2 Phương pháp xử lý liệu văn 41 4.1.3 Phương pháp xử lý liệu âm 42 4.1.4 Phương pháp xử lý liệu video hình ảnh 42 4.2 Phương pháp trích xuất đặc trưng xây dựng mơ hình phân loại văn … 43 4.3 Phương pháp trích xuất đặc trưng nhận diện khuôn mặt 44 4.4 Phương pháp xây dựng mơ hình phân loại hình ảnh 45 4.5 Phương pháp xây dựng mơ hình kết hợp 46 4.6 Phương pháp đánh giá 47 HIỆN THỰC VÀ ĐÁNH GIÁ 48 5.1 Framework đề xuất 48 5.2 Thu thập liệu 50 5.3 Xử lý liệu 52 5.3.1 Tải video audio 52 5.3.2 Gán nhãn liệu 53 5.3.3 Trích xuất khung hình từ video 54 5.3.4 Xử lý huấn luyện liệu văn với mô hình word embedding FastText …………………………………………… 54 5.3.5 Phát nhận diện gương mặt 56 5.4 Huấn luyện mơ hình phân loại dựa đặc trưng hình ảnh 58 5.5 Chiến lược huấn luyện thử nghiệm 59 5.6 Huấn luyện mơ hình kết hợp 60 5.7 Kết mơ hình nhận xét 62 5.7.1 Tập liệu 62 5.7.2 Thử nghiệm đánh giá kết 63 vii 5.8 Xây dựng ứng dụng thử nghiệm 66 KẾT LUẬN 69 6.1 Các kết đạt 69 6.2 Khó khăn hạn chế 70 6.3 Hướng mở rộng đề tài 70 TÀI LIỆU THAM KHẢO 72 LÝ LỊCH TRÍCH NGANG 75 viii đặc trưng văn bị NULL trường hợp xóa ln tiến hành huấn luyện mơ hình Logistic Regession Sau đoạn mã xây dựng huấn luyện mơ hình: Mã chương trình 5.9 Huấn luyện mơ hình kết hơp sử dụng Logistic Regession Mã chương trình 5.9 Mơ tả huấn mơ hình kết hợp sử dụng Logistic Regession, gồm bước: - Sử dụng thư việc Logistic Regression - Khởi tạo mơ hình với tham số mặc định - Huấn luyện mơ hình với đặc trưng văn bản, hình ảnh, gương mặc trích xuất Mã chương trình 5.10 Huấn luyện mơ hình kết hơp sử dụng LightGBM 61 Mã chương trình 5.10 Mơ tả huấn mơ hình kết hợp sử dụng LightGBM, gồm bước: - Sử dụng thư việc lightgbm - Khởi tạo mơ hình với tham số mặc định - Huấn luyện mơ hình với đặc trưng văn bản, hình ảnh, gương mặc trích xuất 5.7! Kết mơ hình nhận xét 5.7.1! Tập liệu Mơ hình huấn luyện thử nghiệm theo luồng trình bày trên, tập liệu tự thu thập gồm: - Dữ liệu Video: thu thập từ tiktok, sau tiến hành trích xuất khung chính, đó: Liên quan đến trị Phi trị 5.252 videos 5.100 videos 57.654 khung 47.242 khung Bảng 5.1 Số liệu video khung Chuyển giọng nói thành văn từ video tiktok: Liên quan đến trị Phi trị 1.789 2.190 Bảng 5.2 Số lượng chuyển giọng nói thành văn 62 + Các video lại chứa nhạc nền, khơng phải giọng đọc hay lời nói + Sau nối với mơ tả video, thu văn để trích xuất đặc trưng 5.7.2! Thử nghiệm đánh giá kết Tiến hành thử nghiệm đánh giá kết tập liệu 10.000 videos thu thập gán nhãn tự động theo hashtag: Hình 5.4 Cho thấy số lượng giữ liệu nhãn lần kiểm thử Sau thử nghiệm mơ hình dựa đặc trưng riêng lẻ mơ hình dựa phương pháp kết hợp chậm, nhận thấy phương pháp kết hợp chậm với mô hình Light GBM cho kết độ đo Acurraycy [22] F1-Score [22] tốt nhất, cụ thể thể bảng sau: 63 Model Text Classification - Logistic Regression - Fasttext Face detection - VGG-Face Image Classification - Inception-V3 + ImageNet Framework - Logistic Regression - Light GBM Acurracy F1-Score 0.73 0.77 0.71 0.75 0.6 0.34 0.73 0.72 0.82 0.85 0.81 0.83 Bảng 5.3 Kết mô hình sau lần kiểm thử đầu tiên.! ! Sau thử nghiệm đánh giá lần nhận thấy kết chưa tốt quan sát thấy liệu bị gán nhãn sai nhiều, tiến hành gắn nhãn thủ công thu khoảng 9.000 videos, sau đồ thị thể tập liệu sau gán nhãn thủ cơng lại: Hình 5.5 Cho thấy số lượng giữ liệu nhãn lần kiểm thử lần hai 64 Sau thử nghiệm mơ hình dựa đặc trưng riêng lẻ mơ hình dựa phương pháp kết hợp chậm tập liệu gắn nhãn thủ công cho kết tốt hẳn so với tập liệu gắn nhãn tự động hashtag, cụ thể thể bảng sau: Model Text Classification - Logistic Regression - Fasttext Face detection - VGG-Face Image Classification - Inception-V3 + ImageNet Framework - Logistic Regression - Light GBM Acurracy F1-Score 0.82 0.88 0.80 0.86 0.68 0.39 0.88 0.85 0.92 0.93 0.91 0.92 ! Bảng 5.4 Kết mơ hình sau lần kiểm thử lần hai Kết thử nghiệm cho thấy, Frameword đề xuất cho kết độ xác tốt đạt 0.93 Bên cạnh đó, Ligh GBM đưa độ quan trọng đặc trưng, theo hình ảnh có ảnh hưởng đến kết phân loại mơ hình 65 Hình 5.6 Mơ tả mức độ quan trọng đặc trưng việc phân loại cấp độ video 5.8! Xây dựng ứng dụng thử nghiệm Để thuận tiện cho việc trải nghiệm tính xác framework, tác giả đóng gói thư viện thu thập liệu, mơ hình huấn luyện, nhúng vào tệp mã nguồn python có tên predict.py; lệnh command line để sử dụng sau: Hình 5.7 Khởi chạy tệp predcit.py với tham số id video Tiktok Đầu vào nhận id video Tiktok, hiển thị kết thông tin sau thu thập, xử lý video, kết phân loại dựa đặc trưng riêng lẻ kết hợp mơ hình Video có liên quan đến trị điểm số kết hợp mơ hình lớn 0.8 Ngồi ra, đề tài có xây dựng thêm giao diện ứng dụng người dùng: 66 Hình 5.8 Giao diện người dùng cho ứng dụng nhận diện video có yếu tố trị Việt Nam mạng xã hội Tiktok Người dùng nhập đường dẫn url tiktok nhấn nút dự đoán, ứng dụng hiển thị thông tin video như: tiêu đề, hình ảnh đầu tiên, kết dự đốn video có yếu tố trị hay khơng 67 Hình 5.9 Ứng dụng người dùng dự đoán video 68 6! KẾT LUẬN 6.1! Các kết đạt -!Thu thập xử lý 10.000 videos từ mạng xã hội Tiktok -!Thu thập 8.500 viết từ trang web vnexpress.net, chinhphu.vn, vietnamnet.vn để phục vụ cho trình huấn luyện kiểm thử mơ hình dựa đặc trưng văn -!Tìm hiểu kiến thức tảng phân loại văn bản, phân loại video, nhận diện gương mặt -!Tìm hiểu cơng trình phân loại video dựa đa đặc trưng kết hợp đa mơ hình; -!Đề xuất framework phân loại video dựa ba đặc trưng video văn bản, gương mặt, hình ảnh; sử dụng chiến lược kết hợp chậm để tổng hợp thông tin từ ba mơ hình từ đưa kết phân loại cấp độ video -!Huấn luyện, tối ưu thử nghiệm framwork tập liệu thu thập được; kết thử nghiệm framework cho kết tốt so với mơ hình dựa đặc trưng riêng lẻ phương pháp kết hợp thơng thường Cụ thể độ xác tốt framework đạt 0.93, mơ hình dựa đặc trưng văn bản, gương mặt, hình ảnh 0.88, 0.68, 0.88 -!Sử dụng chiến lược kết hợp chậm để đưa phân loại cấp độ video cách áp dụng gradient boosting (mơ hình Light GBM) vào toán phân loại, phương pháp mơ hình cho phép đầu vào giá trị null nhằm giải vấn đề thiếu liệu đặc trưng, đưa trọng số tầm quan trọng đặc trưng việc phân loại video -!Ngồi ra, Với video có gương mặt trị gia nội dung khơng liên quan với trị framework phân loại được, cách sử dụng mơ hình kết hợp chậm ba đặc trưng hình ảnh, gương mặt 69 6.2! Khó khăn hạn chế Các khó khăn gặp phải: - Tiktok khơng có API để nhà phát triển thu thập liệu, có sách chặn chương trình thu thập liệu, việc thu thập liệu để phục vụ đề tài gặp nhiều khó khăn, tác giả phải thuê proxy, random session, token key để thu thập đủ liệu thực đề tài - Việc gắn nhãn tự động hashtag cho video thu thập từ Titkok bị sai nhiều, hashtag người dùng nhập khơng xác, chí khơng thống với nội dung video, tác giả phải gẵn nhãn lại cách thủ công - Q trình huấn luyện mơ hình tốn nhiều thời gian hạn chế tài nguyên Các hạn chế: - Do hạn chế nhân lực tài nguyên, đề tài thu thập 10.000 videos, với số lượng video hạn chế vậy, đề tài khơng ứng dụng mơ hình học sâu kết hợp yếu tố không-thời gian như: CNN Fusion [1], CNN-LSTM [6], LR-CN [6] - Cơ sở liệu để nhận diện gương mặt bao gồm số lãnh đạo Bộ trị, Bộ trưởng phủ Việt Nam - Chưa thực OCR (Optical Character Recognition – nhận diện ký tự quang học) để bổ sung vào đặc trưng văn - Do tác giả gắn lại nhãn thủ cơng cho video Tiktok nên cịn mang yếu tố chủ quan 6.3! Hướng mở rộng đề tài - Tiếp tục thu thập thêm liệu, đủ để triển khai mơ hình phân loại video dựa đặc trưng hình ảnh kết hợp yếu tố không-thời gian: CNN Fusion [1], CNN- LSTM [6], LR-CN [6] 70 - Mở rộng liệu gương mặt trị gia, để áp dụng mơ hình nhận diện gương mặt, triển khai sở liệu cho phép tìm kiếm gần để nhận diện gương mặt tốt - Xây dựng hệ thống thu thập, phân loại video có yếu tốt trị Việt Nam tự động; dựa vào lượt thích, bình luận, chia sẻ video để đưa cảnh báo, sau đánh nhãn, tự động huấn luyện lại mơ hình - Sau phân loại, video tự động tóm tắt nội dung, mục đích video, trích xuất ý từ video Từ nhóm video vào kiện để tổng quát hóa 71 TÀI LIỆU THAM KHẢO [1] A Karpathy, G Toderici, S Shetty, T Leung, R Sukthankar, and L Fei-Fei, “Large-scale video classification with convolutional neural networks,” in 2014 IEEE Conference on Computer Vision and Pattern Recognition, Ohio, USA, 2014 [2] Z A A Ibrahim, S Haidar, and I Sbeity, “Large-scale text-based video classification using contextual features,” Eur J Electr Eng Comput Sci., vol 3, no 2, 2019 [3] H Tian, Y Tao, S Pouyanfar, S.-C Chen, and M.-L Shyu, “Multimodal deep representation learning for video classification,” World Wide Web, vol 22, no 3, pp 1325–1341, 2019 [4] T.Trzcinski, “Multimodal social media video classification with deep neural networks,” in Proceedings of SPIE, vol 10808, 2018 doi: 10.1117/12.2501679 [5] Y R Pandeya and J Lee, “Deep learning-based late fusion of multimodal information for emotion classification of music video,” Multimed Tools Appl., vol 80, no 2, pp 2887–2905, 2021 [6] A Dhakal "Political-advertisement video classification using deep learning methods," PhD Thesis Iowa State University Capstones, Iowa, 2019 [7] B Banerjee, “Machine Learning Models for Political Video Advertisement Classification,” PhD Thesis Iowa State University Capstones, Iowa, 2019 [8] Z Weng, L Meng, R Wang, Z Wu, and Y.-G Jiang, “A multimodal framework for video ads understanding,” in Proceedings of the 29th ACM International Conference on Multimedia, Virtual Event, China, 2021 72 [9] K Zhang, Z Zhang, Z Li, and Y Qiao, “Joint face detection and alignment using multitask cascaded convolutional networks,” IEEE Signal Process Lett., vol 23, no 10, pp 1499–1503, 2016 [10] Y Taigman, M Yang, M Ranzato, and L Wolf, “DeepFace: Closing the gap to human-level performance in face verification,” in 2014 IEEE Conference on Computer Vision and Pattern Recognition, Ohio, USA, 2014 [11] G Ke, Q Meng, T Finley, T Wang, W Chen, W Ma, Q Ye, T Liu, “LightGBM: A Highly Efficient Gradient Boosting Decision Tree,” in 31st Conference on Neural Information Processing Systems, California, USA, 2017 [12] C Szegedy, V Vanhoucke, S Ioffe, J Shlens, and Z Wojna, “Rethinking the inception architecture for computer vision,” in 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Nevada, USA, 2016 [13] H El-Amir and M Hamdy, “Convolutional Neural Network,” in Deep Learning Pipeline, Berkeley, CA: Apress, 2020, pp 367–413 [14] P Bojanowski, E Grave, A Joulin, and T Mikolov, “Enriching word vectors with subword information,” arXiv [cs.CL], 2016 [15 “FFMPEG Project.” [Online] Available: https://ffmpeg.org, Mar 8, 2022 [16] “Unofficial TikTok API in Python.” [Online] Available: https://github.com/davidteather/TikTok-Api, Mar 10, 2022 [17] A Krizhevsky, I Sutskever, and G E Hinton, “ImageNet classification with deep convolutional neural networks,” Commun ACM, vol 60, no 6, pp 84–90, 2017 [18] “Extractor” [Online] Available: https://docs.scipy.org/doc/numpy/reference/generated/numpy.extract.html, Mar 6, 2022 [19] NumPy, “NumPy.” [Online] Available: https://numpy.org/, Mar 6, 2022 73 [20] Google, “Google API.” [Online] Available: https://developers.google.com/apisexplorer, Mar 10, 2022 [21] Scikit-Learn, “Scikit-Learn Python Library for Machine Learning.” [Online] Available: https://scikit-learn.org, Mar 12, 2022 [22] “Machine Learning bản” [Online] Available: https://machinelearningcoban.com, Mar 12, 2022 [23] T.Mikolov, L.V.Quoc, and I.Sutskever, “Exploiting Similarities among Languages for Machine Translation,” arXiv: 1309.4168, 2013 74 LÝ LỊCH TRÍCH NGANG Họ tên: Nguyễn Bình Long Ngày, tháng, năm sinh: 03/05/1992 Nơi sinh: Quảng Ngãi Địa liên lạc: 258 Nguyễn Trãi, phường Nguyễn Cư Trinh, quận 1, Tp Hồ Chí Minh Q TRÌNH ĐÀO TẠO -!2010 – 2015: Tốt nghiệp kỹ sư ngành Khoa học máy tính trường Đại học Bách khoa Hồ Chí Minh Q TRÌNH CƠNG TÁC -!2015 - nay: Cục Kỹ Thuật Nghiệp Vụ - Bộ Công an 75 ... TÀI: Nhận diện video có yếu tố trị Việt Nam mạng xã hội Tiktok / Identifying Viet Nam politcal video contents on TikTok social Network II NHIỆM VỤ VÀ NỘI DUNG: Thực việc thu thập liệu gồm video có. .. cấp độ video 66! Hình 5.7 Khởi chạy tệp predcit.py với tham số id video Tiktok 66! Hình 5.8 Giao diện người dùng cho ứng dụng nhận diện video có yếu tố trị Việt Nam mạng xã hội Tiktok. .. học tập có giám sát dựa nhiều đặc trưng để phân loại hiệu video có yếu tố trị Việt Nam mạng xã hội Tiktok, đóng góp đề tài liệt kê sau: -! Bộ liệu 10.000 videos thu thập từ mạng xã hội Tiktok