Khóa luận tốt nghiệp phát hiện bảng sử dụng phương pháp học sâu

ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN KHOA CÔNG NGHỆ PHẦN MỀM NGUYỄN THỊ LAN PHƯƠNG NGUYỄN TRẦN HỒNG THANH KHĨA LUẬN TỐT NGHIỆP PHÁT HIỆN BẢNG SỬ DỤNG PHƯƠNG PHÁP HỌC SÂU TABLE DETECTION USING DEEP LEARNING KỸ SƯ NGÀNH KỸ THUẬT PHẦN MỀM TP HỒ CHÍ MINH, 2021 ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC CƠNG NGHỆ THÔNG TIN KHOA CÔNG NGHỆ PHẦN MỀM NGUYỄN THỊ LAN PHƯƠNG – 16520972 NGUYỄN TRẦN HOÀNG THANH – 16521125 KHÓA LUẬN TỐT NGHIỆP PHÁT HIỆN BẢNG SỬ DỤNG PHƯƠNG PHÁP HỌC SÂU TABLE DETECTION USING DEEP LEARNING KỸ SƯ NGÀNH KỸ THUẬT PHẦN MỀM GIẢNG VIÊN HƯỚNG DẪN TS NGUYỄN TẤN TRẦN MINH KHANG TP HỒ CHÍ MINH, 2021 DANH SÁCH HỘI ĐỒNG BẢO VỆ KHÓA LUẬN Hội đồng chấm khóa luận tốt nghiệp, thành lập theo Quyết định số …………………… ngày ………………… Hiệu trưởng Trường Đại học Công nghệ Thông tin ………………………………………… – Chủ tịch ………………………………………… – Thư ký ………………………………………… – Ủy viên ………………………………………… – Ủy viên ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH CỘNG HỊA XÃ HỘI CHỦ NGHĨA VIỆT NAM TRƯỜNG ĐẠI HỌC Độc Lập - Tự Do - Hạnh Phúc CÔNG NGHỆ THÔNG TIN TP HCM, ngày… tháng… năm…… NHẬN XÉT KHÓA LUẬN TỐT NGHIỆP (CỦA CÁN BỘ HƯỚNG DẪN) Tên khóa luận: PHÁT HIỆN BẢNG SỬ DỤNG PHƯƠNG PHÁP HỌC SÂU Cán hướng dẫn/phản biện: Nhóm SV thực hiện: Nguyễn Thị Lan Phương 16520972 Nguyễn Trần Hoàng Thanh 16521125 Tiến sĩ Nguyễn Tấn Trần Minh Khang Đánh giá khoá luận: Về báo cáo: Số trang: Số chương: Số bảng số liệu: Số hình vẽ: Số tài liệu tham khảo: Sản phẩm: Một số nhận xét hình thức báo cáo: ································································································ ································································································ ································································································ ································································································ Về nội dung nghiên cứu: ································································································ ································································································ ································································································ ································································································ Về chương trình ứng dụng: ································································································ ································································································ ································································································ ································································································ Về thái độ làm việc sinh viên: ································································································ ································································································ ································································································ ································································································ Đánh giá chung: ································································································ ································································································ ································································································ ································································································ Điểm sinh viên: Nguyễn Thị Lan Phương: /10 Nguyễn Trần Hoàng Thanh: /10 Người nhận xét (Ký tên ghi rõ họ tên) ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH CỘNG HỊA XÃ HỘI CHỦ NGHĨA VIỆT NAM TRƯỜNG ĐẠI HỌC Độc Lập - Tự Do - Hạnh Phúc CÔNG NGHỆ THÔNG TIN TP HCM, ngày… tháng… năm…… NHẬN XÉT KHÓA LUẬN TỐT NGHIỆP (CỦA CÁN BỘ PHẢN BIỆN) Tên khóa luận: PHÁT HIỆN BẢNG SỬ DỤNG PHƯƠNG PHÁP HỌC SÂU Cán hướng dẫn/phản biện: Nhóm SV thực hiện: Nguyễn Thị Lan Phương 16520972 Nguyễn Trần Hồng Thanh 16521125 Đánh giá khố luận: Về báo cáo: Số trang: Số chương: Số bảng số liệu: Số hình vẽ: Số tài liệu tham khảo: Sản phẩm: Một số nhận xét hình thức báo cáo: ································································································ ································································································ ································································································ ································································································ Về nội dung nghiên cứu: ································································································ ································································································ ································································································ ································································································ Về chương trình ứng dụng: ································································································ ································································································ ································································································ ································································································ Về thái độ làm việc sinh viên: ································································································ ································································································ ································································································ ································································································ Đánh giá chung: ································································································ ································································································ ································································································ ································································································ Điểm sinh viên: Nguyễn Thị Lan Phương: /10 Nguyễn Trần Hoàng Thanh: /10 Người nhận xét (Ký tên ghi rõ họ tên) LỜI CẢM ƠN Lời đầu tiên, chúng em xin gửi lời cảm ơn đến quý Thầy Cô khoa Công nghệ Phần mềm tận tình giảng dạy, truyền đạt kiến thức quý báu cho chúng em thời gian học đại học tạo điều kiện cho chúng em thực khóa luận Chúng em xin gửi lời biết ơn chân thành đến Tiến sĩ Nguyễn Tấn Trần Minh Khang Thạc sĩ Võ Duy Nguyên Quý thầy hướng dẫn, tin tưởng động viên chúng em vượt qua khó khăn suốt q trình thực đồ án Cảm ơn thầy tháng vừa qua, thầy tận tình hướng dẫn giúp đỡ nhóm em hồn thành đề tài khóa luận tốt nghiệp Trong tháng tiến hành thực đề tài, thời gian khơng q dài đủ để nhóm em vận dụng kiến thức học trường áp dụng vào đề tài Em xin gửi lời cảm ơn đến Tiến sĩ Ngơ Đức Thành phịng thí nghiệm MMLab (UIT) tạo điều kiện, giúp đỡ góp ý cho chúng em suốt thời gian thực đề tài Hầu hết kết trình bày đồ án tiến hành thực nghiệm hệ thống máy tính phịng thí nghiệm MMLab Mặc dù chúng em nổ lực để hoàn thành đề tài, song khơng thể tránh khỏi thiếu sót, mong nhận đóng góp quý báu quý Thầy Cô bạn Cuối cùng, xin chúc tất thầy cô dồi sức khỏe Chúc Trường đại học Công nghệ thông tin – Đại học quốc gia Thành phố Hồ Chí Minh ngày phát triển Xin cảm ơn! Thành phố Hồ Chí Minh, ngày … tháng … năm 2020 Nguyễn Thị Lan Phương Nguyễn Trần Hồng Thanh ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM TRƯỜNG ĐẠI HỌC Độc Lập - Tự Do - Hạnh Phúc CÔNG NGHỆ THÔNG TIN ĐỀ CƯƠNG CHI TIẾT TÊN ĐỀ TÀI: Phát bảng sử dụng phương pháp học sâu TÊN ĐỀ TÀI TIẾNG ANH: Table Detection Using Deep Learning Cán hướng dẫn: TS.Nguyễn Tấn Trần Minh Khang Thời gian thực hiện: Từ ngày 07/09/2020 đến ngày 27/12/2020 Sinh viên thực hiện: Nguyễn Trần Hoàng Thanh – 16521125 Nguyễn Thị Lan Phương – 16520972 Nội dung đề tài: Mục tiêu Trong năm gần đây, toán phát bảng tài liệu dạng ảnh chủ đề nhận nhiều quan tâm, nhiều cơng trình nghiên cứu công bố, thi tổ chức nhằm tìm phương pháp tốt tối ưu giúp giải toán Nhiều liệu phát hành mang lại đóng góp lớn Khóa luận tiến hành nghiên cứu, thực nghiệm đánh giá kết đạt từ phương pháp state-ofthe-art liệu TableBank để phát bảng tài liệu dạng ảnh Bộ liệu xây dựng từ ảnh chụp tài liệu Word Latex internet Cuối đưa nhận xét, so sánh đánh giá độ hiệu phương pháp chọn dựa theo kết huấn luyện liệu TableBank Phạm vi Phân tích kết phát bảng ảnh liệu TableBank từ phương pháp CascadeTabNet DetectoRS Đối tượng Các ảnh chụp tài liệu có chứa không chứa bảng liệu TableBank Các ảnh chụp tài liệu có chứa ảnh khác Phương pháp thực Tìm hiểu phân tích tốn Tìm hiểu phân tích liệu TableBank Tìm hiểu phương pháp state-of-the-art cho toán phát bảng tài liệu dạng ảnh Chạy thực nghiệm, cài đặt huấn luyện phương pháp với liệu TableBank Phân tích đánh giá kết (độ xác, chi phí), độ hiệu đạt phương pháp Kết mong đợi Phân tích giống khác nhau, ưu điểm nhược điểm, độ hiệu phương pháp toán Kế hoạch thực hiện: Từ 15/09 đến 30/09 Tìm hiểu phương pháp state-of-the-art cho toán phát bảng tài liệu dạng ảnh AP viết tắt Average Precision, giá trị trung bình tất giá trị Precision miền giá trị Recall định Trrong đó, Precison (độ xác) tỷ lệ số hộp giới hạn (bounding box) dự đoán số hộp giới hạn (bounding box) xác tổng số dự đốn, cịn Recall (độ phủ) tỷ lệ số hộp giới hạn (bounding box) tổng số hộp giới hạn (bounding box) xác tồn bộ liệu Hình 4.2 Mơ tả Precision Recall [16] Trong đó: P Precison R Recall TP True Positive: phát hợp lệ FP False Positive: phát không hợp lệ FN False Negative: ground truth bị model bỏ sót Các độ đo thường dùng để đánh giá kết phương pháp toán phát đối tương độ đo AP, AP50 (APIoU = 50%), AP75 (APIoU = 75%) Các độ đo mô tả chi tiết bảng 4.1 23 Độ chính xác trung bình 10 IoU khác nhau, từ 50% đến AP 95% kích thước bước (step-size) 5%, kí hiệu AP@[.50: 5: 95] [15] AP50 (APIoU = 0.5) Độ chính xác trung bình ngưỡng IoU 50% (IoU giao với ground truth lớn 0.5) AP75 (APIoU = 0.75) Độ chính xác trung bình ngưỡng IoU 75% (IoU giao với ground truth lớn 0.75) Bảng 4.1 Giải thích chi tiết độ đo AP, AP50, AP75 Hình 4.3 Cơng thức định nghĩa độ xác trung bình (AP) [16] 𝑇𝑟𝑜𝑛𝑔 đó: 𝐴𝑃@α độ xác trung bình ngưỡng IoU α Cuối cùng, mAP (Mean Average Precision) giá trị AP (Average Precision) trung bình tất lớp đối tượng Nó thường dùng để đánh giá hiệu phương pháp phát đối tượng liệu chọn Hình 4.4 Cơng thức định nghĩa mAP [16] 𝑇𝑟𝑜𝑛𝑔 đó: m𝐴𝑃@α trung bình AP 𝑛 lớp đối tượng ngưỡng IoU α Do vậy, chúng em sử dụng mAP để đánh giá hiệu phương pháp GFL, FSAF, Faster R-CNN, CascadeTabNet DetectoRS phần liệu TableBank toán Phát bảng tài liệu dạng ảnh 24 4.2 Tổ chức liệu huấn luyện môi trường thực nghiệm Để đánh giá, từ mục Latex chúng em chọn 1492 ảnh để thực huấn luyện 1000 ảnh dùng để kiểm tra Cách chọn ảnh tác giả cung cấp[2] Chúng em sử dụng phương pháp DetectoRS, GFL, FSAF, Faster R-CNN ATSS để huấn luyện liệu đào tạo lại CascadeTabNet với tham số mặc định tác giả cung cấp Tất mơ hình đào tạo môi trường: Ubuntu 16.04.5 LTS 64 bit, GPU RTX 2080 Ti 25 4.3 Kết thực nghiệm Hình 4.5 Kết thực nghiệm (a) ATSS (b) Faster R-CNN (c) GFL (d) DetectoRS (e) CascadeTabNet (f) FSAF 26 Phần cài đặt thực nghiệm trình bày phần Phụ lục A Ở phần này, chúng em báo cáo kết phương pháp GFL, FSAF, Faster R-CNN DetectoRS mạng ResNet50, phương pháp CascadeTabNet sử dụng mạng HRNet cho ảnh đầu vào với AP, AP50 AP75 Sau đó, chúng em báo cáo kết phương pháp với độ đo AP, APIoU=50 APIoU=75 phần liệu TableBank Phương pháp mAP mAP50 mAP75 Mạng GFL 93.9 97.9 97 ResNet50 Faster R-CNN 81.8 92.4 87.5 ResNet50 ATSS 85.9 96.1 93.5 ResNet50 FSAF 88.3 97 95.8 ResNet50 DetectoRS 94.8 97.5 97.5 ResNet50 CascadeTabNet 92.8 98.1 96.9 HrNet Bảng 4.2 Kết thực nghiệm phương pháp Từ bảng kết chạy thực nghiệm thấy, mạng ResNet50, mAP mAP75 phương pháp DetectoRS cho kết cao nhất, 94,8%(mAP) 97,5%(mAP75) Nhưng với mAP50, phương pháp CascadeTabNet lại cho kết cao 0.2% so với GFL 0.6% với DetectoRS (97.5% với DetectoRS 97.9% GFL) Với CascadeTabNet dùng mạng HrNet cho kết cao, cao ATSS Faster-RCNN mAP, mAP50 mAP75 (lần lượt 92.8% mAP, 98.1% mAP50 96.9% mAP75) Hơn 27 nữa, mAP50, CascadeTabNet cho kết cao (98.1%) so với phương pháp lại Kết mô liệu cho thấy Faster R-CNN có khả phát bảng cao nhiên nhiều phát sai phát hình ảnh, biểu đồ bảng dẫn đến mAP thấp nhất, ATSS khơng có nhiều phát sai khả phát bảng thấp nên mAP cao đôi chút so với Faster R-CNN, FSAF tương tự ATSS khả phát sai ít hơn, CascadeTabNet có khả phát bảng cao nhiên cịn có sai sót Faster R-CNN đạt kết cao mAP50, cuối GFL DetectoRS với khả phát sai ít hẳn so với phương pháp khác khả phát bảng cao nhiên DetectoRS chiếm ưu so với GFL Tóm lại qua q trình thực nghiệm, chúng em nhận thấy CascadeTabNet, GFL DetectoRS phương pháp tốt phát bảng DetectoRS cho kết tốt so với phương pháp Faster R-CNN, CascadeTabNet, FSAF ATSS 28 Chương KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 5.1 Các kết đạt Qua khóa luận này, chúng em tìm hiểu toán phát bảng tài liệu dạng ảnh, trình bày phương pháp phát bảng tài liệu dạng ảnh sử dụng phương pháp CascadeTabNet mạng HrNet, DetectoRS, Faster RCNN, ATSS, FSAF, GFL mạng ResNet50 để kiểm tra hiệu phát bảng tìm phương pháp tốt phần liệu TableBank Từ kết đánh giá biết được, chúng em nhận thấy phương pháp hoạt động tốt phần liệu TableBank mà chúng em chọn để chạy thực nghiệm, đặc biệt ba phương pháp GFL, CascadeTabNet DetectoRS Tuy nhiên, nhìn chung phương pháp DetectoRS đạt hiệu tốt phát bảng phần liệu chọn (mặc dù thấp 0.6% so với phương pháp CascadeTabNet mAP50) Trong tương lai, chúng em tiếp tục kiểm tra hiệu phát bảng phương pháp phần lại liệu TableBank Hơn tìm hiểu thêm phương pháp phát đối tượng khác để chọn phương pháp tốt toàn bộ liệu TableBank, sau chúng em cố gắng cải thiện kết phát bảng tài liệu dạng ảnh với liệu Thêm vào xây dựng ứng dụng demo minh họa cho toán phát bảng TableBank hiển thị biểu đồ so sánh hiệu phát bảng phương pháp với 5.2 - Hướng phát triển Thực nghiệm thuật toán khác, đại nhầm tăng khả phát bảng - Thực nghiệm phần lại liệu TableBank - Xây dựng demo biểu diễn kết phát bảng đánh giá phương pháp thực nghiệm, … 29 TÀI LIỆU THAM KHẢO [1] Qiao, Siyuan and Chen, Liang-Chieh and Yuille, Alan: DetectoRS: Detecting Objects with Recursive Feature Pyramid and Switchable Atrous Convolution Journal 2arXiv preprint arXiv:2006.02334 (2020) [2] Devashish Prasad and Ayan Gadpal and Kshitij Kapadni and Manish Visave and Kavita Sultanpure: CascadeTabNet: An approach for end-to-end table detection and structure recognition from image-based documents Journal arXiv preprint arXiv:2004.12629 (2020) [3] Jingdong Wang and Ke Sun and Tianheng Cheng and Borui Jiang and Chaorui Deng and Yang Zhao and Dong Liu and Yadong Mu and Mingkui Tan and Xinggang Wang and Wenyu Liu and Bin Xiao: Deep HighResolution Representation Learning for Visual Recognition Journal 2TPAMI (2020) [4] S Ren, K He, R Girshick, and J Sun Faster R-CNN: Towards real-time ob-ject detection with region proposal networks In NIPS, 2015 [5] Cai, Zhaowei and Vasconcelos, Nuno: Cascade R-CNN: high quality object detection and instance segmentation Journal 2IEEE Transactions on Pattern Analysis and Machine Intelligence (2019) [6] CascadeTabNet, https://github.com/DevashishPrasad/CascadeTabNet Last accessed 10 Sep 2020 [7] MMDet, https://github.com/open-mmlab/mmdetection Last accessed 10 Sep 2020 30 [8] Li, Minghao and Cui, Lei and Huang, Shaohan and Wei, Furu and Zhou, Ming and Li, Zhoujun: Tablebank: Table benchmark for image-based table detection and recognition Journal 2arXiv preprint arXiv:1903.01949 (2019) [9] Chen, Kai and Wang, Jiaqi and Pang, Jiangmiao and Cao, Yuhang and Xiong, Yu and Li, Xiaoxiao and Sun, Shuyang and Feng, Wansen and Liu, Ziwei and Xu, Jiarui and others: Mmdetection: Open mmlab detection toolbox and benchmark Journal 2arXiv preprint arXiv:1906.07155 (2019) [10] S Zhang, C Chi, Y Yao, Z Lei, and S Z Li, “Bridging the Gap Between Anchor-based and Anchor-free Detection via Adaptive Training Sample Selection” inCVPR, 2020 [11] Kim and H S Lee, “Probabilistic Anchor Assignment with IoU Prediction for Object Detection” inECCV, 2020 [12] C Zhu, Y He, and M Savvides, “Feature selective anchor-free module for single-shot object detection,” 2019 IEEE/CVF Con-ference on Computer Vision and Pattern Recognition (CVPR), pp 840–849, 2019 [13] “CUDA”, Wikipedia, [Online] Available: https://vi.wikipedia.org/wiki/CUDA [Accessed 14 12 2020] [14] Li, Xiang, et al Generalized Focal Loss: Learning Qualified and Distributed Bounding Boxes for Dense Object Detection arXiv preprint arXiv:2006.04388, 2020 [15] K He, G Gkioxari, P Dollár and R Girshick, "Mask R-CNN," 2017 IEEE International Conference on Computer Vision (ICCV), Venice, 2017, pp 2980-2988, doi: 10.1109/ICCV.2017.322 31 [16] “On object detection metrics with worked excample”, Wikipedia, [Online] Available: https://towardsdatascience.com/on-object-detection-metrics- with-worked-example-216f173ed31e [Accessed 2021] [17] Huang, Junjie, Zheng Zhu, and Guan Huang "Multi-Stage HRNet: Multiple Stage High-Resolution Network for Estimation." arXiv preprint arXiv:1910.05901 (2019) 32 Human Pose PHỤ LỤC A Cài đặt thư viện, môi trường cần thiết Các phương pháp chúng em thực nghiệm sử dụng Anaconda MMDetection[9] yêu cầu CUDA 9.2+ nên trước cài đặt MMDetection cần phải cài đặt CUDA a Cài đặt CUDA CUDA (Compute Unified Device Architecture - Kiến trúc thiết bị tính tốn hợp nhất) kiến trúc tính tốn song song NVIDIA phát triển Nói cách ngắn gọn, CUDA động tính toán GPU (Graphics Processing Unit Đơn vị xử lý đồ họa) NVIDIA, lập trình viên sử dụng thơng qua ngơn ngữ lập trình phổ biến Lập trình viên dùng ngơn ngữ C for CUDA, dùng trình biên dịch PathScale Open64 C[16], để cài đặt thuật toán chạy GPU Kiến trúc CUDA hỗ trợ chức tính tốn thơng qua ngơn ngữ C Các bên thứ ba phát triển để hỗ trợ CUDA Python, Fortran, Java MATLAB [17] Danh sách chi tiết GPU chạy CUDA tìm thấy trang sau đây: http://www.nvidia.com/object/cuda_got_cuda.html Tải tại: https://developer.nvidia.com/cuda-downloads Và tiến hành cài đặt Bên cạnh đó, sau tải CUDA, ta cần cài đặt thêm thư viện cuDNN Địa tải cuDNN dành cho Linux: https://developer.nvidia.com/cudnn (lưu ý cần đăng ký tài khoản trướcc tải về), giải nén chép vào thư mục cài đặt CUDA Toolkit (giả sử /usr/local/cuda/) lệnh sau: $ sudo tar -xvf cudnn-8.0-linux-x64-v5.1.tgz -C /usr/local 33 b Cài đặt MMDetection Yêu cầu hệ thống để chạy MMDetection[7]: - Hệ điều hành Linux macOS (Windows giai đoạn thử nghiệm) Python 3.6+ PyTorch 1.3+ CUDA 9.2+ GCC 5+ MMCV (Yêu cầu mmcv-full với phiên 2.3.0 trở lên) Để cài đặt MMDetection phiên cần bước sau đây: # Tạo môi trường conda create name mmdet # Cài đặt pytorch conda install pytorch torchvision -c pytorch # Cài đặt mmcv-full git clone https://github.com/open-mmlab/mmcv.git cd mmcv MMCV_WITH_OPS=1 pip install -e cd # Cài đặt MMDetection git clone https://github.com/open-mmlab/mmdetection.git cd mmdetection pip install -r requirements/build.txt pip install -v -e # or "python setup.py develop" 34 Cài đặt tập tin config tiến hành huấn luyện a Cài đặt tập tin config Có thể dễ dàng tìm kiếm thấy tập tin config thư mục mmdetection/configs/ Mở tập tin config chỉnh sửa đường dẫn đến thư mục dataset tập tin dòng sau: num_classes = (số lượng class liệu) # num_classes nằm model = dict(…) data_root=”./data/” classes = ( ‘ ‘) # Danh sách class có liệu data = dict( imgs_per_gpu=1, workers_per_gpu=4, train=dict( type=dataset_type, ann_file='train.json', img_prefix=data_root + 'images/', classes = classes, pipeline=train_pipeline), val=dict( type=dataset_type, ann_file='test.json', img_prefix=data_root + 'images/', classes = classes, pipeline=test_pipeline), test=dict( type=dataset_type, ann_file='test.json', img_prefix=data_root + 'images/', classes = classes, pipeline=test_pipeline)) work_dir = “/data/work_dir/” # Thư mục lưu trữ model Sau chỉnh sửa xong bạn dễ dàng tiến hành huấn luyện cách chạy dòng lệnh: python train.py config.py # Sử dụng config sau chỉnh sửa 35 b Cài đặt config CascadeTabNet Đầu tiên vào liên kết sau để tải config CascadeTabNet: https://github.com/DevashishPrasad/CascadeTabNet/tree/master/Config Sau mở tập tin config sửa đổi tên số thuộc tính: • out_size -> output_size • sample_num -> sampling_ratio • imgs_per_gpu -> samples_per_gpu • iou_thr -> iou_threshold Sau bước mở tập tin “functional.py” đường dẫn “anaconda3/envs/%env-name%/lib/%python-version%/site-packages/torch/nn/” • %env-name% tên mơi trường bạn • %python-version% phiên python sử dụng Ví dụ: “python3.8” Sửa thuộc tính “align_corners=None” thành “align_corners=True” tiến hành huấn luyện Các phương pháp lại sử dụng “align_corners=None” c Huấn luyện đánh giá phần liệu TableBank Như trình bày, chúng em dùng phần liệu Latex TableBank để huấn luyện đánh giá Bước 1: Tổ chức thư mục cho liệu: | Tablebank | images Chứa tất ảnh train test | latex_train.json Tập tin json chứa danh sách file train | latex_test.json Tập tin json chứa danh sách file test Bước 2: Chỉnh sửa file config theo mục a) Bước : Tiến hành huấn luyện cách sử dụng dòng lệnh python train.py config.py # Sử dụng config sau chỉnh sửa 36 37 ... năm…… NHẬN XÉT KHÓA LUẬN TỐT NGHIỆP (CỦA CÁN BỘ PHẢN BIỆN) Tên khóa luận: PHÁT HIỆN BẢNG SỬ DỤNG PHƯƠNG PHÁP HỌC SÂU Cán hướng dẫn/phản biện: Nhóm SV thực hiện: Nguyễn Thị Lan Phương 16520972... LUẬN TỐT NGHIỆP (CỦA CÁN BỘ HƯỚNG DẪN) Tên khóa luận: PHÁT HIỆN BẢNG SỬ DỤNG PHƯƠNG PHÁP HỌC SÂU Cán hướng dẫn/phản biện: Nhóm SV thực hiện: Nguyễn Thị Lan Phương 16520972 Nguyễn Trần Hoàng Thanh... tốn Tính đến có nhiều phương pháp học sâu đời, cải tiến nhằm phát bảng cách hiệu xác Trong luận văn này, chúng em tập trung vào việc tìm hiểu sử dụng phương pháp học sâu Faster RCNN, DetectoRS,

Định dạng
Số trang	54
Dung lượng	1,99 MB