Phạm vi thực hiện trong luận văn là áp dụng vào nghiên cứu và phát triển ứng dụng dự đoán biển số phương tiện bằng thuật toán nhận dạng đối tượng với phương.. Mục tiêu của luận văn là xâ
Trang 1ĐẠI HỌC QUOC GIA TP HCMTRUONG ĐẠI HỌC CÔNG NGHỆ THONG TIN
BARR
NGUYEN TUONG DUY
XÂY DUNG UNG DUNG DỰ DOAN BIEN SO XEBANG THUAT TOAN NHAN DANG DOI TUQNG
LUAN VAN THAC Si
NGANH CONG NGHE THONG TIN
Mã số: 8.48.02.01
TP HO CHÍ MINH - 2022
Trang 2ĐẠI HỌC QUỐC GIA TP HCM
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN
BARR
⁄Z
Nguyễn Tường Duy
XÂY DUNG UNG DUNG DỰ DOAN BIEN SO XE
BANG THUAT TOAN NHAN DANG DOI TUQNG
LUAN VAN THAC Si
NGANH CONG NGHE THONG TIN
Mã số: 8.48.02.01
NGƯỜI HƯỚNG DẪN KHOA HỌC:
TS NGUYEN TAN CAM
TP HO CHi MINH - 2022
Trang 3LỜI CAM ĐOANHọc viên xin cam đoan luận văn thạc sĩ “Xây dựng ứng dụng dự đoán biển số xe bằngthuật toán nhận dạng đối tượng” là công trình nghiên cứu của riêng học viên Các số liệuthống kê được sử dung trong luận văn là trung thực và chưa được công bồ trong bat kỳcông trình nghiên cứu nảo.
Tắt cả tài liệu tham khảo, kế thừa đều được trích dẫn và tham chiếu đầy đủ
Học viên
Nguyễn Tường Duy
Trang 4LỜI CẢM ƠNTrong quá trình hiện thực lên ý tưởng nghiên cứu và hoàn thành đề tài, học viênrất trân trọng vì may mắn nhận được sự hỗ trợ từ Nhà Trường, quý Thầy Cô, bạn bè
cùng khoá học và sự động viên, khích lệ từ Gia Đình.
Học viên xin gửi lời cảm ơn chân thành đến quý Thầy Cô trong khoa và PhòngĐào Tạo Sau Đại Học trường Đại Học Công Nghệ Thông Tin đã hỗ trợ, tạo điều kiện
để học viên được học tập, nghiên cứu và hoàn thành luận văn
Học viên cũng rất cảm ơn Thầy TS Nguyễn Gia Tuấn Anh về sự quan tâm vàhướng dẫn tan tình của Thay
Học viên xin được gửi lời tri ân đến Thay TS Nguyễn Tan Cầm - người thay luôntheo sát và chia sẽ kiến thức chuyên môn giúp học viên có thêm nhiều góc nhìn về đềtài Ngoài ra, thầy đã hỗ trợ góp ý, đưa ra những nhận xét tích cực dé học viên có thêm
ý tưởng phát triển đề tài và hoàn thành luận văn
Tran trọng cảm on Công Ty Cổ Phần Kinh Doanh và Quản Lý Chợ Nông Sản Thủ
Đức (Chợ Đầu Mối Thủ Đức) đã tin tưởng và chia sẽ thông tin giúp học viên có cơ hộithực hiện luận văn.
Học viên cũng muốn gửi lời cảm ơn đến những người bạn học thân thiết đã chia
sẻ kinh nghiệm, kiến thức chuyên môn để giúp học viên có thêm hiểu biết để hoàn thành
được dé tài Cảm ơn gia đình tạo điều kiện về tinh than lẫn vật chất giúp học viên có cơhội học tập, nghiên cứu và hoàn thành luận văn.
Một lân nữa học viên xin chân thành cảm ơn và kính gửi đến quý Thầy Cô, đơn vịtài trợ và bạn bè, thân nhân những lời chúc tốt đẹp nhất
TP Hồ Chí Minh, ngày 30 tháng 06 năm 2021
Học viên
Nguyễn Tường Duy
Trang 5CHƯƠNG 1: TONG QUAN VE DE TÀI
1 GIỚI THIEU DE TAI
1.1 Giới thiệu đề tài
1⁄2 Mục tiêu nghiên cir
1.3 Đối tượng và phạm vi nghiên cin Nk)
2 TÔNG QUAN TINH HÌNH NGHIÊN CỨU .14
2.1 - Giới thiệu chung .14 2.2 _ Tình hình nghiên cứu các công trình — dự án trong nước 14 2.3 Tình hình nghiên cứu các công trình - dự án nước ngoài.
2.4 Những tồn tại cần giải quyết
CHƯƠNG 2: KIEN THỨC NEN TANG
1 Tông quan về trí tuệ nhân tạo và máy học 18
2 Một số thuật toán máy học phô biến 19
CHƯƠNG 3: THU THẬP VÀ XÂY DỰNG BO DU LI 8
1 Bộ dữ liệu thu thập sử dụng cho máy học 28
1.1 Nguồn cung cấp dữ liệu 281.2 Mô tả bộ dữ liệu thu thập dùng cho may họ: 31
2 Đánh giá và xây dung bộ dữ liệu chuẩn 31
CHUONG 4: PHUONG PHAP VA THUC NGHIEM CAC THUAT TOAN MAY
HỌC DỰ DOAN
1 Các chỉ sô đánh giá thuật toán
2 Môi trường dùng cho huấn luyện máy học
3 Thực nghiệm và đánh giá.
3.1 Thực nghiệm kiểm tra heatmap với thuật toán CNN
3.2 Tăng cường dữ liệu Data Augmentation
3.3 Gan nhãn dữ liệu - dùng LabelIng tool
Trang 63.4 Huấn luyện bằng thuật toán You Only Look Once (YOLO)
3.5 Huấn luyện bằng thuật toán Single Shot Detector (SSD)
4 Tổng hợp kết quả
CHƯƠNG 5: TRIEN KHAI UNG DUNG DỰ ĐOÁN BIEN SO XE BẰNG THUẬT
TOÁN NHẬN DẠNG ĐÓI TƯỢNG
1 Mô hình ứng dụng dự đoán biển số xe
2 Giao diện ứng dụng dự đoán biển số xe
2.1 Màn hình chính
2.2 Trang thống kê
CHƯƠNG 6: KET LUẬN VÀ HƯỚNG PHÁT TRIEN
1 Những thuận lợi và khó khăn.
2 Kết quả đạt được
3 _ Hướng phát triên
TAI LIEU THAM KHAO
Trang 7Danh mục các ký hiệu và chữ viết tắt
Ký hiệu Ý nghĩa
CNTT Công nghệ thông tin
VN Việt Nam.
TP HCM _ | Thành phố Hồ Chí Minh tại Việt Nam
= Xấp xi, tương đương
e Phần tử thuộc tập hợp
3 Tén tại
vụ Với mọi
f Kí hiệu hàm số (in đậm, chữ thường)
xy Các vector (in đậm, chữ thường).
Xi Phần tử thứ ¿ của vector x (i bat dau từ 1)
XY Các ma trận (in đậm, chữ hoa).
(xr,x:, x„} | Kí hiệu tập hợp các phan tử (từ 1 đến n, n là số tự nhiên)
„1 Tổng của n phần tử (phan tử ¡ bắt đầu từ 0 đến n — 1)
i=0
1.234,56 Dinh dang kiểu dữ liệu số học: dấu phẩy để ngăn cách phần thập
phân và dau chấm đề ngăn cách các nhóm sé
IDE Integrated Development Environment: môi trường phát triển tích
hợp.
Trang 8Danh mục các bảng
Bang 1: Bảng đánh giá so sánh những đề tài tương tự với luận văn
Bảng 2: Mô tả các thuộc tính của bộ dữ liệu Đăng Kiểm Việt Nam
Bảng 3: Hình ảnh phương tiện tại chợ đầu mối Thủ Đức
Bảng 4: Mô tả thông tin hình ảnh phương tiện tại chợ dau Môi Thủ Đức .
Bảng 5: Công thức tính các chỉ số đánh giá mô hình máy học
Bảng 6: Thông tin môi trường thực nghiệm
Bảng 7: Kiểm thử những trường hợp đặc biệt bằng các thuật toan
Bang 8: Kết quả kiểm thử 100 phương tiện bằng thuật toán Yolo
Bảng 9: Kết quả kiểm thử 100 phương tiện bằng thuật toán SSD
Bảng 10: So sánh kết quả giữa SSD và YOLO
Bang 11: Mô tả thông tin dit liệu phương tiện khi nhập chợ.
Bảng 12: Mô tả thông tin dữ liệu phương tiện khi nhập chợ.
Bang 13: Mô tả màn hình chính của ứng dụng
Bảng 14: Mô tả màn hình trang thống kê,
Bảng 15: Kết quả nhận dạng trên hệ thống bán tự động
Bảng 16: Kết quả thu được khi áp dụng thêm thuật toán Yolo
Trang 9Phương tiện xếp hàng vào chợ đầu mối Thủ Đức .
Sơ đồ phân loại máy học
Trang chủ Keras: https://keras.io/
Mô phỏng một mạng Nơ-ron đơn giản
: Trang chủ TensorFlow: https://www.tensorflow.org/
: Vai trò của TensorFlow trong các kiến trúc ứng dụng
: Cấu trúc thư mục Data AugmentationTập tin gan nhãn cho hình ảnh phương tiện định dang txt .
Các giai đoạn thực nghiệm với mô hình SSD và YOLO
CNN (visualize feature maps - heatmap
: Hình ảnh thực tế chụp lại từ camera khi xe vào |:
Hình ảnh phương tiện được gán nhãi: Thông số phương tiện sau khi được gán nhãn
Training Loss = 0,060837.
Kết quả du đoán phương tiện - YOLmAP = 77,93 % at 30.000 step .
Loss/total_loss: 2,65 - global_ step = 30.000
Kết quả dự đoán phương tiện — SSD
Sơ đồ Use-case
Kiến trúc tổng quang hệ thống dự đoán biển số phương tiện
Lưu đồ thuật toán dự đoán biển số phương tiện
Màn hình chính ứng dụng dự đoán biển sé xe
Màn hình chỉ tiết thông tin phương tiện sau khi Biên Sô được dự đoán 70Màn hình trang thống kê, ứng dụng dự đoán biển số phương tiện 71Biểu mẫu bản kê sau khi được in
Trang 10MỞ ĐÀU
Để quản lý phương tiện cơ giới khi tham giao thông, nhận dang bién số là cách
dùng tốt nhất Mỗi bién số là duy nhất ứng với một phương tiện có các đặc trưng riêng
biệt về loại phương tiện, màu sắc Được quản lý thông tin như: năm sản xuất, nguồngốc xuất xứ, hạn đăng kiểm, ngày kiểm định, tải trọng, chủ sở hữu Biển số giúp quản
lý và thống kê phương tiện khi vận chuyển hàng hóa, vận chuyển hành khách, lưu
đậu kho bãi, nhập xuất hàng hoá, bến cảng, khu dân cư
Quản lý phương tiện thông qua nhận dạng biển số như: vé giữ xe (bãi giữ xe
truyền thống ghi thông tin biển số vào vé hoặc phát hành các loại vé riêng gây matthời gian có nhiều khả năng mắt vé, vé giả, ) đến bãi giữ xe có gắn camera (cameragiám sát quan sát và chụp lại hình ảnh khi xe vào bến, bãi làm cơ sở đối chứng vớihình ảnh khi xe rời bến, bãi) Các phương pháp quản lý chưa đáp ứng được nhu cầu
về thống kê Hiện nay, để hạn chế rủi ro và giảm thiểu sai sót, nghiệp vụ quản lýphương tiện cần thông tin quản lý: thông tin xe, chủ sở hữu, số lượt ra vào tương ứng,với từng xe với nhu cầu thống kê theo ca làm việc nhằm tăng hiệu quả về chỉ phí quản
lý.
Phạm vi thực hiện trong luận văn là áp dụng vào nghiên cứu và phát triển ứng
dụng dự đoán biển số phương tiện bằng thuật toán nhận dạng đối tượng với phương
pháp áp dụng công nghệ máy học vào dự đoán đề quản lý phương tiện vào bãi giữ xecủa toà nhà, khu dân cư, bến, cảng
Mục tiêu của luận văn là xây dựng một mô hình với thuật toán phù hợp đề áp
dụng các kỹ thuật máy học vào bài toán dự đoán biển số phương tiện khi tham giao
thông vào Chợ đầu mối Thủ Đức Để thực hiện tốt nhu cầu với mục tiêu dé ra, luậnvăn của học viên được tham khảo từ các công trình khoa học có liên quan và đã đượccông bồ trước
Trong giai đoạn xây dựng và phát triển hệ thống, dir liệu luận văn thu thập làhình ảnh các phương tiện giao thông vào chợ đầu mối Thủ Đức, hình ảnh phương tiện
được lưu lại từ camera giám sát tại các quầy soát vé (Hệ thống thu phí bán tự độngđang hoạt động).
Trang 11Dữ liệu thu thập là hình ảnh chụp lại từ các camera nhận dạng biển số trên hệ
thống bán tự động Đồng thời, luận văn còn thu thập thêm dữ liệu từ cục đăng kiểm
làm nền tản xác định thông tin phương tiện
Dữ liệu thu thập được, hệ thống sẽ lưu trữ, phân tích, áp dụng kỹ thuật máyhọc để xây dựng một mô hình với thuật toán có thông số phù hợp trên bộ dữ liệu huấn
luyện để phát triên mô hình dự đoán
Sau cùng, luận văn sẽ đưa ra một mô hình có thuật toán phụ hợp để ứng dụngtổng quát cho dự đoán biển số phương tiện Kết quả dự đoán sẽ được trực quan hóa
lên giao diện ứng dụng Windows Form Application (.Net Framework) và người sử
dụng có thể thao tác dễ dàng và truy xuất kết quả nhanh chóng
Van đề về dự đoán biển số phương tiện trong luận văn của học viên nhằm giúp
giảm sai sót về dự đoán biển số và khắc phục nhiều hạn chế mà hệ thống hiện đangkhông giải quyết được, giảm sự phụ thuộc vào thiết bị chuyên dụng như: camera nhậndạng biển số, bộ cảm biến vòng từ, giúp nhanh chóng trong việc bảo trì hệ thống vàtiết kiệm chỉ phí vận hành Đáp ứng được việc áp dụng công nghệ AI dự đoán vào
một quy trình quản lý mà điên hình là áp dụng vào quy trình quản lý phương tiện
tham gia giao thông.
II
Trang 12CHƯƠNG 1: TONG QUAN VE DE TÀI
Chương I luận văn giới thiệu đề tài, mục tiêu và đối tượng nghiên cứu, giới
thiệu các công nghệ về nhận dạng biển số tại việt nam và nước ngoài Qua đó, liệt kê
những tôn tại chưa được giải quyết và các mat hạn chế trên các hệ thống thu phiđang vận hành tại các trạm thu phí và các dịch vụ lưu giữ kho, bãi.
1 GIỚI THIỆU ĐÈ TÀI
1.1 Giới thiệu đề tài
Quản lý phương tiện giao thông là van đề được quan tâm tại các thành phố cómật độ dân cư và phương tiện giao thông nhiều Tại nhiều thành phó, các khu côngnghiệp, bến cảng, kho bãi, các trung tâm thương mại, chợ đầu mối có mật độ phươngtiện tham gia giao thông lớn, cần có giải pháp quản lý phương tiện dé tránh tình trang
ùn tắc, gây mat an ninh trật tự, mắt nhiều thời gian xữ lý Do đó, cần giải pháp quản
lý hiệu quả có độ chính xác cao, thời gian xử lý nhanh, công tác bảo trì dé dàng, it
phụ thuộc vào thiết bị chuyên dụng gây tốn kém
'Hinh 1: Phương tiện xếp hàng vào chợ dau mối Thi Đức.
, truoc-gio-g-20210707020811691.htm
Trang 13https://tuoitre.vn/hang-ngan-xe-tai-ba-gac-do-ve-cho-dau-moi-thu-duc-1.2 Mục tiêu nghiên cứu
Luận văn hướng đến xây dựng một hệ thống quản lý đữ liệu, dự đoán biển số
và xác định thông tin của phương tiện khi tham gia hoạt động giao thông tại các kho,
bến thông qua hệ thông camera giám sát đã được trang ¡, không phụ thuộc vào các
thiết bị chuyên dụng: vòng từ cảm biến, camera đọc biển số Giúp giảm chỉ phí đầu
tư và giảm thời gian bảo trì.
1.3 Đối tượng và phạm vi nghiên cứu
Đối tượng nghiên cứu:
Bộ dữ liệu về thông tin xe cơ giới của bộ giao thông vận tải nhằm hỗ trợkiêm tra thông tin đăng kiểm, tải trọng, số ghế, "
Bộ dữ liệu về hình ảnh xe nhập chợ từ năm 2017 đến 2019 là hình ảnhđược truyền về từ các camera giám sát đặt tại các làn soát vé.
Dựa trên bộ dữ liệu thu thập, luận văn tiến hành chuẩn hoá dit liệu cho dữ
liệu đầu vào và dữ liệu đầu ra cho mô hình dự đoán biển số các phươngtiện.
Mô hình dự đoán biển số phương tiện
Ứng dụng: dự đoán biên số và thông kê phương tiện tham gia vào Chợ đầu
mối Thủ Đức
Phạm vi nghiên cứu của luận văn:
Phương tiện tham gia giao thông vào chợ đầu mối Thủ Đức có thông tin biển
số bị che khuất và khảo sát trên 100 phương tiện vào chợ nhiều nhất
Trang 142 TONG QUAN TINH HÌNH NGHIÊN CỨU
2.1 Giới thiệu chung
Thực tế có nhiều công trình và dự án quản lý phương tiện giao thông từ cameragiám sát đã được triển khai và đang hoạt động Tuy nhiên, tính đặc trưng cho từngnhu cầu riêng biệt thì chưa được thực hiện, việc đầu tư hạ tầng chi phí cao, công tácbảo trì, bảo dưỡng mất nhiều thời gian nên nhu cầu khai thác và sử dụng từ các côngtrình, dự án thực tế chỉ đạt mức trung bình và còn nhiều mặt hạn chế
2.2 Tình hình nghiên cứu các công trình — dự án trong nước.
Một số công trình, dự án đã được triển khai và đang vận hành tại Việt Namnhư:
e Công ty TNHH Tin Học - Công Nghệ Hoang Vân? cung cấp “GIẢI
PHÁP NHẬN DẠNG BIÊN SỐ XE TỰ ĐỘNG ANPR” (Thuật toán
“Automatic Number Plate Recognition - ANPR*’, thường được chia
thành bốn bước: (1) Chup ảnh phương tiện, (2) Phát hiện biển sé, (3)
Phân đoạn ký tự và (4) Nhận dang ký tự, Automatic Number Plate Recognition (ANPR) [24]).
© License Plate Recognition — LPR‘, phát triển bởi FPT Software hoạtđộng tốt với biển số Việt Nam và Nhật Ban, LPR dùng công nghệ Phân
đoạn và chỉnh lưu nhận dạng ký tự quang học: chuyển đổi hình ảnh cónội dung văn bản thành định dạng văn bản mà máy tính có thé có thé
đọc được, Recognizing License Plates in Real-Time [10].
® Nhận dạng biển số xe tự động dùng công nghệ nhận dạng quang học
được cơ quan chức năng dùng quan sát giao thông của công dân Được
ứng dụng rộng rãi dé giám sát các bãi đỗ xe như bãi giữ xe trường học,
siêu thị,
'Website:https://hoangvanco.com.vn
Tài liệu tham khảo [24]
Trang 15e NHẬN DIỆN BIEN SO XE MO CONG THONG MINH Š dùng
Camera AI View kết hợp thiết bị điện thông minh SH-C2Z và động cơ
mở cửa cổng đề kiểm soát do “BKAV Smart HOME” phát t
e_ CAMERA NHẬN DIỆN BIEN SO XE 5 qua thẻ từ RFID với tiếp xúc
không chạm - Mỗi một phương tiện sẽ được cấp một thẻ RFID chứa
các thông tin như họ tên chủ phương tiện, số CMT/CCCD người sở
hữu, loại phương tiện, biển số phương tiện Thông tin sẽ được lưu vào
hệ thống thông qua phần mềm chuyên dụng
Những nghiên cứu có nội dung tương tự với luận văn này:
Đề tài Ưu điểm Nhược điểm
BIEN SỐ XE TỰ độ di chuyên và điêu
ĐỘNG ANPR - Kết hợp với bộ cảm biến kiện thời tiết thuận lợi —
từ, giải pháp hoàn chỉnh ánh sáng tốt
phục vụ công việc quản lý
: - Phụ thuộc vào thiết bi, phương tiện ` `
phân cứng - chi phí dau
tư cao.
Website: bkavsmarthome.vn
k GSP® - AV Consultant | Audio Visual & Video Conferencing
15
Trang 16- Nhận dạng biển số theo - Nhận dạng ký tự trên
thời gian thật, ảnh chuyền biển số và bỏ qua cácđộng yếu tố đặc trưng, dấuLicense Plate hiệu riêng.
Recognition - - Tích hợp máy học vào bài
LPR, giải pháp do _ | toán nhận dạng ký tự - Biển số phải đúng quy
ô : cách, khoảng cách và
công ty FPT - Tốc độ xử lý nhanh, ft pho | as de 2
A A liêu kiện thời tiêt thuận
software cung cap thuộc vào thiét bi chuyên Loe
lợi, giúp nhận dang tot.
dụng.
- Dễ bảo tri, bảo dưỡng
Bảng 1: Bảng đánh giá so sánh những đề tài tương tự với luận văn.
2.3 Tình hình nghiên cứu các công trình - dự án nước ngoài.
e Automatic license plate recognition (ALPR) được phát trién boi NVIDIA’.
Dựa vào công nghệ ‘NVIDIA TAO TOOLKIT”, kết hợp giữa 2 mô hìnhLicense Plate Detection - LPD xác định khu vực, vùng có biển số vàLicense Plate Recognition - LPR đọc thông tin biển số từ vùng xác địnhdựa vào công nghệ nhận dạng các ký tự quang học có tốc độ xữ lý nhanh,đáp ứng được nhu cầu nhận dang bién số theo thời gian thuc, phuong tién
di chuyển, phù hợp ứp dụng vào quan lý phương tiện giao thông tại các
Thanh Phó, Đô Thị, Bến Cảng (Automatic License Plate Recognition
(ALPR): A State-of-the-Art Review [25]).
© Công Nghệ DTK LPR SDK phát triển bởi “DKTSoft” - Ung dụng nhậndang biển số phương tiện với nguồn dữ liệu là các video từ nhiều cameragiám sát khác nhau, Công Nghệ DTK LPR SDK cung cấp giải pháp nhận
dạng ký tự biển số của nhiều quốc gia khác nhau(Automatic Number Plate
Recognition/License Plate Recognition [24]).
https://developer.nvidia.com
Trang 172.4 Những tồn tại cần giải quyết
Những giải pháp và các dự án đã triển khai về nhận dạng bién số phương tiệnhiện mang lại hiệu quả tốt trong công tác quản lý và thống kê Tuy nhiên, vẫn cònnhiều giới hạn như là: phụ thuộc vào thiết bị phần cứng, chỉ phí triển khai dự án cao,khó khăn trong công tác bảo trì - bảo dưỡng, phụ thuộc vào điều kiện, qui cách biển
số nên nhu cầu đặc trưng riêng, sự chuyên biệt hoá của doanh nghiệp thật sự chưa
được quan tâm.
17
Trang 18CHƯƠNG 2: KIÊN THUC NEN TANG
Chương 2 luận văn gồm những kiến thức cơ bản về máy học và những mô hình
dự đoán Qua đó kiến thức này dùng dé thực hiện đề tài xây dựng ứng dung dự đoán
thông tin biển số phương tiện
1 Tổng quan về trí tuệ nhân tạo và máy học
Ai cũng đều hy vọng trí tuệ nhân tao có thể được tích hợp trên thiết bị máy
tính, thiết bị điện tử Việc nghiên cứu và tích hợp công nghệ, kỹ thuật máy học được
áp dụng rộng rãi trong nhiều lĩnh vực khác nhau Máy học cũng được áp dụng nhiềutrong những ngành khoa học/công nghiệp sản xuất với nguồn dữ liệu lớn có sẵn, cácứng dụng điển hình dé giải quyết các bài toán thực tiễn như:
e Xử lý ngôn ngữ tự nhiên (Natural Language Processing): xử lý văn bản,
phát hiện ngôn từ đả kích, phát ngôn tiêu cực trên mang xã hội,
e Pattern Recognition: nhận dạng khuôn mặt, nhận dang vân tay, giọng nói,
văn bản trong hình ảnh,
e Hệ thống tìm kiếm (Search Engine): tìm kiếm thông tin, tìm kiếm hình
ảnh,
e Hệ khuyến nghị xử lý công việc như chan đoán sớm bệnh động mạch vành,
dự đoán xu hướng của một mã chứng khoán
Qua đó, việc ứng dụng máy học ngày càng phát triển đã mang đến nhiều đột
phá lớn cho nhân loại Điền hình là sự bùng nổ của máy học đã mang lại nhiều thànhtựu trong vai trò phát triển Rô bốt Ngày nay, Rô bốt còn được phát triển thêm về mặt
cảm xúc, giọng nói tốt hơn - những thứ mà trước đây chúng ta thường thấy trên phim
ảnh, khoa học viễn tưởng.
Có thể nói việc áp dụng máy học đang là một bước tiến công nghệ để hỗ trợchan đoán bệnh lý, dự báo nguồn cung của thị trường bán lẻ, tự động hóa sản xuất 7giúp tiết kiệm được thời gian và chi phí vận hành và công sức lao động Tại ViệtNam, các chuyên đề ứng dụng AI nhằm hỗ trong các lĩnh vực nêu trên còn khá mới,nhưng đây là bước tiền mới thúc day phát triển xã hội hiện đại và cũng đang được cảithiện tốt hơn
Trang 19Các nhóm thuật toán dành cho học máy:
Các loại máy học
Học có giám sát Học không giám sát Học bán giám sát Hoc củng cố
ZN | | ZN
Continuous | | Categorical i : Categorical | | Target“Target “Target Target Variable not Categorical Target “Target Su
Variable Variable available) Variable Variable | {not available’
Regression Pisssification Clustering | | Association Flassification, Clustering Csireion ‘Control
Ũ + + + 1 + * +
Dự báo Hìnhảnh | | Phânkhúc | [Market basket! | Phânloại | |Timđườngđi| | Téiwuhéa | | Xe không
thời thiết y khoa khách hàng, analysis van ban trên DL GPS | | makerting người lái
Hình 2: Sơ dé phân loại máy học.
Dựa vào phương thức trong quá trình học máy, máy học chia làm 04 nhóm:
Hoc có giám sát (Supervised learning), Học không giám sát (Unsupervised learning),
Học bán giám sát (Semi-supervised learning) và Học cùng cố (Reinforcementlearning).
2 Một số thuật toán máy học pho biến
2.1 Phân loại hình ảnh (Classification) trong Thị giác máy tính
Phân loại “Image Classification with Classic and Deep Learning Techniques [4]”, “Developing an Image Classification Model Using CNN [5]” là một những cáchphổ biến để xử ly dữ liệu hình ảnh
Object detection Image segmentation Image classification
Hình 3: ví dụ phân loại hình ảnh.
19
Trang 202.2 Các thuật toán object detection
Gồm “Deep Learning for Computer Vision: A Gentle Introduction to Object
Recognition With Deep Learning [8]”, “Very Deep Convolutional Networks for Large-Scale Image Recognition [18]”:
- Ho cac m6 hinh R-CNN (Region-Based Convolutional NeuralNetworks) giải quyết các nhiệm vụ định vị vat thé và nhận diện vật thể
- Ho các mô hình YOLO (You Only Look Once), kỹ thuật nhận dang đối
tượng được thiết kế để nhận diện theo thời gian thực
Lớp các mô hình họ R-CNN
R-CNN (2014)
R-CNN được giới thiệu lần đầu vào 2014 bởi Ross Girshick và các cộng sự
“Rich feature hierarchies for accurate object detection and semantic segmentation
Trang 21Faster R-CNN (2016)
“Faster R-CNN: Towards Real-Time Object Detection with Region
Proposal Networks [15]”, “Fast R-CNN [17]” vào năm 2016.
YOLO được giới thiệu vào năm 2015 “YOLOv3: An Incremental
Improvement [11]”, “You Only Look Once: Unified, Real-Time Object Detection[14]” với kha năng xử ly 45 khung hình trên giây (frames per second - FPS), tốt hơnrất nhiều so với mô hình Faster R-CNN chi đạt 7 FPS Có nhiều phiên bản YOLOđược ra mắt và phiên bản nào cũng cho thấy sự cải thiện đáng kể (đặc biệt là về mặttốc độ)
Hình 6: Kiến trúc mô hình YOLO
21
Trang 22Thuật toán Single Shot Detector (SSD)
Kiến trúc SSD “SSD: Single Shot MultiBox Detector [16]” dựa trên CNN để
phát hiện tiêu đối tượng được thực hiện theo hai giai đoạn: Trích xuất các bản đồ đặctrưng và Áp dụng các bộ lọc tích chập dé xác định các đối tượng
512x512x3 38x38x512 19x19x1024 19x19x1024 10xi0x512 5x5x256 3x3x256 1x1x256
Hình 7: Kiến trúc mô hình SSD
2.3 Một số thư viện sử dụng thuật toán máy học và công cụ hỗ trợ
Luận văn đã giới thiệu các thuật toán trong máy học được sử dụng phổ biến,
ngoài ra còn có rất nhiều các thuật toán máy học khác luận văn không thể trình bày
đầy đủ như Phân cụm (Clustering), Cây quyết định (Decision tree), Phân loại Naive
Bayes (Naive Bayes classifier), SVM (Support Vector Machines)
Để tạo điều kiện thuận lợi, hỗ trợ tốt quá trình phát triển ngành khoa học maytính, có nhiều thư viện được tạo ra nhằm giúp đỡ các nhà khoa học, các nhóm nghiêncứu, lập trình viên sử dụng, giúp giải quyết các bài toán máy học trở nên đơn giảnhơn, tiết kiệm nhiều chỉ phí cũng như thời gian nghiên cứu
Tuy có nhiều thư viện hỗ trợ trong các thuật toán máy học được, luận văn này
sẽ giới thiệu ba thư viện phổ biến, đó là: Scikit Learn, Keras và Tensorflow
2.3.1 Giới thiệu Keras
Keras là một thư viện chuyên hỗ trợ cho việc học sâu (deep learning), thư viện
này được xây dựng trên nền tảng của thư viện Theano và TensorFlow, được tạo ra
bởi Francois Chollet Keras được viết bằng ngôn ngữ lập trình Python, cung cấp các
API phục vụ cho việc cho việc xây dựng mạng nơ-ron trong máy học, hỗ trợ phát
Trang 23triển nhanh chóng việc xây dựng mạng no-ron mà không cần biết quá nhiều về cácchỉ tiết toán học của đại số tensor hay những phương pháp tối ưu hóa và kỹ thuật xử
lý các con số Ý tưởng cốt lõi của Keras là tạo điều kiện cho việc tạo ra mẫu
nhanh và đễ đàng thử nghiệm
Sử dụng Keras là một lợi thế lớn trong máy học, đặc biệt đối với các nhà khoa
học và các nhà phát triển vì họ có thể bắt tay vào xây dựng các mô hình học sâu mà
không gặp nhiều khó khăn
Keras
Simple Flexible Powerful.
Looking for a Keras companion course?
Deep Learning with Python, Second Edition is out now.
Hình 8: Trang chủ Keras: https://keras.io/
Nghiên cứu học sâu ngày nay đang bước vào thời kỳ hoàng kim, xu hướng sửdụng các mô hình học sâu hiện đang thịnh hành, nhu cầu về những người được đào.tạo về các mô hình học sâu cũng ngày càng tăng Các tổ chức về khoa học công nghệcũng đang có ging kết hợp học sâu vào các quy trình của họ, cụ thể hóa các ý tưởng
và Keras là sự lựa chọn thích hợp vì nó cung cấp một API dễ dang để thử nghiệm vàxây dựng các ứng dụng có thuật toán học sâu mà không cần tốn quá nhiều công sức
Keras có những đặc diém sau:
© Keras là thư viện cấp cao xây dựng trên Theano và TensorFlow , vì vậy cóthể sử dụng ở phía backend Có chuyền từ backend này sang backend khác
(Thenao hay TensorFlow ) một cách thuận lợi.
Trang 24e Việc học trên các mạng lưới nơ-ron yêu cầu khá nhiều thời gian và bộ nhớmáy tính Các thư viện học sâu như TensorFlow, Caffe, Torch, chỉ có thể
chạy trên GPU Keras có thể chạy tốt trên cả CPU và GPU
® Keras hỗ trợ nhiều loại lớp mạng nơ-ron đa dạng như: tầng kết nối đầy đủ
(fully connected), mạng tích chập (convolution), mạng tập trung (pooling),mạng hồi quy (recurrent), Có thé kết hợp các lớp đề xây dựng những môhình phức tạp hơn.
e Trong cấu trúc tự nhiên của Keras, mỗi thành phần của mạng nơ-ron là mộtmô-đun riêng lẻ, độc lập, có thể cấu hình đầy đủ, và các mô-đun này có thểđược kết hợp với nhau để tạo ra các mô hình mới Tắt cả các mô-đun khác
nhau có thể được kết hợp đề xây dựng thành các mô hình khác nhau Ưu
điểm chủ yếu của hệ mô-đun (modularity) là dễ dàng thêm vào các mô-đunriêng biệt Điều này làm cho Keras trở nên nôi bat và khả dụng hơn, cực kỳ
linh hoạt và phù hợp cho việc nghiên cứu sáng tạo.
© Xây dựng mã nguồn trong Keras rat dễ dàng và thuận lợi Các API được
cung cấp dễ sử dụng, thân thiện với người dùng mà không cần biết quá
nhiều về kiến thức mạng nơ-ron Keras là một thư viện Python đầy đủ, vàtoàn bộ mã nguồn được viết bằng Python, điều này làm cho nó trở nên dễ
gỡ rồi (debug) trong quá trình xây dựng và khám phá Các mã nguồn được
tối giản, và các thao tác được thêm vao các câu lệnh Python cũng trực quan
Trang 25Thanh phan cốt lõi của kiến trúc Keras là một mô hình (model) Bao gồm
class, activations, optimization, và loss Mô hình Keras đơn giản nhất là mô hình
tuần tự (Sequential) gồm một chồng xếp tuyến tính đơn giản Việc sắp xếp lớp khác
có thé được hình thành bằng mô hình chức năng (Functional model)
Keras cung cấp API cho hầu hết các loại lớp phô biến Ta cũng có thé hợp nhất
hoặc ghép nói lớp cho một mô hình song song, ngoài ra ta có thé tự viết một lớp riêng
Các thành phần khác của mô hình mạng nơ-non như hàm mit mát (loss function),
metric, phương pháp tối ưu hóa, hàm activation và regularization đều có sẵn với hầuhết các lựa chọn Một thành phần hữu ích khác của Keras là mô-đun tiền xử lý với hỗ
trợ thao tác và tiền xử lý hình ảnh, văn bản va dữ liệu chuỗi
Những lợi thế lớn nhất của Keras là một danh sách rất lớn các mã nguồn vớimẫu ví dụ có sẵn trong kho lưu trữ Keras github và trên mạng internet
Trang 26TensorFlow là một thư viện da nền tảng Thư viện này chạy trên hầu như tat
cả: GPUs và CPU — bao gồm di động và nền tảng nhúng, thậm chí đơn vị xử lý tensor
(TPUs) là phần cứng chuyên dụng dé tính toán tensor Đến nay, TensorFlow càng
được cung cấp rộng rãi
Models ina box
TensorFlow Distributed E› n Engine
Hình 11: Vai trò của TensorFlow trong các kiến trúc ứng dungKiến trúc TensorFlow hoạt động được chia thành 3 phần: Tiền xử lý dữ liệu,Xây dựng mô hình, Huan luyện và Ước tính mô hình
Các API cấp cao của TensorFlow kết hợp với đồ thị tính toán làm cho môi
trường phát triển phong phú và linh hoạt cũng như khả năng sản xuất mạnh mẽ trong
cùng một khuôn khổ
Một số ưu điểm của TensorFlow :
© Cung cấp một hệ thống tính toán tối ưu.
© Chia bài toán thành các mô-đun nhỏ, giúp đồ thị biết mô-đun nào.
© Tính toán phân tán, song song trên nhiều CPU, TPU, GPU hoặc nhiều thiết
bị máy tính.
Trang 272.4 Tăng cường dữ liệu trong deep learning
2.4.1 Tìm hiểu về cách Data Augmentation trong keras
Data
—* + ——Ỳ
Train Valid Test
| class_a class_b | | class_a class_b | Test_folder
1 =1
Hình 12: Cấu trúc thư mục Data Augmentation
2.4.2 Labellmg tool - gan nhãn dữ liệu:
Hình 13: Tập tin gan nhãn cho hình ảnh phương tiện định dang wt.
- (1): <lớp>, (2): <x>, (3):<y>, (4): <chiều rộng>, (5): <chiều cao>
27
Trang 28CHƯƠNG 3: THU THẬP VÀ XÂY DỰNG BỘ DỮ LIỆU
Chương 3 luận văn trình bày về quá trình thu thập dữ liệu dành cho máy học,
leu trữ và phân tích dữ liệu Sau đó, luận văn sẽ đánh gi dit liệu và xây dựng một
bộ dữ liệu chuẩn dé huấn luyện cho mô hình dự báo biên số phương tiện
1 Bộ dữ liệu thu thập sử dụng cho máy học
1.1 Nguồn cung cấp dữ liệu
Dữ liệu đăng kiểm tại cổng thông tin điện tử Cục Đăng Kiểm Việt Nam
Trên bộ dữ liệu này, giúp hệ thống tra cứu thông tin phương tiện như: Loại
Biển Số, Thông Tin Biển Số, Loại Phương Tiện, Hạng Đăng Kiểm, Tải trọng, Số
Luận văn sử dụng các thông tin đữ liệu phương tiện cơ giới của Cục Đăng
Kiểm Việt Nam gồm những thông tin cơ bản như:
Thuộc tính Mô tả thông tin
thông tin phương tiện được cấp và quản lý bởi Bộ
GTVT.
Biển Số
Nhãn Hiệu, Loại Phương Tiện _ | Nhà sản xuất, loại phương tiện: 6-t6 con, 5 chỗ, 6 chỗTải Trọng Trọng lượng tông của phương tiện
Đơn Vị Đăng Ký Nơi đăng ký kiểm định
Tem Kiểm Định Mã số quản lý thông tin kiểm định của phương tiện
Hạn Đăng Ký Kiểm Định Thời gian kết thúc kiểm định của phương tiện
Dữ liệu được cập nhật liên tục ngay khi có thông tin
Tính khả dụng của dữ liệu a
dang ky, dang kiém.
Bang 2: Mô ta các thuộc tinh của bộ dữ liệu Đăng Kiểm Việt Nam.
Trang 29Dữ liệu hình ảnh của phương tiện lưu tại Chợ đầu mối Thủ Đức.
Phương tiện cơ giới khi tham gia hoạt động tại Chợ đầu mối Thủ Đức phải vào
làn xe theo quy định và dừng tại quầy soát vé, hồng camera giám sát lưu lại quá
trình phương tiện vào chợ, hệ thống cảm biến kết hợp với hệ thống camera chuyêndụng sẽ chụp hình ảnh phương tiện, tiến hành xữ lý dé xác định thông tin biển số (đọc
biển số) và truy xuất thông tin phương tiện từ Cục Đăng Kiểm Việt Nam” Khi xác
định được thông tin phương tiện hệ thống sẽ đề xuất vé nhập chợ và hoàn tat quytrình nhập chợ của phương tiện.
Bộ dữ liệu trong luận văn là hình ảnh và thông tin các phương tiện tham gia
hoạt động vào chợ liên tục từ năm 2017 đến 2019 Luận văn này sử dụng dữ liệu hình
ảnh được sự cho phép từ công ty và chỉ dùng cho mục đích nghiên cứu và học tập.
Dữ liệu hình ảnh từ camera giám sát dùng cho quá trình huấn luyện với thôngtin như sau:
Trang 30Nội Dung Diễn Giải
từ trái sang phải):
e Phuong tiện vào làn: 01.
® Ngay vào: năm 2017, tháng 07
Trang 311.2 Mô tả bộ dữ liệu thu thập dùng cho máy học
Bộ dữ liệu thông tin của phương tiện từ Cục Đăng Kiểm Việt Nam được sửdụng để tra cứu thông tin phương tiện: Loại phương tiện, Tải trọng, Hạn đăng kiểm,
Số chỗ ngồi, qua công thông tin điện tử
Bộ dữ liệu hình ảnh tất cả các phương tiện tham gia vào chợ dừng tại các lànsoát vé được camera giám sát lưu lại tại Chợ đầu mối Thủ Đức được dùng để huấn
luyện mô hình (¢raining).
2 Đánh giá và xây dựng bộ dữ liệu chuẩn
Khao sát thực tế và nguồn dữ liệu:
Dữ liệu sử dụng cho việc huấn luyện mô hình máy học là hình ảnh phươngtiện từ camera giám sát được đặt tại các cabin soát vé khi phương tiện vao làn xe kiểmsoát với đầy đủ thông tin hợp lệ từ Cục Đăng Kiểm Việt Nam Tắt cả thông tin củaphương tiện: thông tin biên só, thông tin đăng kiêm, ngày, giờ vào chợ được lưu trong
cơ sở dữ liệu tại Chợ đầu mối Thủ Đức
Từ thực tế hoạt động tại Chợ, luận văn khảo sát nhu cầu lượt phương tiện vàochợ hàng ngày (không khảo sát các ngày lễ, tết, ngày chợ cao điềm) và thu nhận được
Chợ đầu mối Thủ Đúc chỉ các phương tiện vận chuyền chuyên dụng là
có nhu cầu vào chợ thường xuyên Các phương tiện này được kiểm soát
và phân loại như: xe container, xe khách từ 15 ghế trở lên, xe tải, xe
bán tải, xe ga-gác.
- Không kiểm soát (không tính lượt) các loại phương tiện như: xe máy,
xe hơi 04 ghế, xe hơi 07 ghế và xe hơi 09 ghế
- Thời gian hoạt động có lượt phương tiện vào nhiều từ 22 giờ đến 04 giờ
hôm sau.
- Số làn xe tại khuôn viên chợ:
31
Trang 32¢ Làn xe kiểm soát vào và ra: 07 làn xe.
© Làn xe không kiểm soát vào va ra: 04 làn xe.
Có 02 loại kiểm soát thông tin phương tiện:
© Loại phương tiện là xe container, kiểm soát đầy đủ thông tin :thông tin biển số đầu kéo, hình ảnh đầu kéo, thông tin biển sốrơ-mooc, hình ảnh rơ-mooc, thông tin biển số thùng container,
Giới hạn của hệ thống và nhu cầu nâng cấp:
Hiện trạng hoạt động thu phi bán tự động tại Chợ đầu mối Thủ Đức, luận văn
dau tư cao
Viéc bảo trì, bao dưỡng hiện tại không đáp ứng được nhu cầu hoạt độngliên tục.
Hệ thống thu phí bán tự động hiện tại: không nhận dạng vì hình ảnhphương tiện có biển số bị che khuất, biển số bị biến dạng, ký tự trên
biển số bị nhoè Dẫn đến tình trạng phợng tiện tham gia giao thông vào
chợ bị nhận dạng sai thông tin, hoặc không nhận dạng được rất nhiều.Phương tiện cần kiểm soát là loại phương tiện “xe tải” Nhu cầu quản
lý về thông tin biển sé, hình ảnh phương tiện và thời gian phương tiệnvào, ra là rất lớn
Trang 33Từ những giới hạn của hệ thống thu phí bán tự động, luận văn đề xuất giải
pháp là t mô hình máy học dé nhận dạng thông tin đối tượng, cụ thé là nhận dạngthông tin biển số phương tiện qua hình ảnh được truyền về từ camera, nhằm giúp hỗtrợ hệ thống bán tự động hiện tại trong những trường hợp: không nhận dạng đượchoặc nhận dang sai thông tin biển số phương tiện
Mục tiêu đạt được khi phát triển hệ thống thu phí với máy học:
Giúp nhận dạng được thông tin phương tiện trong các trường hợp đặc
biệt mà hệ thống thu phí bán tự động hiện tại không nhận dạng đượchoặc nhận dạng sai: biển số bi che khuất, biển số bị biến đạng, biển số
có ký tự bị nhoè.
Đáp ứng được nhu cầu bảo trì nhanh chóng, đảm bảo được tính liên tục
vì không phụ thuộc vào các thiết bị chuyên dụng, giải pháp sử dụngthiết bị thay thế phô biến với chi phí thấp
Từng bước thay thế hệ thống bán tự động hiện tại phụ thuộc vào thiết
bị phần cứng chuyên dụng, tiến tới sử dụng hệ thống nhận dạng bằng
thuật toán nhận dạng đối tượng ít phụ thuộc thiết bị chuyên dụng
“Tích hợp thuật toán và ứng dụng trên các thiết bị di động như PDA chonhu cầu mở rộng hoặc tăng cường làn kiểm soát
Điều kiện thuận lợi phát triển giải pháp cho mô hình máy học:
Được áp dụng tại Cho đầu mối Thủ Đức
Dữ liệu mới (phương tiện mới vào chợ) phát sinh rat ít
Dữ liệu về thông tin phương tiện cơ giới - Cục Đăng Kiểm Việt Namkết hợp hình ảnh phương tiện từ camera giám sát: đầy đủ và phù hợpcho việc huấn luyện mô hình nhận dạng bằng máy học
Loại phương tiện có nhu cầu kiểm soát quản lý nhiều nhất là: loại
phương tiện “xe tải” (chỉ kiểm soát và quản lý thông tin biển số và hìnhảnh phương tiện, ngày, giờ vào - ra).
Mô hình nhận dạng thông tin đối tượng trong máy học với độ chính xáccao, nhiều mô hình có các thuật toán được cải tiến, nâng cấp liên tục
“ œ
Trang 34Dữ liệu cơ sở thực nghiệm:
Sau 03 năm hoạt động hệ thống thu phí bán tự động tại Chợ đầu mối Thủ Đức(từ 2015 đến 2017), luận văn nhận xét tháy dữ liệu mới (xe mới vào chợ lần đầu) phátsinh rất ít và năm 2020 đến năm 2022 dữ liệu bị gián đoạn bởi đại dịch covit
Do đó, luận văn đề xuất chọn mẫu dữ liệu từ 01/01/2017 đến 31/12/2019 làm
cơ sở đữ liệu tiêu chuẩn đưa vào các thuật toán máy học đê huấn luyện mô hình nhậnđạng:
- Lọc thông tin phương tiện vào chợ trong khoản thời gian từ 01/01/2017đến 01/01/02019, lấy toàn bộ hình ảnh từng phương tiện mỗi khi nhậpchợ.
Để dữ liệu được thống nhất và chuẩn hóa, phạm vi nghiên cứu của luận vănnày quy định như sau:
- Từ cở sở dữ liệu: hình ảnh và thông tin phương tiện được lưu tại Chợđầu mối Thủ Đức, luận văn lọc ra phương tiện vào chợ nhiều nhất vàchọn 100 phương tiện làm dữ liệu cơ sở thực nghiệm với tiêu chí được
chọn:
e 20 phương tiện hệ thống hiện tại nhận dạng chính xác
e 80 phương tiện hệ thống hiện tại nhận dạng sai hoặc không nhậndang được.
e Phuong tiện là xe tải lớn, chỉ nhập chợ vào khoản thời gian 22
giờ đến 04 giờ hôm sau
e Phuong tiện là xe tải nhỏ, giống nhau về mẫu xe, màu sơn, tải
trọng, khác nhau về biển số và các logo trên mỗi phương tiện,
có thời gian nhập chợ từ 22 giờ đến 04 giờ hôm sau
- Nội dung từng hinh anh của phương tiện được chọn theo tiêu chí: hình
ảnh nhận dang đúng thông tin biển số với ánh sáng ban ngày, hình ảnhthông tin biển số nhận dạng đúng với ánh sáng đèn chiếu sáng ban đêm,hình ảnh thông tin biển số nhận đạng sai do biển số bị che chuất bởi vậtcản phía trước, biển số bị biến dạng, ảnh hưởng bởi thời tiết: loá sáng,
hạt mưa.
Trang 35Phương tiện có thông tin đầy đủ: Hạn đăng kiểm, Loại phương tiện,
Tén phương tiện, Tải trọng, Số ghé
Tiến hành trích chọn dữ liệu hình ảnh huấn luyện: mỗi phương tiện lọc
tất cả số lần (lượt) vào chợ trong khoản thời gian 01 năm, từ 01/01/2018đến 31/12/2019 (tương đương 365 ngày), số hình ảnh nhận được sẽ
kiểm tra theo tiêu chí giống nhau thì chọn 05 hình làm đặc trưng, từ đó
tìm các yếu tố phân biệt như là: hình ảnh rõ ràng, ánh sáng đầy đủ, khảnăng nhận dạng tốt — hình ảnh bị gây nhiều: vật cản (bùn, sình lay, bién
số bị che khuất (một phần, hoàn toàn), yếu tố thời thiết gây nhòe, bị lóasáng, thiếu sáng, vị trí xe dừng tại cabin lệt trái, lệt phải, dừng từ xa,
Mỗi phương tiện lấy ra 50 hình đại diện cho các yếu tố cần phân biệt
đặc trung (ứng với 1 hình là 1 lần tham gia vào chợ): trong đó 30 hìnhlàm cơ sở huấn luyện, 10 hình là cơ sở kiểm tra trong quá trinh huấnluyện và 10 hình làm cơ sở kiểm chứng sau khi huấn luyện
Dữ liệu ảnh từng phương tiện trước khi đưa vào huấn luyện được tăng
cường số lượng mẫu huấn luyện bởi “Data augmentation” với tiêu chí:
dich chuyên sang trái, dịch chuyền sang phải, dich chuyền lên trên, dichchuyền xuống dưới, tăng sáng, giảm sáng, tăng nhiễu nhằm mô phỏng
như điều kiện thực tế khi phương tiện vào làn kiểm soát
Dùng bộ dụng cụ labellmg.py dé gan nhãn hình ảnh từng phương tiện
Trường hợp thực nghiệm (thực tế) kiểm tra tính khả thi (độ chính xác)
nhận dạng phương tiện và dự đoán biển số, luận văn quy định: biển số
do hệ thống nhận dạng sai (% độ chính xác dưới 80) xem như dữ liệukhông được chọn, xe vào chợ lần đầu (dữ liệu chưa được huấn luyện)
và các yếu tố nhận dạng cho ra kết quả không đúng (bao gồm khôngnhận dạng được), hướng xữ lý như sau:
Trang 36© Nhân viên bán vé, chịu trách nhiệm giám sát, kiểm tra biển số
xe dừng tại cabin có đúng (chính xác) với trên phần mềm kiểm
soat:
Y Nếu đúng, xuất vé bán — xe vào chợ thành công
Y Nếu sai, nhập lại thông tin biển số đúng — bán vé, xe vào.chợ thành công.
« Sau mỗi ca làm việc (08 giờ): bộ phận IT, chịu trách nhiệm trích
lọc thông tin liệt kê xe vào chợ với điều kiện biển số hệ thốngnhận dàng và biển số nhân viên nhập vào là không giống nhau,
từ đó có được danh sách thông tin xe nhập chợ:
Y Đối với nhận dang sai từ hệ thống: tiến hành khảo sát tìm
hình ảnh phân tích, gán nhãn
- Huấn luyện lại để tang cường độ chính xác cho lần
nhận dạng kế tiếp, đối với xe đã được huấn luyện.- Đối với các trường hợp xe mới, cần ghi chú và gannhãn theo doi dé chuẩn bị dữ liệu cho lần huấn
luyện mới.
Dữ liệu huấn luyện mô hình:
- Dữ liệu tăng cường (DATA AUGMENTATIONS):
e Làm lại kích thước hình ( Resize): 512(W) x 409(H), 96 dpi, 24
bit.
e Dữ liệu huấn luyện ( dataTrain)/100 class: 3.000 hình ảnh.
- Dữ liệu kiểm chứng ( dataValid)/100 class: 1.000 hình ảnh
- Dữ liệu xác thực ( dataPredict)/100 class: 1.000 hình ảnh - 720 (W) x
576 (H), 96 dpi, 24 bit ( ứng với mỗi lớp xác thực 10 hình).
Trang 37CHƯƠNG 4: PHƯƠNG PHÁP VÀ THỰC NGHIỆM CÁC
THUẬT TOÁN MÁY HỌC DỰ ĐOÁN
Chương 4 luận văn giới thiệu các tiêu chí để đánh giá thuật toán máy họcbằng các chỉ số đánh giá thuật toán, môi trường để chạy thuật toán máy học Sau đó
sẽ cho ra kết quả thực nghiệm đánh giá mô hình dựa trên các chỉ số đánh giá thuậttoán.
1 _ Các chỉ số đánh giá thuật toán
Để đánh giá mô hình thuật toán dự đoán biển số phương tiện, luận văn này sửdụng phương pháp thống kê giữa giá trị thực tế (dữ liệu dùng đề kiểm thử) với giá trị
dự báo dé đánh giá độ chính xác của thuật toán máy học trên bộ dữ liệu.
Các chỉ số đánh giá được sử dụng trong luận văn:
Sai số trung bình bình phương bình quân (4.1)
(RMSE: root-mean-square error):
Bảng 5: Công thức tính các chỉ số đánh giá mô hình máy học.
Sai số bình phương trung bình (RMSE) ở công thức (4.1) có miễn giá trị nằm
trong khoảng (0, +œ) La chỉ số được sử dụng nhiều trong việc đánh giá các mô hình
dự báo RMSE là giá trị thể hiện độ lớn trung bình của sai số của dự báo Các RMSE
có giá trị = 0 khi và chỉ khi giá trị dự báo bằng với giá trị giá trị đo được từ kết quả
thực tế tại mọi thời điểm trong không gian, thời gian (độ chính xác 100% và không
Trang 38có sai số) Trong thực tế, giá trị lệch bằng 0 khó xảy ra và giá trị của thông số RMSEthường lớn hơn 0.
Thực nghiệm trong luận văn dựa trên các thư viện máy học mã nguồn mở,
dùng các thông số trên để đánh giá độ chính xác của thuật toán máy học trên bộ dữliệu Tất cả các thông số trên được hiện thực bằng các thư viện máy học mã nguồn
mở phổ biến như Tensorflow, Scikit-learn, Keras với ngôn ngữ python
2 Môi trường dùng cho huấn luyện máy học
Máy tính được sử dụng để thực hiện huấn luyện cho các mô hình thuật toánmáy học là Colaboratory (Google Research) với cầu hình phần cứng được cung cấp:
° CPU: Intel(R) Xeon(R) CPU @ 2.00GHz.
e RAM: 14 GB.
e ~~ SSD: 200GB
e GPU: NVIDIA-SMI 460.32.03 | Persistence-M
° OS: Ubuntu 18.04.5 LTSPhát triển phần mềm sử dụng Visual Studio 2019 (VS2019) VS2019 hỗ trợnhiều tiện ích, các gói phát triển phần mềm khác nhau: Python, Javascript,
Trang 40Thông tin Mô hình SSD Mô hình YOLO
Môi trường | Colaboratory Colaboratory
Thu viện TensorFlow TensorFlow
Ngôn ngữ Python Python
Số Class 100 100
Size ảnh 512(W) x 409(H), 96dpi, 24bit | 512(W) x 409(H), 96dpi, 24bit
Data Train
3.000/100 class 3.000/100 class (hinh anh)
Data Valid
1.000/100 class 1.000/100 class (hinh anh)
Data Test
1.000/100 class 1.000/100 class (hinh anh)
Pre-train
ssd_mobilenet_v2 darknet53.conv.74Model
Bước Train | 30.000 30.000
Bang 6: Thông tin môi trường thực nghiệm