1. Trang chủ
  2. » Luận Văn - Báo Cáo

Luận văn thạc sĩ Công nghệ thông tin: Xây dựng ứng dụng dự đoán biển số xe bằng thuật toán nhận dạng đối tượng

88 0 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Xây Dựng Ứng Dụng Dự Đoán Biển Số Xe Bằng Thuật Toán Nhận Dạng Đối Tượng
Tác giả Nguyễn Tường Duy
Người hướng dẫn TS. Nguyễn Tấn Cầm
Trường học Đại học Quốc gia TP HCM - Trường Đại học Công nghệ Thông tin
Chuyên ngành Công nghệ thông tin
Thể loại luận văn thạc sĩ
Năm xuất bản 2022
Thành phố TP Hồ Chí Minh
Định dạng
Số trang 88
Dung lượng 38,44 MB

Nội dung

Phạm vi thực hiện trong luận văn là áp dụng vào nghiên cứu và phát triển ứng dụng dự đoán biển số phương tiện bằng thuật toán nhận dạng đối tượng với phương.. Mục tiêu của luận văn là xâ

Trang 1

ĐẠI HỌC QUOC GIA TP HCMTRUONG ĐẠI HỌC CÔNG NGHỆ THONG TIN

BARR

NGUYEN TUONG DUY

XÂY DUNG UNG DUNG DỰ DOAN BIEN SO XEBANG THUAT TOAN NHAN DANG DOI TUQNG

LUAN VAN THAC Si

NGANH CONG NGHE THONG TIN

Mã số: 8.48.02.01

TP HO CHÍ MINH - 2022

Trang 2

ĐẠI HỌC QUỐC GIA TP HCM

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN

BARR

⁄Z

Nguyễn Tường Duy

XÂY DUNG UNG DUNG DỰ DOAN BIEN SO XE

BANG THUAT TOAN NHAN DANG DOI TUQNG

LUAN VAN THAC Si

NGANH CONG NGHE THONG TIN

Mã số: 8.48.02.01

NGƯỜI HƯỚNG DẪN KHOA HỌC:

TS NGUYEN TAN CAM

TP HO CHi MINH - 2022

Trang 3

LỜI CAM ĐOANHọc viên xin cam đoan luận văn thạc sĩ “Xây dựng ứng dụng dự đoán biển số xe bằngthuật toán nhận dạng đối tượng” là công trình nghiên cứu của riêng học viên Các số liệuthống kê được sử dung trong luận văn là trung thực và chưa được công bồ trong bat kỳcông trình nghiên cứu nảo.

Tắt cả tài liệu tham khảo, kế thừa đều được trích dẫn và tham chiếu đầy đủ

Học viên

Nguyễn Tường Duy

Trang 4

LỜI CẢM ƠNTrong quá trình hiện thực lên ý tưởng nghiên cứu và hoàn thành đề tài, học viênrất trân trọng vì may mắn nhận được sự hỗ trợ từ Nhà Trường, quý Thầy Cô, bạn bè

cùng khoá học và sự động viên, khích lệ từ Gia Đình.

Học viên xin gửi lời cảm ơn chân thành đến quý Thầy Cô trong khoa và PhòngĐào Tạo Sau Đại Học trường Đại Học Công Nghệ Thông Tin đã hỗ trợ, tạo điều kiện

để học viên được học tập, nghiên cứu và hoàn thành luận văn

Học viên cũng rất cảm ơn Thầy TS Nguyễn Gia Tuấn Anh về sự quan tâm vàhướng dẫn tan tình của Thay

Học viên xin được gửi lời tri ân đến Thay TS Nguyễn Tan Cầm - người thay luôntheo sát và chia sẽ kiến thức chuyên môn giúp học viên có thêm nhiều góc nhìn về đềtài Ngoài ra, thầy đã hỗ trợ góp ý, đưa ra những nhận xét tích cực dé học viên có thêm

ý tưởng phát triển đề tài và hoàn thành luận văn

Tran trọng cảm on Công Ty Cổ Phần Kinh Doanh và Quản Lý Chợ Nông Sản Thủ

Đức (Chợ Đầu Mối Thủ Đức) đã tin tưởng và chia sẽ thông tin giúp học viên có cơ hộithực hiện luận văn.

Học viên cũng muốn gửi lời cảm ơn đến những người bạn học thân thiết đã chia

sẻ kinh nghiệm, kiến thức chuyên môn để giúp học viên có thêm hiểu biết để hoàn thành

được dé tài Cảm ơn gia đình tạo điều kiện về tinh than lẫn vật chất giúp học viên có cơhội học tập, nghiên cứu và hoàn thành luận văn.

Một lân nữa học viên xin chân thành cảm ơn và kính gửi đến quý Thầy Cô, đơn vịtài trợ và bạn bè, thân nhân những lời chúc tốt đẹp nhất

TP Hồ Chí Minh, ngày 30 tháng 06 năm 2021

Học viên

Nguyễn Tường Duy

Trang 5

CHƯƠNG 1: TONG QUAN VE DE TÀI

1 GIỚI THIEU DE TAI

1.1 Giới thiệu đề tài

1⁄2 Mục tiêu nghiên cir

1.3 Đối tượng và phạm vi nghiên cin Nk)

2 TÔNG QUAN TINH HÌNH NGHIÊN CỨU .14

2.1 - Giới thiệu chung .14 2.2 _ Tình hình nghiên cứu các công trình — dự án trong nước 14 2.3 Tình hình nghiên cứu các công trình - dự án nước ngoài.

2.4 Những tồn tại cần giải quyết

CHƯƠNG 2: KIEN THỨC NEN TANG

1 Tông quan về trí tuệ nhân tạo và máy học 18

2 Một số thuật toán máy học phô biến 19

CHƯƠNG 3: THU THẬP VÀ XÂY DỰNG BO DU LI 8

1 Bộ dữ liệu thu thập sử dụng cho máy học 28

1.1 Nguồn cung cấp dữ liệu 281.2 Mô tả bộ dữ liệu thu thập dùng cho may họ: 31

2 Đánh giá và xây dung bộ dữ liệu chuẩn 31

CHUONG 4: PHUONG PHAP VA THUC NGHIEM CAC THUAT TOAN MAY

HỌC DỰ DOAN

1 Các chỉ sô đánh giá thuật toán

2 Môi trường dùng cho huấn luyện máy học

3 Thực nghiệm và đánh giá.

3.1 Thực nghiệm kiểm tra heatmap với thuật toán CNN

3.2 Tăng cường dữ liệu Data Augmentation

3.3 Gan nhãn dữ liệu - dùng LabelIng tool

Trang 6

3.4 Huấn luyện bằng thuật toán You Only Look Once (YOLO)

3.5 Huấn luyện bằng thuật toán Single Shot Detector (SSD)

4 Tổng hợp kết quả

CHƯƠNG 5: TRIEN KHAI UNG DUNG DỰ ĐOÁN BIEN SO XE BẰNG THUẬT

TOÁN NHẬN DẠNG ĐÓI TƯỢNG

1 Mô hình ứng dụng dự đoán biển số xe

2 Giao diện ứng dụng dự đoán biển số xe

2.1 Màn hình chính

2.2 Trang thống kê

CHƯƠNG 6: KET LUẬN VÀ HƯỚNG PHÁT TRIEN

1 Những thuận lợi và khó khăn.

2 Kết quả đạt được

3 _ Hướng phát triên

TAI LIEU THAM KHAO

Trang 7

Danh mục các ký hiệu và chữ viết tắt

Ký hiệu Ý nghĩa

CNTT Công nghệ thông tin

VN Việt Nam.

TP HCM _ | Thành phố Hồ Chí Minh tại Việt Nam

= Xấp xi, tương đương

e Phần tử thuộc tập hợp

3 Tén tại

vụ Với mọi

f Kí hiệu hàm số (in đậm, chữ thường)

xy Các vector (in đậm, chữ thường).

Xi Phần tử thứ ¿ của vector x (i bat dau từ 1)

XY Các ma trận (in đậm, chữ hoa).

(xr,x:, x„} | Kí hiệu tập hợp các phan tử (từ 1 đến n, n là số tự nhiên)

„1 Tổng của n phần tử (phan tử ¡ bắt đầu từ 0 đến n — 1)

i=0

1.234,56 Dinh dang kiểu dữ liệu số học: dấu phẩy để ngăn cách phần thập

phân và dau chấm đề ngăn cách các nhóm sé

IDE Integrated Development Environment: môi trường phát triển tích

hợp.

Trang 8

Danh mục các bảng

Bang 1: Bảng đánh giá so sánh những đề tài tương tự với luận văn

Bảng 2: Mô tả các thuộc tính của bộ dữ liệu Đăng Kiểm Việt Nam

Bảng 3: Hình ảnh phương tiện tại chợ đầu mối Thủ Đức

Bảng 4: Mô tả thông tin hình ảnh phương tiện tại chợ dau Môi Thủ Đức .

Bảng 5: Công thức tính các chỉ số đánh giá mô hình máy học

Bảng 6: Thông tin môi trường thực nghiệm

Bảng 7: Kiểm thử những trường hợp đặc biệt bằng các thuật toan

Bang 8: Kết quả kiểm thử 100 phương tiện bằng thuật toán Yolo

Bảng 9: Kết quả kiểm thử 100 phương tiện bằng thuật toán SSD

Bảng 10: So sánh kết quả giữa SSD và YOLO

Bang 11: Mô tả thông tin dit liệu phương tiện khi nhập chợ.

Bảng 12: Mô tả thông tin dữ liệu phương tiện khi nhập chợ.

Bang 13: Mô tả màn hình chính của ứng dụng

Bảng 14: Mô tả màn hình trang thống kê,

Bảng 15: Kết quả nhận dạng trên hệ thống bán tự động

Bảng 16: Kết quả thu được khi áp dụng thêm thuật toán Yolo

Trang 9

Phương tiện xếp hàng vào chợ đầu mối Thủ Đức .

Sơ đồ phân loại máy học

Trang chủ Keras: https://keras.io/

Mô phỏng một mạng Nơ-ron đơn giản

: Trang chủ TensorFlow: https://www.tensorflow.org/

: Vai trò của TensorFlow trong các kiến trúc ứng dụng

: Cấu trúc thư mục Data AugmentationTập tin gan nhãn cho hình ảnh phương tiện định dang txt .

Các giai đoạn thực nghiệm với mô hình SSD và YOLO

CNN (visualize feature maps - heatmap

: Hình ảnh thực tế chụp lại từ camera khi xe vào |:

Hình ảnh phương tiện được gán nhãi: Thông số phương tiện sau khi được gán nhãn

Training Loss = 0,060837.

Kết quả du đoán phương tiện - YOLmAP = 77,93 % at 30.000 step .

Loss/total_loss: 2,65 - global_ step = 30.000

Kết quả dự đoán phương tiện — SSD

Sơ đồ Use-case

Kiến trúc tổng quang hệ thống dự đoán biển số phương tiện

Lưu đồ thuật toán dự đoán biển số phương tiện

Màn hình chính ứng dụng dự đoán biển sé xe

Màn hình chỉ tiết thông tin phương tiện sau khi Biên Sô được dự đoán 70Màn hình trang thống kê, ứng dụng dự đoán biển số phương tiện 71Biểu mẫu bản kê sau khi được in

Trang 10

MỞ ĐÀU

Để quản lý phương tiện cơ giới khi tham giao thông, nhận dang bién số là cách

dùng tốt nhất Mỗi bién số là duy nhất ứng với một phương tiện có các đặc trưng riêng

biệt về loại phương tiện, màu sắc Được quản lý thông tin như: năm sản xuất, nguồngốc xuất xứ, hạn đăng kiểm, ngày kiểm định, tải trọng, chủ sở hữu Biển số giúp quản

lý và thống kê phương tiện khi vận chuyển hàng hóa, vận chuyển hành khách, lưu

đậu kho bãi, nhập xuất hàng hoá, bến cảng, khu dân cư

Quản lý phương tiện thông qua nhận dạng biển số như: vé giữ xe (bãi giữ xe

truyền thống ghi thông tin biển số vào vé hoặc phát hành các loại vé riêng gây matthời gian có nhiều khả năng mắt vé, vé giả, ) đến bãi giữ xe có gắn camera (cameragiám sát quan sát và chụp lại hình ảnh khi xe vào bến, bãi làm cơ sở đối chứng vớihình ảnh khi xe rời bến, bãi) Các phương pháp quản lý chưa đáp ứng được nhu cầu

về thống kê Hiện nay, để hạn chế rủi ro và giảm thiểu sai sót, nghiệp vụ quản lýphương tiện cần thông tin quản lý: thông tin xe, chủ sở hữu, số lượt ra vào tương ứng,với từng xe với nhu cầu thống kê theo ca làm việc nhằm tăng hiệu quả về chỉ phí quản

lý.

Phạm vi thực hiện trong luận văn là áp dụng vào nghiên cứu và phát triển ứng

dụng dự đoán biển số phương tiện bằng thuật toán nhận dạng đối tượng với phương

pháp áp dụng công nghệ máy học vào dự đoán đề quản lý phương tiện vào bãi giữ xecủa toà nhà, khu dân cư, bến, cảng

Mục tiêu của luận văn là xây dựng một mô hình với thuật toán phù hợp đề áp

dụng các kỹ thuật máy học vào bài toán dự đoán biển số phương tiện khi tham giao

thông vào Chợ đầu mối Thủ Đức Để thực hiện tốt nhu cầu với mục tiêu dé ra, luậnvăn của học viên được tham khảo từ các công trình khoa học có liên quan và đã đượccông bồ trước

Trong giai đoạn xây dựng và phát triển hệ thống, dir liệu luận văn thu thập làhình ảnh các phương tiện giao thông vào chợ đầu mối Thủ Đức, hình ảnh phương tiện

được lưu lại từ camera giám sát tại các quầy soát vé (Hệ thống thu phí bán tự độngđang hoạt động).

Trang 11

Dữ liệu thu thập là hình ảnh chụp lại từ các camera nhận dạng biển số trên hệ

thống bán tự động Đồng thời, luận văn còn thu thập thêm dữ liệu từ cục đăng kiểm

làm nền tản xác định thông tin phương tiện

Dữ liệu thu thập được, hệ thống sẽ lưu trữ, phân tích, áp dụng kỹ thuật máyhọc để xây dựng một mô hình với thuật toán có thông số phù hợp trên bộ dữ liệu huấn

luyện để phát triên mô hình dự đoán

Sau cùng, luận văn sẽ đưa ra một mô hình có thuật toán phụ hợp để ứng dụngtổng quát cho dự đoán biển số phương tiện Kết quả dự đoán sẽ được trực quan hóa

lên giao diện ứng dụng Windows Form Application (.Net Framework) và người sử

dụng có thể thao tác dễ dàng và truy xuất kết quả nhanh chóng

Van đề về dự đoán biển số phương tiện trong luận văn của học viên nhằm giúp

giảm sai sót về dự đoán biển số và khắc phục nhiều hạn chế mà hệ thống hiện đangkhông giải quyết được, giảm sự phụ thuộc vào thiết bị chuyên dụng như: camera nhậndạng biển số, bộ cảm biến vòng từ, giúp nhanh chóng trong việc bảo trì hệ thống vàtiết kiệm chỉ phí vận hành Đáp ứng được việc áp dụng công nghệ AI dự đoán vào

một quy trình quản lý mà điên hình là áp dụng vào quy trình quản lý phương tiện

tham gia giao thông.

II

Trang 12

CHƯƠNG 1: TONG QUAN VE DE TÀI

Chương I luận văn giới thiệu đề tài, mục tiêu và đối tượng nghiên cứu, giới

thiệu các công nghệ về nhận dạng biển số tại việt nam và nước ngoài Qua đó, liệt kê

những tôn tại chưa được giải quyết và các mat hạn chế trên các hệ thống thu phiđang vận hành tại các trạm thu phí và các dịch vụ lưu giữ kho, bãi.

1 GIỚI THIỆU ĐÈ TÀI

1.1 Giới thiệu đề tài

Quản lý phương tiện giao thông là van đề được quan tâm tại các thành phố cómật độ dân cư và phương tiện giao thông nhiều Tại nhiều thành phó, các khu côngnghiệp, bến cảng, kho bãi, các trung tâm thương mại, chợ đầu mối có mật độ phươngtiện tham gia giao thông lớn, cần có giải pháp quản lý phương tiện dé tránh tình trang

ùn tắc, gây mat an ninh trật tự, mắt nhiều thời gian xữ lý Do đó, cần giải pháp quản

lý hiệu quả có độ chính xác cao, thời gian xử lý nhanh, công tác bảo trì dé dàng, it

phụ thuộc vào thiết bị chuyên dụng gây tốn kém

'Hinh 1: Phương tiện xếp hàng vào chợ dau mối Thi Đức.

, truoc-gio-g-20210707020811691.htm

Trang 13

https://tuoitre.vn/hang-ngan-xe-tai-ba-gac-do-ve-cho-dau-moi-thu-duc-1.2 Mục tiêu nghiên cứu

Luận văn hướng đến xây dựng một hệ thống quản lý đữ liệu, dự đoán biển số

và xác định thông tin của phương tiện khi tham gia hoạt động giao thông tại các kho,

bến thông qua hệ thông camera giám sát đã được trang ¡, không phụ thuộc vào các

thiết bị chuyên dụng: vòng từ cảm biến, camera đọc biển số Giúp giảm chỉ phí đầu

tư và giảm thời gian bảo trì.

1.3 Đối tượng và phạm vi nghiên cứu

Đối tượng nghiên cứu:

Bộ dữ liệu về thông tin xe cơ giới của bộ giao thông vận tải nhằm hỗ trợkiêm tra thông tin đăng kiểm, tải trọng, số ghế, "

Bộ dữ liệu về hình ảnh xe nhập chợ từ năm 2017 đến 2019 là hình ảnhđược truyền về từ các camera giám sát đặt tại các làn soát vé.

Dựa trên bộ dữ liệu thu thập, luận văn tiến hành chuẩn hoá dit liệu cho dữ

liệu đầu vào và dữ liệu đầu ra cho mô hình dự đoán biển số các phươngtiện.

Mô hình dự đoán biển số phương tiện

Ứng dụng: dự đoán biên số và thông kê phương tiện tham gia vào Chợ đầu

mối Thủ Đức

Phạm vi nghiên cứu của luận văn:

Phương tiện tham gia giao thông vào chợ đầu mối Thủ Đức có thông tin biển

số bị che khuất và khảo sát trên 100 phương tiện vào chợ nhiều nhất

Trang 14

2 TONG QUAN TINH HÌNH NGHIÊN CỨU

2.1 Giới thiệu chung

Thực tế có nhiều công trình và dự án quản lý phương tiện giao thông từ cameragiám sát đã được triển khai và đang hoạt động Tuy nhiên, tính đặc trưng cho từngnhu cầu riêng biệt thì chưa được thực hiện, việc đầu tư hạ tầng chi phí cao, công tácbảo trì, bảo dưỡng mất nhiều thời gian nên nhu cầu khai thác và sử dụng từ các côngtrình, dự án thực tế chỉ đạt mức trung bình và còn nhiều mặt hạn chế

2.2 Tình hình nghiên cứu các công trình — dự án trong nước.

Một số công trình, dự án đã được triển khai và đang vận hành tại Việt Namnhư:

e Công ty TNHH Tin Học - Công Nghệ Hoang Vân? cung cấp “GIẢI

PHÁP NHẬN DẠNG BIÊN SỐ XE TỰ ĐỘNG ANPR” (Thuật toán

“Automatic Number Plate Recognition - ANPR*’, thường được chia

thành bốn bước: (1) Chup ảnh phương tiện, (2) Phát hiện biển sé, (3)

Phân đoạn ký tự và (4) Nhận dang ký tự, Automatic Number Plate Recognition (ANPR) [24]).

© License Plate Recognition — LPR‘, phát triển bởi FPT Software hoạtđộng tốt với biển số Việt Nam và Nhật Ban, LPR dùng công nghệ Phân

đoạn và chỉnh lưu nhận dạng ký tự quang học: chuyển đổi hình ảnh cónội dung văn bản thành định dạng văn bản mà máy tính có thé có thé

đọc được, Recognizing License Plates in Real-Time [10].

® Nhận dạng biển số xe tự động dùng công nghệ nhận dạng quang học

được cơ quan chức năng dùng quan sát giao thông của công dân Được

ứng dụng rộng rãi dé giám sát các bãi đỗ xe như bãi giữ xe trường học,

siêu thị,

'Website:https://hoangvanco.com.vn

Tài liệu tham khảo [24]

Trang 15

e NHẬN DIỆN BIEN SO XE MO CONG THONG MINH Š dùng

Camera AI View kết hợp thiết bị điện thông minh SH-C2Z và động cơ

mở cửa cổng đề kiểm soát do “BKAV Smart HOME” phát t

e_ CAMERA NHẬN DIỆN BIEN SO XE 5 qua thẻ từ RFID với tiếp xúc

không chạm - Mỗi một phương tiện sẽ được cấp một thẻ RFID chứa

các thông tin như họ tên chủ phương tiện, số CMT/CCCD người sở

hữu, loại phương tiện, biển số phương tiện Thông tin sẽ được lưu vào

hệ thống thông qua phần mềm chuyên dụng

Những nghiên cứu có nội dung tương tự với luận văn này:

Đề tài Ưu điểm Nhược điểm

BIEN SỐ XE TỰ độ di chuyên và điêu

ĐỘNG ANPR - Kết hợp với bộ cảm biến kiện thời tiết thuận lợi —

từ, giải pháp hoàn chỉnh ánh sáng tốt

phục vụ công việc quản lý

: - Phụ thuộc vào thiết bi, phương tiện ` `

phân cứng - chi phí dau

tư cao.

Website: bkavsmarthome.vn

k GSP® - AV Consultant | Audio Visual & Video Conferencing

15

Trang 16

- Nhận dạng biển số theo - Nhận dạng ký tự trên

thời gian thật, ảnh chuyền biển số và bỏ qua cácđộng yếu tố đặc trưng, dấuLicense Plate hiệu riêng.

Recognition - - Tích hợp máy học vào bài

LPR, giải pháp do _ | toán nhận dạng ký tự - Biển số phải đúng quy

ô : cách, khoảng cách và

công ty FPT - Tốc độ xử lý nhanh, ft pho | as de 2

A A liêu kiện thời tiêt thuận

software cung cap thuộc vào thiét bi chuyên Loe

lợi, giúp nhận dang tot.

dụng.

- Dễ bảo tri, bảo dưỡng

Bảng 1: Bảng đánh giá so sánh những đề tài tương tự với luận văn.

2.3 Tình hình nghiên cứu các công trình - dự án nước ngoài.

e Automatic license plate recognition (ALPR) được phát trién boi NVIDIA’.

Dựa vào công nghệ ‘NVIDIA TAO TOOLKIT”, kết hợp giữa 2 mô hìnhLicense Plate Detection - LPD xác định khu vực, vùng có biển số vàLicense Plate Recognition - LPR đọc thông tin biển số từ vùng xác địnhdựa vào công nghệ nhận dạng các ký tự quang học có tốc độ xữ lý nhanh,đáp ứng được nhu cầu nhận dang bién số theo thời gian thuc, phuong tién

di chuyển, phù hợp ứp dụng vào quan lý phương tiện giao thông tại các

Thanh Phó, Đô Thị, Bến Cảng (Automatic License Plate Recognition

(ALPR): A State-of-the-Art Review [25]).

© Công Nghệ DTK LPR SDK phát triển bởi “DKTSoft” - Ung dụng nhậndang biển số phương tiện với nguồn dữ liệu là các video từ nhiều cameragiám sát khác nhau, Công Nghệ DTK LPR SDK cung cấp giải pháp nhận

dạng ký tự biển số của nhiều quốc gia khác nhau(Automatic Number Plate

Recognition/License Plate Recognition [24]).

https://developer.nvidia.com

Trang 17

2.4 Những tồn tại cần giải quyết

Những giải pháp và các dự án đã triển khai về nhận dạng bién số phương tiệnhiện mang lại hiệu quả tốt trong công tác quản lý và thống kê Tuy nhiên, vẫn cònnhiều giới hạn như là: phụ thuộc vào thiết bị phần cứng, chỉ phí triển khai dự án cao,khó khăn trong công tác bảo trì - bảo dưỡng, phụ thuộc vào điều kiện, qui cách biển

số nên nhu cầu đặc trưng riêng, sự chuyên biệt hoá của doanh nghiệp thật sự chưa

được quan tâm.

17

Trang 18

CHƯƠNG 2: KIÊN THUC NEN TANG

Chương 2 luận văn gồm những kiến thức cơ bản về máy học và những mô hình

dự đoán Qua đó kiến thức này dùng dé thực hiện đề tài xây dựng ứng dung dự đoán

thông tin biển số phương tiện

1 Tổng quan về trí tuệ nhân tạo và máy học

Ai cũng đều hy vọng trí tuệ nhân tao có thể được tích hợp trên thiết bị máy

tính, thiết bị điện tử Việc nghiên cứu và tích hợp công nghệ, kỹ thuật máy học được

áp dụng rộng rãi trong nhiều lĩnh vực khác nhau Máy học cũng được áp dụng nhiềutrong những ngành khoa học/công nghiệp sản xuất với nguồn dữ liệu lớn có sẵn, cácứng dụng điển hình dé giải quyết các bài toán thực tiễn như:

e Xử lý ngôn ngữ tự nhiên (Natural Language Processing): xử lý văn bản,

phát hiện ngôn từ đả kích, phát ngôn tiêu cực trên mang xã hội,

e Pattern Recognition: nhận dạng khuôn mặt, nhận dang vân tay, giọng nói,

văn bản trong hình ảnh,

e Hệ thống tìm kiếm (Search Engine): tìm kiếm thông tin, tìm kiếm hình

ảnh,

e Hệ khuyến nghị xử lý công việc như chan đoán sớm bệnh động mạch vành,

dự đoán xu hướng của một mã chứng khoán

Qua đó, việc ứng dụng máy học ngày càng phát triển đã mang đến nhiều đột

phá lớn cho nhân loại Điền hình là sự bùng nổ của máy học đã mang lại nhiều thànhtựu trong vai trò phát triển Rô bốt Ngày nay, Rô bốt còn được phát triển thêm về mặt

cảm xúc, giọng nói tốt hơn - những thứ mà trước đây chúng ta thường thấy trên phim

ảnh, khoa học viễn tưởng.

Có thể nói việc áp dụng máy học đang là một bước tiến công nghệ để hỗ trợchan đoán bệnh lý, dự báo nguồn cung của thị trường bán lẻ, tự động hóa sản xuất 7giúp tiết kiệm được thời gian và chi phí vận hành và công sức lao động Tại ViệtNam, các chuyên đề ứng dụng AI nhằm hỗ trong các lĩnh vực nêu trên còn khá mới,nhưng đây là bước tiền mới thúc day phát triển xã hội hiện đại và cũng đang được cảithiện tốt hơn

Trang 19

Các nhóm thuật toán dành cho học máy:

Các loại máy học

Học có giám sát Học không giám sát Học bán giám sát Hoc củng cố

ZN | | ZN

Continuous | | Categorical i : Categorical | | Target“Target “Target Target Variable not Categorical Target “Target Su

Variable Variable available) Variable Variable | {not available’

Regression Pisssification Clustering | | Association Flassification, Clustering Csireion ‘Control

Ũ + + + 1 + * +

Dự báo Hìnhảnh | | Phânkhúc | [Market basket! | Phânloại | |Timđườngđi| | Téiwuhéa | | Xe không

thời thiết y khoa khách hàng, analysis van ban trên DL GPS | | makerting người lái

Hình 2: Sơ dé phân loại máy học.

Dựa vào phương thức trong quá trình học máy, máy học chia làm 04 nhóm:

Hoc có giám sát (Supervised learning), Học không giám sát (Unsupervised learning),

Học bán giám sát (Semi-supervised learning) và Học cùng cố (Reinforcementlearning).

2 Một số thuật toán máy học pho biến

2.1 Phân loại hình ảnh (Classification) trong Thị giác máy tính

Phân loại “Image Classification with Classic and Deep Learning Techniques [4]”, “Developing an Image Classification Model Using CNN [5]” là một những cáchphổ biến để xử ly dữ liệu hình ảnh

Object detection Image segmentation Image classification

Hình 3: ví dụ phân loại hình ảnh.

19

Trang 20

2.2 Các thuật toán object detection

Gồm “Deep Learning for Computer Vision: A Gentle Introduction to Object

Recognition With Deep Learning [8]”, “Very Deep Convolutional Networks for Large-Scale Image Recognition [18]”:

- Ho cac m6 hinh R-CNN (Region-Based Convolutional NeuralNetworks) giải quyết các nhiệm vụ định vị vat thé và nhận diện vật thể

- Ho các mô hình YOLO (You Only Look Once), kỹ thuật nhận dang đối

tượng được thiết kế để nhận diện theo thời gian thực

Lớp các mô hình họ R-CNN

R-CNN (2014)

R-CNN được giới thiệu lần đầu vào 2014 bởi Ross Girshick và các cộng sự

“Rich feature hierarchies for accurate object detection and semantic segmentation

Trang 21

Faster R-CNN (2016)

“Faster R-CNN: Towards Real-Time Object Detection with Region

Proposal Networks [15]”, “Fast R-CNN [17]” vào năm 2016.

YOLO được giới thiệu vào năm 2015 “YOLOv3: An Incremental

Improvement [11]”, “You Only Look Once: Unified, Real-Time Object Detection[14]” với kha năng xử ly 45 khung hình trên giây (frames per second - FPS), tốt hơnrất nhiều so với mô hình Faster R-CNN chi đạt 7 FPS Có nhiều phiên bản YOLOđược ra mắt và phiên bản nào cũng cho thấy sự cải thiện đáng kể (đặc biệt là về mặttốc độ)

Hình 6: Kiến trúc mô hình YOLO

21

Trang 22

Thuật toán Single Shot Detector (SSD)

Kiến trúc SSD “SSD: Single Shot MultiBox Detector [16]” dựa trên CNN để

phát hiện tiêu đối tượng được thực hiện theo hai giai đoạn: Trích xuất các bản đồ đặctrưng và Áp dụng các bộ lọc tích chập dé xác định các đối tượng

512x512x3 38x38x512 19x19x1024 19x19x1024 10xi0x512 5x5x256 3x3x256 1x1x256

Hình 7: Kiến trúc mô hình SSD

2.3 Một số thư viện sử dụng thuật toán máy học và công cụ hỗ trợ

Luận văn đã giới thiệu các thuật toán trong máy học được sử dụng phổ biến,

ngoài ra còn có rất nhiều các thuật toán máy học khác luận văn không thể trình bày

đầy đủ như Phân cụm (Clustering), Cây quyết định (Decision tree), Phân loại Naive

Bayes (Naive Bayes classifier), SVM (Support Vector Machines)

Để tạo điều kiện thuận lợi, hỗ trợ tốt quá trình phát triển ngành khoa học maytính, có nhiều thư viện được tạo ra nhằm giúp đỡ các nhà khoa học, các nhóm nghiêncứu, lập trình viên sử dụng, giúp giải quyết các bài toán máy học trở nên đơn giảnhơn, tiết kiệm nhiều chỉ phí cũng như thời gian nghiên cứu

Tuy có nhiều thư viện hỗ trợ trong các thuật toán máy học được, luận văn này

sẽ giới thiệu ba thư viện phổ biến, đó là: Scikit Learn, Keras và Tensorflow

2.3.1 Giới thiệu Keras

Keras là một thư viện chuyên hỗ trợ cho việc học sâu (deep learning), thư viện

này được xây dựng trên nền tảng của thư viện Theano và TensorFlow, được tạo ra

bởi Francois Chollet Keras được viết bằng ngôn ngữ lập trình Python, cung cấp các

API phục vụ cho việc cho việc xây dựng mạng nơ-ron trong máy học, hỗ trợ phát

Trang 23

triển nhanh chóng việc xây dựng mạng no-ron mà không cần biết quá nhiều về cácchỉ tiết toán học của đại số tensor hay những phương pháp tối ưu hóa và kỹ thuật xử

lý các con số Ý tưởng cốt lõi của Keras là tạo điều kiện cho việc tạo ra mẫu

nhanh và đễ đàng thử nghiệm

Sử dụng Keras là một lợi thế lớn trong máy học, đặc biệt đối với các nhà khoa

học và các nhà phát triển vì họ có thể bắt tay vào xây dựng các mô hình học sâu mà

không gặp nhiều khó khăn

Keras

Simple Flexible Powerful.

Looking for a Keras companion course?

Deep Learning with Python, Second Edition is out now.

Hình 8: Trang chủ Keras: https://keras.io/

Nghiên cứu học sâu ngày nay đang bước vào thời kỳ hoàng kim, xu hướng sửdụng các mô hình học sâu hiện đang thịnh hành, nhu cầu về những người được đào.tạo về các mô hình học sâu cũng ngày càng tăng Các tổ chức về khoa học công nghệcũng đang có ging kết hợp học sâu vào các quy trình của họ, cụ thể hóa các ý tưởng

và Keras là sự lựa chọn thích hợp vì nó cung cấp một API dễ dang để thử nghiệm vàxây dựng các ứng dụng có thuật toán học sâu mà không cần tốn quá nhiều công sức

Keras có những đặc diém sau:

© Keras là thư viện cấp cao xây dựng trên Theano và TensorFlow , vì vậy cóthể sử dụng ở phía backend Có chuyền từ backend này sang backend khác

(Thenao hay TensorFlow ) một cách thuận lợi.

Trang 24

e Việc học trên các mạng lưới nơ-ron yêu cầu khá nhiều thời gian và bộ nhớmáy tính Các thư viện học sâu như TensorFlow, Caffe, Torch, chỉ có thể

chạy trên GPU Keras có thể chạy tốt trên cả CPU và GPU

® Keras hỗ trợ nhiều loại lớp mạng nơ-ron đa dạng như: tầng kết nối đầy đủ

(fully connected), mạng tích chập (convolution), mạng tập trung (pooling),mạng hồi quy (recurrent), Có thé kết hợp các lớp đề xây dựng những môhình phức tạp hơn.

e Trong cấu trúc tự nhiên của Keras, mỗi thành phần của mạng nơ-ron là mộtmô-đun riêng lẻ, độc lập, có thể cấu hình đầy đủ, và các mô-đun này có thểđược kết hợp với nhau để tạo ra các mô hình mới Tắt cả các mô-đun khác

nhau có thể được kết hợp đề xây dựng thành các mô hình khác nhau Ưu

điểm chủ yếu của hệ mô-đun (modularity) là dễ dàng thêm vào các mô-đunriêng biệt Điều này làm cho Keras trở nên nôi bat và khả dụng hơn, cực kỳ

linh hoạt và phù hợp cho việc nghiên cứu sáng tạo.

© Xây dựng mã nguồn trong Keras rat dễ dàng và thuận lợi Các API được

cung cấp dễ sử dụng, thân thiện với người dùng mà không cần biết quá

nhiều về kiến thức mạng nơ-ron Keras là một thư viện Python đầy đủ, vàtoàn bộ mã nguồn được viết bằng Python, điều này làm cho nó trở nên dễ

gỡ rồi (debug) trong quá trình xây dựng và khám phá Các mã nguồn được

tối giản, và các thao tác được thêm vao các câu lệnh Python cũng trực quan

Trang 25

Thanh phan cốt lõi của kiến trúc Keras là một mô hình (model) Bao gồm

class, activations, optimization, và loss Mô hình Keras đơn giản nhất là mô hình

tuần tự (Sequential) gồm một chồng xếp tuyến tính đơn giản Việc sắp xếp lớp khác

có thé được hình thành bằng mô hình chức năng (Functional model)

Keras cung cấp API cho hầu hết các loại lớp phô biến Ta cũng có thé hợp nhất

hoặc ghép nói lớp cho một mô hình song song, ngoài ra ta có thé tự viết một lớp riêng

Các thành phần khác của mô hình mạng nơ-non như hàm mit mát (loss function),

metric, phương pháp tối ưu hóa, hàm activation và regularization đều có sẵn với hầuhết các lựa chọn Một thành phần hữu ích khác của Keras là mô-đun tiền xử lý với hỗ

trợ thao tác và tiền xử lý hình ảnh, văn bản va dữ liệu chuỗi

Những lợi thế lớn nhất của Keras là một danh sách rất lớn các mã nguồn vớimẫu ví dụ có sẵn trong kho lưu trữ Keras github và trên mạng internet

Trang 26

TensorFlow là một thư viện da nền tảng Thư viện này chạy trên hầu như tat

cả: GPUs và CPU — bao gồm di động và nền tảng nhúng, thậm chí đơn vị xử lý tensor

(TPUs) là phần cứng chuyên dụng dé tính toán tensor Đến nay, TensorFlow càng

được cung cấp rộng rãi

Models ina box

TensorFlow Distributed E› n Engine

Hình 11: Vai trò của TensorFlow trong các kiến trúc ứng dungKiến trúc TensorFlow hoạt động được chia thành 3 phần: Tiền xử lý dữ liệu,Xây dựng mô hình, Huan luyện và Ước tính mô hình

Các API cấp cao của TensorFlow kết hợp với đồ thị tính toán làm cho môi

trường phát triển phong phú và linh hoạt cũng như khả năng sản xuất mạnh mẽ trong

cùng một khuôn khổ

Một số ưu điểm của TensorFlow :

© Cung cấp một hệ thống tính toán tối ưu.

© Chia bài toán thành các mô-đun nhỏ, giúp đồ thị biết mô-đun nào.

© Tính toán phân tán, song song trên nhiều CPU, TPU, GPU hoặc nhiều thiết

bị máy tính.

Trang 27

2.4 Tăng cường dữ liệu trong deep learning

2.4.1 Tìm hiểu về cách Data Augmentation trong keras

Data

—* + ——Ỳ

Train Valid Test

| class_a class_b | | class_a class_b | Test_folder

1 =1

Hình 12: Cấu trúc thư mục Data Augmentation

2.4.2 Labellmg tool - gan nhãn dữ liệu:

Hình 13: Tập tin gan nhãn cho hình ảnh phương tiện định dang wt.

- (1): <lớp>, (2): <x>, (3):<y>, (4): <chiều rộng>, (5): <chiều cao>

27

Trang 28

CHƯƠNG 3: THU THẬP VÀ XÂY DỰNG BỘ DỮ LIỆU

Chương 3 luận văn trình bày về quá trình thu thập dữ liệu dành cho máy học,

leu trữ và phân tích dữ liệu Sau đó, luận văn sẽ đánh gi dit liệu và xây dựng một

bộ dữ liệu chuẩn dé huấn luyện cho mô hình dự báo biên số phương tiện

1 Bộ dữ liệu thu thập sử dụng cho máy học

1.1 Nguồn cung cấp dữ liệu

Dữ liệu đăng kiểm tại cổng thông tin điện tử Cục Đăng Kiểm Việt Nam

Trên bộ dữ liệu này, giúp hệ thống tra cứu thông tin phương tiện như: Loại

Biển Số, Thông Tin Biển Số, Loại Phương Tiện, Hạng Đăng Kiểm, Tải trọng, Số

Luận văn sử dụng các thông tin đữ liệu phương tiện cơ giới của Cục Đăng

Kiểm Việt Nam gồm những thông tin cơ bản như:

Thuộc tính Mô tả thông tin

thông tin phương tiện được cấp và quản lý bởi Bộ

GTVT.

Biển Số

Nhãn Hiệu, Loại Phương Tiện _ | Nhà sản xuất, loại phương tiện: 6-t6 con, 5 chỗ, 6 chỗTải Trọng Trọng lượng tông của phương tiện

Đơn Vị Đăng Ký Nơi đăng ký kiểm định

Tem Kiểm Định Mã số quản lý thông tin kiểm định của phương tiện

Hạn Đăng Ký Kiểm Định Thời gian kết thúc kiểm định của phương tiện

Dữ liệu được cập nhật liên tục ngay khi có thông tin

Tính khả dụng của dữ liệu a

dang ky, dang kiém.

Bang 2: Mô ta các thuộc tinh của bộ dữ liệu Đăng Kiểm Việt Nam.

Trang 29

Dữ liệu hình ảnh của phương tiện lưu tại Chợ đầu mối Thủ Đức.

Phương tiện cơ giới khi tham gia hoạt động tại Chợ đầu mối Thủ Đức phải vào

làn xe theo quy định và dừng tại quầy soát vé, hồng camera giám sát lưu lại quá

trình phương tiện vào chợ, hệ thống cảm biến kết hợp với hệ thống camera chuyêndụng sẽ chụp hình ảnh phương tiện, tiến hành xữ lý dé xác định thông tin biển số (đọc

biển số) và truy xuất thông tin phương tiện từ Cục Đăng Kiểm Việt Nam” Khi xác

định được thông tin phương tiện hệ thống sẽ đề xuất vé nhập chợ và hoàn tat quytrình nhập chợ của phương tiện.

Bộ dữ liệu trong luận văn là hình ảnh và thông tin các phương tiện tham gia

hoạt động vào chợ liên tục từ năm 2017 đến 2019 Luận văn này sử dụng dữ liệu hình

ảnh được sự cho phép từ công ty và chỉ dùng cho mục đích nghiên cứu và học tập.

Dữ liệu hình ảnh từ camera giám sát dùng cho quá trình huấn luyện với thôngtin như sau:

Trang 30

Nội Dung Diễn Giải

từ trái sang phải):

e Phuong tiện vào làn: 01.

® Ngay vào: năm 2017, tháng 07

Trang 31

1.2 Mô tả bộ dữ liệu thu thập dùng cho máy học

Bộ dữ liệu thông tin của phương tiện từ Cục Đăng Kiểm Việt Nam được sửdụng để tra cứu thông tin phương tiện: Loại phương tiện, Tải trọng, Hạn đăng kiểm,

Số chỗ ngồi, qua công thông tin điện tử

Bộ dữ liệu hình ảnh tất cả các phương tiện tham gia vào chợ dừng tại các lànsoát vé được camera giám sát lưu lại tại Chợ đầu mối Thủ Đức được dùng để huấn

luyện mô hình (¢raining).

2 Đánh giá và xây dựng bộ dữ liệu chuẩn

Khao sát thực tế và nguồn dữ liệu:

Dữ liệu sử dụng cho việc huấn luyện mô hình máy học là hình ảnh phươngtiện từ camera giám sát được đặt tại các cabin soát vé khi phương tiện vao làn xe kiểmsoát với đầy đủ thông tin hợp lệ từ Cục Đăng Kiểm Việt Nam Tắt cả thông tin củaphương tiện: thông tin biên só, thông tin đăng kiêm, ngày, giờ vào chợ được lưu trong

cơ sở dữ liệu tại Chợ đầu mối Thủ Đức

Từ thực tế hoạt động tại Chợ, luận văn khảo sát nhu cầu lượt phương tiện vàochợ hàng ngày (không khảo sát các ngày lễ, tết, ngày chợ cao điềm) và thu nhận được

Chợ đầu mối Thủ Đúc chỉ các phương tiện vận chuyền chuyên dụng là

có nhu cầu vào chợ thường xuyên Các phương tiện này được kiểm soát

và phân loại như: xe container, xe khách từ 15 ghế trở lên, xe tải, xe

bán tải, xe ga-gác.

- Không kiểm soát (không tính lượt) các loại phương tiện như: xe máy,

xe hơi 04 ghế, xe hơi 07 ghế và xe hơi 09 ghế

- Thời gian hoạt động có lượt phương tiện vào nhiều từ 22 giờ đến 04 giờ

hôm sau.

- Số làn xe tại khuôn viên chợ:

31

Trang 32

¢ Làn xe kiểm soát vào và ra: 07 làn xe.

© Làn xe không kiểm soát vào va ra: 04 làn xe.

Có 02 loại kiểm soát thông tin phương tiện:

© Loại phương tiện là xe container, kiểm soát đầy đủ thông tin :thông tin biển số đầu kéo, hình ảnh đầu kéo, thông tin biển sốrơ-mooc, hình ảnh rơ-mooc, thông tin biển số thùng container,

Giới hạn của hệ thống và nhu cầu nâng cấp:

Hiện trạng hoạt động thu phi bán tự động tại Chợ đầu mối Thủ Đức, luận văn

dau tư cao

Viéc bảo trì, bao dưỡng hiện tại không đáp ứng được nhu cầu hoạt độngliên tục.

Hệ thống thu phí bán tự động hiện tại: không nhận dạng vì hình ảnhphương tiện có biển số bị che khuất, biển số bị biến dạng, ký tự trên

biển số bị nhoè Dẫn đến tình trạng phợng tiện tham gia giao thông vào

chợ bị nhận dạng sai thông tin, hoặc không nhận dạng được rất nhiều.Phương tiện cần kiểm soát là loại phương tiện “xe tải” Nhu cầu quản

lý về thông tin biển sé, hình ảnh phương tiện và thời gian phương tiệnvào, ra là rất lớn

Trang 33

Từ những giới hạn của hệ thống thu phí bán tự động, luận văn đề xuất giải

pháp là t mô hình máy học dé nhận dạng thông tin đối tượng, cụ thé là nhận dạngthông tin biển số phương tiện qua hình ảnh được truyền về từ camera, nhằm giúp hỗtrợ hệ thống bán tự động hiện tại trong những trường hợp: không nhận dạng đượchoặc nhận dang sai thông tin biển số phương tiện

Mục tiêu đạt được khi phát triển hệ thống thu phí với máy học:

Giúp nhận dạng được thông tin phương tiện trong các trường hợp đặc

biệt mà hệ thống thu phí bán tự động hiện tại không nhận dạng đượchoặc nhận dạng sai: biển số bi che khuất, biển số bị biến đạng, biển số

có ký tự bị nhoè.

Đáp ứng được nhu cầu bảo trì nhanh chóng, đảm bảo được tính liên tục

vì không phụ thuộc vào các thiết bị chuyên dụng, giải pháp sử dụngthiết bị thay thế phô biến với chi phí thấp

Từng bước thay thế hệ thống bán tự động hiện tại phụ thuộc vào thiết

bị phần cứng chuyên dụng, tiến tới sử dụng hệ thống nhận dạng bằng

thuật toán nhận dạng đối tượng ít phụ thuộc thiết bị chuyên dụng

“Tích hợp thuật toán và ứng dụng trên các thiết bị di động như PDA chonhu cầu mở rộng hoặc tăng cường làn kiểm soát

Điều kiện thuận lợi phát triển giải pháp cho mô hình máy học:

Được áp dụng tại Cho đầu mối Thủ Đức

Dữ liệu mới (phương tiện mới vào chợ) phát sinh rat ít

Dữ liệu về thông tin phương tiện cơ giới - Cục Đăng Kiểm Việt Namkết hợp hình ảnh phương tiện từ camera giám sát: đầy đủ và phù hợpcho việc huấn luyện mô hình nhận dạng bằng máy học

Loại phương tiện có nhu cầu kiểm soát quản lý nhiều nhất là: loại

phương tiện “xe tải” (chỉ kiểm soát và quản lý thông tin biển số và hìnhảnh phương tiện, ngày, giờ vào - ra).

Mô hình nhận dạng thông tin đối tượng trong máy học với độ chính xáccao, nhiều mô hình có các thuật toán được cải tiến, nâng cấp liên tục

“ œ

Trang 34

Dữ liệu cơ sở thực nghiệm:

Sau 03 năm hoạt động hệ thống thu phí bán tự động tại Chợ đầu mối Thủ Đức(từ 2015 đến 2017), luận văn nhận xét tháy dữ liệu mới (xe mới vào chợ lần đầu) phátsinh rất ít và năm 2020 đến năm 2022 dữ liệu bị gián đoạn bởi đại dịch covit

Do đó, luận văn đề xuất chọn mẫu dữ liệu từ 01/01/2017 đến 31/12/2019 làm

cơ sở đữ liệu tiêu chuẩn đưa vào các thuật toán máy học đê huấn luyện mô hình nhậnđạng:

- Lọc thông tin phương tiện vào chợ trong khoản thời gian từ 01/01/2017đến 01/01/02019, lấy toàn bộ hình ảnh từng phương tiện mỗi khi nhậpchợ.

Để dữ liệu được thống nhất và chuẩn hóa, phạm vi nghiên cứu của luận vănnày quy định như sau:

- Từ cở sở dữ liệu: hình ảnh và thông tin phương tiện được lưu tại Chợđầu mối Thủ Đức, luận văn lọc ra phương tiện vào chợ nhiều nhất vàchọn 100 phương tiện làm dữ liệu cơ sở thực nghiệm với tiêu chí được

chọn:

e 20 phương tiện hệ thống hiện tại nhận dạng chính xác

e 80 phương tiện hệ thống hiện tại nhận dạng sai hoặc không nhậndang được.

e Phuong tiện là xe tải lớn, chỉ nhập chợ vào khoản thời gian 22

giờ đến 04 giờ hôm sau

e Phuong tiện là xe tải nhỏ, giống nhau về mẫu xe, màu sơn, tải

trọng, khác nhau về biển số và các logo trên mỗi phương tiện,

có thời gian nhập chợ từ 22 giờ đến 04 giờ hôm sau

- Nội dung từng hinh anh của phương tiện được chọn theo tiêu chí: hình

ảnh nhận dang đúng thông tin biển số với ánh sáng ban ngày, hình ảnhthông tin biển số nhận dạng đúng với ánh sáng đèn chiếu sáng ban đêm,hình ảnh thông tin biển số nhận đạng sai do biển số bị che chuất bởi vậtcản phía trước, biển số bị biến dạng, ảnh hưởng bởi thời tiết: loá sáng,

hạt mưa.

Trang 35

Phương tiện có thông tin đầy đủ: Hạn đăng kiểm, Loại phương tiện,

Tén phương tiện, Tải trọng, Số ghé

Tiến hành trích chọn dữ liệu hình ảnh huấn luyện: mỗi phương tiện lọc

tất cả số lần (lượt) vào chợ trong khoản thời gian 01 năm, từ 01/01/2018đến 31/12/2019 (tương đương 365 ngày), số hình ảnh nhận được sẽ

kiểm tra theo tiêu chí giống nhau thì chọn 05 hình làm đặc trưng, từ đó

tìm các yếu tố phân biệt như là: hình ảnh rõ ràng, ánh sáng đầy đủ, khảnăng nhận dạng tốt — hình ảnh bị gây nhiều: vật cản (bùn, sình lay, bién

số bị che khuất (một phần, hoàn toàn), yếu tố thời thiết gây nhòe, bị lóasáng, thiếu sáng, vị trí xe dừng tại cabin lệt trái, lệt phải, dừng từ xa,

Mỗi phương tiện lấy ra 50 hình đại diện cho các yếu tố cần phân biệt

đặc trung (ứng với 1 hình là 1 lần tham gia vào chợ): trong đó 30 hìnhlàm cơ sở huấn luyện, 10 hình là cơ sở kiểm tra trong quá trinh huấnluyện và 10 hình làm cơ sở kiểm chứng sau khi huấn luyện

Dữ liệu ảnh từng phương tiện trước khi đưa vào huấn luyện được tăng

cường số lượng mẫu huấn luyện bởi “Data augmentation” với tiêu chí:

dich chuyên sang trái, dịch chuyền sang phải, dich chuyền lên trên, dichchuyền xuống dưới, tăng sáng, giảm sáng, tăng nhiễu nhằm mô phỏng

như điều kiện thực tế khi phương tiện vào làn kiểm soát

Dùng bộ dụng cụ labellmg.py dé gan nhãn hình ảnh từng phương tiện

Trường hợp thực nghiệm (thực tế) kiểm tra tính khả thi (độ chính xác)

nhận dạng phương tiện và dự đoán biển số, luận văn quy định: biển số

do hệ thống nhận dạng sai (% độ chính xác dưới 80) xem như dữ liệukhông được chọn, xe vào chợ lần đầu (dữ liệu chưa được huấn luyện)

và các yếu tố nhận dạng cho ra kết quả không đúng (bao gồm khôngnhận dạng được), hướng xữ lý như sau:

Trang 36

© Nhân viên bán vé, chịu trách nhiệm giám sát, kiểm tra biển số

xe dừng tại cabin có đúng (chính xác) với trên phần mềm kiểm

soat:

Y Nếu đúng, xuất vé bán — xe vào chợ thành công

Y Nếu sai, nhập lại thông tin biển số đúng — bán vé, xe vào.chợ thành công.

« Sau mỗi ca làm việc (08 giờ): bộ phận IT, chịu trách nhiệm trích

lọc thông tin liệt kê xe vào chợ với điều kiện biển số hệ thốngnhận dàng và biển số nhân viên nhập vào là không giống nhau,

từ đó có được danh sách thông tin xe nhập chợ:

Y Đối với nhận dang sai từ hệ thống: tiến hành khảo sát tìm

hình ảnh phân tích, gán nhãn

- Huấn luyện lại để tang cường độ chính xác cho lần

nhận dạng kế tiếp, đối với xe đã được huấn luyện.- Đối với các trường hợp xe mới, cần ghi chú và gannhãn theo doi dé chuẩn bị dữ liệu cho lần huấn

luyện mới.

Dữ liệu huấn luyện mô hình:

- Dữ liệu tăng cường (DATA AUGMENTATIONS):

e Làm lại kích thước hình ( Resize): 512(W) x 409(H), 96 dpi, 24

bit.

e Dữ liệu huấn luyện ( dataTrain)/100 class: 3.000 hình ảnh.

- Dữ liệu kiểm chứng ( dataValid)/100 class: 1.000 hình ảnh

- Dữ liệu xác thực ( dataPredict)/100 class: 1.000 hình ảnh - 720 (W) x

576 (H), 96 dpi, 24 bit ( ứng với mỗi lớp xác thực 10 hình).

Trang 37

CHƯƠNG 4: PHƯƠNG PHÁP VÀ THỰC NGHIỆM CÁC

THUẬT TOÁN MÁY HỌC DỰ ĐOÁN

Chương 4 luận văn giới thiệu các tiêu chí để đánh giá thuật toán máy họcbằng các chỉ số đánh giá thuật toán, môi trường để chạy thuật toán máy học Sau đó

sẽ cho ra kết quả thực nghiệm đánh giá mô hình dựa trên các chỉ số đánh giá thuậttoán.

1 _ Các chỉ số đánh giá thuật toán

Để đánh giá mô hình thuật toán dự đoán biển số phương tiện, luận văn này sửdụng phương pháp thống kê giữa giá trị thực tế (dữ liệu dùng đề kiểm thử) với giá trị

dự báo dé đánh giá độ chính xác của thuật toán máy học trên bộ dữ liệu.

Các chỉ số đánh giá được sử dụng trong luận văn:

Sai số trung bình bình phương bình quân (4.1)

(RMSE: root-mean-square error):

Bảng 5: Công thức tính các chỉ số đánh giá mô hình máy học.

Sai số bình phương trung bình (RMSE) ở công thức (4.1) có miễn giá trị nằm

trong khoảng (0, +œ) La chỉ số được sử dụng nhiều trong việc đánh giá các mô hình

dự báo RMSE là giá trị thể hiện độ lớn trung bình của sai số của dự báo Các RMSE

có giá trị = 0 khi và chỉ khi giá trị dự báo bằng với giá trị giá trị đo được từ kết quả

thực tế tại mọi thời điểm trong không gian, thời gian (độ chính xác 100% và không

Trang 38

có sai số) Trong thực tế, giá trị lệch bằng 0 khó xảy ra và giá trị của thông số RMSEthường lớn hơn 0.

Thực nghiệm trong luận văn dựa trên các thư viện máy học mã nguồn mở,

dùng các thông số trên để đánh giá độ chính xác của thuật toán máy học trên bộ dữliệu Tất cả các thông số trên được hiện thực bằng các thư viện máy học mã nguồn

mở phổ biến như Tensorflow, Scikit-learn, Keras với ngôn ngữ python

2 Môi trường dùng cho huấn luyện máy học

Máy tính được sử dụng để thực hiện huấn luyện cho các mô hình thuật toánmáy học là Colaboratory (Google Research) với cầu hình phần cứng được cung cấp:

° CPU: Intel(R) Xeon(R) CPU @ 2.00GHz.

e RAM: 14 GB.

e ~~ SSD: 200GB

e GPU: NVIDIA-SMI 460.32.03 | Persistence-M

° OS: Ubuntu 18.04.5 LTSPhát triển phần mềm sử dụng Visual Studio 2019 (VS2019) VS2019 hỗ trợnhiều tiện ích, các gói phát triển phần mềm khác nhau: Python, Javascript,

Trang 40

Thông tin Mô hình SSD Mô hình YOLO

Môi trường | Colaboratory Colaboratory

Thu viện TensorFlow TensorFlow

Ngôn ngữ Python Python

Số Class 100 100

Size ảnh 512(W) x 409(H), 96dpi, 24bit | 512(W) x 409(H), 96dpi, 24bit

Data Train

3.000/100 class 3.000/100 class (hinh anh)

Data Valid

1.000/100 class 1.000/100 class (hinh anh)

Data Test

1.000/100 class 1.000/100 class (hinh anh)

Pre-train

ssd_mobilenet_v2 darknet53.conv.74Model

Bước Train | 30.000 30.000

Bang 6: Thông tin môi trường thực nghiệm

Ngày đăng: 24/11/2024, 14:39

TÀI LIỆU CÙNG NGƯỜI DÙNG

  • Đang cập nhật ...

TÀI LIỆU LIÊN QUAN