Bài viết tập trung nghiên cứu về các đặc trưng được dùng biểu diễn phương tiện và các kết quả thử nghiệm sẽ được đánh giá trên bộ dữ liệu VeRi-776, đây là bộ dữ liệu chuyên phục vụ bài toán tái nhận dạng phương tiện giao thông. Với mục tiêu kết hợp các đặc trưng học sâu nhằm cải thiện hiệu quả tìm kiếm phương tiện và lưu trữ đặc trưng, chúng tôi đã thực hiện một vài thử nghiệm trên hai loại đặc trưng VGG16, Vcolor và thiết kế một mạng nơron để kết hợp hai đặc trưng trên.
Kỷ yếu Hội nghị KHCN Quốc gia lần thứ XI Nghiên cứu ứng dụng Công nghệ thông tin (FAIR); Hà Nội, ngày 09-10/8/2018 DOI: 10.15625/vap.2018.00063 TÁI NHẬN DẠNG PHƯƠNG TIỆN GIAO THÔNG SỬ DỤNG MẠNG KẾT HỢP CÁC ĐẶC TRƯNG HỌC SÂU Trịnh Mẫn Hoàng, Nguyễn Thanh Sơn, Nguyễn Vinh Tiệp, Nguyễn Tấn Trần Minh Khang, Lê Đình Duy PTN Truyền thơng Đa phƣơng tiện, Đại học Công nghệ Thông tin ĐHQG TP HCM hoangtrinh1001@gmail.com {sonnt, tiepnv, khangnttm, duyld}@uit.edu.vn TĨM TẮT: Cơng trình nghiên cứu tốn tái nhận dạng phương tiện giao thơng Cho ảnh phương tiện, nhiệm vụ toán tái nhận dạng phương tiện giao thơng tìm kiếm tập liệu phương tiện có định danh với phương tiện ảnh Đây toán nhận nhiều quan tâm cộng đồng khả ứng dụng nó, đặc biệt hệ thống camera giám sát giao thông Trong báo này, tập trung nghiên cứu đặc trưng dùng biểu diễn phương tiện kết thử nghiệm đánh giá liệu VeRi-776, liệu chuyên phục vụ toán tái nhận dạng phương tiện giao thông Với mục tiêu kết hợp đặc trưng học sâu nhằm cải thiện hiệu tìm kiếm phương tiện lưu trữ đặc trưng, thực vài thử nghiệm hai loại đặc trưng VGG16, Vcolor thiết kế mạng nơron để kết hợp hai đặc trưng Các kết thực nghiệm cho thấy, đặc trưng rút trích từ mạng nơron đề xuất khơng có hiệu cao so với đặc trưng riêng biệt mà giảm số chiều đặc trưng cần lưu trữ đến lần Từ khóa: Tái nhận dạng phương tiện giao thơng, đặc trưng học sâu, kết hợp đặc trưng học sâu I GIỚI THIỆU Tái nhận dạng phƣơng tiện giao thông toán thƣờng đƣợc sử dụng trình tìm kiếm theo dõi phƣơng tiện Mặc dù tồn nhiều phƣơng pháp để theo dõi nhận dạng đối tƣợng nhƣ theo dõi GPS theo dõi tín hiệu sóng Bluetooth1, hầu hết áp dụng vào phƣơng tiện cơng cộng phƣơng tiện tổ chức định Sự phát triển hệ thống camera giám sát giao thông thành phố lớn mang lại nhiều thuận lợi cho việc xây dựng hệ thống theo dõi phƣơng tiện giao thông thông qua áp dụng tốn tái nhận diện phƣơng tiện giao thơng vào liệu thu thập đƣợc (Vehicle re-identification) Hình Mục tiêu tái nhận dạng phƣơng tiện giao thông tìm ảnh mục tiêu di chuyển qua vùng quan sát nhiều camera khác Việc tái nhận dạng phƣơng tiện giao thông hệ thống gồm nhiều camera khác tồn nhiều thách thức Đặc biệt, môi trƣờng thực tế, khả tái nhận dạng thấp phƣơng tiện bị che khuất, ảnh hƣởng ánh sáng, góc quay,… Ngồi ra, với tính chất đặc biệt loại liệu, vài nhập nhằng so sánh hai ảnh hai phƣơng tiện xảy ra, ví dụ nhƣ hai phƣơng tiện có định danh khác nhƣng Thông tin đƣợc tham khảo từ http://www.libelium.com/vehicle_traffic_monitoring_bluetooth_sensors_over_zigbee/ Trịnh Mẫn Hoàng, Nguyễn Thanh Sơn, Nguyễn Vinh Tiệp, Nguyễn Tấn Trần Minh Khang, Lê Đình Duy 483 có ngoại hình hồn tồn tƣơng đồng hay phƣơng tiện có thơng tin thị giác khác góc chụp khác nhau, vấn đề lớn cần giải để tái nhận dạng phƣơng tiện cách xác Để giải thách thức trên, thông tin bổ sung nhƣ không gian thời gian thƣờng đƣợc cung cấp nhằm tăng hiệu so khớp Tuy nhiên việc sử dụng đặc trƣng liệu có đủ để biễu diễn phƣơng tiện Để trả lời câu hỏi này, cơng trình [1], Xinchen Liu cộng đề xuất mơ hình kết hợp đặc trƣng thủ công BOW_SIFT [4], BOW_CN [5] đặc trƣng học sâu GoogleNet [6] dựa kết hợp độ tƣơng đồng theo trọng số gọi Fusion of Attributes and Color feaTures (FACT) [1] Cách kết hợp đặc trƣng FACT giúp tăng hiệu chung hệ thống tái nhận dạng phƣơng tiện, nhiên FACT gặp nhiều hạn chế phụ thuộc vào trọng số kết hợp cho trƣớc, điều dẫn đến thiếu linh hoạt muốn mở rộng mơ hình, đồng thời, đặc trƣng thủ công FACT dƣờng nhƣ không đóng góp nhiều cho mơ hình kết hợp (xem hình 2) Hình Mơ hình Fusion of Attributes and Color feaTures Nhằm giải vấn đề hạn chế tọn số mơ hình FACT, báo này, chúng tơi đề xuất mơ hình kết hợp hai đặc trƣng học sâu mạng nơron với trọng số đƣợc học tự động Cụ thể, đánh giá đặc trƣng rút trích từ mạng học sâu gồm Vcolor từ toán nhận dạng màu sắc phƣơng tiện giao thơng VGG16 [2] từ tốn tái nhận dạng phƣơng tiện giao thông liệu chuyên tái nhận dạng phƣơng tiện giao thông VeRi776 [1], [3] (776 phƣơng tiện 50.000 ảnh) Từ kết thực nghiệm, đƣa số nhận xét kết thu đƣợc Phần lại báo đƣợc tổ chức nhƣ sau: phần II chúng tơi trình bày cơng trình liên quan đƣợc sử dụng báo Phần III trình bày đặc trƣng học sâu đƣợc khảo sát báo mơ hình kết hợp đặc trƣng học sâu đƣợc đề xuất Phần IV, chúng tơi trình bày mơi trƣờng thực nghiệm, kết thu đƣợc thảo luận kết tƣơng ứng với phƣơng pháp Cuối cùng, Phần V kết luận báo đƣa hƣớng nghiên cứu II CÁC NGHIÊN CỨU LIÊN QUAN Trong phần này, chúng tơi trình bày mơ hình đƣợc sử dụng phổ biến trình tái nhận dạng phƣơng tiện giao thông dựa đặc trƣng thị giác toán liên quan đến phƣơng tiện giao thơng Hình Mơ hình phổ biến tái nhận dạng phƣơng tiện giao thông dựa đặc trƣng thị giác Tái nhận dạng phƣơng tiện giao thông dựa đặc trƣng thị giác Mơ hình phổ biến đƣợc sử dụng toán tái nhận dạng phƣơng tiện giao thông dựa vào đặc trƣng thị giác gồm hai bƣớc rút trích đặc trƣng so khớp đƣợc thực theo thứ tự lần lƣợt (xem hình 3) Các phƣơng pháp rút trích đặc trƣng đƣợc chia làm hai loại: đặc trƣng thủ công đặc trƣng học sâu Các đặc trƣng sau đƣợc rút trích đƣợc dùng bƣớc so khớp để tính độ tƣơng đồng cặp ảnh Dựa độ tƣơng đồng tính, ảnh tập liệu đƣợc xếp theo thứ tự tăng dần độ tƣơng đồng giảm dần độ khác biệt so với ảnh tìm kiếm 484 TÁI NHẬN DẠNG PHƢƠNG TIỆN GIAO THÔNG SỬ DỤNG MẠNG KẾT HỢP CÁC ĐẶC TRƢNG HỌC SÂU Các toán liên quan đến phƣơng tiện giao thơng Cho đến tại, tốn tái nhận diện phƣơng tiện giao thông kế thừa nhiều lợi ích từ tốn phân loại phƣơng tiện giao thơng Cụ thể, nhiều đặc trƣng học sâu đạt hiệu cao từ tốn phân loại phƣơng tiện giao thơng đƣợc áp dụng cho toán tái nhận diện phƣơng tiện giao thông nhƣ GoogleNet, VGG16 Tuy nhiên, để tránh trƣờng hợp overfit vào tập liệu mang tính cá nhân toán tái nhận diện phƣơng tiện giao thơng, hầu hết đặc trƣng đƣợc rút trích từ mơ hình với trọng số tốn phân loại phƣơng tiện giao thơng Bài tốn nhận diện màu sắc phƣơng tiện giao thông đạt đƣợc nhiều thành tựu khả quan thời gian gần Nhiều mơ hình học sâu đƣợc đề xuất nhƣ Vcolor [4], NIN [5],… mang lại hiệu thực ấn tƣợng Đặc biệt, mơ hình đạt kết tốt đƣợc áp dụng liệu thực tế môi trƣờng nội thành Các kĩ thuật tăng độ đa dạng liệu Các kĩ thuật tăng độ đa dạng liệu thƣờng đƣợc áp dụng cho toán với liệu nhỏ Các kĩ thuật hình học đơn giản nhƣ xoay, lật, thu phóng,… đƣợc sử dụng rộng rãi tính đơn giản chúng Tuy nhiên, mơi trƣờng thực tế, kĩ thuật dƣờng nhƣ mơ hết biến thể xảy liệu Để tạo liệu phù hợp với yêu cầu trên, hai kĩ thuật tăng độ đa dạng liệu dựa máy học đƣợc giới thiệu Generative adversarial networks (GANs) [6] Neural Style Transfer [7] Một mơ hình GANs chuyển hố ảnh từ điều kiện mơi trƣờng sang điều kiện môi trƣờng khác sau đƣợc huấn luyện cách có điều kiện liệu tƣơng ứng Sử dụng GANs đạt đƣợc kết tốt, nhiên lại tốn nhiều chi phí tính tốn Nhằm giảm chi phí, ta sử dụng phƣơng pháp tốn neural style transfer đƣợc giới thiệu trƣớc GANs Với Neural Style Transfer, thông tin khác nhƣ cấu trúc, môi trƣờng, màu sắc,… đƣợc thu thập trộn lẫn vào nhau, cách tái tạo lại biến thể liệu tƣơng tự nhƣ GANs Điều hạn chế mơ hình ảnh đầu thiên hƣớng hội hoạ so với GANs III CÁC ĐẶC TRƢNG HỌC SÂU VÀ MƠ HÌNH KẾT HỢP ĐẶC TRƢNG Trong phần này, giới thiệu đặc trƣng học sâu mơ hình kết hợp đặc trƣng đƣợc sử dụng thực nghiệm Cụ thể, sử dụng mạng học sâu VGG16 Vcolor để tiến hành rút trích đặc trƣng 3.1 VGG16 [2] VGG16 mơ hình mạng học sâu đƣợc cơng bố Simonyan Zisserman Đƣợc chứng minh mơ hình học sâu hiệu cho việc rút trích đặc trƣng thị giác, đồng thời VGG16 đƣợc chứng minh đạt hiệu cao tốn phân loại phƣơng tiện giao thơng (93,2 % rank project DeepCar [8]) VGG16 có kiến trúc gồm 13 lớp conv với lớp cuối fully connected layer VGG16 sử dụng lọc có kích thƣớc nhỏ 3x3 (xem hình 3) để học đặc trƣng thị giác từ đơn giản lọc đầu phức tạp cuối mơ hình Dựa hƣớng dẫn The Keras Blog [9] xem xét hình ảnh thu thập đƣợc từ camera giám sát giao thơng thực tế, chúng tơi giảm kích thƣớc ảnh đầu vào cịn 150x150 so với 224x224 mơ hình gốc Sau đó, nhằm tránh overfit vào đặc trƣng cấp cao tập liệu huấn luyện, chọn rút đặc trƣng lớp pooling cuối trƣớc chuyển tiếp qua lớp fully connected Hình Kiến trúc mạng VGG16 3.2 Vcolor [4] Mơ hình học sâu Vcolor đƣợc đề xuất Reza Fuad Rachmadi cộng năm 2017 xác định đƣợc đặc trƣng mặt màu sắc phƣơng tiện giao thông Vcolor đặc biệt hiệu với hệ màu RGB mơ hình tốt tốn nhận diện màu sắc phƣơng tiện giao thông hệ màu Nhằm kế thừa lợi ích từ tốn nhận diện màu sắc phƣơng tiện giao thông vào bổ sung thông tin màu sắc cho kết hợp, sử dụng trọng số mơ hình đƣợc cơng bố báo Vehicle Color Recognition using Convolutional Neural Network[], sau chúng tơi rút trích đặc trƣng lớp fc2 để làm đầu vào cho mạng kết hợp Trịnh Mẫn Hoàng, Nguyễn Thanh Sơn, Nguyễn Vinh Tiệp, Nguyễn Tấn Trần Minh Khang, Lê Đình Duy 485 Hình Kiến trúc mạng Vcolor [4] 3.3 Mơ hình kết hợp đặc trƣng học sâu Nhƣ trình bày, với mục tiêu kết hợp đặc trƣng học sâu không chịu phụ thuộc vào trọng số cho trƣớc Dựa kĩ thuật neural style transfer, thiết kế mạng kết hợp đặc trƣng đƣợc rút trích từ hai mạng học sâu VGG16 Vcolor, sau huấn luyện qua tập liệu tái nhận dạng phƣơng tiện giao thơng, chúng tơi sử dụng mơ hình để rút trích đặc trƣng kết hợp lớp fully connected Hình Mạng kết hợp đƣợc đề xuất Trong đó: Lớp Concat làm nhiệm vụ nối hai đặc trƣng đầu vào Lớp fully connected làm nhiệm vụ kết hợp, trộn lẫn đặc trƣng lại với nhằm tạo đặc trƣng tổng quát cho ảnh phƣơng tiện Số chiều lớp 4096 đƣợc lựa chọn dựa cấu trúc VGG16 Đây lớp rút trích đặc trƣng mạng Lớp Softmax làm nhiệm vụ phân loại đặc trƣng đầu từ lớp fully connected theo định danh trình huấn luyện IV THỰC NGHIỆM VÀ ĐÁNH GIÁ 4.1 Bộ liệu Hình Minh hoạ trình thu thập liệu liệu VeRi-776 [3] 486 TÁI NHẬN DẠNG PHƢƠNG TIỆN GIAO THÔNG SỬ DỤNG MẠNG KẾT HỢP CÁC ĐẶC TRƢNG HỌC SÂU Để đánh giá hiệu mạng kết hợp đƣợc đề xuất, tiến hành thực nghiệm liệu VeRi-776 [1] [3] Đây liệu chuyên toán tái nhận dạng phƣơng tiện giao thơng có cung cấp thêm thông tin không gian thời gian, điều giúp mở rộng thử nghiệm sau VeRi-776 bao gồm 50.000 ảnh 776 phƣơng tiện đƣợc thu thập từ 20 camera khác đƣợc lắp đặt phạm vi km2 vòng 24 tiếng Mỗi phƣơng tiện đƣợc thu thập thơng qua từ đến 18 camera Để tiến hành thực nghiệm, sử dụng cách phân chia liệu đƣợc cung cấp tác giả liệu VeRi-776 Cụ thể, VeRi-776 đƣợc chia làm hai tập huấn luyện kiểm tra theo tỉ lệ 3:1 Tập huấn luyện bao gồm 37,781 ảnh tập kiểm tra gồm 11.579 ảnh Riêng tập kiểm tra, 1.678 ảnh đƣợc dùng nhƣ ảnh tìm kiếm Ngồi VeRi-776, liệu VehicleID [10] liệu thông dụng toán Tuy nhiên, VehicleID lớn VeRi-776 số lƣợng định danh, cụ thể 26.267 so với 776 VeRi-776, phƣơng tiện VehicleID đƣợc chụp từ phía trƣớc phía sau Trong đó, phƣơng tiện VeRi-776 đƣợc thu thập với nhiều góc quay, điều kiện mơi trƣờng khác khiến chúng không khác biệt so với điều kiện thực tế 4.2 Phƣơng pháp đánh giá Khi tìm kiếm ảnh phƣơng tiện cần tái nhận dạng, hệ thống tái nhận dạng phƣơng tiện giao thông trả danh sách xếp hạng ảnh phƣơng tiện đƣợc thu thập trƣớc vị trí camera Các ảnh đƣợc xếp hạng theo thứ tự giảm dần độ tƣơng đồng tăng dần độ khác biệt với ảnh phƣơng tiện cần tái nhận dạng Trong báo sử dụng độ đo khác biệt L2-normalization Mục tiêu toán tái nhận dạng phƣơng tiện giao thơng phƣơng tiện cần tìm có độ khác biệt thấp tốt, nghĩa ngƣời sử dụng tìm thấy đối tƣợng theo dõi sớm tốt Hiện nay, nhiều phƣơng pháp để đánh giá hiệu suất hệ thống tái nhận dạng phƣơng tiện giao thông đƣợc đề xuất Trong báo này, sử dụng độ đo phổ biến đƣợc sử dụng nhiều cơng trình nghiên cứu khoa học giới bao gồm: mean Average Precision (mAP), Rank i Trong đó, mAP biểu thị độ xác trung bình tƣơng ứng với ảnh đƣợc tìm kiếm số 1.678 ảnh, rank i tỉ lệ kết thứ i danh sách xếp hạng kết Với độ đo rank i, với i nhỏ, kết rank i cao tốt Với ảnh tìm kiếm q, giá trị Average Precision cho ảnh tìm kiếm q đƣợc tính tốn nhƣ sau: ∑ AP(q) = () () (1) Trong đó, P(i) biễu diễn precision vị trí thứ i, giá trị weight(i) tƣơng ứng với kết vị trí có liên quan hay khơng Từ đó, mAP cho tập ảnh đƣợc tính nhƣ sau: mAP = ∑ ( ) (2) Trong đó, n_q biễu diễn tổng số lƣợng ảnh tìm kiếm (bằng 1.678 VeRi-776) Dựa theo thiết lập thử nghiệm Xinchen Liu [], với ảnh tìm kiếm q, có ảnh có định danh với q nhƣng đƣợc thu thập camera khác đƣợc sử dụng để tính mAP nhƣ rank rank 4.3 Kết thực nghiệm Trong phần này, thực thử nghiệm liệu VeRi-776 Các kết tái nhận dạng phƣơng tiện giao thông theo độ đo mAP rank i (với i = 1, 5) đƣợc công bố bảng Nhằm đánh giá hiệu đặc trƣng, thử nghiệm sử dụng riêng biệt đặc trƣng trình so khớp So sánh kết VGG16 đƣợc huấn luyện tập huấn luyện VeRi-776 FACT, ta nhận thấy VGG16 cho kết qua mAP thấp FACT 0,4 % với độ đo mAP tƣợng overfitting huấn luyện mơ hình học sâu tập liệu mức thực thể Trong đó, đặc trƣng Vcolor cho kết thấp đứng riêng biệt Nguyên nhân dễ nhận thấy mơ hình Vcolor chƣa đƣợc huấn luyện qua liệu phƣơng tiện cấp độ thực thể Với giả thuyết có mặt Vcolor kết hợp giúp mạng kết hợp tạo nên đặc trƣng đa dạng tổng quát hơn, dựa lý thuyết Neural Style Transfer, thực nghiệm kết hợp hai đặc trƣng VGG16 Vcolor mạng kết hợp đƣợc đề xuất Tuy đạt hiệu thấp đứng riêng biệt, Vcolor có khả làm tăng hiệu rút trích đặc trƣng, cụ thể với kết hợp hai đặc trƣng, hiệu đặc trƣng rút trích từ mạng kết hợp tăng 3,75 % mAP, 2,2 % với Rank 3,4 % cho rank so sánh với trƣờng hợp sử dụng đặc trƣng VGG16 Điều chứng minh thơng tin mà Vcolor học đƣợc từ tốn nhận dạng màu sắc phƣơng tiện hỗ trợ bù đắp cho phần bị thiếu hụt mơ hình chung Tiếp tục so sánh sang mơ hình kết hợp FACT Với trọng số đƣợc học tự động q trình huấn luyện, đặc trƣng đƣợc rút trích từ mạng kết hợp đƣợc đề xuất cho kết tốt mơ hình kết hợp FACT độ đo mAP, rank 1, rank Cụ thể, đặc trƣng từ mạng kết hợp đƣợc đề xuất cho kết cao Trịnh Mẫn Hoàng, Nguyễn Thanh Sơn, Nguyễn Vinh Tiệp, Nguyễn Tấn Trần Minh Khang, Lê Đình Duy 487 mơ hình FACT lần lƣợt 3,35 %, 13,53 % 3,28 % ba độ đo mAP, rank rank Rõ ràng, việc kết hợp với đặc trƣng Vcolor đƣợc huấn luyện liệu nhận diện màu sắc giúp mơ hình bù trừ đƣợc số trƣờng hợp overfitting VGG16 tăng hiệu mơ hình Từ hình ta thấy kết từ mơ hình kết hợp đƣợc đề xuất cho kết cao vƣợt trội so với phƣơng pháp khác Ngoài với đầu đặc trƣng rút trích 4.096 chiều, mạng kết hợp khơng giúp tăng hiệu chung đặc trƣng mà giảm số chiều đặc trƣng cần lƣu trữ xuống lần Bảng Kết thực nghiệm Phƣơng pháp VGG16 Vcolor FACT Mơ hình kết hợp mAP(%) 18,09 3,45 18,49 21,84 Rank (%) 62,28 13,59 50,95 62,87 Rank (%) 73,36 24,43 73,48 74,91 Hình Kết thực nghiệm V KẾT LUẬN Trong báo này, đề xuất mơ hình để kết hợp đặc trƣng học sâu Dựa kỹ thuật Neural Style Transfer thiết kế mạng nơron kết hợp hai đặc trƣng VGG16 Vcolor Kết thực nghiệm liệu VeRi-776 cho thấy hiệu rõ rệt việc rút trích đặc trƣng từ mạng kết hợp đƣợc đề xuất Đồng thời, mạng kết hợp đề xuất giúp giảm số chiều đặc trƣng cần lƣu trữ lần tăng hiệu đặc trƣng Tuy nhiên, mơ hình mạng chúng tơi cịn đơn giản, đó, tƣơng lai, tiếp tục thiết kế mạng kết hợp phức tạp nhƣ cung cấp thêm cho mạng nhiều loại đặc trƣng nhằm tăng tính tổng qt mơ hình Ngồi ra, việc mơ hình đề xuất sử dụng thơng tin trích xuất từ ảnh thu thập giúp mơ hình mở rộng áp dụng loại đối tƣợng nhƣ ngƣời, động vật, xe máy,… có liệu đƣợc thu thập từ nhiều camera VI LỜI CẢM ƠN Nghiên cứu đƣợc tài trợ Đại học Quốc gia Thành phố Hồ Chí Minh (ĐHQG-HCM) khn khổ đề tài mã số B2015-26-01 VIII TÀI LIỆU THAM KHẢO [1] Liu X., Liu W., Ma H., Fu H "Large-scale vehicle re-identification in urban surveillance videos" in IEEE International Conference on Multimedia and Expo, 2016 [2] Karen Simonyan, Andrew Zisserman "Very Deep Convolutional Networks for Large-scale Image Recognition" in International Conference on Learning Representations, 2015 488 TÁI NHẬN DẠNG PHƢƠNG TIỆN GIAO THÔNG SỬ DỤNG MẠNG KẾT HỢP CÁC ĐẶC TRƢNG HỌC SÂU [3] Liu X., Liu W., Mei T., Ma H "A Deep Learning-Based Approach to Progressive Vehicle Re-identification for Urban Surveillance" in European Conference on Computer Vision, 2016 [4] Reza Fuad Rachmadi, I Ketut Eddy Purnama and Mauridhi Hery Purnomo "Vehicle Color Recognition using Convolutional Neural Network" in arXiv:1510.07391v2 [cs.CV], 2017 [5] Boyang Su, Jie Shao, Jianying Zhou, Xiaoteng Zhang, Lin Mei "Vehicle Color Recognition in The Surveillance with Deep Convolutional Neural Networks" in Joint International Mechanical, Electronic and Information Technology Conference, 2015 [6] Ian J Goodfellow, Jean Pouget-Abadie, Mehdi Mirza, Bing Xu, David Warde-Farley, Sherjil Ozair, Aaron Courville, Yoshua Bengio "Generative Adversarial Nets" in NIPS, 2014 [7] P.Rosinand, J.Collomosse "Image and video-based artistic stylisation" Springer Science & Business Media, vol 42, 2012 [8] Charleo85 "GitHub" 14 10 2017 [Online] Available: https://github.com/Charleo85/DeepCar [9] F Chollet "The Keras Blog" 2016 [Online] Available: https://blog.keras.io/building-powerful-imageclassification-models-using-very-little-data.html [10] Liu, Hongye and Tian, Yonghong and Wang, Yaowei and Pang, Lu and Huang, Tiejun "Deep Relative Distance Learning: Tell the Difference Between Similar Vehicles" in IEEE Conference on Computer Vision and Pattern Recognition, 2016 [11] Christian Szegedy, Wei Liu, Yangqing Jia, Pierre Sermanet, Scott Reed, Dragomir Anguelov, Dumitru Erhan, Vincent Vanhoucke, Andrew Rabinovich "Going Deeper with Convolutions" in arXiv:1409.4842 [cs.CV], 2014 [12] Linjie Yang, Ping Luo, Chen Change Loy, Xiaoou Tang "A Large-Scale Car Dataset for Fine-Grained Categorization and Verification" in Computer Vision and Pattern Recognition, 2015 [13] Liang Zheng, Shengjin Wang, Wengang Zhou, and Qi Tian "Bayes merging of multiple vocabularies for scalable image retrieval" in CVPR, 2014 [14] Liang Zheng, Liyue Shen, Lu Tian, Shengjin Wang, Jing- dong Wang, Jiahao Bu, and Qi Tian "Scalable person re- identification: A benchmark" in ICCV, 2015 VEHICLE RE-IDENTIFICATION USING FUSION OF DEEP FEATURES Trinh Man Hoang, Nguyen Thanh Son, Nguyen Vinh Tiep, Nguyen Tan Tran Minh Khang, Le Dinh Duy ABSTRACT: This paper researches about the vehicle re-identification problem With a vehicle image as an input, the task of vehicle re-identification problem is to search the dataset for the vehicle with the same identity as the vehicle in the image This is a problem that is receiving a great deal of attention from the community because of its applicability, especially in traffic camera systems In this paper, we focus on the features used in vehicle representations and the test results will be evaluated on the VeRi-776 dataset, which is specific for the vehicle re-identification problem With the goal of combining deep features to improve the of vehicle identity searching and features storing efficiency, we have done several tests on the VGG16, Vcolor and designed a neural network to fuse them Experimental results show that the feature extracted from the neural network is not only more effective than individual incorporating feature, but also reduces the size of feature that need to be stored up to three times Keywords: Vehicle Re-Identification, Deep features, incorporating Deep features ... tìm kiếm 484 TÁI NHẬN DẠNG PHƢƠNG TIỆN GIAO THƠNG SỬ DỤNG MẠNG KẾT HỢP CÁC ĐẶC TRƢNG HỌC SÂU Các tốn liên quan đến phƣơng tiện giao thơng Cho đến tại, toán tái nhận diện phƣơng tiện giao thơng... GANs III CÁC ĐẶC TRƢNG HỌC SÂU VÀ MƠ HÌNH KẾT HỢP ĐẶC TRƢNG Trong phần này, giới thiệu đặc trƣng học sâu mơ hình kết hợp đặc trƣng đƣợc sử dụng thực nghiệm Cụ thể, sử dụng mạng học sâu VGG16... 486 TÁI NHẬN DẠNG PHƢƠNG TIỆN GIAO THÔNG SỬ DỤNG MẠNG KẾT HỢP CÁC ĐẶC TRƢNG HỌC SÂU Để đánh giá hiệu mạng kết hợp đƣợc đề xuất, tiến hành thực nghiệm liệu VeRi-776 [1] [3] Đây liệu chuyên toán tái