2.4.3 Đề xuất hệ thống nhận dạng hành động
Với đặc thù giao thơng đơ thị ở Việt Nam, các loại phương tiện phổ biến là xe máy, xe đạp, ơ tơ và xe buýt. Tình trạng giao thơng xảy ra cịn nhiều vấn đề tồn tại. Trong đĩ nổi lên các hành động, hành vi giao thơng phức tạp do các yếu tố cá nhân, điều kiện, mơi trường cũng như văn hĩa giao thơng của người dân. Việc nhận dạng hành động, hành vi cần cĩ những giải pháp, kỹ thuật phù hợp với thực tiễn. Do vậy, chúng tơi xây dựng hệ thống nhận dạng như Hình 2-7 nhằm nhận dạng hành động giao thơng cơ bản (Dừng, Đi thẳng, Rẽ trái, Rẽ phải) để lấy đĩ làm cơ sở cho nhận dạng hành vi giao thơng bất thường.
Hệ thống thực hiện việc thu thập, tiền xử lý dữ liệu, biến đổi để cĩ tập dữ liệu đặc trưng dựa trên tập thuộc tính được đề xuất. Từ một số nghiên cứu đã cĩ cho thấy, kích thước cửa sổ dữ liệu sử dụng trong nhận dạng được cố định đối với tất cả các đối tượng. Điều này gặp phải nhiều khĩ khăn khi các hành động, hành vi cần nhận dạng cĩ những đặc điểm, tính chất khác nhau. Do đĩ, hệ thống nhận dạng dựa vào dữ liệu đặc trưng được biến đổi bằng tập thuộc tính đề xuất với cửa sổ dữ liệu khác nhau theo từng loại hành động. Các kích thước cửa sổ được lựa chọn dựa trên đánh giá độ đo AUC khi phân lớp dữ liệu.
The parameters Mơ hình Nhận dạng PHÂN LỚP Dữ liệu gia tốc (gán nhãn) TIỀN XỬ LÝ DỮ LIỆU - Kỹ thuật cửa sổ - Biến đổi dữ liệu
Dữ liệu gia tốc (phát hiện) Tham số mơ hình Hành động Pha huấn luyện Pha pha phát hiện ` LOẠI HÀNH ĐỘNG TIỀN XỬ LÝ DỮ LIỆU - Kỹ thuật cửa sổ - Biến đổi dữ liệu
Hệ thống nhận dạng phương tiện giao thơng, hành động giao thơng được xây dựng và biểu diễn như Hình 2-7 dưới đây:
Hình 2-7. Hệ thống nhận dạng hành động giao thơng
Hệ thống nhận dạng bao gồm 2 pha: pha thứ nhất, sử dụng dữ liệu gia tốc cĩ gán nhãn các loại hành động cơ bản đã được thu thập và xác định trước. Các kỹ thuật tiền xử lý dữ liệu được sử dụng kết hợp với tập thuộc tính đặc trưng được đề xuất để xây dựng tập dữ liệu đặc trưng qua đĩ xây dựng mơ hình phát hiện cho hệ thống bằng phương pháp nhận dạng.
Pha thứ hai: nhận dạng các hành động dựa trên dữ liệu cảm biến thu được từ điện thoại của đối tượng đang tham gia giao thơng. Các kỹ thuật biến đổi dữ liệu, trích xuất đặc trưng được áp dụng để tạo mẫu dữ liệu phát hiện, phát hiện nhãn của mẫu dữ liệu này bằng bộ phân lớp.
Mỗi loại hành động, hành vi cĩ tính chất, đặc trưng khác nhau nên kích thước cửa sổ dữ liệu tương ứng cũng khác nhau. Việc tìm một kích thước cửa sổ cĩ kích thước phù hợp chứa đủ các thơng tin của tất cả các đối tượng cần phân loại, nhận dạng sẽ gặp nhiều khĩ khăn dẫn đến cần phải khảo sát và lựa chọn các kích thước phù hợp với từng nhãn lớp. Trong kỹ thuật cửa sổ dữ liệu, kết quả khảo sát, tối ưu nhận được là các giá trị kích thước cửa sổ và chồng dữ liệu phù hợp theo từng nhãn lớp hành động. Các kích thước này sẽ được áp dụng vào việc xây dựng dữ liệu huấn luyện cũng xử lý dữ liệu phát hiện các đối tượng tương ứng. Giải pháp
MƠ HÌNH PHÂN LỚP - Bộ phân lớp Dữ liệu cảm biến (Cĩ nhãn) TIỀN XỬ LÝ DỮ LIỆU - Kích thƣớc cửa sổ - Chồng dữ liệu - Biến đổi dữ liệu
Dữ liệu đặc trƣng (Huấn luyện)
Giá trị AUC > Delta
Các kích thƣớc cửa sổ và chồng dữ liệu tƣơng ứng với giá trị
AUC lớn nhất Đúng
Sai
Hình 2-8. Thuật tốn lựa chọn kích thƣớc cửa sổ và chồng dữ liệu theo AUC
Thuật tốn lựa chọn tham số mơ hình được thực hiện như sau: Từ tập dữ liệu cảm biến gán nhãn, thực hiện lọc nhiễu và cắt dữ liệu cảm biến gia tốc thành cửa sổ dữ liệu. Sử dụng tập thuộc tính đặc trưng để biến đổi dữ liệu gia tốc từ cửa sổ vừa cĩ được để cĩ dữ liệu đặc trưng tương ứng. Tập dữ liệu đặc trưng thu được sử dụng cho việc xây dựng mơ hình phân lớp và đánh giá kết quả dựa trên độ đo AUC. Kết quả tối ưu thu được là các kích thước cửa sổ và chồng dữ liệu được lựa chọn sao cho độ đo AUC khi phân lớp tương ứng tăng so với giá trị của cửa sổ trước nĩ nhỏ hơn một giá trị Delta cho trước thì lựa chọn kích thước của cửa sổ đĩ. Trong hoạt động nhận dạng hành động, cửa sổ nhỏ nhất được lựa chọn là 1 giây và kích thước tăng thêm mỗi lần là 1. Qua quá trình thực nghiệm, giá trị chênh lệch độ đo AUC của hai cửa sổ liền nhau (Delta) sử dụng để lựa chọn cửa sổ phù hợp nhất là 0.001.
Thuật tốn lựa chọn kích thước cửa sổ dựa trên độ đo phân lớp AUC sử dụng các giải thuật phân lớp với dữ liệu được cắt bởi các kích thước cửa sổ thể hiện trong thuật tốn sau:
Thuật tốn: Lựa chọn kích thước cửa sổ (Δt=0.001,v =1)
1. w1; / /gán kích thước cửa sổ khởi tạo là 1 giây
2. AUCw ComputeAUC(w)// Tính giá trị AUC tương ứng với W
3. While true do 4. AUCw+v ComputeAUC(w + v) 5. AUCw+vAUCw 6. if tthen 7. AUCw AUCw + v 8. w w v 9. else 10. Break 11. EndWhile 12. Return w
Thuật tốn 2.1. Thuật tốn lựa chọn kích thước cửa sổ [CT4]
Sau khi thực hiện thuật tốn, kích thước cửa sổ phù hợp được lựa chọn để sử dụng cho nhận dạng các nhãn lớp hành động khác nhau dựa trên các thuật tốn phân lớp với tập dữ liệu được xây dựng bởi kích thước của sổ này.
Trong đĩ, pha phát hiện với N nhãn lớp hành động, sử dụng giải pháp tối ưu cửa sổ sẽ cĩ N kích thước cửa sổ khác nhau, đồng thời cần phải thực hiện N lần phân lớp để xác định kết quả nhãn lớp để đưa ra nhãn lớp phù hợp theo Hình 2-9 như sau: DỮ LIỆU PHÁT HIỆN MƠ HÌNH PHÂN LỚP M1 MƠ HÌNH PHÂN LỚP Mi MƠ HÌNH PHÂN LỚP MN NHÃN LỚP Xử lý với kích thước Wi ĐÁNH GIÁ NHÃN LỚP XÁC ĐỊNH NHÃN LỚP
Hình 2-9. Nhận dạng hành động với các kích thƣớc cửa sổ lựa chọn.
Tại một thời điểm, dữ liệu được tiền xử lý với N kích thước cửa sổ tối ưu và được nhận dạng nhãn lớp tương ứng. Việc xác định nhãn lớp được quyết định bởi Thuật tốn 2-2 dựa trên giá trị AUC dưới đây. Các bước thực hiện giải thuật được đặc tả dưới dạng giả mã như sau:
Thuật tốn: Nhận dạng nhãn lớp hành động (Wi)với i = 1,...,N
1. L ← Rỗng// tập nhãn lớp tương ứng với cửa sổ Wi với i =
1,...,N
2. U ← Rỗng // tập độ đo AUC (Wi), với i = 1,...,N
3. bi← 0 // tổng số nhãn trùng với nhãn Li, i = 1,...,N
4. BL ← “S”//nhãn lớp được lựa chọn, khởi đầu bằng nhãn “S”-
“Dừng”
5. Si ← 0 // tổng giá trị AUC của các nhãn trùng với Li
6. For i:=1 to N do //thực hiện N lần
7. For j:=1 to N do // thực hiện N lần
8. Lj ComputeL(Wj)//Lj thu được khi nhận dạng với Wj
8. If Lj = Li Then
9. bi = bi + 1 // tăng giá trị khi nhãn phân lớp bằng Li
10. EndIf
11. EndFor
11. Si = bi * Ui;với i = 1,...,N// tính Si
12. EndFor
13. BL = Lm khi Sm == Max(Si) với i = 1,...,N
14. Return BL
Thuật tốn 2-2. Nhận dạng nhãn lớp với N kích thước cửa sổ
Tại một thời điểm, kết quả nhận dạng thu được là tập nhãn lớp Li với i = 1,..,N tương ứng với N cửa sổ đầu vào (tương ứng với các nhãn hành động khác nhau); Ui là giá trị độ đo AUC tương ứng; bi là số lượng các nhãn trùng với nhãn của cửa sổ Li, dựa vào bi ta tính được Si là tổng các giá trị độ đo AUC của các cửa sổ cĩ nhãn lớp trùng với Li. Nhãn lớp BL được chọn tương ứng với nhãn lớp thứ m là Lm mà Sm là giá trị lớn nhất trong các Si với i = 1,...,N.
2.5 Thực nghiệm và đánh giá 2.5.1 Mơi trƣờng thực nghiệm 2.5.1 Mơi trƣờng thực nghiệm
Hệ thống thu thập và phân tích dữ liệu cảm biến của điện thoại được xây dựng dựa trên hệ điều hành Android phiên bản 4.5 đến 6.0 sử dụng ngơn ngữ Java. Các mơ hình phân tích dữ liệu, phát hiện phương tiện, hành động giao thơng sử dụng bộ cơng cụ WEKA [53].
Thực nghiệm tiến hành với các đối tượng mang điện thoại khi điều khiển phương tiện hoặc ngồi sau các phương tiện do người khác điều khiển trong quá trình tham gia giao thơng trên đường phố. Vị trí điện thoại cĩ thể thay đổi tùy ý khi tiến hành thực nghiệm. Do tính chất đặc thù ở các thành phố của Việt Nam và trong khuơn khổ luận án, chúng tơi tiến hành thực nghiệm nhận dạng các hành động cơ bản của phương tiện thơng dụng nhất là xe máy.
Qua quá trình khảo sát các cơng trình nghiên cứu về nhận dạng hành động, hành vi sử dụng phương pháp phân lớp. Chúng tơi lựa chọn một số thuật tốn thường được sử dụng cho nhận dạng hành động, hành vi giao thơng như RF, k –NN, NB, SVM và J48. Các tham số của thuật tốn phân lớp được lựa chọn mặc định trên cơng cụ WEKA phiên bản 3. 8 thực hiện đánh giá bằng phương pháp kiểm chứng chéo chia dữ liệu thành 10 tập như bảng dưới đây:
TT Thuật tốn Tham số 1 RF P = 100; I =100; num-slots = 1; K =10; M = 1.0; V = 0.001; S = 1 2 J48 C = 0.25; M = 2 3 k- NN K=1; W = 0; A: "weka.core.neighboursearch.LinearNNSearch -A \"weka.core.EuclideanDistance -R first-last 4 NB 5 SVM S= 0; K= 2; D = 3; G = 0.0; R = 0.0; N = 0.5; M = 40.0; C = 1.0; E = 0.001; P = 0.1