Hệ thống nhận dạng hành động giao thơng

Một phần của tài liệu (LUẬN án TIẾN sĩ) nhận dạng hành vi của người tham gia giao thông dựa trên cảm biến điện thoại luận án TS máy tính 94801 (Trang 65)

Hành động Pha huấn luyện Pha pha phát hiện ` LOẠI HÀNH ĐỘNG TIỀN XỬ LÝ DỮ LIỆU - Kỹ thuật cửa sổ - Biến đổi dữ liệu

Hệ thống nhận dạng phương tiện giao thơng, hành động giao thơng được xây dựng và biểu diễn như Hình 2-7 dưới đây:

Hình 2-7. Hệ thống nhận dạng hành động giao thơng

Hệ thống nhận dạng bao gồm 2 pha: pha thứ nhất, sử dụng dữ liệu gia tốc cĩ gán nhãn các loại hành động cơ bản đã được thu thập và xác định trước. Các kỹ thuật tiền xử lý dữ liệu được sử dụng kết hợp với tập thuộc tính đặc trưng được đề xuất để xây dựng tập dữ liệu đặc trưng qua đĩ xây dựng mơ hình phát hiện cho hệ thống bằng phương pháp nhận dạng.

Pha thứ hai: nhận dạng các hành động dựa trên dữ liệu cảm biến thu được từ điện thoại của đối tượng đang tham gia giao thơng. Các kỹ thuật biến đổi dữ liệu, trích xuất đặc trưng được áp dụng để tạo mẫu dữ liệu phát hiện, phát hiện nhãn của mẫu dữ liệu này bằng bộ phân lớp.

Mỗi loại hành động, hành vi cĩ tính chất, đặc trưng khác nhau nên kích thước cửa sổ dữ liệu tương ứng cũng khác nhau. Việc tìm một kích thước cửa sổ cĩ kích thước phù hợp chứa đủ các thơng tin của tất cả các đối tượng cần phân loại, nhận dạng sẽ gặp nhiều khĩ khăn dẫn đến cần phải khảo sát và lựa chọn các kích thước phù hợp với từng nhãn lớp. Trong kỹ thuật cửa sổ dữ liệu, kết quả khảo sát, tối ưu nhận được là các giá trị kích thước cửa sổ và chồng dữ liệu phù hợp theo từng nhãn lớp hành động. Các kích thước này sẽ được áp dụng vào việc xây dựng dữ liệu huấn luyện cũng xử lý dữ liệu phát hiện các đối tượng tương ứng. Giải pháp

MƠ HÌNH PHÂN LỚP - Bộ phân lớp Dữ liệu cảm biến (Cĩ nhãn) TIỀN XỬ LÝ DỮ LIỆU - Kích thƣớc cửa sổ - Chồng dữ liệu - Biến đổi dữ liệu

Dữ liệu đặc trƣng (Huấn luyện)

Giá trị AUC > Delta

Các kích thƣớc cửa sổ và chồng dữ liệu tƣơng ứng với giá trị

AUC lớn nhất Đúng

Sai

Hình 2-8. Thuật tốn lựa chọn kích thƣớc cửa sổ và chồng dữ liệu theo AUC

Thuật tốn lựa chọn tham số mơ hình được thực hiện như sau: Từ tập dữ liệu cảm biến gán nhãn, thực hiện lọc nhiễu và cắt dữ liệu cảm biến gia tốc thành cửa sổ dữ liệu. Sử dụng tập thuộc tính đặc trưng để biến đổi dữ liệu gia tốc từ cửa sổ vừa cĩ được để cĩ dữ liệu đặc trưng tương ứng. Tập dữ liệu đặc trưng thu được sử dụng cho việc xây dựng mơ hình phân lớp và đánh giá kết quả dựa trên độ đo AUC. Kết quả tối ưu thu được là các kích thước cửa sổ và chồng dữ liệu được lựa chọn sao cho độ đo AUC khi phân lớp tương ứng tăng so với giá trị của cửa sổ trước nĩ nhỏ hơn một giá trị Delta cho trước thì lựa chọn kích thước của cửa sổ đĩ. Trong hoạt động nhận dạng hành động, cửa sổ nhỏ nhất được lựa chọn là 1 giây và kích thước tăng thêm mỗi lần là 1. Qua quá trình thực nghiệm, giá trị chênh lệch độ đo AUC của hai cửa sổ liền nhau (Delta) sử dụng để lựa chọn cửa sổ phù hợp nhất là 0.001.

Thuật tốn lựa chọn kích thước cửa sổ dựa trên độ đo phân lớp AUC sử dụng các giải thuật phân lớp với dữ liệu được cắt bởi các kích thước cửa sổ thể hiện trong thuật tốn sau:

Thuật tốn: Lựa chọn kích thước cửa sổ (Δt=0.001,v =1)

1. w1; / /gán kích thước cửa sổ khởi tạo là 1 giây

2. AUCw ComputeAUC(w)// Tính giá trị AUC tương ứng với W

3. While true do 4. AUCw+v ComputeAUC(w + v) 5.  AUCw+vAUCw 6. if   tthen 7. AUCwAUCw + v 8. w  w v 9. else 10. Break 11. EndWhile 12. Return w

Thuật tốn 2.1. Thuật tốn lựa chọn kích thước cửa sổ [CT4]

Sau khi thực hiện thuật tốn, kích thước cửa sổ phù hợp được lựa chọn để sử dụng cho nhận dạng các nhãn lớp hành động khác nhau dựa trên các thuật tốn phân lớp với tập dữ liệu được xây dựng bởi kích thước của sổ này.

Trong đĩ, pha phát hiện với N nhãn lớp hành động, sử dụng giải pháp tối ưu cửa sổ sẽ cĩ N kích thước cửa sổ khác nhau, đồng thời cần phải thực hiện N lần phân lớp để xác định kết quả nhãn lớp để đưa ra nhãn lớp phù hợp theo Hình 2-9 như sau: DỮ LIỆU PHÁT HIỆN MƠ HÌNH PHÂN LỚP M1 MƠ HÌNH PHÂN LỚP Mi MƠ HÌNH PHÂN LỚP MN NHÃN LỚP Xử lý với kích thước Wi ĐÁNH GIÁ NHÃN LỚP XÁC ĐỊNH NHÃN LỚP

Hình 2-9. Nhận dạng hành động với các kích thƣớc cửa sổ lựa chọn.

Tại một thời điểm, dữ liệu được tiền xử lý với N kích thước cửa sổ tối ưu và được nhận dạng nhãn lớp tương ứng. Việc xác định nhãn lớp được quyết định bởi Thuật tốn 2-2 dựa trên giá trị AUC dưới đây. Các bước thực hiện giải thuật được đặc tả dưới dạng giả mã như sau:

Thuật tốn: Nhận dạng nhãn lớp hành động (Wi)với i = 1,...,N

1. L ← Rỗng// tập nhãn lớp tương ứng với cửa sổ Wi với i =

1,...,N

2. U ← Rỗng // tập độ đo AUC (Wi), với i = 1,...,N

3. bi← 0 // tổng số nhãn trùng với nhãn Li, i = 1,...,N

4. BL ← “S”//nhãn lớp được lựa chọn, khởi đầu bằng nhãn “S”-

“Dừng”

5. Si ← 0 // tổng giá trị AUC của các nhãn trùng với Li

6. For i:=1 to N do //thực hiện N lần

7. For j:=1 to N do // thực hiện N lần

8. LjComputeL(Wj)//Lj thu được khi nhận dạng với Wj

8. If Lj = Li Then

9. bi = bi + 1 // tăng giá trị khi nhãn phân lớp bằng Li

10. EndIf

11. EndFor

11. Si = bi * Ui;với i = 1,...,N// tính Si

12. EndFor

13. BL = Lm khi Sm == Max(Si) với i = 1,...,N

14. Return BL

Thuật tốn 2-2. Nhận dạng nhãn lớp với N kích thước cửa sổ

Tại một thời điểm, kết quả nhận dạng thu được là tập nhãn lớp Li với i = 1,..,N tương ứng với N cửa sổ đầu vào (tương ứng với các nhãn hành động khác nhau); Ui là giá trị độ đo AUC tương ứng; bi là số lượng các nhãn trùng với nhãn của cửa sổ Li, dựa vào bi ta tính được Si là tổng các giá trị độ đo AUC của các cửa sổ cĩ nhãn lớp trùng với Li. Nhãn lớp BL được chọn tương ứng với nhãn lớp thứ m là LmSm là giá trị lớn nhất trong các Si với i = 1,...,N.

2.5 Thực nghiệm và đánh giá 2.5.1 Mơi trƣờng thực nghiệm 2.5.1 Mơi trƣờng thực nghiệm

Hệ thống thu thập và phân tích dữ liệu cảm biến của điện thoại được xây dựng dựa trên hệ điều hành Android phiên bản 4.5 đến 6.0 sử dụng ngơn ngữ Java. Các mơ hình phân tích dữ liệu, phát hiện phương tiện, hành động giao thơng sử dụng bộ cơng cụ WEKA [53].

Thực nghiệm tiến hành với các đối tượng mang điện thoại khi điều khiển phương tiện hoặc ngồi sau các phương tiện do người khác điều khiển trong quá trình tham gia giao thơng trên đường phố. Vị trí điện thoại cĩ thể thay đổi tùy ý khi tiến hành thực nghiệm. Do tính chất đặc thù ở các thành phố của Việt Nam và trong khuơn khổ luận án, chúng tơi tiến hành thực nghiệm nhận dạng các hành động cơ bản của phương tiện thơng dụng nhất là xe máy.

Qua quá trình khảo sát các cơng trình nghiên cứu về nhận dạng hành động, hành vi sử dụng phương pháp phân lớp. Chúng tơi lựa chọn một số thuật tốn thường được sử dụng cho nhận dạng hành động, hành vi giao thơng như RF, k –NN, NB, SVM và J48. Các tham số của thuật tốn phân lớp được lựa chọn mặc định trên cơng cụ WEKA phiên bản 3. 8 thực hiện đánh giá bằng phương pháp kiểm chứng chéo chia dữ liệu thành 10 tập như bảng dưới đây:

TT Thuật tốn Tham số 1 RF P = 100; I =100; num-slots = 1; K =10; M = 1.0; V = 0.001; S = 1 2 J48 C = 0.25; M = 2 3 k- NN K=1; W = 0; A: "weka.core.neighboursearch.LinearNNSearch -A \"weka.core.EuclideanDistance -R first-last 4 NB 5 SVM S= 0; K= 2; D = 3; G = 0.0; R = 0.0; N = 0.5; M = 40.0; C = 1.0; E = 0.001; P = 0.1

2.5.2 Dữ liệu thực nghiệm

Hệ thống nhận dạng hành động giao thơng được thực hiện trên từng loại phương tiện. Với mục đích làm cơ sở phát hiện hành vi bất thường, luận án tập trung nhận dạng 4 hành động cơ bản là đi thẳng, dừng, rẽ trái và rẽ phải. Dữ liệu cảm biến gia tốc được chuyển trục dựa vào cảm biến con quan hồi chuyển và cảm biến từ; sau đĩ thực hiện các bước tiền xử lý dữ liệu khác để thực hiện các thực nghiệm về: lựa chọn tập thuộc tính; khảo sát thuật tốn phân lớp; và xây dựng tập dữ liệu huấn luyện dựa trên tối ưu kích thước cửa sổ dữ liệu.

Số lƣợng Giới tính Độ tuổi Nghề nghiệp Địa điểm, thời gian thu dữ liệu

11 người 7 nam, 4 nữ 22 đến 40 Sinh viên, giảng viên, nhân viên văn phịng.

Khi đi học, đi làm và trở về trên đường phố Hà Nội

Bảng 2-7. Thơng tin đối tƣợng tham gia thực nghiệm

Thực nghiệm tiến hành thu dữ liệu khi các đối tượng ngồi sau hoặc điều khiển phương tiện trong hành trình lưu thơng. Tần số thu dữ liệu là 50Hz. Các hành động cần được nhận dạng là: {Dừng (S), Đi thẳng (G), Rẽ trái (L), Rẽ phải (R)}.

Hành động Số lượng Thời gian Vị trí của điện thoại

Dừng 11 6 phút Cầm tay khi lái xe, cầm tay ngồi sau

Đi thẳng 11 20 phút Cầm tay khi lái xe, cầm tay ngồi sau, bỏtúi

Rẽtrái 3 10 phút Cầm tay khi lái xe, cầm tay ngồi sau Rẽ phải 3 10 phút Cầm tay khi lái xe, cầm tay ngồi sau

Bảng 2-8. Cảnh huống thu thập dữ liệu của các hành động

Các cảnh huống thực hiện thu thập dữ liệu đối với từng hành động được bố trí như sau: Dữ liệu hành động dừng được thu thập khi phương tiện chuẩn bị dừng cho đến khi phương tiện dừng hẳn. Hành động đi thẳng được thực hiện khi phương tiện di chuyển khơng thay đổi hướng trong lộ trình.

Hình 2-10. Hành động dừng và hành động đi thẳng

Dừng chờ Di chuyển

-5 0 5 10 15 1 11 21 31 41 51 61 71 81 91 101 111 121 131 141 Dừng X Y Z -10 -5 0 5 10 15 1 11 21 31 41 51 61 71 81 91 101 111 121 131 141 Đi thẳng X Y Z -10 0 10 20 1 13 25 37 49 61 73 85 97 109 121 133 145 157 Rẽ trái X Y Z -10 0 10 20 1 11 21 31 41 51 61 71 81 91 101 111 121 131 141 151 Rẽ phải X Y Z α

- Hành động rẽ trái được thực hiện khi phương tiện chuẩn bị rẽ trái đến khi kết thúc rẽ trái, tương tự là hành động rẽ phải với gĩc chuyển hướng 450 được mơ phỏng như Hình 2-11.

Dữ liệu phát hiện được thu thập và phân tích nhằm phát hiện ra loại phương tiện mà người dùng điện thoại đang sử dụng, từ kết quả này hệ thống sẽ chuyển sang phát hiện các hành động cơ bản. Đây là cơ sở để phát hiện các hành động khác phức tạp hơn dựa trên tổ hợp từ 4 hành động cơ bản này.

(a) (b)

Hình 2-11. (a): Hành động rẽ phải; (b): Hành động rẽ trái

Khi thu thập dữ liệu cảm biến gia tốc, dữ liệu được thể hiện như hình sau:

(a) (b)

(c) (d)

361 3797 1750

1656

Số lượng mẫu của các hành động

Dừng Đi thẳng Rẽ trái Rẽ phải

Khi thực hiện phân tích dữ liệu với các kích thước cửa sổ khác nhau, số lượng các bản ghi tương ứng trong tập dữ liệu huấn luyện sử dụng để khảo sát các hành động được biểu diễn như hình sau:

Hành động Dừng Đi thẳng Rẽ trái Rẽ phải

Số lượng mẫu 361 3797 1750 1656

Bảng 2-9. Tập mẫu dữ liệu đặc trưng sử dụng nhận dạng hành động giao thơng cơ bản Thơng tin về tập dữ liệu đặc trưng trong Bảng 2-9 được minh họa bằng Hình Thơng tin về tập dữ liệu đặc trưng trong Bảng 2-9 được minh họa bằng Hình 2-13 dưới đây:

Hình 2-13. Tập dữ liệu đặc trƣng sử dụng cho nhận dạng hành động giao thơng cơ bản

Cũng cĩ thể thấy được phân bổ của dữ liệu đặc trưng đã được biến đổi với 59 thuộc tính từ dữ liệu cảm biến gia tốc thể hiện bởi Hình 2-14 sau:

Hình 2-14. Phân bổ của tập dữ liệu đặc trƣng đƣợc biến đổi với 59 thuộc tính

Với các tập dữ liệu đặc trưng được biến đổi với các tập thuộc tính khác nhau, áp dụng các phương pháp phân lớp và đánh giá kết quả bằng phương pháp kiểm chứng chéo để tiến hành các thực nghiệm trên.

2.5.3 Lựa chọn tập thuộc tính

Để đánh giá, lựa chọn tập thuộc tính phù hợp bằng cách đánh giá tên từng tập thuộc tính, sau đĩ tiến hành kết hợp các tập thuộc tính với nhau. Thực nghiệm tiến hành với tập thuộc tính: H2, T2, F2, TF2, TH2, TFH2. Dữ liệu cảm biến gia tốc thơ chưa chuyển trục được thu khi người tham gia giao thơng điều khiển phương tiện xe máy với tần số thu dữ liệu là 50Hz.

Cửa sổ dữ liệu là một tham số quan trọng trong phương pháp trích xuất các thơng tin bởi các thuộc tính đặc trưng với mong muốn tìm được nhiều thơng tin hữu ích cĩ trong cửa sổ đĩ. Tuy nhiên, tùy từng nghiên cứu khác nhau, các cửa sổ được lựa chọn với kích thước khác nhau – thường là từ thực nghiệm như kích thước 3 giây trong nghiên cứu [21]; hay 60 giây trong nghiên cứu [32]. Thơng qua thực nghiệm, với mong muốn lựa chọn một cửa sổ đồng nhất nhằm đánh giá tính chất của các thuộc tính phù hợp, cửa sổ dữ liệu được lựa chọn là 5 giây đối với tất cả hành động, cùng với tỉ lệ chồng dữ liệu là 50%. Một số thuật tốn phân lớp thơng dụng như rừng ngẫu nhiên, J48, Nạve Bayes, k- láng giềng gần nhất, máy véc tơ tựa với các tham số mặc định được lựa chọn để tiến hành thực nghiệm được lựa chọn như trong Bảng 2-6. Số lượng các thuộc tính trên mỗi tập được biểu diễn như Bảng 2-10. Phương pháp đánh giá sử dụng kiểm tra chéo – 10 tập.

Kiểu Tập đặc trưng Số lượng thuộc tính Áp dụng nhận dạng

T T2 34 Hành động F F2 7 Hành động T+F TF2 41 Hành động H H2 18 Hành động T+H TH2 52 Hành động T+F+H TFH2 59 Hành động

Bảng 2-10. Khảo sát tập thuộc tính cho hệ thống phát hiện hành động cơ bản

Trong Bảng 2-10, kiểu thuộc tính T: là dựa trên thời gian, F: dựa trên tần số; Áp dụng cho hệ thống nhận dạng hành động. Thực nghiệm với các tập thuộc tính trên thu được các kết quả về độ chính xác Accuracy (ACC) và AUC như sau:

0.50 0.55 0.60 0.65 0.70 0.75 0.80 0.85 0.90 0.95 1.00 RF J48 NB KNN SVM Độ đo AU C Thuật tốn H2 F2 T2 TH2 TF2 TFH2

Random Forest J48 Nạve Bayes KNN SVM

ACC AUC ACC AUC ACC AUC ACC AUC ACC AUC

H2 82,39% 0,9531 65,57% 0,8881 65,57% 0,8326 66,89% 0,8153 65,41% 0,7273 F2 82,85% 0,9530 79,16% 0,8690 54,29% 0,7970 75,99% 0,8120 51,12% 0,6551 T2 88,79% 0,9730 69,90% 0,9213 69,90% 0,8546 73,91% 0,8596 70,86% 0,7506 TH2 88,39% 0,975 82,06% 0,8620 38,19% 0,8440 78,56% 0,8400 76,45% 0,8090 TF2 88,85% 0,9752 70,60% 0,9134 70,60% 0,8462 74,08% 0,8481 70,99% 0,7384 TFH2 88,32% 0,9768 70,36% 0,9104 70,36% 0,8479 72,39% 0,8406 69,64% 0,7384

Bảng 2-11, Kết quả phân lớp hành động trên các tập thuộc tính

Để cĩ sự đánh giá sự kết hợp các thuộc tính ở các tập khác nhau giữa các miền tần số và thời gian, thực nghiệm phân lớp được khảo sát trên H2, T2, F2, TH2,

Một phần của tài liệu (LUẬN án TIẾN sĩ) nhận dạng hành vi của người tham gia giao thông dựa trên cảm biến điện thoại luận án TS máy tính 94801 (Trang 65)

Tải bản đầy đủ (PDF)

(121 trang)