Nhận dạng đối tƣợng bằng mụ hỡnh mạng nơron

Một phần của tài liệu Nghiên cứu một số phương pháp nhận dạng đối tượng ứng dụng trong hệ thống camera quan sát bảo vệ mục tiêu (Trang 56)

Nhƣ đó trỡnh bày trong chƣơng 3, kế thừa cỏc kết quả nghiờn cứu từ cỏc Luận văn trƣớc, chỳng tụi lựa chọn mạng nơron lan truyền ngƣợc hƣớng cho việc phõn loại đối tƣợng vào một trong hai lớp đối tƣợng và khụng phải đối tƣợng.

Cấu trỳc của mạng nơron lan truyền ngƣợc hƣớng đƣợc xỏc định là hai số nguyờn xỏc định số biến của tớn hiệu vào và số nơron trờn lớp Kohonen. Cỏc trọng số của cỏc nơron trong mạng đƣợc lƣu trữ trờn một bảng tuyến tớnh cấp phỏt động W ( ). Việc tớnh địa chỉ cho từng trọng số trong bảng tuyến tớnh này đƣợc thực hiện bởi một hàm phụ trợ wIndex(j, i) sẽ đƣợc mụ tả kỹ trong phần giải thuật. Việc làm này rất thuận lợi cho việc mó hoỏ và giải mó bộ trọng số thành một chuỗi phục vụ cho quỏ trỡnh học của mạng. Bảng trọng số này đƣợc cấp phỏt nhƣ một bảng toàn cục:

a.Tổ chức số liệu và lưu trữ

Ngoài ra chỳng ta cần một bảng toàn cục Out ( ) để lƣu trữ cỏc tớn hiệu ra của cỏc nơron. Cũng nhƣ bảng lƣu trữ trọng số bảng lƣu trữ tớn hiệu ra này là một bảng tuyến tớnh việc tớnh địa chỉ cho từng nơron đƣợc thực hiện qua một hàm phụ trợ kIndex (l, j).

Số liệu thực nghiệm đƣợc tổ chức trong một tệp số liệu, tốt nhất là đƣợc tổ chức trong file dữ liệu Binary. Số liệu đƣợc lƣu trữ bao gồm vectơ vào của mỗi ảnh đối tƣợng tức là mảng một chiều Input ( ) và một giỏ trị số nguyờn lƣu trữ giỏ trị 0 tƣơng ứng với lớp khụng phải đối tƣợng và 1 tƣơng ứng với lớp đối tƣợng. Đối với số liệu để học thỡ là một file dữ liệu cần lƣu trữ tƣơng ứng với hai lớp cần phõn loại.

Đối với file lƣu trữ cỏc trọng số của cỏc nơron và tớn hiệu ra của cỏc nơron là một giỏ trị nguyờn với cỏc giỏ trị 0 và 1 tƣơng ứng với 2 lớp. Ngoài ra file dữ liệu này cũn đƣợc ghi cỏc tham số của mạng nhƣ độ lớn của mạng, cỏc hằng số học, số lần học.

Túm lại chƣơng trỡnh cần 2 file dữ liệu cú cấu trỳc nhƣ sau: File lƣu trữ số liệu mẫu:

Private Type File data Input () as Single Char as Integer End Type

File lƣu trữ trọng số của mạng Private Type FileNet

W() as Single Out () as Integer Rong as Integer Dài as Integer Amax as Single Amin as Single So_lan_hoc as Double End Type

b. Tuyến tớnh hoỏ số liệu

* Chức năng: Thực hiện việc biến đổi số liệu cho phự hợp với quỏ trỡnh làm việc của mạng nơron lan truyền ngƣợc hƣớng

Vào: Mảng động một chiều TH() lƣu trữ giỏ trị lấy mẫu của một chu kỳ tớn hiệu

Ra: Mảng một chiều XR() cú độ dài cố định lƣu trữ cỏc thành phần của vectơ vào.

* Giải thuật: Với mỗi phần tử thứ i của mảng XR () cần xỏc định hai phần tử thứ j và j+1 của mảng TH () sao cho TH(j)  XR(i)  TH(j+1)

Giả sử số phần tử của mảng TH () là M và số phần tử của mảng XR () là N, khi đú phần tử thứ j của TH () và XR (j) đƣợc xỏc định nhƣ sau:

b = M-1 b = i * b j = b \ (N – 1) a = b / (N – 1) – j XR (i) = TH (j) + a * c +) Tỡm giỏ trị max của mảng XR() +) Quy chuẩn XR(i): =XR(i) / Max

c. Thủ tục học cú chỉ đạo của mạng nơron lan truyền ngược hướng

- Chức năng: Thực hiện quỏ trỡnh học cú chỉ đạo của mạng nơron lan truyền ngƣợc hƣớng bao gồm quỏ trỡnh học tự tổ chức của lớp Kohonen và quỏ trỡnh tự học cú chỉ đạo của lớp ra.

- Vào: Mảng một chiều XS () lƣu trữ cỏc tập mẫu và mảng một chiều YS () lƣu trữ lớp lời giải.

- Ra: Mảng hai chiều W () lƣu trữ trọng số của cỏc nơron trờn lớp Kohonen và mảng hai chiều C () lƣu trữ trọng số của cỏc nơron trờn lớp ra.

- Giải thuật:

+) Khởi động mạng

+) Thả một tớn hiệu vào XS đi vào lớp Kohonen. +) Xỏc định nơron trung tõm

+) Hiệu chỉnh tất cả trọng số của cỏc nơron trờn lớp Kohonen +) Thả lời giải YS đi vào mạng theo hƣớng ngƣợc lại để hiệu chỉnh cỏc trọng số của cỏc nơron trờn lớp ra

* Khởi động mạng

- Vào: Mảng hai chiều W () lƣu trữ cỏc giỏ trị trọng số của cỏc nơron trờn lớp Kohonen.

- Ra: Mảng hai chiều W () - Giải thuật:

Xỏc định chiều dài, chiều rộng của mảng W () tƣơng ứng là WD và WR.

Khởi gỏn cỏc giỏ trị ngẫu nhiờn cho cỏc phần tử của mảng For i: = 1 to WR do

For j: = 1 to WR do W (i, j): = RND;

* Xỏc định nơron trung tõm

- Chức năng: Đối với mỗi một đối tƣợng đƣợc thả vào mạng cần phải xỏc định nơron trung tõm sao cho vectơ trọng số của nơron đú giống với tớn hiệu vào nhất.

- Vào: Mảng một chiều XS () lƣu trữ vector vào của tập mẫu - Ra: Số nguyờn xỏc định vị trớ của nơron trung tõm

- Giải thuật: Tớnh hàm khuếch đại đối với mỗi nơron của mạng Giả thiết mạng Kohonen cú ma trận trọng số W(i, j), cỏc tớn hiệu vào cú m biến

XS = { XS (1), XS (2), ..., XS (m)}

Khi đú hàm khuếch đại của N nơron trờn lớp Kohonen đƣợc xỏc định.

KD(j) =    n i j i W i XS 1 2 )) , ( ) ( (

Tỡm giỏ trị nhỏ nhất của hàm khuếch đại KD (j). Chỉ số của hàm khuếch đại KD (j) tỡm đƣợc sẽ là vị trớ của nơron trung tõm.

* Hiệu chỉnh cỏc trọng số của cỏc nơron trờn lớp Kohonen.

- Chức năng: Đối với mỗi mẫu XS () đi vào mạng cần phải xột tới phản ứng của mỗi nơron trong toàn mạng. Trọng số của cỏc nơron đƣợc hiệu chỉnh sao cho nếu cũng mẫu đú lần sau đi vào mạng thỡ sẽ cho hiệu ứng tốt hơn.

- Vào: Mảng một chiều XS () lƣu trữ cỏc thành phần của vectơ vào và mảng hai chiều W () lƣu trữ trọng số của cỏc nơron trờn lớp Kohonen.

Giải thuật:

Sau khi nơron trung tõm đƣợc chọn, tớnh lỏng giềng của toàn bộ cỏc nơron trờn lớp Kohonen đối với nơron trung tõm. Khoảng cỏch D giữa nơron trung tõm c cú tọa độ (kc, lc) với nơron cú tọa độ (kj, lj) đƣợc tớnh theo cụng thức:

D = max[ min (kj - kc,kj – kc +dai,kj – kc - rong), min (lj - lc,lj – lc + dai,lj – lc -rong) ]

( Trong đú dai và rong là chiều dài và chiều rộng của mạng nơron)

Tớnh hàm phụ thuộc topo a(dc – dj)

Trong đú DMax là lõn cận xa nhất cú thể cú của mạng DMax = Max( dai \ 2, rong \ 2) + 1

WJi(new) = WJi(old) +  (t)  a(dC – dj )  ( xi- WJi(old)) Trong đú a(dC – dj ) là hàm phụ thuộc topo đó đƣợc tớnh ở trờn

(t) = (amax – amin) min

1 max max a t t t   

Trong đú: t – số đối tƣợng đó qua mạng

Tmax – tổng số đối tƣợng qua mạng amax, amin – hằng số học của mạng

a(dC – dj )          DMax khiD DMax D DMax DMax khiD , , 0

Quỏ trỡnh lặp lại với cỏc đối tƣợng tiếp theo

Mỗi lần tất cả cỏc đối tƣợng mẫu đó đi qua mạng đƣợc gọi là một lƣợt. Thụng thƣờng cần phải cú từ vài trăm đến hàng ngàn lƣợt để mạng ổn định. Khi chọn đƣợc cỏc hằng số đặc trƣng của quỏ trỡnh học amax, amin thớch hợp thỡ quỏ trỡnh học của mạng luụn hội tụ

* Hiệu chỉnh trọng số của cỏc nơron trờn lớp ra

- Chức năng: Tạo đƣợc một bảng tra để thuận lợi cho quỏ trỡnh nghiờn cứu về sau.

- Vào: Mảng một chiều YS () lƣu trữ lớp lời giải, mảng hai chiều W () lƣu trữ cỏc trọng số của cỏc nơron trờn lớp Kohonen

- Ra: Mảng hai chiều C () lƣu trữ trọng số của cỏc nơron trờn lớp ra. - Giải thuật:

+ Thả đối tƣợng lời giải YS () vào mạng

+ Xỏc định nơron tƣơng ứng trờn lớp Kohonen ứng với lời giải YS (). Thực chất của bƣớc này là tỡm nơron trung tõm trờn lớp Kohonen.

+ Gỏn trọng số của nơron trờn lớp ra tƣơng ứng với nơron trung tõm đƣợc chọn ở bƣớc trờn bằng giỏ trị 1 hoặc 0 tƣơng ứng với vectơ lời giải YS() đƣợc phõn vào lớp đối tƣợng hoặc khụng phải đối tƣợng.

+Quỏ trỡnh đƣợc lặp lại đối với tất cả cỏc đối tƣợng lời giải đƣợc đi qua mạng.

+ Sau khi thực hiện thủ tục hiệu chỉnh trọng số của cỏc nơron trờn lớp ra, chỳng ta thu đƣợc mảng hai chiều C () lƣu trữ phõn bố topo của mạng, lƣu trữ cỏc lời giải của mạng.

d. Tra cứu bằng mạng nơron

- Chức năng: Thực hiện quỏ trỡnh nhận dạng, thực chất là tra cứu bảng tra trờn bản đồ phõn bố topo của cỏc đối tƣợng.

- Vào: Mảng một chiều TH () lƣu trữ giỏ trị lấy mẫu của hai giỏ trị 0,1 tƣơng ứng với hai lớp đối tƣợng và khụng phải đối tƣợng và ảnh của đối tƣợng cần nhận dạng

- Ra: Giỏ trị 1 hoặc 0 tƣơng ứng với hai lớp. - Giải thuật:

Thả tớn hiệu vào TH () đi qua mạng. Chọn phần tử trung tõm theo thuật toỏn đó đƣợc trỡnh bày ở trờn.

Sau khi xỏc định đƣợc vị trớ của nơron trung tõm trờn lớp Kohonen, đối sỏnh 1 – 1 về toạ độ sang lớp ra. Giỏ trị trọng số của nơron trờn lớp ra sẽ cho một số nguyờn 0 hoặc 1 tƣơng ứng với lớp đối tƣợng cần phần loại.

KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN

Trong phạm vi nghiờn cứu của Luận văn, chỳng tụi đó tỡm hiểu đƣợc tổng quan về hệ thống camera quan sỏt bao gồm cấu hỡnh phần cứng và cỏc chức năng phần mềm. Tỡm hiểu nghiờn cứu một số loại camera giỏm sỏt trờn thị trƣờng cụng nghệ thụng tin ở Việt Nam, trờn cơ sở tỡm hiểu cỏc phƣơng thức kết nối với mỏy tớnh, chỳng tụi đó đề xuất đƣợc một số loại camera cú khả năng ứng dụng trong phạm vi nghiờn cứu.

Chỳng tụi cũng đó tỡm hiểu nghiờn cứu cỏc phƣơng phỏp và cỏc bƣớc tiến hành phõn tớch ảnh video, từ đú xõy dựng đƣợc chƣơng trỡnh phỏt hiện và bỏm sỏt sự di chuyển của đối tƣợng trong vựng camera quan sỏt đƣợc. Cỏc sản phẩm đều đƣợc chỳng tụi phỏt triển trờn ngụn ngữ lập trỡnh visual basic mà khụng sử dụng bất kỳ cỏc hàm thƣ viện nào, trừ hai AxtiveX thu nhận tớn hiệu video đƣợc cung cấp bởi hai camera IP và USB mà chỳng tụi đó đƣợc đầu tƣ nghiờn cứu.

Trong hơn một năm nghiờn cứu Luận văn, cỏc kết quả đạt mà Luận văn đó đạt đƣợc nhƣ sau:

 Nghiờn cứu một số loại camera hiện cú trờn thị trƣờng giỏm sỏt bảo vệ mục tiờu, đỏnh giỏ chất lƣợng ảnh cũng nhƣ khả năng liờn kết với mỏy tớnh. Xõy dựng chƣơng trỡnh thu nhận ảnh trực tiếp từ camera, kết xuất ra từng ảnh riờng biệt theo từ frame của luồng video.

 Thu thập thống kờ và phõn tớch cỏc mẫu về hỡnh dỏng di chuyển của con ngƣời. Xõy dựng chƣơng trỡnh tổng hợp và phõn tớch cỏc mẫu này để làm cơ sở cho quỏ trỡnh huấn luyện của hệ thống. Tự động cập nhật cỏc mẫu di chuyển mới

 Xõy dựng chƣơng trỡnh nhận dạng phỏt hiện đối tƣợng xuất hiện tại khu vực cần bảo vệ, trong vựng camera quan sỏt đƣợc.

 Xõy dựng chƣơng trỡnh bỏm sỏt di chuyển của đối tƣợng trong vựng camera quan sỏt đƣợc. Đặt ngƣỡng bỏo động nếu nhƣ đối tƣợng xuất hiện tại khu vục cần bảo vệ quỏ một thời gian qui định

 Xõy dựng chƣơng trỡnh dũ tỡm khuụn mặt đối với mỗi đối tƣợng phỏt hiện đƣợc. Nếu xuất hiện khuụn mặt trong luồng video quan sỏt đƣợc thỡ định vị và sao lƣu khuụn mặt của đối tƣợng.

 Hoàn thiện chƣơng trỡnh nhận dạng đối tƣợng với nhiều đối tƣợng cựng xuất hiện trong frame ảnh thu nhận đƣợc từ camera. Phỏt hiện, định vị và sao lƣu cỏc khuụn mặt của đối tƣợng nếu cú thể.

Với cỏc kết quả đó đạt đƣợc, chỳng tụi tự nhận thấy đó hoàn thành đỳng nội dung và mục tiờu đề ra trong bản thuyết minh nghiờn cứu.

Dựa trờn những nghiờn cứu này, với một số kết quả đó đạt đƣợc chỳng tụi xin đề xuất một số phỏt triển tiếp theo đề Luận văn cú thể ứng dụng trong thực tế:

- Xột về bảy bài toỏn đó đề cập trong chƣơng 1, chỳng tụi đó thực hiện đƣợc ba bài toỏn bao gồm: Phỏt hiện sự xuất hiện hoặc biến mất của cỏc đồ vật, phỏt hiện và bỏm sỏt sự di chuyển của con ngƣời trong phạm vi camera quan sỏt đƣợc. Do điều kiện chƣa cú số liệu thực tế, nờn chỳng tụi cũng đó bƣớc đầu thử nghiệm với việc phỏt hiện và bỏm sỏt sự di chuyển của cỏc phƣơng tiện giao thụng với cỏc đoạn video sẵn cú. Vỡ vậy chỳng tụi xin đề nghị đƣợc tiếp tục nghiờn cứu để hoàn thiện cỏc bài toỏn cũn lại của hệ thống camera giỏm sỏt. ở phạm vi cao hơn là làm luận văn tiến sĩ.

- Dựa trờn cỏc kỹ thuật phõn tớch hỡnh ảnh video, một hƣớng nghiờn cứu cú thể đƣợc phỏt triển và cú nhiều ứng dụng là xõy dựng cỏc chỉ mục tỡm kiếm video nhằm cung cấp cho ngƣời sử dụng cụng cụ để tra cứu thụng tin bằng hỡnh ảnh video.

PHỤ LỤC A. GIAO DIỆN CHƢƠNG TRèNH

1. Giao diện chớnh

Giao diện chớnh của chƣơng trỡnh đƣợc thiết kế nhƣ trong hỡnh A.1 với cỏc chức năng chớnh nhƣ sau:

Cỏc chức năng về thống:

- Thiết lập cấu hỡnh camera: Ngƣời sử dụng (NSD) cú thể thiết lập cỏc chế độ lƣu trữ hỡnh ảnh của camera nhƣ kớch thƣớc cỏc khung hỡnh, chế độ màu và tốc độ lƣu trữ hỡnh ảnh (Cỏc camera hiện tại cú thể đạt 30 khung hỡnh trờn giõy)

- Cài đặt cỏc thụng số về hệ thống nhƣ: chu kỳ bỏo động, hỡnh thức bỏo động bằng hỡnh ảnh hoặc bằng õm thanh

- Thử nghiệm kết nối đồng thời hai loại camera là camera IP và camera qua cổng USB.

Cỏc chức năng đối với camera IP hoặc camera USB:

- Giỏm sỏt đồ vật: Phỏt hiện sự xuất hiện hoặc biến mất của cỏc đồ vật tại khu vực quan sỏt.

- Giỏm sỏt con ngƣời: Phỏt hiện và bỏm sỏt sự di chuyển của con ngƣời trong vựng quan sỏt của camera

- Phỏt hiện khuụn mặt: Phỏt hiện và sao lƣu nếu khuụn mặt con ngƣời xuất hiện trờn cỏc khung hỡnh.

Cỏc chức năng huấn luyện:

- Huấn luyện khuụn mặt: Tổ chức tập mẫu luyện là khuụn mặt và tập mẫu luyện khụng phải là khuụn mặt để giỳp hệ thống phõn biệt đƣợc chớnh xỏc cỏc khuụm mặt trong quỏ trỡnh làm việc

- Huấn luyện hỡnh dỏng ngƣời: Tƣơng tự nhƣ đối với khuụn mặt, hệ thống cũng cần đƣợc huấn luyện với cỏc mẫu hỡnh dỏng con ngƣời kế cả một số mẫu khụng đầy đủ, để hệ thống cú thể phõn biệt đƣợc chớnh xỏc đõu là con ngƣời xuất hiện trong cỏc khung hỡnh.

- Cuối cựng là chức năng kiểm tra quỏ trỡnh huấn luyện nhằm đỏnh giỏ mức độ hội tụ của quỏ trỡnh huấn luyện.2. Giao diện chương trỡnh giỏm sỏt đồ vật

Giao diện của chức năng giỏm sỏt đồ vật đƣợc thiết kế nhƣ trong hỡnh A2. Nỳt lệnh "On" thực hiện chức năng bật/tắt camera. Nỳt lệnh "Đặt vựng giỏm sỏt" cho phộp NSD khoang vựng cần giỏm sỏt. Sau một thời gian đƣợc thiết lập trong cỏc thụng số của hệ thống, nếu nhƣ đồ vật xuất hiện hoặc biến mất thỡ bỏo động bằng hỡnh ảnh là đốn chuyển sang mầu đỏ.

Giao diện giỏm sỏt đồ vật bằng camera IP và camera USB đều đƣợc thiết kế tƣơng tự nhau, với cỏc thao tỏc giống nhau.

3. Giao diện chƣơng trỡnh giỏm sỏt con ngƣời

Chức năng giỏm sỏt con ngƣời đƣợc thiết kế nhƣ trong hỡnh A.3 với cả hai loại camera IP và camer USB. Ngoài chức năng thu nhận trực tiếp từ camera, chỳng tụi thiết kết thờm hai nỳt lệnh "Tuan" và "Quan" mụ tả đoạn video đó đƣợc ghi tại phũng làm việc của chỳng tụi với hai hƣớng di chuyển từ trỏi qua phải và ngƣợc lại của hai đồng chớ Quõn và Tuấn.

4.Giao diện chƣơng trỡnh phỏt hiện khuụn mặt

Hỡnh A.3: Chức năng giỏm sỏt con ngƣời

Chức năng phỏt hiện khuụn mặt đối với hai loại camera IP và USB đều đƣợc thiết kế nhƣ trong hỡnh A.4.

Một phần của tài liệu Nghiên cứu một số phương pháp nhận dạng đối tượng ứng dụng trong hệ thống camera quan sát bảo vệ mục tiêu (Trang 56)

Tải bản đầy đủ (PDF)

(88 trang)