CHƯƠNG 3 THIẾT KẾ VÀ XÂY DỰNG CHƯƠNG TRÌNH
3.5. Nhận dạng đối tƣợng bằng mô hình mạng nơron
Như đã trình bày trong chương 3, kế thừa các kết quả nghiên cứu từ các Luận văn trước, chúng tôi lựa chọn mạng nơron lan truyền ngược hướng cho việc phân loại đối tƣợng vào một trong hai lớp đối tƣợng và không phải đối tƣợng.
Cấu trúc của mạng nơron lan truyền ngược hướng được xác định là hai số nguyên xác định số biến của tín hiệu vào và số nơron trên lớp Kohonen.
Các trọng số của các nơron trong mạng được lưu trữ trên một bảng tuyến tính cấp phát động W ( ). Việc tính địa chỉ cho từng trọng số trong bảng tuyến tính này đƣợc thực hiện bởi một hàm phụ trợ wIndex(j, i) sẽ đƣợc mô tả kỹ trong phần giải thuật. Việc làm này rất thuận lợi cho việc mã hoá và giải mã bộ trọng số thành một chuỗi phục vụ cho quá trình học của mạng. Bảng trọng số này đƣợc cấp phát nhƣ một bảng toàn cục:
a.Tổ chức số liệu và lưu trữ
Ngoài ra chúng ta cần một bảng toàn cục Out ( ) để lưu trữ các tín hiệu ra của các nơron. Cũng như bảng lưu trữ trọng số bảng lưu trữ tín hiệu ra này là một bảng tuyến tính việc tính địa chỉ cho từng nơron đƣợc thực hiện qua một hàm phụ trợ kIndex (l, j).
Số liệu thực nghiệm đƣợc tổ chức trong một tệp số liệu, tốt nhất là được tổ chức trong file dữ liệu Binary. Số liệu được lưu trữ bao gồm vectơ vào của mỗi ảnh đối tƣợng tức là mảng một chiều Input ( ) và một giá trị số nguyên lưu trữ giá trị 0 tương ứng với lớp không phải đối tượng và 1 tương ứng với lớp đối tượng. Đối với số liệu để học thì là một file dữ liệu cần lưu trữ tương ứng với hai lớp cần phân loại.
(LUAN.van.THAC.si).nghien.cuu.mot.so.phuong.phap.nhan.dang.doi.tuong.ung.dung.trong.he.thong.camera.quan.sat.bao.ve.muc.tieu(LUAN.van.THAC.si).nghien.cuu.mot.so.phuong.phap.nhan.dang.doi.tuong.ung.dung.trong.he.thong.camera.quan.sat.bao.ve.muc.tieu(LUAN.van.THAC.si).nghien.cuu.mot.so.phuong.phap.nhan.dang.doi.tuong.ung.dung.trong.he.thong.camera.quan.sat.bao.ve.muc.tieu(LUAN.van.THAC.si).nghien.cuu.mot.so.phuong.phap.nhan.dang.doi.tuong.ung.dung.trong.he.thong.camera.quan.sat.bao.ve.muc.tieu
Đối với file lưu trữ các trọng số của các nơron và tín hiệu ra của các nơron là một giá trị nguyên với các giá trị 0 và 1 tương ứng với 2 lớp. Ngoài ra file dữ liệu này còn đƣợc ghi các tham số của mạng nhƣ độ lớn của mạng, các hằng số học, số lần học.
Tóm lại chương trình cần 2 file dữ liệu có cấu trúc như sau:
File lưu trữ số liệu mẫu:
Private Type File data Input () as Single Char as Integer End Type
File lưu trữ trọng số của mạng Private Type FileNet
W() as Single Out () as Integer Rong as Integer Dài as Integer Amax as Single Amin as Single
So_lan_hoc as Double End Type
b. Tuyến tính hoá số liệu
* Chức năng: Thực hiện việc biến đổi số liệu cho phù hợp với quá trình làm việc của mạng nơron lan truyền ngược hướng
Vào: Mảng động một chiều TH() lưu trữ giá trị lấy mẫu của một chu kỳ tín hiệu
Ra: Mảng một chiều XR() có độ dài cố định lưu trữ các thành phần của vectơ vào.
* Giải thuật: Với mỗi phần tử thứ i của mảng XR () cần xác định hai phần tử thứ j và j+1 của mảng TH () sao cho TH(j) XR(i) TH(j+1)
+) Áp dụng quy tắc tam xuất để tính giá trị của phần tử XR(i)
TIEU LUAN MOI download : skknchat@gmail.com
(LUAN.van.THAC.si).nghien.cuu.mot.so.phuong.phap.nhan.dang.doi.tuong.ung.dung.trong.he.thong.camera.quan.sat.bao.ve.muc.tieu(LUAN.van.THAC.si).nghien.cuu.mot.so.phuong.phap.nhan.dang.doi.tuong.ung.dung.trong.he.thong.camera.quan.sat.bao.ve.muc.tieu(LUAN.van.THAC.si).nghien.cuu.mot.so.phuong.phap.nhan.dang.doi.tuong.ung.dung.trong.he.thong.camera.quan.sat.bao.ve.muc.tieu(LUAN.van.THAC.si).nghien.cuu.mot.so.phuong.phap.nhan.dang.doi.tuong.ung.dung.trong.he.thong.camera.quan.sat.bao.ve.muc.tieu
Giả sử số phần tử của mảng TH () là M và số phần tử của mảng XR () là N, khi đó phần tử thứ j của TH () và XR (j) đƣợc xác định nhƣ sau:
b = M-1 b = i * b j = b \ (N – 1) a = b / (N – 1) – j XR (i) = TH (j) + a * c +) Tìm giá trị max của mảng XR() +) Quy chuẩn XR(i): =XR(i) / Max
c. Thủ tục học có chỉ đạo của mạng nơron lan truyền ngược hướng
- Chức năng: Thực hiện quá trình học có chỉ đạo của mạng nơron lan truyền ngược hướng bao gồm quá trình học tự tổ chức của lớp Kohonen và quá trình tự học có chỉ đạo của lớp ra.
- Vào: Mảng một chiều XS () lưu trữ các tập mẫu và mảng một chiều YS () lưu trữ lớp lời giải.
- Ra: Mảng hai chiều W () lưu trữ trọng số của các nơron trên lớp Kohonen và mảng hai chiều C () lưu trữ trọng số của các nơron trên lớp ra.
- Giải thuật:
+) Khởi động mạng
+) Thả một tín hiệu vào XS đi vào lớp Kohonen.
+) Xác định nơron trung tâm
+) Hiệu chỉnh tất cả trọng số của các nơron trên lớp Kohonen +) Thả lời giải YS đi vào mạng theo hướng ngược lại để hiệu chỉnh các trọng số của các nơron trên lớp ra
* Khởi động mạng
- Vào: Mảng hai chiều W () lưu trữ các giá trị trọng số của các nơron trên lớp Kohonen.
- Ra: Mảng hai chiều W () - Giải thuật:
Xác định chiều dài, chiều rộng của mảng W () tương ứng là WD và WR.
(LUAN.van.THAC.si).nghien.cuu.mot.so.phuong.phap.nhan.dang.doi.tuong.ung.dung.trong.he.thong.camera.quan.sat.bao.ve.muc.tieu(LUAN.van.THAC.si).nghien.cuu.mot.so.phuong.phap.nhan.dang.doi.tuong.ung.dung.trong.he.thong.camera.quan.sat.bao.ve.muc.tieu(LUAN.van.THAC.si).nghien.cuu.mot.so.phuong.phap.nhan.dang.doi.tuong.ung.dung.trong.he.thong.camera.quan.sat.bao.ve.muc.tieu(LUAN.van.THAC.si).nghien.cuu.mot.so.phuong.phap.nhan.dang.doi.tuong.ung.dung.trong.he.thong.camera.quan.sat.bao.ve.muc.tieu
Khởi gán các giá trị ngẫu nhiên cho các phần tử của mảng For i: = 1 to WR do
For j: = 1 to WR do W (i, j): = RND;
* Xác định nơron trung tâm
- Chức năng: Đối với mỗi một đối tƣợng đƣợc thả vào mạng cần phải xác định nơron trung tâm sao cho vectơ trọng số của nơron đó giống với tín hiệu vào nhất.
- Vào: Mảng một chiều XS () lưu trữ vector vào của tập mẫu - Ra: Số nguyên xác định vị trí của nơron trung tâm
- Giải thuật: Tính hàm khuếch đại đối với mỗi nơron của mạng Giả thiết mạng Kohonen có ma trận trọng số W(i, j), các tín hiệu vào có m biến
XS = { XS (1), XS (2), ..., XS (m)}
Khi đó hàm khuếch đại của N nơron trên lớp Kohonen đƣợc xác định.
KD(j) =
n
i
j i W i XS
1
))2
, ( ) ( (
Tìm giá trị nhỏ nhất của hàm khuếch đại KD (j). Chỉ số của hàm khuếch đại KD (j) tìm đƣợc sẽ là vị trí của nơron trung tâm.
* Hiệu chỉnh các trọng số của các nơron trên lớp Kohonen.
- Chức năng: Đối với mỗi mẫu XS () đi vào mạng cần phải xét tới phản ứng của mỗi nơron trong toàn mạng. Trọng số của các nơron đƣợc hiệu chỉnh sao cho nếu cũng mẫu đó lần sau đi vào mạng thì sẽ cho hiệu ứng tốt hơn.
- Vào: Mảng một chiều XS () lưu trữ các thành phần của vectơ vào và mảng hai chiều W () lưu trữ trọng số của các nơron trên lớp Kohonen.
- Ra: Mảng hai chiều W ()
TIEU LUAN MOI download : skknchat@gmail.com
(LUAN.van.THAC.si).nghien.cuu.mot.so.phuong.phap.nhan.dang.doi.tuong.ung.dung.trong.he.thong.camera.quan.sat.bao.ve.muc.tieu(LUAN.van.THAC.si).nghien.cuu.mot.so.phuong.phap.nhan.dang.doi.tuong.ung.dung.trong.he.thong.camera.quan.sat.bao.ve.muc.tieu(LUAN.van.THAC.si).nghien.cuu.mot.so.phuong.phap.nhan.dang.doi.tuong.ung.dung.trong.he.thong.camera.quan.sat.bao.ve.muc.tieu(LUAN.van.THAC.si).nghien.cuu.mot.so.phuong.phap.nhan.dang.doi.tuong.ung.dung.trong.he.thong.camera.quan.sat.bao.ve.muc.tieu
Giải thuật:
Sau khi nơron trung tâm đƣợc chọn, tính láng giềng của toàn bộ các nơron trên lớp Kohonen đối với nơron trung tâm. Khoảng cách D giữa nơron trung tâm c có tọa độ (kc, lc) với nơron có tọa độ (kj, lj) đƣợc tính theo công thức:
D = max[ min (kj - kc,kj – kc +dai,kj – kc - rong), min (lj - lc,lj – lc + dai,lj – lc -rong) ]
( Trong đó dai và rong là chiều dài và chiều rộng của mạng nơron)
Tính hàm phụ thuộc topo a(dc – dj)
Trong đó DMax là lân cận xa nhất có thể có của mạng DMax = Max( dai \ 2, rong \ 2) + 1
WJi(new) = WJi(old) + (t) a(dC – dj ) ( xi- WJi(old)) Trong đó a(dC – dj ) là hàm phụ thuộc topo đã đƣợc tính ở trên
(t) = (amax – amin) min 1
max
max a
t
t
t
Trong đó: t – số đối tƣợng đã qua mạng
Tmax – tổng số đối tƣợng qua mạng amax, amin – hằng số học của mạng
a(dC – dj )
DMax DMax khiD
D DMax
DMax khiD
, ,
0
Quá trình lặp lại với các đối tƣợng tiếp theo
Mỗi lần tất cả các đối tƣợng mẫu đã đi qua mạng đƣợc gọi là một lƣợt.
Thông thường cần phải có từ vài trăm đến hàng ngàn lượt để mạng ổn định.
Khi chọn đƣợc các hằng số đặc trƣng của quá trình học amax, amin thích hợp thì quá trình học của mạng luôn hội tụ
* Hiệu chỉnh trọng số của các nơron trên lớp ra
- Chức năng: Tạo đƣợc một bảng tra để thuận lợi cho quá trình nghiên cứu về sau.
(LUAN.van.THAC.si).nghien.cuu.mot.so.phuong.phap.nhan.dang.doi.tuong.ung.dung.trong.he.thong.camera.quan.sat.bao.ve.muc.tieu(LUAN.van.THAC.si).nghien.cuu.mot.so.phuong.phap.nhan.dang.doi.tuong.ung.dung.trong.he.thong.camera.quan.sat.bao.ve.muc.tieu(LUAN.van.THAC.si).nghien.cuu.mot.so.phuong.phap.nhan.dang.doi.tuong.ung.dung.trong.he.thong.camera.quan.sat.bao.ve.muc.tieu(LUAN.van.THAC.si).nghien.cuu.mot.so.phuong.phap.nhan.dang.doi.tuong.ung.dung.trong.he.thong.camera.quan.sat.bao.ve.muc.tieu
- Vào: Mảng một chiều YS () lưu trữ lớp lời giải, mảng hai chiều W () lưu trữ các trọng số của các nơron trên lớp Kohonen
- Ra: Mảng hai chiều C () lưu trữ trọng số của các nơron trên lớp ra.
- Giải thuật:
+ Thả đối tƣợng lời giải YS () vào mạng
+ Xác định nơron tương ứng trên lớp Kohonen ứng với lời giải YS (). Thực chất của bước này là tìm nơron trung tâm trên lớp Kohonen.
+ Gán trọng số của nơron trên lớp ra tương ứng với nơron trung tâm được chọn ở bước trên bằng giá trị 1 hoặc 0 tương ứng với vectơ lời giải YS() đƣợc phân vào lớp đối tƣợng hoặc không phải đối tƣợng.
+Quá trình đƣợc lặp lại đối với tất cả các đối tƣợng lời giải đƣợc đi qua mạng.
+ Sau khi thực hiện thủ tục hiệu chỉnh trọng số của các nơron trên lớp ra, chúng ta thu được mảng hai chiều C () lưu trữ phân bố topo của mạng, lưu trữ các lời giải của mạng.
d. Tra cứu bằng mạng nơron
- Chức năng: Thực hiện quá trình nhận dạng, thực chất là tra cứu bảng tra trên bản đồ phân bố topo của các đối tƣợng.
- Vào: Mảng một chiều TH () lưu trữ giá trị lấy mẫu của hai giá trị 0,1 tương ứng với hai lớp đối tượng và không phải đối tượng và ảnh của đối tƣợng cần nhận dạng
- Ra: Giá trị 1 hoặc 0 tương ứng với hai lớp.
- Giải thuật:
Thả tín hiệu vào TH () đi qua mạng. Chọn phần tử trung tâm theo thuật toán đã đƣợc trình bày ở trên.
Sau khi xác định đƣợc vị trí của nơron trung tâm trên lớp Kohonen, đối sánh 1 – 1 về toạ độ sang lớp ra. Giá trị trọng số của nơron trên lớp ra sẽ cho một số nguyên 0 hoặc 1 tương ứng với lớp đối tượng cần phần loại.
TIEU LUAN MOI download : skknchat@gmail.com
(LUAN.van.THAC.si).nghien.cuu.mot.so.phuong.phap.nhan.dang.doi.tuong.ung.dung.trong.he.thong.camera.quan.sat.bao.ve.muc.tieu(LUAN.van.THAC.si).nghien.cuu.mot.so.phuong.phap.nhan.dang.doi.tuong.ung.dung.trong.he.thong.camera.quan.sat.bao.ve.muc.tieu(LUAN.van.THAC.si).nghien.cuu.mot.so.phuong.phap.nhan.dang.doi.tuong.ung.dung.trong.he.thong.camera.quan.sat.bao.ve.muc.tieu(LUAN.van.THAC.si).nghien.cuu.mot.so.phuong.phap.nhan.dang.doi.tuong.ung.dung.trong.he.thong.camera.quan.sat.bao.ve.muc.tieu
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN
Trong phạm vi nghiên cứu của Luận văn, chúng tôi đã tìm hiểu đƣợc tổng quan về hệ thống camera quan sát bao gồm cấu hình phần cứng và các chức năng phần mềm. Tìm hiểu nghiên cứu một số loại camera giám sát trên thị trường công nghệ thông tin ở Việt Nam, trên cơ sở tìm hiểu các phương thức kết nối với máy tính, chúng tôi đã đề xuất đƣợc một số loại camera có khả năng ứng dụng trong phạm vi nghiên cứu.
Chúng tôi cũng đã tìm hiểu nghiên cứu các phương pháp và các bước tiến hành phân tích ảnh video, từ đó xây dựng được chương trình phát hiện và bám sát sự di chuyển của đối tƣợng trong vùng camera quan sát đƣợc. Các sản phẩm đều đƣợc chúng tôi phát triển trên ngôn ngữ lập trình visual basic mà không sử dụng bất kỳ các hàm thƣ viện nào, trừ hai AxtiveX thu nhận tín hiệu video đƣợc cung cấp bởi hai camera IP và USB mà chúng tôi đã đƣợc đầu tƣ nghiên cứu.
Trong hơn một năm nghiên cứu Luận văn, các kết quả đạt mà Luận văn đã đạt đƣợc nhƣ sau:
Nghiên cứu một số loại camera hiện có trên thị trường giám sát bảo vệ mục tiêu, đánh giá chất lƣợng ảnh cũng nhƣ khả năng liên kết với máy tính. Xây dựng chương trình thu nhận ảnh trực tiếp từ camera, kết xuất ra từng ảnh riêng biệt theo từ frame của luồng video.
Thu thập thống kê và phân tích các mẫu về hình dáng di chuyển của con người. Xây dựng chương trình tổng hợp và phân tích các mẫu này để làm cơ sở cho quá trình huấn luyện của hệ thống. Tự động cập nhật các mẫu di chuyển mới
Xây dựng chương trình nhận dạng phát hiện đối tượng xuất hiện tại khu vực cần bảo vệ, trong vùng camera quan sát đƣợc.
Xây dựng chương trình bám sát di chuyển của đối tượng trong vùng camera quan sát đƣợc. Đặt ngƣỡng báo động nếu nhƣ đối tƣợng xuất hiện tại khu vục cần bảo vệ quá một thời gian qui định
(LUAN.van.THAC.si).nghien.cuu.mot.so.phuong.phap.nhan.dang.doi.tuong.ung.dung.trong.he.thong.camera.quan.sat.bao.ve.muc.tieu(LUAN.van.THAC.si).nghien.cuu.mot.so.phuong.phap.nhan.dang.doi.tuong.ung.dung.trong.he.thong.camera.quan.sat.bao.ve.muc.tieu(LUAN.van.THAC.si).nghien.cuu.mot.so.phuong.phap.nhan.dang.doi.tuong.ung.dung.trong.he.thong.camera.quan.sat.bao.ve.muc.tieu(LUAN.van.THAC.si).nghien.cuu.mot.so.phuong.phap.nhan.dang.doi.tuong.ung.dung.trong.he.thong.camera.quan.sat.bao.ve.muc.tieu
Xây dựng chương trình dò tìm khuôn mặt đối với mỗi đối tượng phát hiện đƣợc. Nếu xuất hiện khuôn mặt trong luồng video quan sát đƣợc thì định vị và sao lưu khuôn mặt của đối tượng.
Hoàn thiện chương trình nhận dạng đối tượng với nhiều đối tượng cùng xuất hiện trong frame ảnh thu nhận đƣợc từ camera. Phát hiện, định vị và sao lưu các khuôn mặt của đối tượng nếu có thể.
Với các kết quả đã đạt đƣợc, chúng tôi tự nhận thấy đã hoàn thành đúng nội dung và mục tiêu đề ra trong bản thuyết minh nghiên cứu.
Dựa trên những nghiên cứu này, với một số kết quả đã đạt đƣợc chúng tôi xin đề xuất một số phát triển tiếp theo đề Luận văn có thể ứng dụng trong thực tế:
- Xét về bảy bài toán đã đề cập trong chương 1, chúng tôi đã thực hiện đƣợc ba bài toán bao gồm: Phát hiện sự xuất hiện hoặc biến mất của các đồ vật, phát hiện và bám sát sự di chuyển của con người trong phạm vi camera quan sát đƣợc. Do điều kiện chƣa có số liệu thực tế, nên chúng tôi cũng đã bước đầu thử nghiệm với việc phát hiện và bám sát sự di chuyển của các phương tiện giao thông với các đoạn video sẵn có. Vì vậy chúng tôi xin đề nghị đƣợc tiếp tục nghiên cứu để hoàn thiện các bài toán còn lại của hệ thống camera giám sát. ở phạm vi cao hơn là làm luận văn tiến sĩ.
- Dựa trên các kỹ thuật phân tích hình ảnh video, một hướng nghiên cứu có thể đƣợc phát triển và có nhiều ứng dụng là xây dựng các chỉ mục tìm kiếm video nhằm cung cấp cho người sử dụng công cụ để tra cứu thông tin bằng hình ảnh video.
TIEU LUAN MOI download : skknchat@gmail.com