Xử lý ảnh là một ngành khoa học mới mẻ so với nhiều ngành khoa học khác nhưng tốc độ phát triển của nó rất nhanh, kích thích các trung tâm nghiên cứu, ứng dụng, đặc biệt là máy tính chuy
TỔNG QUAN
Tổng quan
Trước sự phát triển như vũ bão của khoa học kỹ thuật, ngành điều khiển học và tự động hóa đã có những bước tiến lớn Điều khiển học và tự động hóa ngày càng đóng vai trò quan trọng trong việc tăng năng xuất lao động, giảm giá thành, tăng sự ổn định chất lượng của sản phẩm Thêm vào đó, môi trường làm việc được cải thiện đặt biệt trong một số ngành nghề có tính chất độc hại nguy hiểm cho tính mạng con người: dò bom mìn, thao tác trong các nhà máy điện hạt nhân hoặc các khu vực có độ phóng xạ cao, thám hiểm mặt trăng sao hỏa, thám hiểm đáy biển sâu Trong xã hội công nghiệp ngày nay, việc ứng dụng các robot tự hành, các cánh tay máy, có khả năng hoạt động độc lập ngày càng phổ biến Để có khả năng thông minh đó, chúng phải có khả năng nhìn, nhận dạng các tình huống, xử lý tình huống như con người Đáp ứng nhu cầu đó, xử lý ảnh đã tham gia vào điều khiển học và tự động hóa Dữ liệu về hình ảnh có lượng thông tin lớn và chính xác hơn các loại dữ liệu từ các cảm biến khác.Điều này giúp cho việc giải quyết các vấn đề trong lĩnh vực điều khiển tự động dễ dàng hơn Một trong những bài toán về xử lý ảnh phổ biến hiện nay là “phát hiện khuôn mặt người” Và đã được ứng dụng rộng rãi vào cuộc sống hiện nay như:
• Hệ thống tương tác giữa người và máy: Giúp những người bị tật hoặc khuyết điểm có thể trao đổi Những người dùng ngôn ngữ tay có thể giao tiếp với người bình thường Những người bị bại liệt thông qua một số ký hiệu nháy mắt có thể biểu lộ những gì họ muốn Đó là các bài toán điệu bộ của bàn tay (hand gesture), điệu bộ của khuôn mặt
• Nhận dạng người A có phải là tội phạm truy nã hay không, giúp cơ quan an ninh quản lý tốt con người Công việc nhận dạng có thể có thể ở trong môi trường bình thường cũng như trong bóng tối
• Thẻ căn cước, chứng minh nhân dân (Face identification)
• An ninh sân bay, xuất nhập cảnh ( hiện nay cơ quan an ninh xuất nhập cảnh
Mỹ đã áp dụng) Dùng để xác thực người xuất nhập cảnh và kiểm tra có phải là nhân vật khủng bố hay không
• Điều khiển vào ra: Văn phòng, công ty, trụ sở, máy tính…, kết hợp thêm vân tay và móng mắt Cho phép nhân viên được vào ra nơi cần thiết, hay mỗi người sẽ đăng nhập máy tính cá nhân của mình mà không cần nhớ tên đăng nhập cũng như mật khẩu mà chỉ cần xác định thông qua khuôn mặt
• Tìm kiếm dữ liệu liên quan đến con người thông qua khuôn mặt người trên nhìu hệ cơ sở dữ liệu lưu trữ thật lớn như internet, các hãng truyền hình Để phát hiện, nhận diện và cảnh báo, đảm bảo tính chính xác thì hệ thống cần phải có tốc độ xử lý nhanh, hoạt động như một hệ thống thời gian thực.Một sản phẩm tốt thì không bao giờ có những sai xót, nếu hệ thống phát hiện có chuyển động và nhận dạng mà hệ thống cảnh báo vẫn không hoạt động thì đó là việc không thể chấp nhận được.Vì vậy tốc độ nhanh và tính chính xác là 2 yếu tố quan trọng nhất trong việc xây dựng và thưc hiện hệ thống.
Các kết quả nghiên cứu trong và ngoài nước đã công bố
1.2.1 Các kết quả nghiên cứu trong nước : a “Nhận dạng mặt người trên Matlab” của Võ Hồng Hoan
Trong đề tài tác giả đã sữ dụng thuật toán PCA để nhận dạng khuôn mặt, từ đó xây dựng chương trình tìm kiếm một bức ảnh có khuôn mặt một người trong tập ảnh cơ sở giống với khuôn mặt của người trong bức ảnh cần kiểm tra bằng ngôn ngữ Matlab b “Nhận dạng mặt người dùng SVM và mạng nơron” của Nguyễn Thành
Thái Ở đề tài này, tác giả tập trung nghiên cứu hai phân lớp ảnh SVM và mạng nơron để áp dụng cho bài toán nhận dạng mặt người Từ đó, đưa ra một ứng dụng thực tế là xác định một đối tượng có phải là học sinh của trường THPT Nguyễn Hữu Cầu hay không, để minh họa cho tính khả thi của hai phương pháp nêu trên c “Thuật toán phát hiện chuyển động” của Đào Ngọc Anh Đề tài đã tìm hiểu các phương pháp mô hình hỗn hợp nền thích nghi, mô hình không tham số thích nghi, mô hình sử dụng từ điển (code- book) thích nghi thời gian thực.Giả lập chuyển động để tạo ra ảnh lối vào khi nghiên cứu các đặc tính cần đánh giá.Làm chủ được thuật toán phát hiện chuyển động trên cơ sở sử dụng các phương pháp khác nhau để mô hình hóa nền d “Nhận dạng khuôn mặt” của Mai Hữu Lợi
Tác giả thực hiện mô phỏng hệ thống nhận dạng khuôn mặt sử dụng thuật toán PCA (Principal Component Analysis) để rút trích đặc trưng áp dụng cho quá trình nhận dạng khuôn mặt, từ đó xây dựng 2 chương trình: chương trình nhận dạng gương mặt từ bộ dữ liệu ảnh tĩnh lấy từ ORL và chương trình nhận dạng trực tiếp từ wedcam
1.2.2 Các kết quả nghiên cứu ngoài nước Ở các nước khác trên thế giới, các nghiên cứu đã tiếp cận đề tài theo nhiều hướng khác nhau, trong đó có những công trình nghiên cứu sau: d Công trình nghiên cứu của Viola và Jones [5]:
Nghiên cứu này mô tả phương pháp nhận dạng vật thể, xử lý ảnh tốc độ rất nhanh và có độ chính xác rất cao Viola và Jones đã đề xuất 3 điểm nổi bật:
+ Thứ nhất là khái niệm “Itergral image” cho phép tính toán các đặc điểm nhận dạng rất nhanh
+ Thứ hai là thuật toán AdaBoost cho phép lựa chọn những đặc điểm quan trọng và phân tầng phân loại hoạt động hiệu quả
+ Thứ ba là phương pháp kết hợp những bộ phân loại thành những tầng cho phép những vùng phông nền không chứa vật thể bị loại nhanh ngay từ những tầng đầu và dành nhiều thời gian hơn cho việc tính toán những vùng có vật thể
Cách tiếp cận mới này đã cho phép giảm thời gian tính toán trong khi vẫn đàm bảo được tỉ lệ nhận dạng cao khoảng gần 94%, tốc độ tăng khoàng
15 lần so với những nghiên cứu trước Do những đặc điểm nổi trội trên nên mô hình có thể được áp dụng cho những ứng dụng thời gian thực e “Contours finding and Background removal” của Ivano Zanchetta
Nghiên cứu đã đề cập đến kỹ thuật trừ nền và phát hiện đường biên để đánh dấu vật chuyển động trong nền cho trước Nghiên cứu đã thấy ưu thế về tốc độ xử lý của kỹ thuật trừ nền để phát hiện chuyển động và có khả năng ứng dụng thời gian thực rất tốt f ‘ Face detection and recognition using hidden Markov models’ của
Các tác giả sử dụng mô hình Makov ẩn (HMM) trong việc nhận dạng và phát hiện gương mặt Các vector quan sát được sử dụng để mô tả các trạng thái của HMM thu được bằng cách sử dụng hệ số của biến đổi Karhunen-Loeve (KLT) Phương pháp nhận dạng khuôn mặt được trình bày trong đề tài làm giảm đáng kể độ phức tạp trong tính toán của hệ thống nhận dạng khuôn mặt, đồng thời tăng tốc độ nhận dạng khuôn mặt.Bài viết giới thiệu một cách tiếp cận mới trong việc phát hiện khuôn mặt dựa trên HMM.
Nhiệm vụ của đề tài
1.3.1 Yêu cầu của đề tài
Mục tiêu của đề tài là thiết kế một mô hình giám sát và điểm danh sinh viên một cách tự động bằng công nghệ nhận dạng mặt người Yêu cầu của hệ thống là phải hoạt động ổn định, phát hiện nhận dạng nhanh, hoạt động trong nhiều môi trường khác nhau như : đủ sáng, thiếu sáng, chói sáng,….Khối xử lý trung tâm phải phát hiện được gương mặt một hoặc nhiều người ở các góc độ khác nhau như : nhìn chính diện, nhìn nghiên, nhìn từ bên trái, nhìn từ bên phải, đồng thời phải phát hiện được gương mặt có đeo kính, đeo khẩu trang, hay tóc phủ nhiều
1.3.2 Nội dung cần thực hiện Đề tài nghiên cứu và phát triển mô hình phát hiện và nhận dạng khuôn mặt người dựa trên thư viện thị giác máy tính mã nguồn mở OpenCVdo Intel phát triển Hệ thống được xây dựng dựa trên camera AI để nhận dạng mặt người và gửi danh sách điểm danh về địa chỉ email của người dùng, Đề tài tập trung nghiên cứu các vấn đề cơ bản sau :
1 Tìm hiểu thư viện thị giác máy tính mã nguồn mở OpenCV
2 Tìm hiểu kỹ thuật rút trích đặc trưng Harr-like theo mô hình phân tầng cascade
3 Tìm hiểu thuật toán Adaboots trong việc huấn luyện đặc trưng gương mặt
4 Ứng dụng camera AI để xây dựng hệ thống nhận dạng mặt người
CƠ SỞ LÝ THUYẾT XỬ LÝ ẢNH
CƠ SỞ LÝ THUYẾT XỬ LÝ ẢNH
2.1 Phương pháp xử lý ảnh
Xử lý ảnh là một lĩnh vực mang tính khoa học và công nghệ [1] Nó là một ngành khoa học mới mẻ so với nhiều ngành khoa học khác nhưng tốc độ phát triển của nó rất nhanh, kích thích các trung tâm nghiên cứu, ứng dụng, đặc biệt là máy tính chuyên dụng riêng cho nó Xử lý ảnh là một quá trình liên tục Đầu tiên là thu nhận ảnh từ camera, vệ tinh hay các bộ cảm ứng,…Tiếp theo tín hiệu lấy vào sẽ được số hóa thành tín hiệu số và chuyển qua giai đoạn xử lý, phân tích hay lưu trữ lại Việc xử lý ảnh chính là tăng cường ảnh, tức là làm cho ảnh trở nên đẹp hơn, tốt hơn và rõ hơn Ảnh có thể được hiểu là thông tin (về đường nét, hình khối, màu sắc…) của vật thể hay quang cảnh được chiếu sáng mà con người cảm nhận và quan sát được bằng mắt và hệ thống thần kinh thị giác Đối tượng chính của xử lý ảnh chính là ảnh chụp tự nhiên Quá trình xử lý ảnh được hiểu là xử lý nội dung thông qua dữ liệu ảnh, qua đó nâng cao chất lượng ảnhhiển thị hay đạt được một yêu cầu cảm quan nào đó Ảnh thông thường được hiểu là dữ liệu trên một mặt phẳng ảnh, ta còn gọi là ảnh đơn (Image), hay ảnh tĩnh Ngoài ảnh đơn, ta còn gặp dạng chuỗi các ảnh được chụp liên tiếp nhau thông qua mối quan hệ về thời gian, ảnh đó gọi là chuỗi ảnh,(hay ảnh động, phim) Đối với ảnh đơn màu, hay ảnh đa mức xám, dữ liệu ảnh được biểu diễn dưới dạng một hàm độ chói I(x,y) Với các giá trị I(x,y), x, y là các số thực, và ta có 0 ≤ I(x,y) ≤ I MAX Với ảnh màu, dữ liệu ảnh được biểu diễn thông qua 3 hàm độ chói của 3 màu cơ bản R (đỏ), G (xanh lá), B (xanh lam): IR(x,y), IG(x,y) , IB(x,y) Ảnh số là một dạng biểu diễn, lưu trữ và thể hiện ảnh tĩnh Ảnh số thực chất là ảnh chụp (mặt phẳng ảnh gồm vô số điểm với vô số các giá trị màu khác nhau) thông qua quá trình lấy mẫu (rời rạc hóa về không gian) và lượng tử hóa (rời rạc hóa về mặt giá trị dữ liệu) Ảnh số được biểu diễn dưới dạng một ma trận điểm ảnh I[m,n] (m € [0 M], n € [0 N]) , mỗi phần tử của ma trận đó gọi là một điểm ảnh – pixel Trong đó giá trị của mỗi điểm ảnh lại phụ thuộc vào từng loại ảnh: Ảnh nhị phân: một điểm ảnh chỉ nhận 2 mức giá trị nên cần 1 bit lưu trữ Ảnh đa mức xám: giá trị điểm ảnh được chia thành 256 mức [0 255] nên ta cần 8 bits/pixel Với ảnh màu: tùy thuộc vào số lượng màu, chất lượng màu mà ta cần 8, 16, 24 bits/pixel Với hệ màu cơ bản RGB ta cần 3*8 = 24 bits/pixel Đến đây việc xử lý ảnh trở thành việc xử lý các phần tử của ma trận điểm ảnh
Một bức ảnh số được biểu diễn bởi một ma trận điểm ảnh I[m,n], trong đó một điểm ảnh được đặc trưng bởi tọa độ [m,n] và giá trị màu I Như vậy, các phép xử lý ảnh có thể tác động vào tọa độ của các điểm ảnh, làm thay đổi vị trí của các điểm ảnh, hình khối trong ảnh, ta gọi đó là các phép xử lý về hình học Bên cạnh tác độngvào tọa độ của các điểm ảnh, các phép xử lý ảnh cũng có tác động đến giá trị màu I của các điểm ảnh, ta gọi đó là các phép xử lý về nội dung Nhìn chung các phép xử lý hình học không làm thay đổi nội dung của ảnh và được ứng dụng phổ biến trong quá trình hiển thị hình ảnh Các phép xử lý về nội dung tác động làm thay đổi các thành phần về mặt giá trị màu của điểm ảnh, từ đó mang lại những hiệu quả về cảm nhận khác nhau
Tuy nhiên, nhiều khi không phải ảnh nào cũng rõ nét cũng đẹp, chẳng hạn những vật thể mà bản thân nó đã xấu thì ảnh chụp của nó không thể đẹp được.Thậm chí ảnh chụp càng rõ nét thì càng xấu, vì cái xấu đã được soi rất rõ, rất kỹ Do đó, đối với những ảnh như vậy, ta không mong muốn nó rõ thêm nữa, mà muốn nó mờ đi để che bớt khuyết điểm của vật trong ảnh Lúc này, ta chỉ giữ lại những sóng với tần số thấp trong miền tần số (Lowpass filter), bỏ đi các sóng có tần số cao thể hiện độ sắc nét của ảnh Bởi vì, các sóng này giờ đây chỉ đóng vai trò nhiễu mà thôi
Gốc của ảnh (ảnh tự nhiên) [2] là ảnh liên tục về không gian và độ sáng Để xử lý bằng máy tính (số), ảnh cần phải được số hoá Số hoá ảnh là sự biến đổi gần đúng một ảnh liên tục thành một tập điểm phù hợp với ảnh thật về vị trí (không gian) và độ sáng (mức xám) Khoảng cách giữa các điểm ảnh đó được thiết lập sao cho mắt người không phân biệt được ranh giới giữa chúng Mỗi một điểm như vậy gọi là điểm ảnh (PEL: Picture Element) hay gọi tắt là Pixel Trong khuôn khổ ảnh hai chiều, mỗi pixel ứng với cặp tọa độ (x, y) Điểm ảnh (Pixel) là một phần tử của ảnh số tại toạ độ (x, y) với độ xám hoặc màu nhất định.Kích thước và khoảng cách giữa các điểm ảnh đó được chọn thích hợp sao cho mắt người cảm nhận sự liên tục về không gian và mức xám (hoặc màu) của ảnh số gần như ảnh thật.Mỗi phần tử trong ma trận được gọi là một phần tử ảnh
2.1.3 Độ phân giải của ảnh Độ phân giải (Resolution) của ảnh là mật độ điểm ảnh được ấn định trên một ảnh số được hiển thị
Theo định nghĩa, khoảng cách giữa các điểm ảnh phải được chọn sao cho mắt người vẫn thấy được sự liên tục của ảnh Việc lựa chọn khoảng cách thích hợp tạo nên một mật độ phân bổ, đó chính là độ phân giải và được phân bố theo trục x và y trong không gian hai chiều
Nhận dạng tự động (automatic recognition), mô tả đối tượng, phân loại và phân nhóm các mẫu là những vấn đề quan trọng trong thị giác máy, được ứng dụng trong nhiều ngành khoa học khác nhau Tuy nhiên, một câu hỏi đặt ra là: mẫu (pattern) là gì? Watanabe [5], một trong những người đi đầu trong lĩnh vực này đã định nghĩa:
“Ngược lại với hỗn loạn (chaos), mẫu là một thực thể (entity), được xác định một cách ang áng (vaguely defined) và có thể gán cho nó một tên gọi nào đó” Ví dụ mẫu có thể là ảnh của vân tay, ảnh của một vật nào đó được chụp, một chữ viết, khuôn mặt người hoặc một ký đồ tín hiệu tiếng nói Khi biết một mẫu nào đó, để nhận dạng hoặc phân loại mẫu đó có thể:
Hoặc phân loại có mẫu [3] (supervised classification), chẳng hạn phân tích phân biệt (discriminant analyis), trong đó mẫu đầu vào được định danh như một thành phần của một lớp đã xác định
Hoặc phân loại không có mẫu (unsupervised classification hay clustering) trong đó các mẫu được gán vào các lớp khác nhau dựa trên một tiêu chuẩn đồng dạng nào đó Các lớp này cho đến thời điểm phân loại vẫn chưa biết hay chưa được định danh
Hệ thống nhận dạng tự động bao gồm ba khâu tương ứng với các giai đoạn chủ yếu sau đây:
• Thu nhận dữ liệu và tiền xử lý
• Nhận dạng, ra quyết định
Bốn cách tiếp cận khác nhau trong lý thuyết nhận dạng là:
• Đối sánh mẫu dựa trên các đặc trưng được trích chọn
• Phân loại dựa trên mạng nơ-ron nhân tạo
Trong các ứng dụng rõ ràng là không thể chỉ dùng có một cách tiếp cận đơn lẻ để phân loại “tối ưu” do vậy cần sử dụng cùng một lúc nhiều phương pháp và cách tiếp cận khác nhau Do vậy, các phương thức phân loại tổ hợp hay được sử dụng khi nhận dạng và nay đã có những kết quả có triển vọng dựa trên thiết kế các hệ thống lai (hybrid system) bao gồm nhiều mô hình kết hợp
Việc giải quyết bài toán nhận dạng trong những ứng dụng mới, nảy sinh trong cuộc sống không chỉ tạo ra những thách thức về thuật giải, mà còn đặt ra những yêu cầu về tốc độ tính toán Đặc điểm chung của tất cả những ứng dụng đó là những đặc điểm đặc trưng cần thiết thường là nhiều, không thể do chuyên gia đề xuất, mà phải được trích chọn dựa trên các thủ tục phân tích dữ liệu
Nhằm giảm thiểu không gian lưu trữ Thường được tiến hành theo cả hai cách khuynh hướng là nén có bảo toàn và không bảo toàn thông tin.Nén không bảo toàn thì thường có khả năng nén cao hơn nhưng khả năng phục hồi thì kém hơn Trên cơ sở hai khuynh hướng, có 4 cách tiếp cận cơ bản trong nén ảnh:
• Nén ảnh thống kê: Kỹ thuật nén này dựa vào việc thống kê tần xuất xuất hiện của giá trị các điểm ảnh, trên cơ sở đó mà có chiến lược mã hóa thích hợp Một ví dụ điển hình cho kỹ thuật mã hóa này là *.TIF
• Nén ảnh không gian: Kỹ thuật này dựa vào vị trí không gian của các điểm ảnh để tiến hành mã hóa Kỹ thuật lợi dụng sự giống nhau của các điểm ảnh trong các vùng gần nhau Ví dụ cho kỹ thuật này là mã nén *.PCX
• Nén ảnh sử dụng phép biến đổi: Đây là kỹ thuật tiếp cận theo hướng nén không bảo toàn và do vậy, kỹ thuật thướng nến hiệu quả hơn *.JPG chính là tiếp cận theo kỹ thuật nén này
THIẾT KẾ VÀ THỰC HIỆN MÔ HÌNH HỆ THỐNG
THIẾT KẾ VÀ THỰC HIỆN
Hệ thống hoạt động hoàn toàn tự động và có thể hoạt động trong nhiều điều kiện môi trường, thời tiết khác nhau Hệ thống phát hiện được khuôn mặt bị che phủ một phần như: mặt nghiêng, đeo mắt kiếng, đeo khẩu trang, đeo mắt kiếng và khẩu trang Hệ thống phát hiện mặt người cho phép nhận tín hiệu video đầu vào từ webcam, camera analog, IP camera, file ảnh, file video Trong đề tài này tôi sẽ xây dựng một hệ thống nhận dạng mặt người gồm một số yêu cầu đặt ra như sau :
- Hệ thống thu nhận hình ảnh từ camera AI trong môi trường đủ sáng, thiếu sáng, hay gương mặt bị che phủ một phần
- Dò tìm phát hiện khuôn mặt từ dữ liệu hình ảnh camera đưa về
- Khoanh vùng tất cả gương mặt được phát hiện
- So sánh gương mặt phát hiện với cơ sở dữ liệu gương mặt đã được học
- Nhận dạng người xuất hiện trong khung ảnh là sinh viên của lớp học hay người lạ
- Lưu lại hình ảnh người lạ xuất hiện
- Lập danh sách sinh viên có mặt tại lớp và gửi về địa chỉ email người dùng
3.2 Sơ đồ khối của hệ thống
Yêu cầu của đề tài là xây dựng một hệ thống chạy trên thời gian thực, hoạt động 24/24, do đó đòi hỏi chương trình xử lý phải linh hoạt Tốc độ xử lý hình ảnh phải nhanh, chính xác, phát hiện được khuôn mặt trong nhiều điều kiện môi trường khác nhau Có thể phát hiện nhiều khuôn mặt ở mọi góc độ khác nhau và trong cùng một thời điểm
Hình 3 1 Sơ đồ khối của hệ thống 3.3 Thiết bị phần cứng
Camera AI nhận diện khuôn mặt là thiết bị camera có khả năng nhận dạng, phát hiện khuôn mặt Sau đó tự so sánh, đối chiếu với các khuôn mặt đã có sẵn trong cơ sở dữ liệu Quá trình nhận diện khuôn mặt diễn ra hoàn toàn tự động mà không có sự can thiệp của con người
Nguyên lý hoạt động của hệ thống camera nhận diện khuôn mặt như sau:
- Khi camera xác định đối tượng cần nhận diện, hệ thống sẽ tự động xác định vị trí khuôn mặt để lấy dữ liệu
- Sau đó sẽ tách khuôn mặt ra khỏi khung hình, để lấy dữ liệu phân tích và nhận diện khuôn mặt
- Thông qua các đặc điểm thu thập được ở khuôn mặt và sử dụng tính năng đánh giá đặc điểm ở mức cao Để so sánh với dữ liệu có sẵn trong cơ sở dữ liệu, quá trình nhận diện diễn ra rất nhanh chưa đến 2 giây
- Hệ thống sẽ quyết định đưa ra kết quả có trùng khớp hay không rồi gửi kết quả cho người dùng Ưu điểm nổi bật của hệ thống camera nhận diện khuôn mặt:
- Khả năng nhận diện khuôn mặt nhanh chóng, chính xác 99%: Hệ thống được tích hợp sử dụng thuật toán GLVQ để so sánh đa diện Kết hợp với phương pháp phân tích dữ liệu trên nét mặt, đặc biệt là vùng mắt Sau đó sử dụng công nghệ mạng Neuron giải thuật được đặc điểm khuôn mặt chính xác trong thời gian nhận diện ngắn
- So sánh mặt chính xác: Khi trích xuất được các dữ liệu đặc điểm cần thiết, hệ thống sẽ khoanh vùng những khuôn mặt có đặc điểm tương đồng Tiến hành định dạng và xác thực lại dựa trên những đặc điểm trên khuôn mặt Hơn nữa, camera AI được tích hợp linh hoạt trên nhiều hệ thống camera giám sát trên thị trường và định dạng video, đồ họa mang lại hiệu quả cao
- Hệ thống camera nhận diện khuôn mặt cảnh bảo xâm nhập trái phép nhanh, chuẩn xác: Nếu một đối tượng vượt qua ranh giới an toàn mà hệ thống đã cài đặt trước đó Thiết bị sẽ gửi cảnh báo và kích hoạt chế độ báo động về điện thoại, phần mềm để cho phép nhận diện khuôn mặt Bất kỳ hành động vô ý và cố ý nào trong khu vực đã quy định trên trong khoảng thời gian nhất định Đều sẽ bị phát hiện và báo động cho người dùng ngay lập tức
- Mọi hành động thay đổi góc quay đều được cảnh báo: Hệ thống tự động phát hiện góc quay bị thay đổi, sẽ thông báo cho người dùng và kích hoạt chuông cảnh báo trộm
- Cảnh báo kịp thời khi có vật thể bị lấy đi, bỏ lại: Tính năng này được dùng phổ biến trong showroom, bảo tàng, các sự kiện triển lãm, Khi hoạt động giám sát một đối tượng, khu vực nào đó mà phát hiện thấy bất thường như: Đối tượng biến mất khỏi phạm vi giám sát hoặc có thêm vật thể lạ nào, hệ thống sẽ tự động chụp hình và báo động
- Nhận diện hồ sơ qua biển số: Khi quan sát, quay được biển số, hệ thống camera sẽ trích xuất thông tin cá nhân của chủ sở hữu biển số xe đó ra màn hình Giúp người quản lý dễ dàng nhận diện được khuôn mặt chủ sở hữu biển số xe phòng các đối tượng trộm cắp Ứng dụng của hệ thống camera nhận diện khuôn mặt hiện nay:
- Nhờ những tính năng nổi bật và nguyên lý hoạt động của hệ thống camera nhận diện khuôn mặt được sử dụng trong những khu vực kiểm soát xuất nhập cảnh như: Cửa khẩu, đồn biên phòng, sân bay, ứng dụng kiểm soát đối tượng khách cho khu vực lễ tân khách sạn, bệnh viện,
- Ứng dụng tại khu vực văn phòng, kiểm soát ra vào tòa nhà để nhận diện khách và dân cư của tòa nhà
- Ứng dụng tại những điểm phòng giao dịch, ATM, cơ quan công sở và chính phủ, Đề tài sử dụng Camera AI làm bộ xử lý trung tâm, giúp nhận dạng sinh viên và điểm danh sinh viên đã vào lớp hay chưa Danh sách sinh viên đi học được gửi đến email của người dùng
KÍCH THƯỚC : Cao 11,6cm | Rộng 8,1cm | Sâu 7,0cm
BỘ NHỚ TRONG : EMMC 8GB, 32GB, 64GB
NGÔN NGỮ : Tiếng Việt | English
VỊ TRÍ SỬ DỤNG : Trong nhà ÂM THANH : Speaker, microphone
SENSOR HÌNH ẢNH : 1/2,8-inch,5 megapixel color sensor
RESOLUTION : 2K nhận dạng, lưu video chuẩn HD
CHẾ ĐỘ BAN ĐÊM : high-power infrared LEDs(940nm) - IR cut filter ĐÈN : Logo LED light
- Cài đặt App hannet connect:
- Đăng ký tài khoản sử dụng:
- Giao diện sử dụng và một số khái niệm
3 Quản lý chia sẻ tài khoản
- Khởi tạo thông tin địa điểm:
- Kết nối camera với Internet:
- Phân quyền chia sẻ thông tin địa điểm camera:
3.3.2 Camera tương tự: Độ phân giải 2.0 Megapixel
Cảm biến ảnh CMOS kích thước 1/2.7″, 30fps@1080P
Camera theo ống kính Loại 3.6mm
– Chế độ ngày đêm(ICR), tự động cân bằng trắng (AWB), tự động bù sáng (AGC), chống ngược sáng(BLC), chống nhiễu (2D-DNR) – Tích hợp Mic ghi âm
Model DH-IPC-HDW1230SP-S4
Cảm biến CMOS 1/2.7" Độ phân giải 2.0 Megapixels, Max 25/30fps@1080P
Chuẩn nén H.265 và H.264 Ống kính 3.6mm
Chuẩn chống nước,bụi IP 67
Nguồn điện áp DC12V hoặc PoE (802.3af), công suất 5,5W
Chuẩn nén H.265+/H.264 Độ phân giải ghi hình 5M-N, 4M-N/1080P
Cổng kết nối HDMI, VGA, RJ-45, USB
Số lượng ổ cứng Hỗ trợ 1 ổ cứng
– Cổng ra tín hiệu video đồng thời HDMI/VGA
– Hỗ trợ kết nối nhiều nhãn hiệu camera IP(4+2) hỗ trợ lên đến camera 6MP với chuẩn tương tích Onvif 16.12 – Hỗ trợ 1 ổ cứng tối đa 6TB, 2 cổng usb 2.0, 1 cổng mạng RJ45((100), 1 cổng RS485
– Hỗ trợ điều kiển quay quét 3D thông minh với giao thức Dahua
– Hỗ trợ xem lại và trực tiếp qua mạng máy tính thiết bị di động
– Hỗ trợ cấu hình thông minh qua P2P, 1 cổng audio vào ra
– Hỗ trợ đàm thoại hai chiều, quản lý đồng thời 128 tài khoản kết nối
– Hỗ trợ truyền tải âm thanh, báo động qua cáp đồng trục
– Thiết kế nút reset cứng trên mainboard
Chuẩn nén H.265 Độ phân giải ghi hình Ghi hình 8Mp
Băng thông đầu vào Max 80Mpb
Cổng kết nối HDMI, VGA, RJ-45,
Số lượng ổ cứng Hỗ trợ 1 ổ cứng
KẾT QUẢ THỰC HIỆN
Khung mô hình được làm bằng nhôm định hình 3x3 và 4x6 chắc chắn Hai tấm lưới 800x600mm, lỗ vuông 8mm, cách lỗ 4mm giúp sinh viên gắn thiết bị khi thực hành một cách dễ dàng bằng các sử dụng tắc kê bướm
Hình 4 1 Mô hình hoàn chỉnh
Cấu trúc mô hình gồm:
• Một hệ thống camera quan sát tương tự gồm một đầu thu và 2 camera
Trong đó có một camera bán cầu trong nhà và một camera thân cầu ngoài trời Giúp sinh viên làm quen với 2 loại camera trong nhà và ngoài trời Từ đó sinh viên có thể thi công, cấu hình, lắp đặt, bảo trì và sữa chữa hệ thống camera tương tự
• Một hệ thống camera IP gồm một đầu thu IP và 2 camera IP được cấp nguồi qua PoE Giúp sinh viên làm quen với mô hình camera IP được cấp nguồn qua dây mạng, sinh viên có thể thi công một hệ thống camera IP hoàn chỉnh
• Một hệ thống điểm danh sinh viên tự động gồm camera AI, hình ảnh nhận dạng được lưu trữ trên clound của hệ thống, bảng điểm danh được gửi về email của người sử dụng Giúp sinh viên sử dụng, cấu hình được camera AI trong các ứng dụng điểm danh, chấm công, nhận diện…
Chương trình được ứng dụng chạy thử nghiệm trong nhiều điều kiện ánh sáng khác nhau, từ môi trường có ánh sáng yếu cho đến môi trường đủ sáng ở các khoảng cách khác nhau, khi phát hiện khuôn mặt người sẽ đóng khung hình vuông trên khuôn mặt được phát hiện, và đạt được các kết quả nhận điện 0,1s/khuôn mặt
Bảng điểm danh được gửi về email sau mỗi buổi học
Hình 4.2 Bảng điểm danh được gửi về email
Email doanchanhtin@tdc.edu.vn Địa điểm TDC
ID Tên Chức vụ Phòng ban MSNV
2311525338624032768 Từ Trung Hải Sinh viên - - - - 14:15 14:15
2311524522429251584 Phan Văn Khánh Bâng Sinh viên - - - - 14:15 14:15
2311523339266424832 Phạm Ánh Ngọc Sinh viên - - - - 14:15 14:15
2311522655309660160 Nguyễn Trung Hiệp Sinh viên - - - - 14:13 14:15
2311520727263608832 Nguyễn Trọng Quang Sinh viên - - - - 14:15 14:15
2311521987568074752 Nguyễn Minh Luận Sinh viên - - - - 14:14 14:14
2311525027129851904 Nguyễn Huỳnh Thanh Tú Sinh viên - - - - 14:14 14:15
2311521472524320768 Lê Hoàng Khang Sinh viên - - - - 14:15 14:15
2305068234014982144 Đoàn Chánh Tín Giảng viên Lớp iot 16:19 17:16 10:55 10:58 13:47 14:02
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN
- Trên cơ sở nghiên cứu về bài toán phát hiện mặt người trong thời gian thực Đặc biệt là thuật toán Adaboost, các đặc trưng haar-like và mô hình Cascade of Classifier kết hợp với camera AI Tôi đã áp dụng thành công mô hình Cascade of Classifier vào bài toán phát hiện mặt người trong thời gian thực Xây dựng thành công hệ thống phát hiện, nhận diện sinh viên vào và ra khỏi lớp học Đặc biệt chương trình xử lý ảnh cho kết quả phát hiện nhanh, chính xác nhưng vẫn đáp ứng được ứng dụng phát hiện và cảnh báo theo thời gian thực theo yêu cầu của đề tài
- Đây là bước đầu để phát triển bài toán nhận dạng mặt người (face recognition) sau này Bên cạnh đó, trong quá trình xây dựng chương trình ,tôi đã tìm hiểu về thư viện mã nguồn mở OpenCV, qua đó biết cách sử dụng các hàm trong thư viện OpenCV để xây dựng chương trình phát hiện mặt người trên kit nhúng sau này
- Về chương trình demo, sau khi thử nghiệm với camera AI trong các điều kiện môi trường khác nhau thì chương trình đạt kết quả tốt, thời gian phát hiện nhanh đối với các mặt người nhìn chính diện, tuy nhiên đối với các mặt nghiên hay môi trường quá tối thì chương trình gần như không thể phát hiện được khuôn mặt Hiệu xuất của chương trình còn tùy theo chất lượng của loại camera được sử dụng, chương trình sẽ không thể phát hiện mặt người trong điều kiện độ sáng quá yếu
- Về cơ bản đã hoàn thành các yêu cầu mà ban đầu đề tài đề ra, đây là tiền đề để phát triển bài toán nhận dạng mặt người, từ đó áp dụng vào thực tế như hệ thống giám sát, kiểm tra an ninh, điểm danh học sinh tự động, kiểm tra một người có phải là cán bộ, giảng viên, công nhân viên của trường hay không…
- Kết nối với hệ thống Camera IP để có thể xây dựng 1 trung tâm giám sát an ninh cho công ty, chung cư…
- Tăng khả năng phát hiện của camera bằng cách sử dụng camera hồng ngoại hoặc sử dụng loại camera có độ phân giải cao
- Kết hợp với bài toán nhận dạng mặt người để phát hiện chính xác hơn.