1. Trang chủ
  2. » Thể loại khác

THIẾT KẾ HỆ THỐNG ĐIỀU KHIỂN CỬA TỰ ĐỘNG SỬ DỤNG CƠNG NGHỆ XỬ LÝ GIỌNG NÓI VÀ CÔNG NGHỆ XỬ LÝ ẢNH

6 1 0

Đang tải... (xem toàn văn)

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 6
Dung lượng 436,89 KB

Nội dung

22 Lê Tiến Dũng, Trịnh Ngọc Văn, Nguyễn Văn Kiên, Nguyễn Đức Tường THIẾT KẾ HỆ THỐNG ĐIỀU KHIỂN CỬA TỰ ĐỘNG SỬ DỤNG CƠNG NGHỆ XỬ LÝ GIỌNG NĨI VÀ CÔNG NGHỆ XỬ LÝ ẢNH DESIGNING AN AUTOMATIC DOOR CONTROL SYSTEM APPLYING SPEECH PROCESSING AND IMAGE PROCESSING Lê Tiến Dũng1, Trịnh Ngọc Văn2, Nguyễn Văn Kiên2, Nguyễn Đức Tường2 Trường Đại học Bách khoa, Đại học Đà Nẵng; ltdung@dut.udn.vn Lớp 12DCLC, Trường Đại học Bách khoa, Đại học Đà Nẵng; vantnbk91@gmail.com, vankienemk@yahoo.com, tuongnguyen9494@gmail.com Tóm tắt - Ngày nay, với phát triển không ngừng ngành tự động hóa, người có xu hướng sử dụng thiết bị tự động để nâng cao tính tiện nghi, an tồn cho khơng gian sống họ Trong báo này, đề xuất giải pháp nhằm nâng cao tính an ninh tiện lợi hệ thống điều khiển cửa tự động Hệ thống điều khiển sử dụng công nghệ bảo mật mật khẩu, bảo mật thẻ RFID, hay phương pháp sinh trắc học khác nhận diện khuôn mặt hay giọng nói người dùng Ngồi hệ thống có thêm chức truyền hình ảnh từ camera đặt cửa tới thiết bị mạng LAN, giao tiếp với thiết bị mạng LAN thông qua giao thức MQTT Đồng thời xây dựng mơ hình để kiểm nghiệm hoạt động thực tế giải pháp đề Abstract - Nowadays, because of the consistent development of automation technology, there is a growing tendency among people to use automatic devices to improve the convenience and safety of their living space In this paper, we propose a measure to enhance the convenience and security of the control system of automatic doors Our control system uses security technology such as password, RFID or biometric methods like face recognition or speech recognition Besides, our system have two extra functions: transmitting images captured by camera via Local Area Network (LAN) to other devices and saving video to review when it is necessary The system adopt MQTT as the main communication protocol to exchange messages Finally, we build up a working model to demo and test our solution Từ khóa - xử lý giọng nói; xử lý hình ảnh; hệ thống bảo mật; nhận dạng khn mặt; cửa thông minh Key words - speech processing; image processing; security systems; face recognition; intelligent door Đặt vấn đề Ngày nay, đời sống kinh tế - xã hội phát triển, vấn đề an ninh quan tâm nhiều Ở nước ta, việc bảo vệ an ninh dẫm chân chỗ việc người ta sử dụng người cho mục đích an ninh việc thuê bảo vệ viên, hay lắp đặt hệ thống camera thông thường mà kẻ gian hiểu biết qua mắt Trên giới có nhiều cơng trình nghiên cứu áp dụng hệ thống điều khiển cửa thông minh Trước hết, kể đến hệ thống chng cửa thông minh Chui [4] sử dụng kỹ thuật nhận diện khuôn mặt, thẻ từ mật để nhận diện định mở khóa Ngồi ra, hệ thống cịn truyền hình ảnh qua mạng LAN để người dùng biết người đứng trước cửa Tuy nhiên, hệ thống chưa lưu lại video để người dùng dễ dàng xem lại cần Một ứng dụng thương mại khác hệ thống khóa HF6618 sử dụng kỹ thuật nhận diện khn mặt, thẻ từ, khóa mật kết hợp để mở khóa [8] Nhược điểm hệ thống chưa truyền hình ảnh qua mạng LAN lưu lại video để người sử dụng giám sát nhà họ Bên cạnh đó, kể đến hệ thống cửa thơng minh sân bay Australia [2] đối chiếu khuôn mặt hộ chiếu điện tử khuôn mặt thu từ camera để mở cửa cho du khách nhập cảnh Hệ thống cồng kềnh chưa có chức lưu video hay truyền qua mạng LAN Trong báo này, xây dựng mơ hình hệ thống cửa tự động với cấp độ bảo mật cao khắc phục vấn đề tồn hệ thống cửa thơng kể đến Sơ đồ khối cấu trúc toàn hệ thống biểu diễn hình Hình Sơ đồ khối hệ thống Hệ thống cửa sử dụng camera để phân biệt, nhận diện đối tượng phép mở cửa làm phương thức bảo mật Ngồi ra, hệ thống cửa cịn chấp nhận yêu cầu khác việc nhập từ bàn phím có sẵn hay nhận dạng giọng nói người dùng, đồng thời lưu trữ hình ảnh từ camera để thuận tiện cho việc truy xuất hình ảnh cần ISSN 1859-1531 - TẠP CHÍ KHOA HỌC VÀ CƠNG NGHỆ ĐẠI HỌC ĐÀ NẴNG, SỐ 3(112).2017-Quyển Khi người dùng yêu cầu mở cửa, cấu chốt khóa tự động kéo cho phép người dùng mở cửa Cơ cấu gài lại có u cầu từ người dùng Hệ thống cịn có số tính bổ sung khác truyền hình ảnh từ camera đến thiết bị khác điện thoại, máy tính, chế độ từ chối tiếp khách liên động với chuông cửa Cái cốt lõi mà báo hướng đến giải pháp tự động hóa mang tính cải tiến, nâng cao bảo mật ứng dụng thực tế cao Phần lại báo bố cục sau: Mục trình bày thuật tốn xử lý ảnh nhận diện khn mặt; Mục trình bày phương án xử lý giọng nói cho hệ thống điều khiển cửa tự động; Mục trình bày giải pháp truyền thơng Một mơ hình thực nghiệm xây dựng để kiểm chứng giải pháp đề xuất, trình bày mục Cuối cùng, mục đưa kết luận, đề xuất Thuật toán xử lý ảnh nhận diện khn mặt 2.1 Thuật tốn xử lý ảnh Hệ thống xác minh khuôn mặt báo thực xử lý ảnh qua bốn bước sau:  Phát khn mặt (detection): Tìm vị trí kích thước khn mặt ảnh  Căn chỉnh khn mặt (alignment): Tìm điểm landmarks dựa vào điểm để biến đổi khuôn mặt (xoay, tịnh tiến hay thu phóng) cho khn mặt ảnh góc nhìn diện  Biểu diễn (Representation): Biểu diễn khuôn mặt thành số đo để dựa vào xác minh khn mặt  Xác minh (Verification): Dựa vào số đo tìm để xác minh khn mặt có phải người dùng hay không Bức ảnh thu từ camera có kích thước 480x640x3, ảnh xử lý để phát vị trí kích thước khn mặt; khn mặt cắt điều chỉnh kích thước 96x96x3 Bức ảnh điều chỉnh xử lý tiếp qua giai đoạn sau để xác minh Các khung hình xử lý liên tiếp Sau xử lý xong khung hình, máy tính lấy tiếp khung hình lặp lại bước xử lý trên; q trình lặp lại vơ hạn Trong ngơn ngữ lập trình Python, ảnh biểu diễn dạng numpy array Ví dụ mảng numpy array sau: I = [[1, 0, 0], [0, 1, 2]] Trong mảng này, số cặp ngoặc vuông bên phần tử hàng; dấu phẩy cặp ngoặc vuông phân cách hàng với Việc đánh số phần tử hàng cột bắt đầu số 0, ví dụ I [0, 0] trả giá trị Để lấy tất phần tử chiều đó, ta dùng dấu “:” chiều khác, ví dụ để lấy hàng đầu tiên, ta dùng lệnh I [1,:] (lấy tất cột hàng 1) Các ảnh biểu diễn mảng numpy array chiều theo thứ tự chiều dọc, chiều ngang chiều sâu Sau đây, chi tiết bước xử lý ảnh xác minh trình bày 23 2.2 Phát khn mặt Thuật tốn sử dụng để phát khuôn mặt báo thuật toán Viola-Jones Ưu điểm bật thuật toán tốc độ xử lý Thực tế thuật tốn phát khn mặt có tốc độ nhanh có độ xác tương đối cao Bài báo sử dụng thư viện xử lý ảnh mã nguồn mở OpenCV [3] để thực việc phát khuôn mặt Sau phát khuôn mặt, chương trình trả vị trí kích thước hình chữ nhật bao quanh khn mặt hình Từ đó, ta tách khn mặt khỏi ảnh để thực tiếp bước nhận dạng Hình Kết đoạn chương trình phát khuôn mặt 2.3 Căn chỉnh khuôn mặt Để chỉnh khn mặt, trước hết, cần phải tìm điểm landmarks, điểm đặc biệt có mặt khn mặt, chẳng hạn góc mắt, đỉnh mũi hay khóe miệng Bài báo sử dụng thư viện xử lý ảnh mã nguồn mở Dlib [6] để tìm 68 điểm landmarks khn mặt Thuật tốn sử dụng thuật toán Ensemble of Regression Trees; thuật toán có tốc độ thực thi cao, xử lý 1.000 ảnh vòng 1s Minh họa điểm landmarks khn mặt hình Hình Kết tìm điểm landmarks chỉnh khuôn mặt Sau phát điểm landmarks, ta dựa vào điểm để biến đổi khuôn mặt cho góc nhìn diện Ở ta sử dụng phép biến đổi affine Cụ thể tìm ma trận H, ma trận biến đổi điểm có tọa độ (𝑥𝑖 , 𝑦𝑖 , 1) ảnh gốc thành điểm có tọa độ (𝑥𝑖′ , 𝑦𝑖′ )[3] ảnh cho: 𝑥𝑖 𝑥𝑖′ [ ′ ] = 𝐻 [𝑦𝑖 ] (1) 𝑦𝑖 Để tìm H, ta cần dựa vào tính chất phép biến đổi affine sau: Với hai hình tam giác bất kỳ, ta ln tìm phép biến đổi affine để biến đổi tam giác thành tam giác [5] Dựa vào tính chất này, ta chọn ba điểm, tìm ma trận H cho với ma trận H, ba điểm landmarks chọn ảnh gốc biến đổi thành ba điểm landmarks chuẩn tương ứng Hình bên minh họa 68 điểm landmarks chuẩn mà báo sử dụng [1] Lê Tiến Dũng, Trịnh Ngọc Văn, Nguyễn Văn Kiên, Nguyễn Đức Tường 24 Gọi A, B, C ba điểm landmarks chọn ảnh gốc A’, B’, C’ ba điểm tương ứng landmarks chuẩn, từ phương trình (1) ta có: 𝑥 𝑥𝐴′ 𝐻 𝐻12 𝐻13 𝐴 (2) ] [𝑦𝐴 ] [𝑦 ] = [ 11 𝐻21 𝐻22 𝐻23 𝐴′ 𝑝 Trong 𝑥𝑖𝑎 ảnh người để đối chiếu; 𝑥𝑖 ảnh khác người với 𝑥𝑖𝑎 𝑥𝑖𝑛 𝑝 ảnh người khác với 𝑥𝑖𝑎 𝑥𝑖 Từ bất đẳng thức (7) ta thấy khoảng cách embeddings hai khuôn mặt hai người khác lớn khoảng cách embeddings hai khn mặt người 𝛼 (với mạng neuron OpenFace, 𝛼 = 0.2) [1] 2.5 Xác minh khuôn mặt Sau biểu diễn khuôn mặt, việc xác minh dễ dàng Từ công thức (7) ta rút ra: 𝑝 𝑝 ||𝑓(𝑥𝑖𝑎 ) − 𝑓(𝑥𝑖 )||22 < ||𝑓(𝑥𝑖𝑎 ) − 𝑓(𝑥𝑖 )||22 − 𝛼 (8) Từ công thức (8) suy ra: 𝑝 < ||𝑓(𝑥𝑖𝑎 ) − 𝑓(𝑥𝑖 )||22 − 𝛼 (9) Hình Các điểm landmarks chuẩn sử dụng 𝑥𝐵 𝐻13 ] [𝑦𝐵 ] 𝐻23 𝑥 𝑥𝐶′ 𝐻11 𝐻12 𝐻13 𝐴 ] [𝑦 ] [𝑦 ] = [ 𝐻21 𝐻22 𝐻23 𝐴 𝐶′ Giải hệ phương trình ta tìm H: 𝑥𝐵′ 𝐻 [𝑦 ] = [ 11 𝐻21 𝐵′ 𝐻12 𝐻22 (3) (4) 𝑥𝐴 𝑦𝐴 0 −1 𝑥𝐴′ 𝐻11 𝑦𝐴′ 0 𝑥𝐴 𝑦𝐴 𝐻12 𝑥𝐵′ 𝑥𝐵 𝑦𝐵 0 𝐻13 = 𝑦𝐵′ (5) 𝐻21 0 𝑥𝐵 𝑦𝐵 𝑥𝐶′ 𝐻22 𝑥𝐶 𝑦𝐶 0 𝑦𝐶′ ] [ [𝐻23 ] [ 0 𝑥𝐶 𝑦𝐶 1] Ma trận biến đổi cuối là: 𝐻 𝐻12 𝐻13 𝐻 = [ 11 ] (6) 𝐻21 𝐻22 𝐻23 Trong báo này, điểm landmarks số 39, 42 33 sử dụng để biến đổi 2.4 Biểu diễn khuôn mặt Để so sánh hai khuôn mặt, điều cần thiết phải biểu diễn ảnh thành tính chất để làm giảm biến thiên ảnh người, phải làm tăng biến thiên ảnh hai người khác Đây phần quan trọng q trình xác minh khn mặt q trình xác minh hồn tồn dựa vào tính chất Hệ thống báo sử dụng mạng neuron luyện sẵn thư viện mã nguồn mở OpenFace [1] Mạng neuron có input ảnh màu RGB với kích thước 96x96x3 output vector chứa 128 số đo, gọi embeddings Khoảng cách Euclide hai embeddings hai ảnh lớn chúng thuộc hai người khác nhỏ chúng thuộc hai người khác Gọi 𝑥 ảnh đầu vào 𝑓(𝑥) vector chứa embeddings 𝑥 [7] Mạng huấn luyện cho: 𝑝 ||𝑓(𝑥𝑖𝑎 ) − 𝑓(𝑥𝑖 )||22 + 𝛼 < ||𝑓(𝑥𝑖𝑎 ) − 𝑓(𝑥𝑖𝑛 )||22 (7) Như vậy, khoảng cách Euclide hai khuôn mặt hai người khác lớn 𝛼, báo 0,2 Như vậy, lập trình, cần tính khoảng cách khn mặt lưu máy tính với khn mặt thu từ camera, khoảng cách nhỏ 0,2 kết luận hai khuôn mặt người Ngược lại, lớn 0,2 kết luận hai khuôn mặt khác Tuy nhiên, để đảm bảo an toàn, ta chọn ngưỡng thấp hơn, báo chọn 0,18 2.6 Đọc ảnh từ sever Để đọc ảnh từ server trả về, trước hết, cần phải kết nối với server Server báo trả ảnh dạng JPEG; chuẩn nén ảnh phổ biến internet Nếu server trả ảnh ta cần giải mã chuỗi liệu nhận biến stream ảnh Tuy nhiên, báo này, server liên tục trả ảnh nên cần phải có cách để đọc chuỗi mã hóa ảnh stream Để tìm chuỗi mã hóa ảnh, ta cần tìm chuỗi ‘\xff\xd8’ ‘xff\xd9’; chuỗi mở đầu kết thúc quy ước định dạng ảnh JPEG Sau đọc chuỗi mã hóa, ta xóa giá trị từ ‘\xd9’ trở trước Quá trình đọc ảnh tiếp tục lặp lại để đọc ảnh 2.7 Lưu ảnh thành video Để lưu ảnh thành video, ta dùng hàm cv2.imwrite() thư viện opencv Ta có ba thơng số cần phải khai báo Thơng số tên video (ví dụ ‘out.avi’), sau cần phải khai báo mã Fourcc số khung hình giây (frames per second) Cuối cờ isColor; cờ set True chương trình lưu thành video với khung hình màu, False chương trình lưu lại thành video đen trắng Fourcc đoạn mã dùng để nhận biết mã ảnh động (video codec), định dạng nén định dạng pixel màu sử dụng video Mỗi mã Fourcc ký hiệu bốn chữ bảng mã ASCII Mã Fourcc phụ thuộc vào hệ điều hành sử dụng định dạng video; khai báo sai mã Fourcc việc lưu video thất bại Mã Fourcc sử dụng báo ‘MJPG’ với định dạng video avi Nếu việc lưu video thất bại cần phải thử với mã Fourcc khác trang web https://www.fourcc.org/codecs.php ISSN 1859-1531 - TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ ĐẠI HỌC ĐÀ NẴNG, SỐ 3(112).2017-Quyển Phương pháp xử lý giọng nói 3.1 Thư viện âm MARF Trong phạm vi báo này, chúng tơi nhận thấy việc xác minh người nói (speaker identifier) có ý nghĩa quan trọng việc bảo mật hệ thống thay nhận diện giọng nói, định chọn phần mềm, thiết bị liên quan tới cơng việc Hình Giới thiệu MARF Giải pháp phần mềm đưa báo thư viện MARF (Modular Audio Recognition Framework) chỉnh sửa lại để sử dụng với ngơn ngữ lập trình python hoạt động máy tính Raspberry Pi MARF tảng nghiên cứu mã nguồn mở tập hợp thuật toán xử lý giọng nói/ âm thanh/ ngơn ngữ viết tảng java, xếp vào mô-đun sườn mở rộng việc thêm vào thuật tốn MARF chạy mạng (network) hoạt động thư viện thêm vào ứng dụng, dùng nguồn để nghiên cứu phát triển 3.2 Cài đặt thư viện Thư viện MARF tùy biến thành thư viện piwho sử dụng cho ngôn ngữ lập trình python Về chất, thư viện MARF viết tảng java, để sử dụng thư viện cần java tối thiểu phiên 1.7 Đối với máy tính Raspberry pi nhiều dạng máy tính linux khác, nhân máy cài sẵn java Để kiểm tra phiên tảng java, sử dụng câu lệnh: $ java –version Để ghi âm phục vụ cho nhận diện người nói, cần thư viện âm dành cho python pyaudio: $ pip install pyaudio Cuối câu lệnh cài đặt thư viện: $ pip install piwho 3.3 Huấn luyện máy nhận diện Việc huấn luyện máy nhận diện khơng q khó khăn, người dùng việc lặp lại việc nói câu nhiều lần với âm điệu khác nhau, thường từ năm đến mười lần Sau đoạn âm ghi âm xong, máy tính bắt đầu huấn luyện thư mục chứa đoạn âm ghi âm lưu tập huấn luyện vào tệp tin Yêu cầu việc huấn luyện:  Số lượng huấn luyện: Tối thiểu hai người  Định dạng tệp âm huấn luyện: PCM signed (wav) 25  Tốc độ mẫu âm thanh: 8.000Hz (8Khz)  Độ phân giải mẫu: 16bit  Kênh thu âm: (mono) Nếu tập âm không định dạng chuyển định dạng ghi đè lên tập tin gốc Sau huấn luyện lần mơ-đun có mở rộng “.gzbin” tập tin “speaker.txt “ tạo thư mục làm việc Tập tin “speaker.txt” chứa thơng tin tên người nói số ID người nói Tập tin “*.gzbin” chứa đặc tính phân tích từ tập âm huấn luyện Mỗi lần huấn luyện, tập tin “*.gzbin” cập nhật lại Để sử dụng thư viện piwho chương trình python phải nhập thư viện: from piwho import recognition recog = recognition.SpeakerRecognizer() Nếu tập âm dùng để huấn luyện nhận diện nằm thư mục khác phải rõ địa chúng Ví dụ tập tin nằm địa ‘/home/pi/recordings’: recognition.SpeakerRecognizer(‘/home/pi/recordings/’) Để huấn luyện tập liệu âm sử dụng câu lệnh: recog.train_new_data() 3.4 Nhận diện người nói Sau thực xong việc huấn luyện bước thử nghiệm việc chạy trình nhận diện người nói Để thực điều có số yêu cầu sau:  Phải đảm bảo tập tin “*.gzbin” “speaker.txt” nằm thư mục, nơi chứa đoạn code python thực thi  Kiểm tra “speaker.txt” file trống Thực việc nhận diện hàm identify_speakers() kết trả ‘name’ danh sách hai người nói có điểm số tốt tập huấn luyện Người người nói gần giống nhất, tức có điểm số thấp nhất: name = recog.identify_speaker() Giải pháp truyền thông 4.1 Truyền hình ảnh qua mạng LAN Mạng LAN (Local Area Network) tên loại mạng cục Các thiết bị kết nối mạng chia sẻ thông tin, liệu với mà không bị can thiệp, cơng từ thiết bị ngồi mạng Việc truyền hình ảnh qua mạng LAN giúp thiết bị mạng xem hình ảnh từ camera cửa gửi Để truyền hình ảnh qua mạng LAN máy tính Raspberry Pi (sử dụng hệ điều hành Debian) sử dụng dịch vụ (service) kèm, motion Để cài đặt dịch vụ, nhập vào terminal câu lệnh: sudo apt-get install motion Để bắt đầu sử dụng dịch vụ gõ vào terminal câu lệnh: sudo service motion start Để dừng dịch vụ sử dụng câu lệnh: sudo service motion stop Nếu việc truyền Lê Tiến Dũng, Trịnh Ngọc Văn, Nguyễn Văn Kiên, Nguyễn Đức Tường 26 hình ảnh khơng ý muốn, thay đổi thơng số tập tin cấu hình dịch vụ câu lệnh: sudo nano/etc/motion/motion.conf, lúc tập cấu hình mở chỉnh sửa lại dựa thích trước thơng số, tìm hiểu để biết thêm cách chỉnh sửa thơng số cho phù hợp 4.2 Giao tiếp với thiết bị khác qua giao thức MQTT MQTT giao thức truyền tin hiệu quả, đáng tin cậy dựa tảng giao thức TCP/IP sử dụng phổ biến MQTT thích hợp với việc truyền tải liệu nhỏ, yêu cầu tốc độ nhanh đồng dựa phương pháp đăng ký/xuất (subscribe/publish) lên kênh MQTT có hỗ trợ ngơn ngữ python Để cài đặt gói giao thức MQTT cho python, sử dụng câu lệnh pip install pahomqtt Để thêm thư viện MQTT vào chương trình python, sử dụng import paho.mqtt.client as mqtt Để đăng nội dung lên kênh (topic), sử dụngclient.publish(“topic”, data, qos=0, retain=False) Để đăng ký nội dung từ kênh bất kỳ, sử dụng câu lệnh client.subscribe(“topic”, qos = 0) Chú ý, yêu cầu kênh phải tồn tại, có nghĩa phải rõ địa máy chủ nơi mà kênh thiết lập tồn tại, sử dụng client.connect (địa máy chủ, cổng, thời gian giữ tin) Ví dụ: ”client.connect("iot.eclipse.org", 1883, 60)” Hình Mặt trước mơ hình thực nghiệm thực tế Mơ hình thực nghiệm Để kiểm nghiệm đề xuất, giải pháp báo, xây dựng mơ hình thực tế thử nghiệm phương án nhiều lần Chương trình xác minh khn mặt xác minh 98,55% số lần thử Với chế độ bảo mật bàn phím, tỷ lệ thành cơng 100%, chế độ bảo mật giọng nói có xác suất thành cơng 91%, chế độ bảo mật thẻ RFID đạt tỷ lệ thành công 100% Với chế độ kết hợp, RFID kết hợp xác minh khuôn mặt đạt tỷ lệ thành công 96%; RFID kết hợp giọng nói đạt 89%, xác minh khn mặt kết hợp xác minh giọng nói đạt 88% Như vậy, chương trình cho kết với độ xác cao, chế độ RFID kết hợp với xác minh khuôn mặt chế độ tốt nên sử dụng Hình Mặt sau mơ hình thực nghiệm thực tế Hình Hình ảnh thiết kế mơ hình thiết bị mặt trước Kết luận Bài báo trình bày phương án thiết kế hệ thống điều khiển cửa tự động sử dụng công nghệ xử lý giọng nói cơng nghệ xử lý ảnh phương thức bảo mật kết hợp Các thuật tốn xử lý hình ảnh, nhận dạng giọng nói trình bày chi tiết Các thiết kế trình bày báo giúp làm chủ công nghệ, đưa giải pháp để chế tạo hệ thống điều khiển cửa thơng minh có chất lượng tốt, nhiều ưu điểm so với hệ thống ứng dụng thực tiễn Đồng thời, mơ hình thực tế xây dựng để kiểm nghiệm đề xuất báo Qua q trình thử nghiệm thực tế, chúng tơi nhận thấy mơ hình hoạt động có hiệu quả, đáp ứng yêu cầu đặt áp dụng thực tiễn ISSN 1859-1531 - TẠP CHÍ KHOA HỌC VÀ CƠNG NGHỆ ĐẠI HỌC ĐÀ NẴNG, SỐ 3(112).2017-Quyển 27 TÀI LIỆU THAM KHẢO [5] Gonzalez, R.C & E., W.R., 2007, Digital Image Processcing 3rd ed Pearson [1] Amos, B., Ludwiczuk, B & Satyanarayanan, M., 2016, OpenFace: A general-purpose face recognition library with mobile application, CMU-CS-16-118, CMU School of Computer Science [2] Australian Border Force, n.d The Department of Immigration and Border Protection, [Online] Available at: https://www.border.gov.au [Accessed 20 August 2016] [3] Bradski, G., 2000, “The OpenCV Library”, Dr Dobb's Journal of Software Tools [4] Chui, n.d CHUI, [Online] Available at: https://www.getchui.com/[Accessed 20 August 2016] [6] King, D.E., 2009, “Dlib-ml: A Machine Learning Toolkit”, Journal of Machine Learning Research, 10, page 1755-58 [7] Schroff, F., Kalenichenko, D & Philbin, J., 2015, “FaceNet: A Unified Embedding For Face Recognition And Clustering”, In IEEE Computer Society Conference on Computer Vision and Pattern Recognition 2015., 2015 [8] Xiamen Surmount Industry Co., Ltd., n.d, Xiamen Surmount Industry Co., Ltd, [Online] Available at: http://www.xmsurmount.com/en/ [Accessed 20 August 2016] (BBT nhận bài: 17/12/2016, hoàn tất thủ tục phản biện: 03/02/2017)

Ngày đăng: 02/12/2022, 02:59

HÌNH ẢNH LIÊN QUAN

Từ khó a- xử lý giọng nói; xử lý hình ảnh; hệ thống bảo mật; nhận - THIẾT KẾ HỆ THỐNG ĐIỀU KHIỂN CỬA TỰ ĐỘNG SỬ DỤNG CƠNG NGHỆ XỬ LÝ GIỌNG NÓI VÀ CÔNG NGHỆ XỬ LÝ ẢNH
kh ó a- xử lý giọng nói; xử lý hình ảnh; hệ thống bảo mật; nhận (Trang 1)
hình 2. Từ đó, ta có thể tách khuôn mặt ra khỏi bức ảnh để - THIẾT KẾ HỆ THỐNG ĐIỀU KHIỂN CỬA TỰ ĐỘNG SỬ DỤNG CƠNG NGHỆ XỬ LÝ GIỌNG NÓI VÀ CÔNG NGHỆ XỬ LÝ ẢNH
hình 2. Từ đó, ta có thể tách khuôn mặt ra khỏi bức ảnh để (Trang 2)
Các khung hình được xử lý liên tiếp. Sau khi xử lý xong một khung hình, máy tính sẽ lấy tiếp một khung hình nữa  rồi lặp lại các bước xử lý như trên; quá trình này được lặp  lại vô hạn - THIẾT KẾ HỆ THỐNG ĐIỀU KHIỂN CỬA TỰ ĐỘNG SỬ DỤNG CƠNG NGHỆ XỬ LÝ GIỌNG NÓI VÀ CÔNG NGHỆ XỬ LÝ ẢNH
c khung hình được xử lý liên tiếp. Sau khi xử lý xong một khung hình, máy tính sẽ lấy tiếp một khung hình nữa rồi lặp lại các bước xử lý như trên; quá trình này được lặp lại vô hạn (Trang 2)
Hình 4. Các điểm landmarks chuẩn được sử dụng - THIẾT KẾ HỆ THỐNG ĐIỀU KHIỂN CỬA TỰ ĐỘNG SỬ DỤNG CƠNG NGHỆ XỬ LÝ GIỌNG NÓI VÀ CÔNG NGHỆ XỬ LÝ ẢNH
Hình 4. Các điểm landmarks chuẩn được sử dụng (Trang 3)
Hình 5. Giới thiệu về MARF - THIẾT KẾ HỆ THỐNG ĐIỀU KHIỂN CỬA TỰ ĐỘNG SỬ DỤNG CƠNG NGHỆ XỬ LÝ GIỌNG NÓI VÀ CÔNG NGHỆ XỬ LÝ ẢNH
Hình 5. Giới thiệu về MARF (Trang 4)
5. Mơ hình thực nghiệm - THIẾT KẾ HỆ THỐNG ĐIỀU KHIỂN CỬA TỰ ĐỘNG SỬ DỤNG CƠNG NGHỆ XỬ LÝ GIỌNG NÓI VÀ CÔNG NGHỆ XỬ LÝ ẢNH
5. Mơ hình thực nghiệm (Trang 5)
hình ảnh khơng như ý muốn, chúng ta có thể thay đổi các thông số trong tập tin cấu hình của dịch vụ bằng câu lệnh:  - THIẾT KẾ HỆ THỐNG ĐIỀU KHIỂN CỬA TỰ ĐỘNG SỬ DỤNG CƠNG NGHỆ XỬ LÝ GIỌNG NÓI VÀ CÔNG NGHỆ XỬ LÝ ẢNH
h ình ảnh khơng như ý muốn, chúng ta có thể thay đổi các thông số trong tập tin cấu hình của dịch vụ bằng câu lệnh: (Trang 5)
sudo nano/etc/motion/motion.conf, lúc đó tập cấu hình được mở ra và chúng ta chỉnh sửa lại dựa trên chú thích  trước mỗi thông số, hoặc tìm hiểu để biết thêm cách chỉnh  sửa các thông số cho phù hợp - THIẾT KẾ HỆ THỐNG ĐIỀU KHIỂN CỬA TỰ ĐỘNG SỬ DỤNG CƠNG NGHỆ XỬ LÝ GIỌNG NÓI VÀ CÔNG NGHỆ XỬ LÝ ẢNH
sudo nano/etc/motion/motion.conf, lúc đó tập cấu hình được mở ra và chúng ta chỉnh sửa lại dựa trên chú thích trước mỗi thông số, hoặc tìm hiểu để biết thêm cách chỉnh sửa các thông số cho phù hợp (Trang 5)

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w