o Ưu điểm của việc sử dụng các nhân tố xác thực này bao gồm khả năngxác thực đa nhân tố, làm tăng tính bảo mật: Xác thực đa nhân tố: Kết hợp nhiều yếu tố xác thực này tạo ra một
Tổng quan về xác thực sinh trắc học
Tổng quan về định danh và xác thực
- Định danh là quá trình xác định một thực thể, người dùng, hoặc tài khoản cụ thể trong hệ thống hoặc môi trường nào đó Điều này có nghĩa là chúng ta xác định ai đó bằng cách gán cho họ một tên định danh hoặc một dạng nhận dạng khác. Thông tin định danh thường là duy nhất và không trùng lặp trong hệ thống.
- Định danh có thể là các thông tin như tên, địa chỉ email, số điện thoại, số chứng minh thư, tên đăng nhập (username), hoặc bất kỳ thông tin nào có thể dùng để phân biệt một người dùng hoặc thực thể khỏi các người dùng hoặc thực thể khác.
- Xác thực là quá trình xác minh xem người dùng hoặc thực thể cố gắng truy cập hệ thống hoặc dịch vụ có phải là người dùng hoặc thực thể đó hay không Điều này đảm bảo rằng chỉ những người dùng được phép và có quyền truy cập mới có thể tiến hành truy cập.
- Xác thực thường đòi hỏi việc cung cấp bằng chứng cụ thể để chứng minh danh tính Trong trường hợp của username và password, mật khẩu (password) được sử dụng làm bằng chứng để xác minh danh tính Người dùng phải cung cấp mật khẩu chính xác để được xác thực.
- Xác thực có thể được thực hiện bằng nhiều cách khác nhau, bao gồm cả sử dụng thẻ thông tin, dấu vân tay, mã xác thực tạm thời, hoặc xác thực hai yếu tố (2FA).
- Một quá trình xác thực thành công là cơ sở để cấp quyền truy cập cho người dùng vào hệ thống hoặc dịch vụ.
- Nhân tố xác thực (authentication factor) là thông tin sử dụng cho quá trình xác thực.
- Có 3 loại nhân tố xác thực chính
Cái người dùng biết (Something you know) o Mật khẩu (password): Điều này thường là phương pháp chính để xác thực người dùng Họ phải nhập mật khẩu mà họ đã thiết lập để truy cập tài khoản của họ. o Câu hỏi riêng tư: Ngoài mật khẩu, một số hệ thống yêu cầu người dùng đưa ra câu trả lời cho một hoặc một số câu hỏi riêng tư Thông tin này thường được sử dụng để khôi phục mật khẩu nếu người dùng quên nó. o Ưu điểm của việc sử dụng các nhân tố xác thực này bao gồm sự đơn giản và giá thấp:
Đơn giản: Việc xác thực dựa trên username và password là cách đơn giản để đảm bảo an toàn tài khoản Người dùng chỉ cần nhớ mật khẩu và câu trả lời cho câu hỏi riêng tư.
Chi phí thấp: Triển khai hệ thống xác thực này không đòi hỏi nhiều nguồn lực kỹ thuật hoặc tài chính. o Tuy nhiên, cách tiếp cận này cũng có nhược điểm quan trọng:
Nguy cơ bị lộ (đánh cắp): Mật khẩu và câu trả lời cho câu hỏi riêng tư có thể bị đánh cắp bởi các kẻ xâm nhập hoặc trong các cuộc tấn công mạng.Khi thông tin này bị tiết lộ, tài khoản của người dùng có thể bị đe dọa.
Nguy cơ bị quên: Người dùng có thể quên mật khẩu hoặc câu trả lời cho câu hỏi riêng tư, và việc khôi phục mật khẩu có thể trở nên phức tạp hoặc đòi hỏi thời gian.
Cái người dùng có (Something you have) o Chìa khóa, giấy tờ tùy thân: Đây có thể là chìa khóa vật lý, giấy tờ tùy thân như hộ chiếu hoặc giấy phép lái xe Người dùng cần sở hữu và trình diện chúng để xác thực danh tính. o Thẻ từ, smartcard: Thẻ từ hoặc smartcard là một phương tiện vật lý chứa thông tin xác thực Người dùng cần cắm hoặc đọc thông tin từ thẻ để xác thực. o OTP token, Cryptographic token, khóa mật mã: Đây là các thiết bị tạo ra mã một lần (OTP) hoặc chứa thông tin mật mã dùng để xác thực Người dùng cần cung cấp mã này để xác thực. o SIM điện thoại: SIM điện thoại có thể được sử dụng để xác thực bằng cách gửi mã xác thực đến số điện thoại của người dùng Họ cần truy cập mã này để hoàn thành quá trình xác thực. o Ưu điểm của việc sử dụng các nhân tố xác thực này bao gồm khả năng xác thực đa nhân tố, làm tăng tính bảo mật:
Xác thực đa nhân tố: Kết hợp nhiều yếu tố xác thực này tạo ra một hệ thống mạnh mẽ hơn để bảo vệ tài khoản người dùng. o Tuy nhiên, cách tiếp cận này cũng có nhược điểm quan trọng:
Chi phí cao: Các thiết bị vật lý như thẻ từ, smartcard, OTP token hoặc khóa mật mã thường đắt tiền để triển khai.
Có thể bị mất, chiếm đoạt, làm giả: Các thiết bị vật lý có thể bị thất lạc, đánh cắp hoặc làm giả, dẫn đến vấn đề bảo mật và khôi phục. o Cái thuộc về bản thể người dùng (Something about you/that you are) o Khuôn mặt, vân tay, bàn tay: Các đặc điểm về khuôn mặt, vân tay hoặc bàn tay của người dùng được sử dụng để xác thực Hệ thống quét và so sánh chúng để kiểm tra danh tính. o Võng mạc: Đặc điểm cụ thể của võng mạc của mắt người dùng được sử dụng để xác thực danh tính. o Giọng nói: Đặc điểm trong giọng điệu và cách nói của người dùng được sử dụng để xác thực. o Ưu điểm của việc sử dụng các nhân tố xác thực này bao gồm tính khó sao chép, mất mát hoặc đánh cắp. o Tuy nhiên, cách tiếp cận này cũng có nhược điểm quan trọng:
Chi phí rất cao: Triển khai và duy trì các hệ thống xác thực dựa trên sinh trắc học hoặc giọng nói có thể rất đắt đỏ.
Có thể thay đổi theo thể trạng: Đặc điểm sinh trắc học như khuôn mặt hoặc vân tay có thể thay đổi do sự thay đổi tự nhiên hoặc thương tích, dẫn đến khó khăn trong việc xác thực.
Không phù hợp cho xác thực qua mạng: Các phương thức xác thực này đòi hỏi thiết bị cụ thể để thực hiện kiểm tra, điều này làm cho chúng không phù hợp cho việc xác thực từ xa qua mạng.
- Có 2 nhóm nhân tố xác thực khác
Xác thực sinh trắc học
Sinh trắc học hay xác thực sinh trắc học là một hình thức bảo mật đo lường và đối sánh các tính năng sinh trắc học của người dùng để xác minh rằng một người đang cố gắng truy cập vào một thiết bị cụ thể được phép làm như vậy (có phải là chính chủ hay không) Do sinh trắc học là đặc điểm sinh học riêng biệt của người dùng cho nên sẽ có tính bảo mật cao. Ưu điểm:
Có khả năng cải thiện tính bảo mật, kiểm soát truy cập an toàn, thoải mái, tránh để lộ thông tin người dùng cho tội phạm mạng
Là một giải pháp bảo mật hiện đại và phức tạp nhất, có độ chính xác gần như là tuyệt đối trong quá trình xác thực
So với phương pháp xác thực truyền thống, bảo mật sinh trắc học có thao tác thực hiện nhanh hơn, người dùng hạn chế tình trạng quên chuỗi mật khẩu dài và phức
Khắc phục hiện tượng quá tải thông tin đăng nhập trên các ứng dụng hoặc thiết bị khác nhau
Xác thực sinh trắc học có tính linh hoạt, dễ đăng ký và triển khai sử dụng
Các thiết bị xác thực sinh trắc học thường có chi phí đắt hơn so với thiết bị nhập mật khẩu truyền thống
Nhận dạng sinh trắc học không chính xác 100% Ví dụ: Máy xác thực sinh trắc học sẽ không nhận diện được giọng nói khi người dùng bị cảm cúm hoặc không nhận diện được khuôn mặt khi người dùng tăng/giảm cân
Gây ảnh hưởng đến quyền riêng tư của người sử dụng
Dấu vân tay là một trong những đặc điểm nhận dạng sinh trắc phổ biến sử dụng nhất(sử dụng từ rất lâu trong lĩnh vực tìm kiếm tội phạm) Dấu vân tay có thể được số hóa và đưa vào máy tính thông qua thiết bị quét. Tuy nhiên nhận dạng dấu vân tay không đơn giản là so sánh ảnh bitmap(điều hầu như là bất khả thi vì chúng thường khá lớn và rất dễ khác biệt do xô lệch khi chụp quét) Cơ chế xử lý ở đây là xây dựng một biểu diễn đồ thị từ một ảnh vân tay, trong đó mỗi đỉnh là một dạng đặc trưng xác định trước(ví dụ như chóp uốn) Vì vậy bài toán nhận dạng dấu vân tay có thể chuyển về thành một vấn đề thuật toán kinh điển là so khớp đồ thị(graph matching).
Có thể sử dụng theo hai cách – so khớp về giọng và so khớp về nội dung So khớp giọng nói là so khớp với các mẫu đã được ghi nhận trong cơ sở dữ liệu hệ thống Kỹ thuật này được thực hiện thông qua việc phân tích chiết suất các đặc tính tín hiệu và từ đó thực hiện các phép kiểm tra giả thiết thống kê(statistical hypothesis) Ngược lại so khớp nội dung không quan tâm đến người nói mà chỉ cần kiểm tra nội dung của câu trả lời có phù hợp câu hỏi hay không.
2.4 Mắt Ảnh võng mạc mặt cũng được xem là dấu hiệu xác định duy nhất cho từng người Ảnh có thể thu được thông qua máy chụp(khi nhìn vào khe chỉ định của máy đo), sau đó được phân tích để xác định các yếu tố đặc trưng Các phép kiểm tra giả thiết thống kê cũng được sử dụng để loại bỏ sự trùng khớp ngẫu nhiên.
Tương tự các phương pháp trên, khi mặt được giữ cố định, người ta có các thiết bị để chụp và chiết xuất các yếu tố đặc trưng cần thiết mà tổ hợp của chúng được cho là có thể xác định duy nhất đối tượng.
2.6 Mẫu gõ phím(keystroke pattern)
Mặc dù đây là một quá trình động, việc theo dõi ghi nhận tốc độ, các khoảng trễ trong khi gõ phím có thể đưa lại những mẫu gõ phím mang tính đặc trưng của mỗi người Các đặc trưng chiết xuất(mẫu gõ) cũng có thể được sử dụng để so khớp với mẫu có sặc để sử dụng vào xác thực.
Khái niệm về Eigenface
Eigenface là một khái niệm trong lĩnh vực xử lý ảnh và nhận dạng khuôn mặt.
Nó được giới thiệu lần đầu tiên bởi Matthew Turk và Alex Pentland vào năm
Eigenface là một tập hợp các khuôn mặt ảo được tạo ra bằng cách sử dụng phân tích thành phần chính (PCA - Principal Component Analysis) Ý tưởng cơ bản của eigenface là xác định các thành phần chính trong một tập hợp các khuôn mặt và sử dụng chúng để biểu diễn một khuôn mặt mới
Quá trình xây dựng eigenface bao gồm các bước sau:
Thu thập và chuẩn bị dữ liệu: Thu thập một tập hợp các khuôn mặt huấn luyện từ các nguồn khác nhau Các khuôn mặt này cần được chụp trong cùng một điều kiện ánh sáng và góc nhìn Sau đó, các khuôn mặt được chuẩn hóa để đảm bảo kích thước và độ tương phản đồ nhất
Xây dựng ma trận ảnh: Các khuôn mặt huấn luyện được biểu diễn dưới dạng các ma trận ảnh 2D, trong đó mỗi hàng biểu diễn một khuôn mặt Các giá trị trong ma trận ảnh thể hiện cường độ của mỗi pixel trong khuôn mặt
Phân tích thành phần chính (PCA): Áp dụng phương pháp PCA để phân tích các thành phần chính của ma trận ảnh PCA sẽ tìm các vectơ riêng (eigenvectors) và giá trị riêng (eigenvalues) của ma trận hiệp phương sai của dữ liệu, Các eigenvectors tương ứng với các eigenvalues lớn nhất đại diện cho các eigenfaces.
Xác định eigenfaces: Các eigenvectors được sắp xếp theo thứ tự giảm dần của eigenvalues Các eigenvectors hàng đầu (có eigenvalues lớn nhất) được chọn làm eigenfaces Mỗi eigenface là một vectơ hàng.
Biểu diễn khuôn mặt mới: Để biểu diễn một khuôn mặt mới, ta transform khuôn mặt đó thành một vectơ và tính toán trọng số tương ứng với mỗi eigenface Trong số này thể hiện độ tương quan của khuôn mặt mới với các eigenfaces
Nhận dạng và so sánh: Để nhận dạng một khuôn mặt mới, ta tính toán trọng số của khuôn mặt đó trong không gian eigenface và so sánh với trọng số của các khuôn mặt huấn luyện đã biết trước Khuôn mặt nới được gán nhãn của khuôn mặt có trọng số tương tự nhất.
3.1 Kỹ thuật PCA (Phân tích thành phần chính)
Eigenface dựa trên kỹ thuật PCA để phân tích và trích xuất các thành phần quan trọng từ tập hợp các khuôn mặt PCA giúp giảm chiều dữ liệu và tìm ra các trục chính trong không gian dữ liệu Các thành phần chính (eigenvectors) tương ứng với eigenfaces, là các hướng quan trọng trong không gian khuôn mặt
3.2 Biểu diễn dữ liệu khuôn mặt
Mỗi khuôn mặt trong tập huấn luyện có thể được biểu diễn dưới dạng một vectơ, bằng cách chồng các giá trị pixel của khuôn mặt thành một vectơ hàng Vi dụ, nếu kích thước của mỗi khuôn mặt là 64x64 pixel, vectơ biểu diễn khuôn mặt sẽ có kích thước 1x4096.
3.3 Sự quan trọng của eigenfaces
Các eigenfaces hàng đầu tương ứng với các eigenvalues lớn nhất chứa thông tin quan trọng về transform và biểu diễn các khuôn mặt Các eigenfaces có eigenvalues nhỏ tương ứng với các thành phần ít quan trọng hơn
3.4 Giảm kích thước dữ liệu
Eigenface cho phép giảm kích thước dữ liệu ban đầu bằng cách chỉ lưu trữ một số lượng nhỏ eigenfaces hàng đầu Điều này giúp giảm bộ nhớ và tăng tốc độ xử lý khi thực hiện quá trình nhận dạng
Mặc dù eigenface có những ưu điểm, nhưng nó cũng có một số hạn chế.
Ví dụ, eigenface không nhạy cảm với các biến thể về góc nhìn, ánh sáng hoặc biểu thức khuôn mặt Nếu một khuôn mặt mới khác biệt quá nhiều so với các khuôn mặt huẩn luyện, eigenface có thể không đưa ra kết quả chính xác.
4 Vấn đề tính riêng tư với xác thực sinh trắc học
Một báo cáo năm 2020 của Văn phòng Giải trình Chính phủ Mỹ cho biết Cục Hải quan và Biên phòng Mỹ (CBP) đã “không cung cấp đầy đủ thông tin trong các thông báo về quyền riêng tư đối với quy trình kiểm tra sinh trắc học hoặc đảm bảo thông tin về sinh trắc học được công bố đầy đủ đến mọi du khách"
Matthew Kugler, phó giáo sư luật tại Đại học Northwestern, người đã nghiên cứu về quyền riêng tư sinh trắc học và tội phạm mạng, cho biết: “Nếu bạn muốn nhận được sự đồng ý, ít nhất bạn cần phải công khai những gì bạn đang làm và công khai rõ ràng Chính phủ cũng nên thông báo ngay cho hành khách cách họ có thể chọn không tham gia vào quy trình kiểm tra sinh trắc học"
Và mặc dù những người ủng hộ giải pháp sàng lọc bảo mật sinh trắc học thường khẳng định kiểm tra sinh trắc học có mức độ chính xác cao, nhưng điều đó có thể gây hiểu nhầm Vào năm 2017, các thượng nghị sĩ Edward Markey và Mike Lee đã chỉ ra rằng, ngay cả với tỷ lệ chính xác 96%, thì cứ 25 du khách, công nghệ này vẫn sẽ nhận dạng sai một du khách Theo người phát ngôn của CBP, quy trình này hiện khớp chính xác hơn 98% thời gian
State of the Art (SOTA)
State of the Art (SOTA) là thuật ngữ được sử dụng để chỉ trạng thái của nghệ thuật, công nghệ, hoặc lĩnh vực nghiên cứu đang đạt được hiệu suất, tiến bộ, hoặc thành tựu tốt nhất tới thời điểm hiện tại
Trong mỗi lĩnh vực, có sự phát triển liên tục và các nghiên cứu mới được công bố State of the Art là mức tiến bộ cao nhất mà các nhà nghiên cứu, nhà phát triển, hoặc cộng đồng trong lĩnh vực đó đã đạt được tại thời điểm hiện tại Nó thường được xác định bằng cách so sánh và đánh giá các phương pháp, công nghệ, hoặc kỹ thuật hiện có dựa trên các tiêu chí như hiệu suất, độ chính xác, tốc độ, hoặc các yếu tố khác liên quan Nó đại diện cho tiêu chuẩn tốt nhất hiện có và có thể được sử dụng làm điểm tham chiếu để so sánh và đánh giá các phương pháp hoặc công nghệ mới
Trong lĩnh vực nhận diện khuôn mặt, State of the Art (SOTA) thường được đo bằng các phương pháp và thuật toán đạt được độ chính xác và hiệu suất cac nhất trên các tập dữ liệu và thử nghiệm cụ thể SOTA trong nhận diện khuôn mặt thường được cập nhật liên tục khi có sự tiến bộ trong lĩnh vực này Dưới đây l một số ví dụ về SOTA trong nhận diện khuôn mặt:
Deep Neural Networks - DNN: Trong nhận diện khuôn mặt, các mạng nơ-ron sâu như Convolutional Neural Networks (CNN) đã đạt được hiệu suất cao và được coi là SOTA trong nhiều nhiệm vụ nhân viện khuôn mặt Các mạng nơ-ron sâu này sử dụng lớp tích chập để học các đặc trưng của khuôn mặt và thực hiện phân loại hoặc nhận dạng.
Deep Metric Learning: Phương pháp này tập trung vào việc học các không gian biểu diễn chung cho các khuôn mặt và khoảng cách giữa chúng Điều này giúp tạo ra những biểu diễn mà các khuôn mặt của cùng một người gần nhau hơn so với các khuôn mặt của những người khác. Phương pháp này đã đạt được kết quả tốt và được coi là SOTA trong việc nhận diện khuôn mặt trong các tình huống đa người
Attention-based models: được áp dụng trong việc nhận diện khuôn mặt để tập trung vào các phần quan trọng của khuôn mặt như mắt, mũi, miệng Điều này giúp cải thiện độ chính xác và hiệu suất của hệ thống nhận diện khuôn mặt Các mô hình attention đã đạt được kết quả tốt và được coi là SOTA trong một số thách thức nhận diện khuôn mặt khó khăn
Kết hợp các phương pháp: Ngoài ra, để đạt được kết quả tốt hơn, các nghiên cứu đã kết hợp nhiều phương pháp và kỹ thuật như mạng nơ-ron sâu, học sâu học đại diện và mô hình attention Kết hợp các phương pháp này đã đạt được SOTA trong nhiều nhiệm vụ nhận diện khuôn mặt khó khăn như nhân diện khuôn mặt ở góc nhìn chéo, trong điều kiện ánh sáng yếu hoặc với các transform khác nhau của khuôn mặt
Lưu ý rằng SOTA có thể thay đổi theo thời gian và phụ thuộc vào các bộ dữ liệu và tiêu chuẩn đánh giá được sử dụng Do đó, để nắm bắt SOTA trong nhận diện khuôn mặt, nên tham khảo các công trình nghiên cứu mới nhất và các cuộc thi hoặc thứ nghiệm đánh giá hàng đầu trong lĩnh vực này.
6 Một số khái niệm khác liên quan
Mã hóa đồng cầu là một phương pháp mật mã hóa đặc biệt mà cho phép các phép tính được thực hiện trên dữ liệu đã được mã hóa mà không cần giải mã. Điều này rất hữu ích trong nhiều tình huống, đặc biệt là khi đòi hỏi tính riêng tư và bão mặt của dữ liệu.
Trong môi trường mã hóa đồng cầu, hai phép tính quan trọng là phép cộng và phép nhân có thể được thực hiện trực tiếp trên các giá trị đã được mã hóa mà không cần biết giá trị gốc Kết quả của các phép tính này sau đó có thể được giải mã để nhận được kết quả cuối cùng.
Một số ứng dụng quan trọng:
Bảo vệ quyền riêng tư: Mã hóa đồng cấu cho phép xử lý dữ liệu mà không tiết lộ thông tin nhạy cảm Điều này rất hữu ích trong các lĩnh vực như y tế, tài chính và điện toán đám mây, nơi đã liệu cần được bảo vệ khỏi việc truy cập trái phép
Xử lý dữ liệu phân tán: Trong môi trường phân tán, nhiều bên có thể tham gia vào xử lý dữ liệu chung mà không cần tiết lộ thông tin của họ.
Mã hóa đồng cầu cho phép các bên thực hiện các phép tính trên dữ liệu đã mã hóa mà không cần n truy cập đến dü liệu gốc.
Mật mã đám mây: Mã hóa đồng cầu cũng được sử dụng trong mô hình mật mã đám mây, nơi dữ liệu được lưu trữ và xử lý trên các máy chủ đám mây mà không cần tiết lộ cho các nhà cung cấp dịch vụ đám mây
Một số hạn chế và thách thức:
Hiệu suất tính toán: Phương pháp mã hóa đồng cầu thường có tính toán phức tạp và yêu cầu tài nguyên tính toán cao hơn so với các phương pháp mã hóa truyền thống Điều này có thể ảnh hưởng đến hiệu suất và tốc độ xử lý của hệ thống
Kích thước mã hóa: Dữ liệu sau khi được mã hóa thường có kích thước lớn hơn so với dữ liệu gốc Điều này có thể tạo ra các vấn đề về lưu trữ và truyền dữ liệu trong một môi trường phân tần
Kết luận
Công nghệ sinh trắc học đóng vai trò quan trọng trong việc xác định và xác minh danh tính của con người dựa trên các đặc điểm sinh trắc học duy nhất của họ Ưu thế của công nghệ sinh trắc học bao gồm:
Độ tin cậy cao: Các đặc điểm sinh trắc học như vân tay, khuôn mặt, võng mạc, giọng nói, hình dạng cơ thể, hình dạng ký tự viết tay và nhận diện hình mạch máu não đều là duy nhất và không thể sao chép hoặc mô phỏng dễ dàng Điều này giúp công nghệ sinh trắc học đạt được độ tin cậy cao trong việc xác định và xác mình danh tính
Bảo mật cao: Các đặc điểm sinh trắc học là thông tin cá nhân đặc biệt và không thể thay đổi dễ dàng Vì vậy, công nghệ sinh trắc học mang đến mức độ bảo mật cao hơn so với các phương pháp xác định danh tính truyền thống dựa trên mật khẩu hoặc thẻ thông minh
Đa dạng và linh hoạt: Công nghệ sinh trắc học có thể áp dụng cho nhiều đặc điểm sinh trắc học khác nhau, cho phép lựa chọn và kết hợp các phương pháp phù hợp với mục đích sử dụng Người dùng có thể chọn sử dụng một hoặc nhiều đặc điểm sinh trắc học để tăng cường tính bảo mật và đáng tin cậy
Tiện lợi và tốc độ xử lý: Công nghệ sinh trắc học đã phát triển và tiến bộ đáng kể trong việc tăng cường hiệu suất và tốc độ xử lý Các công nghệ và thuật toán mới đã giúp rút ngắn thời gian xác mình và cải thiện trải nghiệm người dùng
Ứng dụng đa dạng: Công nghệ sinh trắc học được áp dụng rộng rãi trong các lĩnh vực như an ninh, quản lý lưu trữ và truy cập thông tin, đăng ký và xác minh thông tin cá nhân, y tế, ngân hàng và tài chính, giao thông vận tải và nhiều lĩnh vực khác Việc sử dụng công nghệ sinh trắc học giúp tăng cường bảo mật, hiệu quả và thuận tiện trong các quy trình và dịch vụ liên quan đến xác định danh tính
Mặc dù mang lại nhiều lợi ích lớn, nhưng công nghệ sinh trắc học vẫn còn một số lĩnh vực cần cải tiến, nhằm đảm bảo các vấn đề như tỉnh riêng tư khỏi các mối hiểm họa tiềm tàng.
Bảo vệ tính riêng tư cho mô hình xác thực sinh trắc khuôn mặt
Sử dụng MTCNN phát hiện khuôn mặt
MTCNN là viết tắt của "Multi-task Cascaded Convolutional Networks," một mô hình được sử dụng trong lĩnh vực thị giác máy tính để phát hiện khuôn mặt và các điểm đặc trưng liên quan trên khuôn mặt, như mắt, mũi và miệng.
Mô hình này được thiết kế để thực hiện nhiều nhiệm vụ cùng một lúc, bao gồm việc xác định vùng chứa khuôn mặt và xác định vị trí chính xác của các điểm đặc trưng.
MTCNN thường được sử dụng trong các ứng dụng nhận diện khuôn mặt, như trong hệ thống nhận diện khuôn mặt tự động, ứng dụng thay đổi khuôn mặt trong thời gian thực, và các hệ thống giám sát an ninh Mô hình này là một trong những công cụ phổ biến cho việc xử lý ảnh và thị giác máy tính, giúp nhận diện và trích xuất thông tin từ hình ảnh khuôn mặt.
2.2 Cấu trúc của mô hình MTCNN
Hình 2: Sơ đồ hoạt động của MTCNN
Cấu trúc MTCNN bao gồm 3 mạng CNN (Convolutional NeuralNetworks) xếp chồng và đồng thời hoạt động khi phát hiện và xác định khuôn mặt Mỗi mạng CNN trong MTCNN có cấu trúc và vai trò khác nhau trong việc phát hiện khuôn mặt Kết quả dữ liệu đầu ra của MTCNN là véc-tơ đặc trưng biểu diễn cho vị trí khuôn mặt việc được xác định trong bức ảnh (mắt, mũi, miệng, )
MTCNN hoạt động theo 3 bước với 3 mạng nơ-ron riêng cho mỗi bước (P-Net, R-Net và O-Net) Khi sử dụng, MTCNN sẽ cho phép tạo ra nhiều bản sao của hình ảnh đầu vào, với các kích thước khác nhau để làm dữ liệu đầu vào.
Tầng 1: Sử dụng mạng CNN, gọi là Mạng đề xuất (P-Net), để thu được các cửa số chứa khuôn mặt và các vectơ hồi quy trong các cửa sổ đó Tiếp theo, các cửa sổ chứa khuôn mặt được hiệu chuẩn dựa trên các vector hồi quy. Cuối cùng, những cửa sổ xếp chồng nhau tại một vùng được hợp nhất thành một cửa sổ Kết quả đầu ra là các cửa số có thể chứa khuôn mặt.
Hình 3: Mạng đề xuất (P-Net)
Mạng P-Net sử dụng kiến trúc CNN gồm 3 lớp tích chập và 1 lớp co. Đầu vào cửa sổ trượt với kích thước 12x12x3 (với 3 tương ứng với 3 màu: Đỏ, xanh lục, xanh lam trong hệ màu RGB thông thường) Kết quả của P-Net gồm
- Cụm thứ nhất có 2 bộ lọc kích thước 1x1 nhận dạng khuôn mặt
- Cụm thứ hai có 4 bộ lọc kích thước 1x1 đóng khung 4 vị trí hộp giới hạn.
- Cụm thứ ba có 10 bộ lọc kích thước 1x1 đóng khung 10 vị trí khuôn mặt.
Tầng 2: Tất cả các cửa sổ chứa khuôn mặt từ tầng 1 sẽ được sàng lọc bằng cách đưa vào một CNN khác gọi là Mạng lọc (R-Net) để tiếp tục loại bỏ một số lượng lớn các cửa sổ không chứa khuôn mặt Sau đó, thực hiện hiệu chuẩn với véc-tơ hồi quy và thực hiện hợp nhất các cửa sổ xếp chồng nhau tại một vùng.
Trong bước R-Net sử dụng kiến trúc CNN gồm: 3 lớp tích chập, 2 lớp co và 1 lớp kết nối đầy đủ Đầu vào cửa số trượt với kích thước 24x24x3 (3 tương ứng với 3 màu: Đỏ, xanh lục, xanh lam trong hệ màu RGB thông thường) Kết quả của R-Net phân được 3 cụm:
- Cụm thứ nhất có 2 lớp nhận dạng khuôn mặt.
- Cụm thứ hai có 4 lớp đánh dấu vị trí hộp giới hạn.
- Cụm thứ ba có 10 lớp vị trí khuôn mặt.
Tầng 3: Tầng này tương tự như tầng 2, sử dụng CNN chi tiết nhất được gọi là Mạng đầu ra (O-Net) để lọc kết quả một lần nữa và đánh dấu vị trí năm điểm chính trên khuôn mặt.
Hình 5: Mạng đầu ra (O-Net)
Mạng O-Net sử dụng CNN gồm: 4 lớp tích chập, 2 lớp co, 1 lớp kết nối đầy đủ Đầu vào cửa sổ trượt có kích thước 48x48x3 (trong đó số 3 tương ứng với 3 màu: Đỏ, xanh lục, xanh lam trong hệ màu RGB thông thường) Kết quả của O-Net phân được 3 cụm:
- Cụm thứ nhất có 2 lớp nhận dạng khuôn mặt.
- Cụm thứ hai có 4 lớp đánh dấu vị trí hộp giới hạn.
- Cụm thứ ba có 10 lớp vị trí khuôn mặt. Ứng dụng MTCNN để phát hiện khuôn mặt cho phép xác định khuôn mặt trong bức ảnh tốt hơn so với các phương pháp khác.
3 Thuật toán FaceNet nhận dạng khuôn mặt
Các thuật toán nhận dạng khuôn mặt trước đây chủ yếu biểu diễn khuôn mặt bằng một vectơ đặc trưng và thông qua một lớp bottleneck để giảm số chiều dữ liệu. Tuy nhiên, số chiều dữ liệu của vectơ đặc trưng thường tương đối lớn nên sẽ làm cho tốc độ nhận dạng giảm xuống Vì vậy, thuật toán PCA thường được áp dụng để giảm số chiều dữ liệu của vectơ đặc trưng và tăng tốc độ nhận dạng Đồng thời, trong các phương pháp nhận dạng thì hàm loss function thường chỉ xác định khoảng cách giữa
2 bức ảnh (đại lượng mô tả sự giống nhau của hai bức ảnh) Như vậy, xuất hiện vấn đề là trong một lần huấn luyện chỉ có thể học được một kết quả, hoặc là giống nhau nếu hai bức ảnh thuộc về hai lớp riêng.
FaceNet là một thuật toán hỗ trợ cho việc nhận dạng và phân cụm khuôn mặt cho phép giải quyết các hạn chế nêu trên FaceNet sử dụng một mạng CNN và cho phép giảm số chiều dữ liệu của vectơ đặc trưng (thường sử dụng là 128 chiều) Do đó, cho phép tăng tốc độ huấn luyện và xử lý mà độ chính xác vẫn được đảm bảo. Đối với thuật toán FaceNet, hàm loss function sử dụng hàm triplet loss cho phép khắc phục hạn chế của các phương pháp nhận dạng trước đây, quá trình huấn luyện cho phép học được đồng thời: Sự giống nhau giữa hai bức ảnh (nếu hai bức ảnh cùng một lớp) và sự khác nhau giữa hai bức ảnh (nếu chúng không cùng một lớp).
Đảm bảo tính riêng tư trong hệ thống sinh trắc học
4.1 Tầm quan trọng của mã hóa ảnh
Hệ thống sinh trắc học ngày càng trở thành một phần quan trọng trong xã hội hiện đại, đặc biệt là khi nó liên quan đến việc xử lý dữ liệu ảnh cá nhân. Tính riêng tư của người dùng trong quá trình này trở thành mối quan tâm hàng đầu, đặc biệt là khi những dữ liệu này có thể chứa những thông tin nhạy cảm về đặc điểm sinh trắc học cá nhân.
Mã hóa ảnh đóng một vai trò quan trọng trong việc bảo vệ tính riêng tư của người dùng trong hệ thống sinh trắc học Việc chuyển đổi dữ liệu ảnh thành dạng mã hóa không chỉ giúp ngăn chặn truy cập trái phép mà còn đảm bảo rằng những thông tin cá nhân không bị rò rỉ trong quá trình lưu trữ và truyền tải.
4.2 Phương thức mã hóa SEAL
• Phương Thức Mã Hóa SEAL: Simple Encrypted Arithmetic Library, là một thư viện mã hóa số học đơn giản được phát triển bởi Microsoft Research Thư viện này được thiết kế để cung cấp các công cụ và thuật toán mã hóa số học hiệu quả để bảo vệ tính riêng tư của dữ liệu trong quá trình xử lý.
• SEAL chủ yếu được sử dụng trong lĩnh vực tính toán đa bên và tính toán đám mây, nơi các bên muốn thực hiện các phép toán trên dữ liệu mà không cần giải mã nó Điều này giúp giảm rủi ro liên quan đến rò rỉ thông tin nhạy cảm trong khi vẫn giữ tính toàn vẹn và tính bảo mật của dữ liệu.
An Toàn Mã Hóa: SEAL cung cấp một cơ sở hạ tầng mạnh mẽ cho mã hóa đối xử, giúp bảo vệ tính toán và dữ liệu trước các mối đe dọa an ninh.
Phù Hợp Cho Tính Toán Đa Bội: SEAL được thiết kế để hỗ trợ tính toán đa bội, đặc biệt là quan trọng trong các ứng dụng sinh trắc học nơi có yêu cầu cao về xử lý đa bên và đa bội.
Bảo Vệ Dữ Liệu Trong Quá Trình Xử Lý: SEAL cho phép thực hiện các phép toán trên dữ liệu được mã hóa mà không cần giải mã nó, giảm rủi ro bị tiết lộ thông tin quan trọng trong quá trình xử lý.
Bảo Mật Tích Hợp với Môi Trường Đám Mây và IoT: SEAL được thiết kế để làm việc hiệu quả trong các môi trường đám mây và IoT, nơi tính linh hoạt và bảo mật cao là quan trọng.
Tiêu Chuẩn Bảo Mật Cao: SEAL tuân thủ các tiêu chuẩn bảo mật cao, nhưng cũng cung cấp khả năng tinh chỉnh để đáp ứng các yêu cầu cụ thể của hệ thống.
Quản Lý Quyền Truy Cập: SEAL giúp kiểm soát quyền truy cập vào dữ liệu bằng cách giữ thông tin dưới dạng mã hóa và chỉ mở khóa khi cần thiết.
Hỗ Trợ Bảo Mật Ngôn Ngữ Lập Trình: SEAL hỗ trợ nhiều ngôn ngữ lập trình, giúp tích hợp và triển khai một cách linh hoạt trong nhiều hệ thống và ứng dụng khác nhau.
Hiệu Suất Cao: Mặc dù thực hiện các phép toán trên dữ liệu mã hóa, SEAL được tối ưu hóa để đảm bảo hiệu suất cao, giảm thiểu tác động đến trải nghiệm người dùng và thời gian xử lý.
Độ Tin Cậy và Ổn Định: SEAL đã được sử dụng rộng rãi trong các ứng dụng an ninh, đảm bảo độ tin cậy và ổn định trong quá trình sử dụng.
Chọn SEAL để bảo vệ tính riêng tư trong hệ thống sinh trắc học không chỉ là việc áp dụng một thư viện mã hóa mạnh mẽ mà còn là sự đầu tư vào một giải pháp an ninh tiên tiến và linh hoạt.
4.3 Cách thức hoạt động của thuật toán AESGM trong hệ thống
SEAL (Simple Encrypted Arithmetic Library) có thể được tích hợp vào hệ thống sinh trắc học bằng khuôn mặt để bảo vệ tính riêng tư thông tin cá nhân và đảm bảo an toàn trong quá trình xử lý dữ liệu Dưới đây là cách SEAL hoạt động trong ngữ cảnh của hệ thống sinh trắc học bằng khuôn mặt: