Báo cáo chuyên Đề công nghệ phần mềm an toàn Đề tài xây dựng hệ thống sinh trắc học Đảm bảo tính riêng tư

o Ưu điểm của việc sử dụng các nhân tố xác thực này bao gồm khả năngxác thực đa nhân tố, làm tăng tính bảo mật:  Xác thực đa nhân tố: Kết hợp nhiều yếu tố xác thực này tạo ra một

Tổng quan về xác thực sinh trắc học

Tổng quan về định danh và xác thực

- Định danh là quá trình xác định một thực thể, người dùng, hoặc tài khoản cụ thể trong hệ thống hoặc môi trường nào đó Điều này có nghĩa là chúng ta xác định ai đó bằng cách gán cho họ một tên định danh hoặc một dạng nhận dạng khác. Thông tin định danh thường là duy nhất và không trùng lặp trong hệ thống.

- Định danh có thể là các thông tin như tên, địa chỉ email, số điện thoại, số chứng minh thư, tên đăng nhập (username), hoặc bất kỳ thông tin nào có thể dùng để phân biệt một người dùng hoặc thực thể khỏi các người dùng hoặc thực thể khác.

- Xác thực là quá trình xác minh xem người dùng hoặc thực thể cố gắng truy cập hệ thống hoặc dịch vụ có phải là người dùng hoặc thực thể đó hay không Điều này đảm bảo rằng chỉ những người dùng được phép và có quyền truy cập mới có thể tiến hành truy cập.

- Xác thực thường đòi hỏi việc cung cấp bằng chứng cụ thể để chứng minh danh tính Trong trường hợp của username và password, mật khẩu (password) được sử dụng làm bằng chứng để xác minh danh tính Người dùng phải cung cấp mật khẩu chính xác để được xác thực.

- Xác thực có thể được thực hiện bằng nhiều cách khác nhau, bao gồm cả sử dụng thẻ thông tin, dấu vân tay, mã xác thực tạm thời, hoặc xác thực hai yếu tố (2FA).

- Một quá trình xác thực thành công là cơ sở để cấp quyền truy cập cho người dùng vào hệ thống hoặc dịch vụ.

- Nhân tố xác thực (authentication factor) là thông tin sử dụng cho quá trình xác thực.

- Có 3 loại nhân tố xác thực chính

Cái người dùng biết (Something you know) o Mật khẩu (password): Điều này thường là phương pháp chính để xác thực người dùng Họ phải nhập mật khẩu mà họ đã thiết lập để truy cập tài khoản của họ. o Câu hỏi riêng tư: Ngoài mật khẩu, một số hệ thống yêu cầu người dùng đưa ra câu trả lời cho một hoặc một số câu hỏi riêng tư Thông tin này thường được sử dụng để khôi phục mật khẩu nếu người dùng quên nó. o Ưu điểm của việc sử dụng các nhân tố xác thực này bao gồm sự đơn giản và giá thấp:

 Đơn giản: Việc xác thực dựa trên username và password là cách đơn giản để đảm bảo an toàn tài khoản Người dùng chỉ cần nhớ mật khẩu và câu trả lời cho câu hỏi riêng tư.

 Chi phí thấp: Triển khai hệ thống xác thực này không đòi hỏi nhiều nguồn lực kỹ thuật hoặc tài chính. o Tuy nhiên, cách tiếp cận này cũng có nhược điểm quan trọng:

 Nguy cơ bị lộ (đánh cắp): Mật khẩu và câu trả lời cho câu hỏi riêng tư có thể bị đánh cắp bởi các kẻ xâm nhập hoặc trong các cuộc tấn công mạng.Khi thông tin này bị tiết lộ, tài khoản của người dùng có thể bị đe dọa.

 Nguy cơ bị quên: Người dùng có thể quên mật khẩu hoặc câu trả lời cho câu hỏi riêng tư, và việc khôi phục mật khẩu có thể trở nên phức tạp hoặc đòi hỏi thời gian.

 Cái người dùng có (Something you have) o Chìa khóa, giấy tờ tùy thân: Đây có thể là chìa khóa vật lý, giấy tờ tùy thân như hộ chiếu hoặc giấy phép lái xe Người dùng cần sở hữu và trình diện chúng để xác thực danh tính. o Thẻ từ, smartcard: Thẻ từ hoặc smartcard là một phương tiện vật lý chứa thông tin xác thực Người dùng cần cắm hoặc đọc thông tin từ thẻ để xác thực. o OTP token, Cryptographic token, khóa mật mã: Đây là các thiết bị tạo ra mã một lần (OTP) hoặc chứa thông tin mật mã dùng để xác thực Người dùng cần cung cấp mã này để xác thực. o SIM điện thoại: SIM điện thoại có thể được sử dụng để xác thực bằng cách gửi mã xác thực đến số điện thoại của người dùng Họ cần truy cập mã này để hoàn thành quá trình xác thực. o Ưu điểm của việc sử dụng các nhân tố xác thực này bao gồm khả năng xác thực đa nhân tố, làm tăng tính bảo mật:

 Xác thực đa nhân tố: Kết hợp nhiều yếu tố xác thực này tạo ra một hệ thống mạnh mẽ hơn để bảo vệ tài khoản người dùng. o Tuy nhiên, cách tiếp cận này cũng có nhược điểm quan trọng:

 Chi phí cao: Các thiết bị vật lý như thẻ từ, smartcard, OTP token hoặc khóa mật mã thường đắt tiền để triển khai.

 Có thể bị mất, chiếm đoạt, làm giả: Các thiết bị vật lý có thể bị thất lạc, đánh cắp hoặc làm giả, dẫn đến vấn đề bảo mật và khôi phục. o Cái thuộc về bản thể người dùng (Something about you/that you are) o Khuôn mặt, vân tay, bàn tay: Các đặc điểm về khuôn mặt, vân tay hoặc bàn tay của người dùng được sử dụng để xác thực Hệ thống quét và so sánh chúng để kiểm tra danh tính. o Võng mạc: Đặc điểm cụ thể của võng mạc của mắt người dùng được sử dụng để xác thực danh tính. o Giọng nói: Đặc điểm trong giọng điệu và cách nói của người dùng được sử dụng để xác thực. o Ưu điểm của việc sử dụng các nhân tố xác thực này bao gồm tính khó sao chép, mất mát hoặc đánh cắp. o Tuy nhiên, cách tiếp cận này cũng có nhược điểm quan trọng:

 Chi phí rất cao: Triển khai và duy trì các hệ thống xác thực dựa trên sinh trắc học hoặc giọng nói có thể rất đắt đỏ.

 Có thể thay đổi theo thể trạng: Đặc điểm sinh trắc học như khuôn mặt hoặc vân tay có thể thay đổi do sự thay đổi tự nhiên hoặc thương tích, dẫn đến khó khăn trong việc xác thực.

 Không phù hợp cho xác thực qua mạng: Các phương thức xác thực này đòi hỏi thiết bị cụ thể để thực hiện kiểm tra, điều này làm cho chúng không phù hợp cho việc xác thực từ xa qua mạng.

- Có 2 nhóm nhân tố xác thực khác

Xác thực sinh trắc học

Sinh trắc học hay xác thực sinh trắc học là một hình thức bảo mật đo lường và đối sánh các tính năng sinh trắc học của người dùng để xác minh rằng một người đang cố gắng truy cập vào một thiết bị cụ thể được phép làm như vậy (có phải là chính chủ hay không) Do sinh trắc học là đặc điểm sinh học riêng biệt của người dùng cho nên sẽ có tính bảo mật cao. Ưu điểm:

 Có khả năng cải thiện tính bảo mật, kiểm soát truy cập an toàn, thoải mái, tránh để lộ thông tin người dùng cho tội phạm mạng

 Là một giải pháp bảo mật hiện đại và phức tạp nhất, có độ chính xác gần như là tuyệt đối trong quá trình xác thực

 So với phương pháp xác thực truyền thống, bảo mật sinh trắc học có thao tác thực hiện nhanh hơn, người dùng hạn chế tình trạng quên chuỗi mật khẩu dài và phức

 Khắc phục hiện tượng quá tải thông tin đăng nhập trên các ứng dụng hoặc thiết bị khác nhau

 Xác thực sinh trắc học có tính linh hoạt, dễ đăng ký và triển khai sử dụng

 Các thiết bị xác thực sinh trắc học thường có chi phí đắt hơn so với thiết bị nhập mật khẩu truyền thống

 Nhận dạng sinh trắc học không chính xác 100% Ví dụ: Máy xác thực sinh trắc học sẽ không nhận diện được giọng nói khi người dùng bị cảm cúm hoặc không nhận diện được khuôn mặt khi người dùng tăng/giảm cân

 Gây ảnh hưởng đến quyền riêng tư của người sử dụng

Dấu vân tay là một trong những đặc điểm nhận dạng sinh trắc phổ biến sử dụng nhất(sử dụng từ rất lâu trong lĩnh vực tìm kiếm tội phạm) Dấu vân tay có thể được số hóa và đưa vào máy tính thông qua thiết bị quét. Tuy nhiên nhận dạng dấu vân tay không đơn giản là so sánh ảnh bitmap(điều hầu như là bất khả thi vì chúng thường khá lớn và rất dễ khác biệt do xô lệch khi chụp quét) Cơ chế xử lý ở đây là xây dựng một biểu diễn đồ thị từ một ảnh vân tay, trong đó mỗi đỉnh là một dạng đặc trưng xác định trước(ví dụ như chóp uốn) Vì vậy bài toán nhận dạng dấu vân tay có thể chuyển về thành một vấn đề thuật toán kinh điển là so khớp đồ thị(graph matching).

Có thể sử dụng theo hai cách – so khớp về giọng và so khớp về nội dung So khớp giọng nói là so khớp với các mẫu đã được ghi nhận trong cơ sở dữ liệu hệ thống Kỹ thuật này được thực hiện thông qua việc phân tích chiết suất các đặc tính tín hiệu và từ đó thực hiện các phép kiểm tra giả thiết thống kê(statistical hypothesis) Ngược lại so khớp nội dung không quan tâm đến người nói mà chỉ cần kiểm tra nội dung của câu trả lời có phù hợp câu hỏi hay không.

2.4 Mắt Ảnh võng mạc mặt cũng được xem là dấu hiệu xác định duy nhất cho từng người Ảnh có thể thu được thông qua máy chụp(khi nhìn vào khe chỉ định của máy đo), sau đó được phân tích để xác định các yếu tố đặc trưng Các phép kiểm tra giả thiết thống kê cũng được sử dụng để loại bỏ sự trùng khớp ngẫu nhiên.

Tương tự các phương pháp trên, khi mặt được giữ cố định, người ta có các thiết bị để chụp và chiết xuất các yếu tố đặc trưng cần thiết mà tổ hợp của chúng được cho là có thể xác định duy nhất đối tượng.

2.6 Mẫu gõ phím(keystroke pattern)

Mặc dù đây là một quá trình động, việc theo dõi ghi nhận tốc độ, các khoảng trễ trong khi gõ phím có thể đưa lại những mẫu gõ phím mang tính đặc trưng của mỗi người Các đặc trưng chiết xuất(mẫu gõ) cũng có thể được sử dụng để so khớp với mẫu có sặc để sử dụng vào xác thực.

Khái niệm về Eigenface

Eigenface là một khái niệm trong lĩnh vực xử lý ảnh và nhận dạng khuôn mặt.

Nó được giới thiệu lần đầu tiên bởi Matthew Turk và Alex Pentland vào năm

Eigenface là một tập hợp các khuôn mặt ảo được tạo ra bằng cách sử dụng phân tích thành phần chính (PCA - Principal Component Analysis) Ý tưởng cơ bản của eigenface là xác định các thành phần chính trong một tập hợp các khuôn mặt và sử dụng chúng để biểu diễn một khuôn mặt mới

Quá trình xây dựng eigenface bao gồm các bước sau:

 Thu thập và chuẩn bị dữ liệu: Thu thập một tập hợp các khuôn mặt huấn luyện từ các nguồn khác nhau Các khuôn mặt này cần được chụp trong cùng một điều kiện ánh sáng và góc nhìn Sau đó, các khuôn mặt được chuẩn hóa để đảm bảo kích thước và độ tương phản đồ nhất

 Xây dựng ma trận ảnh: Các khuôn mặt huấn luyện được biểu diễn dưới dạng các ma trận ảnh 2D, trong đó mỗi hàng biểu diễn một khuôn mặt Các giá trị trong ma trận ảnh thể hiện cường độ của mỗi pixel trong khuôn mặt

 Phân tích thành phần chính (PCA): Áp dụng phương pháp PCA để phân tích các thành phần chính của ma trận ảnh PCA sẽ tìm các vectơ riêng (eigenvectors) và giá trị riêng (eigenvalues) của ma trận hiệp phương sai của dữ liệu, Các eigenvectors tương ứng với các eigenvalues lớn nhất đại diện cho các eigenfaces.

 Xác định eigenfaces: Các eigenvectors được sắp xếp theo thứ tự giảm dần của eigenvalues Các eigenvectors hàng đầu (có eigenvalues lớn nhất) được chọn làm eigenfaces Mỗi eigenface là một vectơ hàng.

 Biểu diễn khuôn mặt mới: Để biểu diễn một khuôn mặt mới, ta transform khuôn mặt đó thành một vectơ và tính toán trọng số tương ứng với mỗi eigenface Trong số này thể hiện độ tương quan của khuôn mặt mới với các eigenfaces

 Nhận dạng và so sánh: Để nhận dạng một khuôn mặt mới, ta tính toán trọng số của khuôn mặt đó trong không gian eigenface và so sánh với trọng số của các khuôn mặt huấn luyện đã biết trước Khuôn mặt nới được gán nhãn của khuôn mặt có trọng số tương tự nhất.

3.1 Kỹ thuật PCA (Phân tích thành phần chính)

Eigenface dựa trên kỹ thuật PCA để phân tích và trích xuất các thành phần quan trọng từ tập hợp các khuôn mặt PCA giúp giảm chiều dữ liệu và tìm ra các trục chính trong không gian dữ liệu Các thành phần chính (eigenvectors) tương ứng với eigenfaces, là các hướng quan trọng trong không gian khuôn mặt

3.2 Biểu diễn dữ liệu khuôn mặt

Mỗi khuôn mặt trong tập huấn luyện có thể được biểu diễn dưới dạng một vectơ, bằng cách chồng các giá trị pixel của khuôn mặt thành một vectơ hàng Vi dụ, nếu kích thước của mỗi khuôn mặt là 64x64 pixel, vectơ biểu diễn khuôn mặt sẽ có kích thước 1x4096.

3.3 Sự quan trọng của eigenfaces

Các eigenfaces hàng đầu tương ứng với các eigenvalues lớn nhất chứa thông tin quan trọng về transform và biểu diễn các khuôn mặt Các eigenfaces có eigenvalues nhỏ tương ứng với các thành phần ít quan trọng hơn

3.4 Giảm kích thước dữ liệu

Eigenface cho phép giảm kích thước dữ liệu ban đầu bằng cách chỉ lưu trữ một số lượng nhỏ eigenfaces hàng đầu Điều này giúp giảm bộ nhớ và tăng tốc độ xử lý khi thực hiện quá trình nhận dạng

Mặc dù eigenface có những ưu điểm, nhưng nó cũng có một số hạn chế.

Ví dụ, eigenface không nhạy cảm với các biến thể về góc nhìn, ánh sáng hoặc biểu thức khuôn mặt Nếu một khuôn mặt mới khác biệt quá nhiều so với các khuôn mặt huẩn luyện, eigenface có thể không đưa ra kết quả chính xác.

4 Vấn đề tính riêng tư với xác thực sinh trắc học

Một báo cáo năm 2020 của Văn phòng Giải trình Chính phủ Mỹ cho biết Cục Hải quan và Biên phòng Mỹ (CBP) đã “không cung cấp đầy đủ thông tin trong các thông báo về quyền riêng tư đối với quy trình kiểm tra sinh trắc học hoặc đảm bảo thông tin về sinh trắc học được công bố đầy đủ đến mọi du khách"

Matthew Kugler, phó giáo sư luật tại Đại học Northwestern, người đã nghiên cứu về quyền riêng tư sinh trắc học và tội phạm mạng, cho biết: “Nếu bạn muốn nhận được sự đồng ý, ít nhất bạn cần phải công khai những gì bạn đang làm và công khai rõ ràng Chính phủ cũng nên thông báo ngay cho hành khách cách họ có thể chọn không tham gia vào quy trình kiểm tra sinh trắc học"

Và mặc dù những người ủng hộ giải pháp sàng lọc bảo mật sinh trắc học thường khẳng định kiểm tra sinh trắc học có mức độ chính xác cao, nhưng điều đó có thể gây hiểu nhầm Vào năm 2017, các thượng nghị sĩ Edward Markey và Mike Lee đã chỉ ra rằng, ngay cả với tỷ lệ chính xác 96%, thì cứ 25 du khách, công nghệ này vẫn sẽ nhận dạng sai một du khách Theo người phát ngôn của CBP, quy trình này hiện khớp chính xác hơn 98% thời gian

State of the Art (SOTA)

State of the Art (SOTA) là thuật ngữ được sử dụng để chỉ trạng thái của nghệ thuật, công nghệ, hoặc lĩnh vực nghiên cứu đang đạt được hiệu suất, tiến bộ, hoặc thành tựu tốt nhất tới thời điểm hiện tại

Trong mỗi lĩnh vực, có sự phát triển liên tục và các nghiên cứu mới được công bố State of the Art là mức tiến bộ cao nhất mà các nhà nghiên cứu, nhà phát triển, hoặc cộng đồng trong lĩnh vực đó đã đạt được tại thời điểm hiện tại Nó thường được xác định bằng cách so sánh và đánh giá các phương pháp, công nghệ, hoặc kỹ thuật hiện có dựa trên các tiêu chí như hiệu suất, độ chính xác, tốc độ, hoặc các yếu tố khác liên quan Nó đại diện cho tiêu chuẩn tốt nhất hiện có và có thể được sử dụng làm điểm tham chiếu để so sánh và đánh giá các phương pháp hoặc công nghệ mới

Trong lĩnh vực nhận diện khuôn mặt, State of the Art (SOTA) thường được đo bằng các phương pháp và thuật toán đạt được độ chính xác và hiệu suất cac nhất trên các tập dữ liệu và thử nghiệm cụ thể SOTA trong nhận diện khuôn mặt thường được cập nhật liên tục khi có sự tiến bộ trong lĩnh vực này Dưới đây l một số ví dụ về SOTA trong nhận diện khuôn mặt:

 Deep Neural Networks - DNN: Trong nhận diện khuôn mặt, các mạng nơ-ron sâu như Convolutional Neural Networks (CNN) đã đạt được hiệu suất cao và được coi là SOTA trong nhiều nhiệm vụ nhân viện khuôn mặt Các mạng nơ-ron sâu này sử dụng lớp tích chập để học các đặc trưng của khuôn mặt và thực hiện phân loại hoặc nhận dạng.

 Deep Metric Learning: Phương pháp này tập trung vào việc học các không gian biểu diễn chung cho các khuôn mặt và khoảng cách giữa chúng Điều này giúp tạo ra những biểu diễn mà các khuôn mặt của cùng một người gần nhau hơn so với các khuôn mặt của những người khác. Phương pháp này đã đạt được kết quả tốt và được coi là SOTA trong việc nhận diện khuôn mặt trong các tình huống đa người

 Attention-based models: được áp dụng trong việc nhận diện khuôn mặt để tập trung vào các phần quan trọng của khuôn mặt như mắt, mũi, miệng Điều này giúp cải thiện độ chính xác và hiệu suất của hệ thống nhận diện khuôn mặt Các mô hình attention đã đạt được kết quả tốt và được coi là SOTA trong một số thách thức nhận diện khuôn mặt khó khăn

 Kết hợp các phương pháp: Ngoài ra, để đạt được kết quả tốt hơn, các nghiên cứu đã kết hợp nhiều phương pháp và kỹ thuật như mạng nơ-ron sâu, học sâu học đại diện và mô hình attention Kết hợp các phương pháp này đã đạt được SOTA trong nhiều nhiệm vụ nhận diện khuôn mặt khó khăn như nhân diện khuôn mặt ở góc nhìn chéo, trong điều kiện ánh sáng yếu hoặc với các transform khác nhau của khuôn mặt

Lưu ý rằng SOTA có thể thay đổi theo thời gian và phụ thuộc vào các bộ dữ liệu và tiêu chuẩn đánh giá được sử dụng Do đó, để nắm bắt SOTA trong nhận diện khuôn mặt, nên tham khảo các công trình nghiên cứu mới nhất và các cuộc thi hoặc thứ nghiệm đánh giá hàng đầu trong lĩnh vực này.

6 Một số khái niệm khác liên quan

Mã hóa đồng cầu là một phương pháp mật mã hóa đặc biệt mà cho phép các phép tính được thực hiện trên dữ liệu đã được mã hóa mà không cần giải mã. Điều này rất hữu ích trong nhiều tình huống, đặc biệt là khi đòi hỏi tính riêng tư và bão mặt của dữ liệu.

Trong môi trường mã hóa đồng cầu, hai phép tính quan trọng là phép cộng và phép nhân có thể được thực hiện trực tiếp trên các giá trị đã được mã hóa mà không cần biết giá trị gốc Kết quả của các phép tính này sau đó có thể được giải mã để nhận được kết quả cuối cùng.

Một số ứng dụng quan trọng:

 Bảo vệ quyền riêng tư: Mã hóa đồng cấu cho phép xử lý dữ liệu mà không tiết lộ thông tin nhạy cảm Điều này rất hữu ích trong các lĩnh vực như y tế, tài chính và điện toán đám mây, nơi đã liệu cần được bảo vệ khỏi việc truy cập trái phép

 Xử lý dữ liệu phân tán: Trong môi trường phân tán, nhiều bên có thể tham gia vào xử lý dữ liệu chung mà không cần tiết lộ thông tin của họ.

Mã hóa đồng cầu cho phép các bên thực hiện các phép tính trên dữ liệu đã mã hóa mà không cần n truy cập đến dü liệu gốc.

 Mật mã đám mây: Mã hóa đồng cầu cũng được sử dụng trong mô hình mật mã đám mây, nơi dữ liệu được lưu trữ và xử lý trên các máy chủ đám mây mà không cần tiết lộ cho các nhà cung cấp dịch vụ đám mây

Một số hạn chế và thách thức:

 Hiệu suất tính toán: Phương pháp mã hóa đồng cầu thường có tính toán phức tạp và yêu cầu tài nguyên tính toán cao hơn so với các phương pháp mã hóa truyền thống Điều này có thể ảnh hưởng đến hiệu suất và tốc độ xử lý của hệ thống

 Kích thước mã hóa: Dữ liệu sau khi được mã hóa thường có kích thước lớn hơn so với dữ liệu gốc Điều này có thể tạo ra các vấn đề về lưu trữ và truyền dữ liệu trong một môi trường phân tần

Kết luận

Công nghệ sinh trắc học đóng vai trò quan trọng trong việc xác định và xác minh danh tính của con người dựa trên các đặc điểm sinh trắc học duy nhất của họ Ưu thế của công nghệ sinh trắc học bao gồm:

 Độ tin cậy cao: Các đặc điểm sinh trắc học như vân tay, khuôn mặt, võng mạc, giọng nói, hình dạng cơ thể, hình dạng ký tự viết tay và nhận diện hình mạch máu não đều là duy nhất và không thể sao chép hoặc mô phỏng dễ dàng Điều này giúp công nghệ sinh trắc học đạt được độ tin cậy cao trong việc xác định và xác mình danh tính

 Bảo mật cao: Các đặc điểm sinh trắc học là thông tin cá nhân đặc biệt và không thể thay đổi dễ dàng Vì vậy, công nghệ sinh trắc học mang đến mức độ bảo mật cao hơn so với các phương pháp xác định danh tính truyền thống dựa trên mật khẩu hoặc thẻ thông minh

 Đa dạng và linh hoạt: Công nghệ sinh trắc học có thể áp dụng cho nhiều đặc điểm sinh trắc học khác nhau, cho phép lựa chọn và kết hợp các phương pháp phù hợp với mục đích sử dụng Người dùng có thể chọn sử dụng một hoặc nhiều đặc điểm sinh trắc học để tăng cường tính bảo mật và đáng tin cậy

 Tiện lợi và tốc độ xử lý: Công nghệ sinh trắc học đã phát triển và tiến bộ đáng kể trong việc tăng cường hiệu suất và tốc độ xử lý Các công nghệ và thuật toán mới đã giúp rút ngắn thời gian xác mình và cải thiện trải nghiệm người dùng

 Ứng dụng đa dạng: Công nghệ sinh trắc học được áp dụng rộng rãi trong các lĩnh vực như an ninh, quản lý lưu trữ và truy cập thông tin, đăng ký và xác minh thông tin cá nhân, y tế, ngân hàng và tài chính, giao thông vận tải và nhiều lĩnh vực khác Việc sử dụng công nghệ sinh trắc học giúp tăng cường bảo mật, hiệu quả và thuận tiện trong các quy trình và dịch vụ liên quan đến xác định danh tính

Mặc dù mang lại nhiều lợi ích lớn, nhưng công nghệ sinh trắc học vẫn còn một số lĩnh vực cần cải tiến, nhằm đảm bảo các vấn đề như tỉnh riêng tư khỏi các mối hiểm họa tiềm tàng.

Bảo vệ tính riêng tư cho mô hình xác thực sinh trắc khuôn mặt

Sử dụng MTCNN phát hiện khuôn mặt

MTCNN là viết tắt của "Multi-task Cascaded Convolutional Networks," một mô hình được sử dụng trong lĩnh vực thị giác máy tính để phát hiện khuôn mặt và các điểm đặc trưng liên quan trên khuôn mặt, như mắt, mũi và miệng.

Mô hình này được thiết kế để thực hiện nhiều nhiệm vụ cùng một lúc, bao gồm việc xác định vùng chứa khuôn mặt và xác định vị trí chính xác của các điểm đặc trưng.

MTCNN thường được sử dụng trong các ứng dụng nhận diện khuôn mặt, như trong hệ thống nhận diện khuôn mặt tự động, ứng dụng thay đổi khuôn mặt trong thời gian thực, và các hệ thống giám sát an ninh Mô hình này là một trong những công cụ phổ biến cho việc xử lý ảnh và thị giác máy tính, giúp nhận diện và trích xuất thông tin từ hình ảnh khuôn mặt.

2.2 Cấu trúc của mô hình MTCNN

Hình 2: Sơ đồ hoạt động của MTCNN

Cấu trúc MTCNN bao gồm 3 mạng CNN (Convolutional NeuralNetworks) xếp chồng và đồng thời hoạt động khi phát hiện và xác định khuôn mặt Mỗi mạng CNN trong MTCNN có cấu trúc và vai trò khác nhau trong việc phát hiện khuôn mặt Kết quả dữ liệu đầu ra của MTCNN là véc-tơ đặc trưng biểu diễn cho vị trí khuôn mặt việc được xác định trong bức ảnh (mắt, mũi, miệng, )

MTCNN hoạt động theo 3 bước với 3 mạng nơ-ron riêng cho mỗi bước (P-Net, R-Net và O-Net) Khi sử dụng, MTCNN sẽ cho phép tạo ra nhiều bản sao của hình ảnh đầu vào, với các kích thước khác nhau để làm dữ liệu đầu vào.

Tầng 1: Sử dụng mạng CNN, gọi là Mạng đề xuất (P-Net), để thu được các cửa số chứa khuôn mặt và các vectơ hồi quy trong các cửa sổ đó Tiếp theo, các cửa sổ chứa khuôn mặt được hiệu chuẩn dựa trên các vector hồi quy. Cuối cùng, những cửa sổ xếp chồng nhau tại một vùng được hợp nhất thành một cửa sổ Kết quả đầu ra là các cửa số có thể chứa khuôn mặt.

Hình 3: Mạng đề xuất (P-Net)

Mạng P-Net sử dụng kiến trúc CNN gồm 3 lớp tích chập và 1 lớp co. Đầu vào cửa sổ trượt với kích thước 12x12x3 (với 3 tương ứng với 3 màu: Đỏ, xanh lục, xanh lam trong hệ màu RGB thông thường) Kết quả của P-Net gồm

- Cụm thứ nhất có 2 bộ lọc kích thước 1x1 nhận dạng khuôn mặt

- Cụm thứ hai có 4 bộ lọc kích thước 1x1 đóng khung 4 vị trí hộp giới hạn.

- Cụm thứ ba có 10 bộ lọc kích thước 1x1 đóng khung 10 vị trí khuôn mặt.

Tầng 2: Tất cả các cửa sổ chứa khuôn mặt từ tầng 1 sẽ được sàng lọc bằng cách đưa vào một CNN khác gọi là Mạng lọc (R-Net) để tiếp tục loại bỏ một số lượng lớn các cửa sổ không chứa khuôn mặt Sau đó, thực hiện hiệu chuẩn với véc-tơ hồi quy và thực hiện hợp nhất các cửa sổ xếp chồng nhau tại một vùng.

Trong bước R-Net sử dụng kiến trúc CNN gồm: 3 lớp tích chập, 2 lớp co và 1 lớp kết nối đầy đủ Đầu vào cửa số trượt với kích thước 24x24x3 (3 tương ứng với 3 màu: Đỏ, xanh lục, xanh lam trong hệ màu RGB thông thường) Kết quả của R-Net phân được 3 cụm:

- Cụm thứ nhất có 2 lớp nhận dạng khuôn mặt.

- Cụm thứ hai có 4 lớp đánh dấu vị trí hộp giới hạn.

- Cụm thứ ba có 10 lớp vị trí khuôn mặt.

Tầng 3: Tầng này tương tự như tầng 2, sử dụng CNN chi tiết nhất được gọi là Mạng đầu ra (O-Net) để lọc kết quả một lần nữa và đánh dấu vị trí năm điểm chính trên khuôn mặt.

Hình 5: Mạng đầu ra (O-Net)

Mạng O-Net sử dụng CNN gồm: 4 lớp tích chập, 2 lớp co, 1 lớp kết nối đầy đủ Đầu vào cửa sổ trượt có kích thước 48x48x3 (trong đó số 3 tương ứng với 3 màu: Đỏ, xanh lục, xanh lam trong hệ màu RGB thông thường) Kết quả của O-Net phân được 3 cụm:

- Cụm thứ nhất có 2 lớp nhận dạng khuôn mặt.

- Cụm thứ hai có 4 lớp đánh dấu vị trí hộp giới hạn.

- Cụm thứ ba có 10 lớp vị trí khuôn mặt. Ứng dụng MTCNN để phát hiện khuôn mặt cho phép xác định khuôn mặt trong bức ảnh tốt hơn so với các phương pháp khác.

3 Thuật toán FaceNet nhận dạng khuôn mặt

Các thuật toán nhận dạng khuôn mặt trước đây chủ yếu biểu diễn khuôn mặt bằng một vectơ đặc trưng và thông qua một lớp bottleneck để giảm số chiều dữ liệu. Tuy nhiên, số chiều dữ liệu của vectơ đặc trưng thường tương đối lớn nên sẽ làm cho tốc độ nhận dạng giảm xuống Vì vậy, thuật toán PCA thường được áp dụng để giảm số chiều dữ liệu của vectơ đặc trưng và tăng tốc độ nhận dạng Đồng thời, trong các phương pháp nhận dạng thì hàm loss function thường chỉ xác định khoảng cách giữa

2 bức ảnh (đại lượng mô tả sự giống nhau của hai bức ảnh) Như vậy, xuất hiện vấn đề là trong một lần huấn luyện chỉ có thể học được một kết quả, hoặc là giống nhau nếu hai bức ảnh thuộc về hai lớp riêng.

FaceNet là một thuật toán hỗ trợ cho việc nhận dạng và phân cụm khuôn mặt cho phép giải quyết các hạn chế nêu trên FaceNet sử dụng một mạng CNN và cho phép giảm số chiều dữ liệu của vectơ đặc trưng (thường sử dụng là 128 chiều) Do đó, cho phép tăng tốc độ huấn luyện và xử lý mà độ chính xác vẫn được đảm bảo. Đối với thuật toán FaceNet, hàm loss function sử dụng hàm triplet loss cho phép khắc phục hạn chế của các phương pháp nhận dạng trước đây, quá trình huấn luyện cho phép học được đồng thời: Sự giống nhau giữa hai bức ảnh (nếu hai bức ảnh cùng một lớp) và sự khác nhau giữa hai bức ảnh (nếu chúng không cùng một lớp).

Đảm bảo tính riêng tư trong hệ thống sinh trắc học

4.1 Tầm quan trọng của mã hóa ảnh

Hệ thống sinh trắc học ngày càng trở thành một phần quan trọng trong xã hội hiện đại, đặc biệt là khi nó liên quan đến việc xử lý dữ liệu ảnh cá nhân. Tính riêng tư của người dùng trong quá trình này trở thành mối quan tâm hàng đầu, đặc biệt là khi những dữ liệu này có thể chứa những thông tin nhạy cảm về đặc điểm sinh trắc học cá nhân.

Mã hóa ảnh đóng một vai trò quan trọng trong việc bảo vệ tính riêng tư của người dùng trong hệ thống sinh trắc học Việc chuyển đổi dữ liệu ảnh thành dạng mã hóa không chỉ giúp ngăn chặn truy cập trái phép mà còn đảm bảo rằng những thông tin cá nhân không bị rò rỉ trong quá trình lưu trữ và truyền tải.

4.2 Phương thức mã hóa SEAL

• Phương Thức Mã Hóa SEAL: Simple Encrypted Arithmetic Library, là một thư viện mã hóa số học đơn giản được phát triển bởi Microsoft Research Thư viện này được thiết kế để cung cấp các công cụ và thuật toán mã hóa số học hiệu quả để bảo vệ tính riêng tư của dữ liệu trong quá trình xử lý.

• SEAL chủ yếu được sử dụng trong lĩnh vực tính toán đa bên và tính toán đám mây, nơi các bên muốn thực hiện các phép toán trên dữ liệu mà không cần giải mã nó Điều này giúp giảm rủi ro liên quan đến rò rỉ thông tin nhạy cảm trong khi vẫn giữ tính toàn vẹn và tính bảo mật của dữ liệu.

 An Toàn Mã Hóa: SEAL cung cấp một cơ sở hạ tầng mạnh mẽ cho mã hóa đối xử, giúp bảo vệ tính toán và dữ liệu trước các mối đe dọa an ninh.

 Phù Hợp Cho Tính Toán Đa Bội: SEAL được thiết kế để hỗ trợ tính toán đa bội, đặc biệt là quan trọng trong các ứng dụng sinh trắc học nơi có yêu cầu cao về xử lý đa bên và đa bội.

 Bảo Vệ Dữ Liệu Trong Quá Trình Xử Lý: SEAL cho phép thực hiện các phép toán trên dữ liệu được mã hóa mà không cần giải mã nó, giảm rủi ro bị tiết lộ thông tin quan trọng trong quá trình xử lý.

 Bảo Mật Tích Hợp với Môi Trường Đám Mây và IoT: SEAL được thiết kế để làm việc hiệu quả trong các môi trường đám mây và IoT, nơi tính linh hoạt và bảo mật cao là quan trọng.

 Tiêu Chuẩn Bảo Mật Cao: SEAL tuân thủ các tiêu chuẩn bảo mật cao, nhưng cũng cung cấp khả năng tinh chỉnh để đáp ứng các yêu cầu cụ thể của hệ thống.

 Quản Lý Quyền Truy Cập: SEAL giúp kiểm soát quyền truy cập vào dữ liệu bằng cách giữ thông tin dưới dạng mã hóa và chỉ mở khóa khi cần thiết.

 Hỗ Trợ Bảo Mật Ngôn Ngữ Lập Trình: SEAL hỗ trợ nhiều ngôn ngữ lập trình, giúp tích hợp và triển khai một cách linh hoạt trong nhiều hệ thống và ứng dụng khác nhau.

 Hiệu Suất Cao: Mặc dù thực hiện các phép toán trên dữ liệu mã hóa, SEAL được tối ưu hóa để đảm bảo hiệu suất cao, giảm thiểu tác động đến trải nghiệm người dùng và thời gian xử lý.

 Độ Tin Cậy và Ổn Định: SEAL đã được sử dụng rộng rãi trong các ứng dụng an ninh, đảm bảo độ tin cậy và ổn định trong quá trình sử dụng.

Chọn SEAL để bảo vệ tính riêng tư trong hệ thống sinh trắc học không chỉ là việc áp dụng một thư viện mã hóa mạnh mẽ mà còn là sự đầu tư vào một giải pháp an ninh tiên tiến và linh hoạt.

4.3 Cách thức hoạt động của thuật toán AESGM trong hệ thống

SEAL (Simple Encrypted Arithmetic Library) có thể được tích hợp vào hệ thống sinh trắc học bằng khuôn mặt để bảo vệ tính riêng tư thông tin cá nhân và đảm bảo an toàn trong quá trình xử lý dữ liệu Dưới đây là cách SEAL hoạt động trong ngữ cảnh của hệ thống sinh trắc học bằng khuôn mặt:

Tiêu đề	Xây dựng Hệ thống Sinh trắc học Đảm bảo Tính Riêng tư
Tác giả	Nguyễn Thị Bích Tuệ, Trần Văn Hùng
Người hướng dẫn	Thầy Trần Anh Tú
Trường học	Học viện Kỹ thuật Mật mã, Khoa An toàn Thông tin
Chuyên ngành	Công nghệ phần mềm an toàn
Thể loại	Báo cáo chuyên đề
Năm xuất bản	2023
Thành phố	Hà Nội

Định dạng
Số trang	51
Dung lượng	2,14 MB