1. Trang chủ
  2. » Luận Văn - Báo Cáo

tiểu luận bảo mật thông tin tìm hiểu về hệ thống nhận dạng sinh trắc học bằng chữ ký viết tay

27 0 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 27
Dung lượng 2,59 MB

Nội dung

1.2 Ưu điểmNhận dạng bằng chữ ký mang lại nhiều ưu điểm, bao gồm:- Độc nhất vô nhị: Mỗi người có một cách viết riêng biệt và không giống aikhác, giống như một dấu vân tay nên chữ ký trở

Trang 1

TIỂU LUẬN MÔN: BẢO MẬT THÔNG TIN

TÌM HIỂU VỀ HỆ THỐNG NHẬN DẠNG SINH TRẮC HỌC BẰNG CHỮ KÝ VIẾT

TAY

Người hướng dẫn: TS HUỲNH NGỌC TÚ Người thực hiện: NGUYỄN HOÀI AN – 52100001

NGUYỄN VĂN HÀO – 52100792

LÊ GIA HUY – 52100033 Lớp : 21050201 Khoá : 25

THÀNH PHỐ HỒ CHÍ MINH, NĂM 2024

Trang 2

TIỂU LUẬN MÔN: BẢO MẬT THÔNG TIN

TÌM HIỂU VỀ HỆ THỐNG NHẬN DẠNG SINH TRẮC HỌC BẰNG CHỮ KÝ VIẾT

TAY

Người hướng dẫn: TS HUỲNH NGỌC TÚ Người thực hiện: NGUYỄN HOÀI AN – 52100001

NGUYỄN VĂN HÀO – 52100792

LÊ GIA HUY – 52100033 Lớp : 21050201 Khoá : 25

THÀNH PHỐ HỒ CHÍ MINH, NĂM 2024

Trang 3

LỜI CẢM ƠN

Lời đầu tiên, chúng em xin gửi lời cảm ơn chân thành đến Cô Huỳnh Ngọc Tú –Giảng viên khoa Công nghệ thông tin – Trường đại học Tôn Đức Thắng, đã hỗ trợ vàgiúp đỡ nhiệt tình trong quá trình thực hiện tiểu luận này

Chúng em trân trọng cảm ơn Thầy Cô giảng viên Trường đại học Tôn ĐứcThắng nói chung cũng như Thầy Cô giảng viên khoa Công nghệ thông tin nói riêng đãgiảng dạy và truyền đạt nhiều kinh nghiệm quý trong suốt quá trình học tập tại trường.Mặc dù rất cẩn thận trong quá trình thực hiện nhưng cũng không thể tránh khỏinhững thiếu sót Chúng em rất mong nhận được sự góp ý từ các Thầy/Cô để bài tiểuluận được hoàn thiện hơn

Chúng em chân thành cảm ơn!

Trang 4

TIỂU LUẬN ĐƯỢC HOÀN THÀNH

TẠI TRƯỜNG ĐẠI HỌC TÔN ĐỨC THẮNG

Tôi xin cam đoan đây là bài tiểu luận của riêng chúng tôi và được sự hướng dẫncủa TS Huỳnh Ngọc Tú; Các nội dung nghiên cứu, kết quả trong đề tài này là trungthực và chưa công bố dưới bất kỳ hình thức nào trước đây Những số liệu trong cácbảng biểu phục vụ cho việc phân tích, nhận xét, đánh giá được chính tác giả thu thập từcác nguồn khác nhau có ghi rõ trong phần tài liệu tham khảo

Ngoài ra, trong tiểu luận còn sử dụng một số nhận xét, đánh giá cũng như sốliệu của các tác giả khác, cơ quan tổ chức khác đều có trích dẫn và chú thích nguồngốc

Nếu phát hiện có bất kỳ sự gian lận nào chúng tôi xin hoàn toàn chịu trách nhiệm về nội dung tiểu luận của mình Trường đại học Tôn Đức Thắng không liên

quan đến những vi phạm tác quyền, bản quyền do chúng tôi gây ra trong quá trình thựchiện (nếu có)

TP Hồ Chí Minh, ngày tháng năm

Tác giả (ký tên và ghi rõ họ tên)

Nguyễn Văn B

Trần Văn C

Trang 5

PHẦN XÁC NHẬN VÀ ĐÁNH GIÁ CỦA GIẢNG VIÊN

Phần xác nhận của GV hướng dẫn

_ _ _ _ _ _ _

Tp Hồ Chí Minh, ngày tháng năm (kí và ghi họ tên)

Phần đánh giá của GV chấm bài

_ _ _ _ _ _ _

Tp Hồ Chí Minh, ngày tháng năm (kí và ghi họ tên)

Trang 6

TÓM TẮT

Trình bày tóm tắt vấn đề nghiên cứu, các hướng tiếp cận, cách giải quyết vấn đề

và một số kết quả đạt được, những phát hiện cơ bản trong vòng 1 -2 trang

Trang 7

MỤC LỤC

LỜI CẢM ƠN I PHẦN XÁC NHẬN VÀ ĐÁNH GIÁ CỦA GIẢNG VIÊN III TÓM TẮT IV

MỤC LỤC 1

DANH MỤC KÍ HIỆU VÀ CHỮ VIẾT TẮT 3

DANH MỤC CÁC BẢNG BIỂU, HÌNH VẼ, ĐỒ THỊ 4

CHƯƠNG 1 – TỔNG QUAN 5

1.1 GIỚI THIỆU 5

1.2 Ư U ĐIỂM 6

1.3 THÁCH THỨC 6

1.4 GIẢI PHÁP 7

CHƯƠNG 2 – CƠ SỞ LÝ THUYẾT 7

2.1 CHỮ KÝ VIẾT TAY 7

2.1.1 Đặc điểm 7

2.1.2 Tính duy nhất của chữ ký 8

2.2 PHƯƠNG PHÁP NHẬN DẠNG CHỮ KÝ 8

2.2.1 Thu thập dữ liệu chữ ký viết tay 8

2.2.2 Xử lý và tiền xử lý dữ liệu thu thập 9

2.2.3 Xác định và so khớp 10

2.3 NGUYÊN LÝ HOẠT ĐỘNG CỦA HỆ THỐNG 10

2.3.1 Cách hoạt động 10

2.3.2 Các mô hình phổ biến 13

2.4 MÔ HÌNH NEURAL NETWORKS 14

2.4.1 Giai đoạn tiền xử lý dữ liệu 14

2.4.2 Giai đoạn trích xuất đặc trưng 16

2.4.3 Tạo vector đặc trưng 18

2.4.4 Huấn luyện mạng nơ-ron 18

CHƯƠNG 3 – KẾT LUẬN 18

3.1 TÍNH KHẢ THI 18

3.2 Đ Ộ TIN CẬY VÀ BẢO MẬT 19

3.3 ỨNG DỤNG 19

Trang 8

TÀI LIỆU THAM KHẢO 21

Trang 9

DANH MỤC KÍ HIỆU VÀ CHỮ VIẾT TẮTCÁC KÝ HIỆU

f Tần số của dòng điện và điện áp (Hz)

Trang 10

DANH MỤC CÁC BẢNG BIỂU, HÌNH VẼ, ĐỒ THỊ DANH MỤC HÌNH

Hình 1 Sơ đồ các dạng bảo mật bằng sinh trắc học 5

Hình 2 Kiến trúc của một mô hình nhận dạng chữ ký 11

Hình 3 Mô tả thuật toán random forest 12

Hình 4 Mẫu training set trong mô hình random forest 12

Hình 5 Áp dụng nhận dạng chữ ký bằng mô hình random forest 13

Hình 6 Chuẩn hoá kích thước ảnh 15

Hình 7 Làm mỏng ảnh 15

Hình 8 Tạo hộp bao quanh 16

Hình 9 Tính toán đặc trưng bề mặt 3 phần 17

Hình 10 Tính toán đặc trưng bề mặt 6 phần 17

Trang 11

CHƯƠNG 1 – TỔNG QUAN

1.1 Giới thiệu

Ngày nay, nhu cầu về an ninh đang tăng cao trên toàn cầu từ cả cá nhân và tổchức An ninh mạng đã trở thành một trong những vấn đề quan trọng nhất trong thờiđại kỹ thuật số và công nghệ 4.0 hiện nay Một trong những phương pháp quan trọngthường được sử dụng để cung cấp an ninh cho các ứng dụng kỹ thuật số là bảo mật sinhtrắc học

Bảo mật sinh trắc học được định nghĩa bởi các đặc điểm của con người giúpphân biệt giữa mọi người với nhau Bảo mật sinh trắc học có thể phân loại thành 2 loại

là sinh lý hoặc hành vi Khuôn mặt con người, võng mạc, vân tay và con ngươi đượccoi là các đặc điểm sinh lý không thể thay đổi trong khi giọng nói, lực gõ phím và chữ

ký bằng tay, được coi là ví dụ về đặc điểm về hành vi

Hình 1 Sơ đồ các dạng bảo mật bằng sinh trắc học.

Trang 12

Nhận dạng sinh trắc học bằng chữ ký viết tay là quá trình xác định và xác thực

cá nhân dựa trên các đặc điểm độc nhất của việc viết tay của họ

1.2 Ưu điểm

Nhận dạng bằng chữ ký mang lại nhiều ưu điểm, bao gồm:

- Độc nhất vô nhị: Mỗi người có một cách viết riêng biệt và không giống aikhác, giống như một dấu vân tay nên chữ ký trở thành một đặc điểm độc nhất của mỗingười

- Dễ tiếp cận: So với một số phương pháp nhận dạng sinh trắc học khác như vântay hoặc mống mắt, việc thu thập và xác định chữ ký viết tay thường dễ dàng hơn vàkhông đòi hỏi các thiết bị đặc biệt

- Tính khả diễn giải: Chữ ký có thể được dễ dàng kiểm tra và đối chiếu bởi conngười mà không cần các công nghệ phức tạp Điều này làm cho quá trình xác thực trởnên nhanh chóng và hiệu quả

- Ứng dụng đa dạng: Chữ ký có thể được sử dụng trong nhiều lĩnh vực khácnhau như giao dịch tài chính, hợp đồng, biên nhận, xác thực truy cập, và các quy trìnhhành chính khác

- An toàn và bảo mật: Việc sử dụng chữ ký giúp bảo vệ thông tin cá nhân và dữliệu quan trọng bằng cách xác định chính xác người ký và ngăn chặn việc gian lận

- Khả năng giả mạo: Mặc dù chữ ký được xem là độc nhất vô nhị, nhưng nókhông hoàn toàn miễn nhiễm với việc sao chép hoặc giả mạo Có thể có các kỹ thuậtgiả mạo chữ ký như làm giả hoặc sao chép chữ ký từ một người khác

Trang 13

- Cần có dữ liệu đủ lớn: Để xây dựng mô hình nhận dạng chữ ký chính xác, cần

có một tập dữ liệu lớn và đa dạng của các chữ ký từ nhiều người khác nhau Việc thuthập và quản lý dữ liệu đó có thể tốn kém và đòi hỏi nhiều công sức

- Yếu tố kỹ thuật: Việc sử dụng công nghệ để thu thập và xác định chữ ký đòihỏi các thiết bị phức tạp và chi phí Hơn nữa, các phần mềm nhận dạng cần được cậpnhật và duy trì định kỳ để đảm bảo độ chính xác và hiệu suất

- Sử dụng các biện pháp bảo mật mạng: Nhằm ngăn chặn tấn công trái phép vào

dữ liệu chữ ký của người dùng

- Sử dụng chữ ký độc nhất: Người dùng có thể tự tăng cường bảo mật cho chữ

ký cá nhân bằng cách dùng chữ ký độc nhất và phức tạp Tránh dùng các chữ ký đơngiản vì có khả năng bị giả mạo

CHƯƠNG 2 – CƠ SỞ LÝ THUYẾT

2.1 Chữ ký viết tay

Chữ ký viết tay là một loại dữ liệu sinh trắc học độc đáo, mỗi người có một cáchviết riêng biệt và đặc trưng, tạo nên chữ ký cá nhân của họ Các đặc điểm này bao gồmcách nắm bút, lối viết, đặc điểm hình học của các phần từ chữ ký (như kí tự, dấu nối,kích thước, hình dạng của các nét chữ, và khoảng cách giữa các từ và dòng chữ).2.1.1 Đặc điểm

Đặc điểm của chữ ký:

Chữ ký là hình ảnh, không phải ký tự

Trang 14

Tính bất biến: Chữ ký phải được cá nhân sử dụng trong một thời gian dài.Tính đơn nhất: Chữ ký phải phân biệt được các cá nhân.

Tính không thể bắt chước: Chữ ký phải có đủ độ khó để tránh việc bị bắtchước quá dễ dàng

Có thể chia nhỏ và so sánh từng phần

Các điểm đặc trưng của chữ ký, như điểm bắt đầu, điểm kết thúc và các điểmquan trọng trên đường nét, được sử dụng để xác định và so sánh chữ ký với các mẫu đãbiết

2.1.2 Tính duy nhất của chữ ký

Cấu trúc cơ bản của chữ ký bao gồm hình dạng, kích thước của từng ký tự, cũngnhư các yếu tố liên quan như độ nghiêng, khoảng cách giữa các chữ cái, và độ dài củadòng chữ

Chữ ký cũng thể hiện đặc điểm cá nhân của mỗi người, bản tính và cá tính củangười viết được phản ánh trong cách họ viết chữ ký

Mặc dù có thể nỗ lực để sao chép chữ ký của người khác nhưng việc tái tạo mộtcách chính xác là rất khó khăn vì mỗi người có cách viết riêng biệt và đặc trưng

Phương pháp ngoại tuyến: Phương pháp này dành cho các chữ ký đượcviết trên giấy Nó sử dụng một máy quét quang học để thu được chữ ký

2.2.1 Thu thập dữ liệu chữ ký viết tay

Trang 15

Các thiết bị và phương pháp thu thập dữ liệu chữ ký đa dạng và phong phú, dướiđây là một số phương pháp để thu thập dữ liệu chữ ký:

- Bút và giấy: Sử dụng bút và giấy để ghi lại chữ ký của người viết

- Dùng bảng cảm ứng: Người viết sử dụng bút hoặc ngón tay để viết trên bề mặtcảm ứng, trong khi các cảm biến ghi lại các điểm chạm và đường viết

- Sử dụng tablet và bút stylus: Đây là một phương pháp phổ biến trong việc thuthập dữ liệu chữ ký Người viết sử dụng bút Stylus để viết trên màn hình của tablet,trong khi các cảm biến ghi lại các đặc điểm của chữ ký

- Sử dụng camera và phần mềm nhận diện: Được sử dụng để chụp hình chữ kýcủa người viết, sau đó được xử lý bằng các phần mềm nhận diện chữ ký để trích xuấtcác đặc điểm quan trọng của chữ ký

2.3 Nguyên lý hoạt động của hệ thống

Nguyên lý hoạt động của nhận dạng chữ ký viết tay sinh trắc học dựa trên việc phân tích và so sánh các đặc điểm sinh trắc học của chữ viết tay để xác định danh tính của người viết bao gồm các bước sau:

Trang 16

- Support Vector Machine (SVM): Với khả năng tạo ra các ranh giới phân loạichính xác và linh hoạt SVM có thể xử lý cả dữ liệu tuyến tính và phi tuyến tính, giúpđưa ra các dự đoán chính xác trong các tình huống phức tạp.

- Random Forest: Phương pháp Random Forest là một giải pháp hiệu quả choviệc nhận dạng chữ ký, với khả năng xử lý cả dữ liệu đa chiều và dữ liệu không cấutrúc Bằng cách kết hợp nhiều cây quyết định, Random Forest có thể tạo ra các mô hìnhmạnh mẽ và linh hoạt cho bài toán nhận dạng chữ ký

2.4 Mô hình Random Forest

Trang 17

- Thuật toán random forest trong nhận dạng chữ ký viết tay sẽ hoạt động theo 5bước:

• Bước 1: Tiền xử lý hình ảnh

• Bước 2: Chọn các mẫu chữ ký ngẫu nhiên từ tập dữ liệu huấn luyện

• Bước 3: Xây dựng cây quyết định cho mẫu chữ ký

• Bước 4: Các cây quyết định đưa ra các dự đoán

• Bước 5: Chọn kết quả là chữ ký được dự đoán nhiều nhất là dự đoáncuối cùng

Hình 2 Mô tả thuật toán random forest.

- Training Set: Là tập các hình ảnh nằm trong các thư mục có gắn nhãn hoặccác hình ảnh có nhãn

Trang 18

Hình 3 Mẫu training set trong mô hình random forest.

- Training Sample: Là các tập được lựa chọn ngẫu nhiên từ tập training set từ đótạo thành các cây quyết định chuẩn bị cho quá trình voting

- Test: Đưa dữ liệu là hình ảnh chữ ký vào mô hình Kết thúc quá trình voting

sẽ là kết quả của dự đoán

Hình 4 Áp dụng nhận dạng chữ ký bằng mô hình random forest.

- Ưu điểm của random forest là thuật toán mang tính chất mô phỏng dễ hìnhdung, không phức tạp nhiều về thuật toán, nó cũng được hỗ trợ trên nhiều thuật toán,trên nhiều lĩnh vực khác nhau

Trang 19

- Nhược điểm là thuật toán có độ chính xác không cao.

2.5 Mô hình Neural Networks

Quy trình xác thực chữ ký có thể được chia thành 2 giai đoạn:

Giai đoạn 1: Giai đoạn training

Giai đoạn 2: Giai đoạn testing

Trong giai đoạn training sẽ được chia làm 4 bước:

Thu thập dữ liệu

Tiền xử lý dữ liệu (pre-processing)

Trích xuất đặc trưng

Huấn luyện mạng nơ-ron

Giai đoạn testing sẽ được chia làm 5 bước chính:

Lấy dữ liệu đầu vào

Tiền xử lý dữ liệu

Trích xuất đặc trưng

Áp dụng các đặc trưng vào mạng nơ-ron đã được huấn luyện từ trướcKiểm tra kết quả từ mạng nơ-ron

2.5.1 Giai đoạn tiền xử lý dữ liệu

Ở giai đoạn này, chữ ký sẽ được scan và chuyển thành ảnh xám (gray-scale).Mục đích của giai đoạn này là để chắc chắn rằng chữ ký đã đủ đạt tiêu chuẩn để có thểtrích xuất các đặc trưng cho quá trình huấn luyện mạng nơ-ron Giai đoạn này gồmnhiều bước như sau:

- Chuyển ảnh dạng nhị phân (Converting image to binary) Ảnh xám sau khi: scan sẽ được chuyển thành dưới dạng nhị phân để có thể trích xuất đặc trưng dễ dànghơn

- Chuẩn hoá kích thước ảnh (Image resizing) Để có thể thuận tiện và đơn giản: hơn hơn trong việc trích xuất thì chúng ta sẽ tiến hành chuẩn hóa kích thước ảnh theomột kích thước tiêu chuẩn như ở dạng 256*256

Trang 20

Hình 5 Chuẩn hoá kích thước ảnh.

- Cân bằng độ sáng (Brightness equalization): Đảm bảo rằng mức độ sáng củatoàn bộ ảnh là đồng nhất, giúp tránh sự biến động không cần thiết giữa các vùng sáng

và tối của chữ ký

- Cắt cụm chữ ký (Cropping) Loại bỏ các vùng không cần thiết xung quanh chữ:

ký, tạo ra một hình ảnh chỉ chứa chữ ký Điều này giúp giảm kích thước của ảnh và tậptrung vào vùng quan trọng

- Làm mỏng (Thinning) Làm mỏng nhằm làm mịn hoặc làm giảm độ dày của: đối tượng trong hình ảnh, giữ lại các đặc điểm cơ bản như hình dạng hoặc cấu trúc củađối tượng sao cho nét chữ trở nên mảnh mai nhưng vẫn giữ được hình dạng và cấu trúcchính xác của chữ ký giúp giảm kích thước của dữ liệu và tăng cường khả năng phânloại hoặc nhận dạng

Hình 6 Làm mỏng ảnh.

Trang 21

- Tạo hộp bao quanh (Bounding box) Tạo ra một hình chữ nhật bao quanh một: đối tượng hoặc một nhóm các đối tượng trong hình ảnh Được sử dụng để xác định vịtrí và ranh giới của chữ ký trong hình ảnh Điều này giúp tập trung vào vùng quantrọng của hình ảnh và làm giảm kích thước của dữ liệu, đồng thời làm tăng khả năngnhận dạng hoặc phân loại.

Hình 7 Tạo hộp bao quanh.

2.5.2 Giai đoạn trích xuất đặc trưng

- Tính toán biểu đồ tần suất tối đa theo chiều ngang và chiều dọc: Bằng cáchquét qua từng hàng và cột của hình ảnh chữ ký, ta tính được số lượng pixel đen trênmỗi hàng và cột Điều này giúp xác định hàng và cột có số lượng pixel đen tối đa, tạo

ra histogram tối đa theo chiều ngang và dọc

- Xác định trọng tâm: Hình ảnh chữ ký được chia thành hai phần bằng nhau, sau

đó trọng tâm của mỗi phần được tính toán Trọng tâm là điểm trung bình của tất cả cácpixel đen trong mỗi phần, giúp xác định vị trí trọng tâm của chữ ký

- Tính toán diện tích chuẩn hoá của chữ ký: Diện tích của chữ ký được tính bằng

số lượng pixel đen tạo thành nó Điều này được chia cho diện tích của hộp bao quanhchữ ký để tạo ra diện tích chuẩn hóa của chữ ký

Ngày đăng: 07/05/2024, 16:18

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w