1.2 Ưu điểmNhận dạng bằng chữ ký mang lại nhiều ưu điểm, bao gồm:- Độc nhất vô nhị: Mỗi người có một cách viết riêng biệt và không giống aikhác, giống như một dấu vân tay nên chữ ký trở
Trang 1TIỂU LUẬN MÔN: BẢO MẬT THÔNG TIN
TÌM HIỂU VỀ HỆ THỐNG NHẬN DẠNG SINH TRẮC HỌC BẰNG CHỮ KÝ VIẾT
TAY
Người hướng dẫn: TS HUỲNH NGỌC TÚ Người thực hiện: NGUYỄN HOÀI AN – 52100001
NGUYỄN VĂN HÀO – 52100792
LÊ GIA HUY – 52100033 Lớp : 21050201 Khoá : 25
THÀNH PHỐ HỒ CHÍ MINH, NĂM 2024
Trang 2TIỂU LUẬN MÔN: BẢO MẬT THÔNG TIN
TÌM HIỂU VỀ HỆ THỐNG NHẬN DẠNG SINH TRẮC HỌC BẰNG CHỮ KÝ VIẾT
TAY
Người hướng dẫn: TS HUỲNH NGỌC TÚ Người thực hiện: NGUYỄN HOÀI AN – 52100001
NGUYỄN VĂN HÀO – 52100792
LÊ GIA HUY – 52100033 Lớp : 21050201 Khoá : 25
THÀNH PHỐ HỒ CHÍ MINH, NĂM 2024
Trang 3LỜI CẢM ƠN
Lời đầu tiên, chúng em xin gửi lời cảm ơn chân thành đến Cô Huỳnh Ngọc Tú –Giảng viên khoa Công nghệ thông tin – Trường đại học Tôn Đức Thắng, đã hỗ trợ vàgiúp đỡ nhiệt tình trong quá trình thực hiện tiểu luận này
Chúng em trân trọng cảm ơn Thầy Cô giảng viên Trường đại học Tôn ĐứcThắng nói chung cũng như Thầy Cô giảng viên khoa Công nghệ thông tin nói riêng đãgiảng dạy và truyền đạt nhiều kinh nghiệm quý trong suốt quá trình học tập tại trường.Mặc dù rất cẩn thận trong quá trình thực hiện nhưng cũng không thể tránh khỏinhững thiếu sót Chúng em rất mong nhận được sự góp ý từ các Thầy/Cô để bài tiểuluận được hoàn thiện hơn
Chúng em chân thành cảm ơn!
Trang 4TIỂU LUẬN ĐƯỢC HOÀN THÀNH
TẠI TRƯỜNG ĐẠI HỌC TÔN ĐỨC THẮNG
Tôi xin cam đoan đây là bài tiểu luận của riêng chúng tôi và được sự hướng dẫncủa TS Huỳnh Ngọc Tú; Các nội dung nghiên cứu, kết quả trong đề tài này là trungthực và chưa công bố dưới bất kỳ hình thức nào trước đây Những số liệu trong cácbảng biểu phục vụ cho việc phân tích, nhận xét, đánh giá được chính tác giả thu thập từcác nguồn khác nhau có ghi rõ trong phần tài liệu tham khảo
Ngoài ra, trong tiểu luận còn sử dụng một số nhận xét, đánh giá cũng như sốliệu của các tác giả khác, cơ quan tổ chức khác đều có trích dẫn và chú thích nguồngốc
Nếu phát hiện có bất kỳ sự gian lận nào chúng tôi xin hoàn toàn chịu trách nhiệm về nội dung tiểu luận của mình Trường đại học Tôn Đức Thắng không liên
quan đến những vi phạm tác quyền, bản quyền do chúng tôi gây ra trong quá trình thựchiện (nếu có)
TP Hồ Chí Minh, ngày tháng năm
Tác giả (ký tên và ghi rõ họ tên)
Nguyễn Văn B
Trần Văn C
Trang 5PHẦN XÁC NHẬN VÀ ĐÁNH GIÁ CỦA GIẢNG VIÊN
Phần xác nhận của GV hướng dẫn
_ _ _ _ _ _ _
Tp Hồ Chí Minh, ngày tháng năm (kí và ghi họ tên)
Phần đánh giá của GV chấm bài
_ _ _ _ _ _ _
Tp Hồ Chí Minh, ngày tháng năm (kí và ghi họ tên)
Trang 6TÓM TẮT
Trình bày tóm tắt vấn đề nghiên cứu, các hướng tiếp cận, cách giải quyết vấn đề
và một số kết quả đạt được, những phát hiện cơ bản trong vòng 1 -2 trang
Trang 7MỤC LỤC
LỜI CẢM ƠN I PHẦN XÁC NHẬN VÀ ĐÁNH GIÁ CỦA GIẢNG VIÊN III TÓM TẮT IV
MỤC LỤC 1
DANH MỤC KÍ HIỆU VÀ CHỮ VIẾT TẮT 3
DANH MỤC CÁC BẢNG BIỂU, HÌNH VẼ, ĐỒ THỊ 4
CHƯƠNG 1 – TỔNG QUAN 5
1.1 GIỚI THIỆU 5
1.2 Ư U ĐIỂM 6
1.3 THÁCH THỨC 6
1.4 GIẢI PHÁP 7
CHƯƠNG 2 – CƠ SỞ LÝ THUYẾT 7
2.1 CHỮ KÝ VIẾT TAY 7
2.1.1 Đặc điểm 7
2.1.2 Tính duy nhất của chữ ký 8
2.2 PHƯƠNG PHÁP NHẬN DẠNG CHỮ KÝ 8
2.2.1 Thu thập dữ liệu chữ ký viết tay 8
2.2.2 Xử lý và tiền xử lý dữ liệu thu thập 9
2.2.3 Xác định và so khớp 10
2.3 NGUYÊN LÝ HOẠT ĐỘNG CỦA HỆ THỐNG 10
2.3.1 Cách hoạt động 10
2.3.2 Các mô hình phổ biến 13
2.4 MÔ HÌNH NEURAL NETWORKS 14
2.4.1 Giai đoạn tiền xử lý dữ liệu 14
2.4.2 Giai đoạn trích xuất đặc trưng 16
2.4.3 Tạo vector đặc trưng 18
2.4.4 Huấn luyện mạng nơ-ron 18
CHƯƠNG 3 – KẾT LUẬN 18
3.1 TÍNH KHẢ THI 18
3.2 Đ Ộ TIN CẬY VÀ BẢO MẬT 19
3.3 ỨNG DỤNG 19
Trang 8TÀI LIỆU THAM KHẢO 21
Trang 9DANH MỤC KÍ HIỆU VÀ CHỮ VIẾT TẮTCÁC KÝ HIỆU
f Tần số của dòng điện và điện áp (Hz)
Trang 10DANH MỤC CÁC BẢNG BIỂU, HÌNH VẼ, ĐỒ THỊ DANH MỤC HÌNH
Hình 1 Sơ đồ các dạng bảo mật bằng sinh trắc học 5
Hình 2 Kiến trúc của một mô hình nhận dạng chữ ký 11
Hình 3 Mô tả thuật toán random forest 12
Hình 4 Mẫu training set trong mô hình random forest 12
Hình 5 Áp dụng nhận dạng chữ ký bằng mô hình random forest 13
Hình 6 Chuẩn hoá kích thước ảnh 15
Hình 7 Làm mỏng ảnh 15
Hình 8 Tạo hộp bao quanh 16
Hình 9 Tính toán đặc trưng bề mặt 3 phần 17
Hình 10 Tính toán đặc trưng bề mặt 6 phần 17
Trang 11CHƯƠNG 1 – TỔNG QUAN
1.1 Giới thiệu
Ngày nay, nhu cầu về an ninh đang tăng cao trên toàn cầu từ cả cá nhân và tổchức An ninh mạng đã trở thành một trong những vấn đề quan trọng nhất trong thờiđại kỹ thuật số và công nghệ 4.0 hiện nay Một trong những phương pháp quan trọngthường được sử dụng để cung cấp an ninh cho các ứng dụng kỹ thuật số là bảo mật sinhtrắc học
Bảo mật sinh trắc học được định nghĩa bởi các đặc điểm của con người giúpphân biệt giữa mọi người với nhau Bảo mật sinh trắc học có thể phân loại thành 2 loại
là sinh lý hoặc hành vi Khuôn mặt con người, võng mạc, vân tay và con ngươi đượccoi là các đặc điểm sinh lý không thể thay đổi trong khi giọng nói, lực gõ phím và chữ
ký bằng tay, được coi là ví dụ về đặc điểm về hành vi
Hình 1 Sơ đồ các dạng bảo mật bằng sinh trắc học.
Trang 12Nhận dạng sinh trắc học bằng chữ ký viết tay là quá trình xác định và xác thực
cá nhân dựa trên các đặc điểm độc nhất của việc viết tay của họ
1.2 Ưu điểm
Nhận dạng bằng chữ ký mang lại nhiều ưu điểm, bao gồm:
- Độc nhất vô nhị: Mỗi người có một cách viết riêng biệt và không giống aikhác, giống như một dấu vân tay nên chữ ký trở thành một đặc điểm độc nhất của mỗingười
- Dễ tiếp cận: So với một số phương pháp nhận dạng sinh trắc học khác như vântay hoặc mống mắt, việc thu thập và xác định chữ ký viết tay thường dễ dàng hơn vàkhông đòi hỏi các thiết bị đặc biệt
- Tính khả diễn giải: Chữ ký có thể được dễ dàng kiểm tra và đối chiếu bởi conngười mà không cần các công nghệ phức tạp Điều này làm cho quá trình xác thực trởnên nhanh chóng và hiệu quả
- Ứng dụng đa dạng: Chữ ký có thể được sử dụng trong nhiều lĩnh vực khácnhau như giao dịch tài chính, hợp đồng, biên nhận, xác thực truy cập, và các quy trìnhhành chính khác
- An toàn và bảo mật: Việc sử dụng chữ ký giúp bảo vệ thông tin cá nhân và dữliệu quan trọng bằng cách xác định chính xác người ký và ngăn chặn việc gian lận
- Khả năng giả mạo: Mặc dù chữ ký được xem là độc nhất vô nhị, nhưng nókhông hoàn toàn miễn nhiễm với việc sao chép hoặc giả mạo Có thể có các kỹ thuậtgiả mạo chữ ký như làm giả hoặc sao chép chữ ký từ một người khác
Trang 13- Cần có dữ liệu đủ lớn: Để xây dựng mô hình nhận dạng chữ ký chính xác, cần
có một tập dữ liệu lớn và đa dạng của các chữ ký từ nhiều người khác nhau Việc thuthập và quản lý dữ liệu đó có thể tốn kém và đòi hỏi nhiều công sức
- Yếu tố kỹ thuật: Việc sử dụng công nghệ để thu thập và xác định chữ ký đòihỏi các thiết bị phức tạp và chi phí Hơn nữa, các phần mềm nhận dạng cần được cậpnhật và duy trì định kỳ để đảm bảo độ chính xác và hiệu suất
- Sử dụng các biện pháp bảo mật mạng: Nhằm ngăn chặn tấn công trái phép vào
dữ liệu chữ ký của người dùng
- Sử dụng chữ ký độc nhất: Người dùng có thể tự tăng cường bảo mật cho chữ
ký cá nhân bằng cách dùng chữ ký độc nhất và phức tạp Tránh dùng các chữ ký đơngiản vì có khả năng bị giả mạo
CHƯƠNG 2 – CƠ SỞ LÝ THUYẾT
2.1 Chữ ký viết tay
Chữ ký viết tay là một loại dữ liệu sinh trắc học độc đáo, mỗi người có một cáchviết riêng biệt và đặc trưng, tạo nên chữ ký cá nhân của họ Các đặc điểm này bao gồmcách nắm bút, lối viết, đặc điểm hình học của các phần từ chữ ký (như kí tự, dấu nối,kích thước, hình dạng của các nét chữ, và khoảng cách giữa các từ và dòng chữ).2.1.1 Đặc điểm
Đặc điểm của chữ ký:
Chữ ký là hình ảnh, không phải ký tự
Trang 14Tính bất biến: Chữ ký phải được cá nhân sử dụng trong một thời gian dài.Tính đơn nhất: Chữ ký phải phân biệt được các cá nhân.
Tính không thể bắt chước: Chữ ký phải có đủ độ khó để tránh việc bị bắtchước quá dễ dàng
Có thể chia nhỏ và so sánh từng phần
Các điểm đặc trưng của chữ ký, như điểm bắt đầu, điểm kết thúc và các điểmquan trọng trên đường nét, được sử dụng để xác định và so sánh chữ ký với các mẫu đãbiết
2.1.2 Tính duy nhất của chữ ký
Cấu trúc cơ bản của chữ ký bao gồm hình dạng, kích thước của từng ký tự, cũngnhư các yếu tố liên quan như độ nghiêng, khoảng cách giữa các chữ cái, và độ dài củadòng chữ
Chữ ký cũng thể hiện đặc điểm cá nhân của mỗi người, bản tính và cá tính củangười viết được phản ánh trong cách họ viết chữ ký
Mặc dù có thể nỗ lực để sao chép chữ ký của người khác nhưng việc tái tạo mộtcách chính xác là rất khó khăn vì mỗi người có cách viết riêng biệt và đặc trưng
Phương pháp ngoại tuyến: Phương pháp này dành cho các chữ ký đượcviết trên giấy Nó sử dụng một máy quét quang học để thu được chữ ký
2.2.1 Thu thập dữ liệu chữ ký viết tay
Trang 15Các thiết bị và phương pháp thu thập dữ liệu chữ ký đa dạng và phong phú, dướiđây là một số phương pháp để thu thập dữ liệu chữ ký:
- Bút và giấy: Sử dụng bút và giấy để ghi lại chữ ký của người viết
- Dùng bảng cảm ứng: Người viết sử dụng bút hoặc ngón tay để viết trên bề mặtcảm ứng, trong khi các cảm biến ghi lại các điểm chạm và đường viết
- Sử dụng tablet và bút stylus: Đây là một phương pháp phổ biến trong việc thuthập dữ liệu chữ ký Người viết sử dụng bút Stylus để viết trên màn hình của tablet,trong khi các cảm biến ghi lại các đặc điểm của chữ ký
- Sử dụng camera và phần mềm nhận diện: Được sử dụng để chụp hình chữ kýcủa người viết, sau đó được xử lý bằng các phần mềm nhận diện chữ ký để trích xuấtcác đặc điểm quan trọng của chữ ký
2.3 Nguyên lý hoạt động của hệ thống
Nguyên lý hoạt động của nhận dạng chữ ký viết tay sinh trắc học dựa trên việc phân tích và so sánh các đặc điểm sinh trắc học của chữ viết tay để xác định danh tính của người viết bao gồm các bước sau:
Trang 16- Support Vector Machine (SVM): Với khả năng tạo ra các ranh giới phân loạichính xác và linh hoạt SVM có thể xử lý cả dữ liệu tuyến tính và phi tuyến tính, giúpđưa ra các dự đoán chính xác trong các tình huống phức tạp.
- Random Forest: Phương pháp Random Forest là một giải pháp hiệu quả choviệc nhận dạng chữ ký, với khả năng xử lý cả dữ liệu đa chiều và dữ liệu không cấutrúc Bằng cách kết hợp nhiều cây quyết định, Random Forest có thể tạo ra các mô hìnhmạnh mẽ và linh hoạt cho bài toán nhận dạng chữ ký
2.4 Mô hình Random Forest
Trang 17- Thuật toán random forest trong nhận dạng chữ ký viết tay sẽ hoạt động theo 5bước:
• Bước 1: Tiền xử lý hình ảnh
• Bước 2: Chọn các mẫu chữ ký ngẫu nhiên từ tập dữ liệu huấn luyện
• Bước 3: Xây dựng cây quyết định cho mẫu chữ ký
• Bước 4: Các cây quyết định đưa ra các dự đoán
• Bước 5: Chọn kết quả là chữ ký được dự đoán nhiều nhất là dự đoáncuối cùng
Hình 2 Mô tả thuật toán random forest.
- Training Set: Là tập các hình ảnh nằm trong các thư mục có gắn nhãn hoặccác hình ảnh có nhãn
Trang 18Hình 3 Mẫu training set trong mô hình random forest.
- Training Sample: Là các tập được lựa chọn ngẫu nhiên từ tập training set từ đótạo thành các cây quyết định chuẩn bị cho quá trình voting
- Test: Đưa dữ liệu là hình ảnh chữ ký vào mô hình Kết thúc quá trình voting
sẽ là kết quả của dự đoán
Hình 4 Áp dụng nhận dạng chữ ký bằng mô hình random forest.
- Ưu điểm của random forest là thuật toán mang tính chất mô phỏng dễ hìnhdung, không phức tạp nhiều về thuật toán, nó cũng được hỗ trợ trên nhiều thuật toán,trên nhiều lĩnh vực khác nhau
Trang 19- Nhược điểm là thuật toán có độ chính xác không cao.
2.5 Mô hình Neural Networks
Quy trình xác thực chữ ký có thể được chia thành 2 giai đoạn:
Giai đoạn 1: Giai đoạn training
Giai đoạn 2: Giai đoạn testing
Trong giai đoạn training sẽ được chia làm 4 bước:
Thu thập dữ liệu
Tiền xử lý dữ liệu (pre-processing)
Trích xuất đặc trưng
Huấn luyện mạng nơ-ron
Giai đoạn testing sẽ được chia làm 5 bước chính:
Lấy dữ liệu đầu vào
Tiền xử lý dữ liệu
Trích xuất đặc trưng
Áp dụng các đặc trưng vào mạng nơ-ron đã được huấn luyện từ trướcKiểm tra kết quả từ mạng nơ-ron
2.5.1 Giai đoạn tiền xử lý dữ liệu
Ở giai đoạn này, chữ ký sẽ được scan và chuyển thành ảnh xám (gray-scale).Mục đích của giai đoạn này là để chắc chắn rằng chữ ký đã đủ đạt tiêu chuẩn để có thểtrích xuất các đặc trưng cho quá trình huấn luyện mạng nơ-ron Giai đoạn này gồmnhiều bước như sau:
- Chuyển ảnh dạng nhị phân (Converting image to binary) Ảnh xám sau khi: scan sẽ được chuyển thành dưới dạng nhị phân để có thể trích xuất đặc trưng dễ dànghơn
- Chuẩn hoá kích thước ảnh (Image resizing) Để có thể thuận tiện và đơn giản: hơn hơn trong việc trích xuất thì chúng ta sẽ tiến hành chuẩn hóa kích thước ảnh theomột kích thước tiêu chuẩn như ở dạng 256*256
Trang 20Hình 5 Chuẩn hoá kích thước ảnh.
- Cân bằng độ sáng (Brightness equalization): Đảm bảo rằng mức độ sáng củatoàn bộ ảnh là đồng nhất, giúp tránh sự biến động không cần thiết giữa các vùng sáng
và tối của chữ ký
- Cắt cụm chữ ký (Cropping) Loại bỏ các vùng không cần thiết xung quanh chữ:
ký, tạo ra một hình ảnh chỉ chứa chữ ký Điều này giúp giảm kích thước của ảnh và tậptrung vào vùng quan trọng
- Làm mỏng (Thinning) Làm mỏng nhằm làm mịn hoặc làm giảm độ dày của: đối tượng trong hình ảnh, giữ lại các đặc điểm cơ bản như hình dạng hoặc cấu trúc củađối tượng sao cho nét chữ trở nên mảnh mai nhưng vẫn giữ được hình dạng và cấu trúcchính xác của chữ ký giúp giảm kích thước của dữ liệu và tăng cường khả năng phânloại hoặc nhận dạng
Hình 6 Làm mỏng ảnh.
Trang 21- Tạo hộp bao quanh (Bounding box) Tạo ra một hình chữ nhật bao quanh một: đối tượng hoặc một nhóm các đối tượng trong hình ảnh Được sử dụng để xác định vịtrí và ranh giới của chữ ký trong hình ảnh Điều này giúp tập trung vào vùng quantrọng của hình ảnh và làm giảm kích thước của dữ liệu, đồng thời làm tăng khả năngnhận dạng hoặc phân loại.
Hình 7 Tạo hộp bao quanh.
2.5.2 Giai đoạn trích xuất đặc trưng
- Tính toán biểu đồ tần suất tối đa theo chiều ngang và chiều dọc: Bằng cáchquét qua từng hàng và cột của hình ảnh chữ ký, ta tính được số lượng pixel đen trênmỗi hàng và cột Điều này giúp xác định hàng và cột có số lượng pixel đen tối đa, tạo
ra histogram tối đa theo chiều ngang và dọc
- Xác định trọng tâm: Hình ảnh chữ ký được chia thành hai phần bằng nhau, sau
đó trọng tâm của mỗi phần được tính toán Trọng tâm là điểm trung bình của tất cả cácpixel đen trong mỗi phần, giúp xác định vị trí trọng tâm của chữ ký
- Tính toán diện tích chuẩn hoá của chữ ký: Diện tích của chữ ký được tính bằng
số lượng pixel đen tạo thành nó Điều này được chia cho diện tích của hộp bao quanhchữ ký để tạo ra diện tích chuẩn hóa của chữ ký