Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 11 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
11
Dung lượng
663,97 KB
Nội dung
BÀI TẬP LỚN MÔ HỌC : XỬ LÝ ẢNH Đề tài 43: Tìm hiểu các đặc trưng sinh trắc ảnh vân tay (Fingerprint Biometric), phương pháp và thuậttoántríchchọn đặc trưng vân tay. Phân tích một ứng dụng. Nhóm sinh viên : Giáo viên hƣơng dẫn : PGS.TS Nguyễn Thị Hoàng Lan Mục Lục Contents Chƣơng 1. TỔNG QUAN 3 1. Sự cần thiết của nhận dạng bằng ảnh sinh trắc : 3 2. Lịch sử của nhân dạng vân tay : . 4 3. Các hệ thống xác thực : 7 4.So sánh các đặc trưng sinh trắc : 8 5. Các loại lỗi của hệ thống sinh trắc : 10 5.1. Các lỗi của hệ thống kiểm tra : .10 5.2. Các loại lỗi của hệ thống nhân dạng : 14 Chƣơng 2 . PHÂN TÍCH VÀ BIỂU DIỄN VÂN TAY .16 1. Phân tích cấu trúc vân tay : .16 2. Biểu diến hình ảnh vân tay : 17 3. Ước lượng hướng vân cục bộ : MỘTSỐTHUẬT TỐN TRÍCHCHỌN ĐẶC TRƯNG TRONG BÀI TỐN XỬ LÝ SỐ LIỆU LỚN Ngơ Thùy Linh Khoa Hệ thống thông tin Quản lý – Học viện Ngân hàng Email: linhnt.hvnh@gmail.com, Điện thoại: 0904.002.779 Tóm tắt: Ngày với phát triển mạnh mẽ khoa học kỹ thuật mà tích lũy liệu xảy với tốc độ bùng nổ, lượng thông tin lưu trữ thiết bị điện tử không ngừng tăng lên Số lượng ghi kích thước ghi thu thập nhanh lớn gây khó khăn việc lưu trữ xử lý thông tin Trong báo giới thiệu sốthuật tốn tríchchọn đặc trưng để tìm đặc trưng tối ưu toán xử lý số liệu lớn Đặt vấn đề Trong lĩnh vực nghiên cứu khai phá liệu nói chung nghiên cứu thuật tốn phân lớp nói riêng, vấn đề xử lý liệu lớn ngày trở thành vấn đề cấp thiết đóng vai trò chủ đạo việc giải toán thực tế Phần lớn thuậttoán phân lớp phát triển giải với lượng số liệu giới hạn với độ phức tạp liệu biết trước Trong lượng liệu mà thu thập ngày trở nên phong phú đa dạng nhờ phát triển mạnh mẽ khoa học kỹ thuật Mặc dù nhiều kỹ thuật khai phá liệu dựa số tảng lý thuyết khác phát triển ứng dụng từ lâu, thực tế cho thấy kết phụ thuộc nhiều vào đặc tính liệu khả xử lý liệu thơ nhóm nghiên cứu Một điều hiển nhiên với phương pháp đáp ứng xử lý tốt vài liệu ứng dụng cụ thể Trong khai phá liệu phương pháp tríchchọn đóng vai trò quan trọng tiền xử lý số liệu Hướng tiếp cận làm tăng hiệu thu nhận tri thức ngành tin sinh, xử lý liệu web, xử lý tiếng nói, hình ảnh với đặc tính có nhiều thuộc tích (vài trăm vài trăm ngàn thuộc tính) thường có số lượng tương đối nhỏ mẫu dùng để huấn luyện (thường vài trăm) Phương pháp tríchchọn giúp giảm kích cỡ khơng gian liệu, loại bỏ thuộc tính khơng liên quan thuộc tính nhiễu Phương pháp có ảnh hưởng đến ứng dụng tăng tốc độ thuậttoán khai phá liệu, cải thiện chất lượng liệu tăng hiệu suất khai phá liệu, kiểm soát kết thuậttoán Phương pháp giới thiệu từ năm 1970 tài liệu xác suất thống kê, học máy khai phá liệu Những năm trở lại đây, nhu cầu giảm chiều số liệu ngày cao nên có nhiều nghiên cứu lựa chọn thuộc tính, lĩnh vực phát triển mạnh mẽ chiều rộng lẫn chiều sâu [1] Cơ sở lý thuyết 2.1 Giới thiệu tríchchọn đặc trưng Về việc bóc tách thuộc tính đặc trưng bao gồm hai phần xây dựng thuộc tính lựa chọn thuộc tính đặc trưng Xây dựng thuộc tính công việc quan trọng việc xử lý số liệu Khi xây dựng liệu cần phải đảm bảo không để nhiều thông tin khơng q tốn mặt chi phí Phần thứ hai có mục tiêu tìm thuộc tính đại diện cho đối tượng, loại bỏ thuộc tính thừa gây nhiễu nhằm tăng hiệu suất thuậttoán khai phá liệu Giảm bớt số chiều mẫu theo gọi nén tập liệu, thơng qua tríchchọn thuộc tính lựa chọn thuộc tính Q trình bước việc tiền xử lý liệu Lựa chọn thuộc tính phần vốn có tríchchọn thuộc tính ví dụ phương pháp phân tích thành phần chí thiết kế xử lý thuật tốn ví dụ thiết kế định Tuy nhiên, lựa chọn thuộc tính thường bước lập riêng biệt chuỗi xử lý [2] Có thể định nghĩa lựa chọn thuộc tính q trình tìm tập thuộc tính từ M tập thuộc tính tập liệu N ban đầu, phải xác định tiêu chuẩn lựa chọn thuộc tính Theo cách này, kích cỡ khơng gian đặc trưng rút ngắn tối đa theo tiêu chuẩn định lượng định Khi kích cỡ lĩnh vực mở rộng, số phần tử tập N tăng lên, việc tìm tập đại diện tốt thường gặp khó khăn có nhiều vấn đề liên quan đến tập chọn Nhìn chung, thuật tốn tríchchọn gồm bước bản: Sinh tập con, lượng giá tập con, điều kiện dừng xác nhận kết Quá trình sinh tập thủ tục tìm kiếm, sinh tập dùng cho việc lượng giá Gọi N số đại diện (đặc trưng) tập liệu gốc ban đầu, tổng số tập sinh 2n 2n tập liệt kê toàn tập không gian Mỗi tập sinh thuậttoán cần lượng giá trị tiêu chuẩn lượng giá trị định so sánh với tập tốt tìm trước Nếu khơng có điều kiện dừng phù hợp, thuật tốn chạy khơng dừng Điều kiện dừng trình sinh phải rơi vào số trường hợp sau: - Toàn phần tử tập hợp chọn - Các phần tử chưa chọn bị lặp lại - Sinh thêm tập không cho kết tốt - Đã chọn đủ số tập thoả mãn điều kiện tiêu chuẩn Tập tốt chọn phải lượng giá trường hợp khác với tập gốc phải biểu diễn với liệu thực tế Lựa chọn thuộc tính tiến hành theo hai cách: cách thứ xếp loại thuộc tính theo tiêu chuẩn lấy k thuộc tính đầu tiên, cách dựa vào ngưỡng để chọn thuộc tính Cách thứ hai chọn tập nhỏ mà khơng làm giảm q trình học, với cách tự động xác định số lượng thuộc tính Lựa chọn thuộc tính dựa vào mơ hình, chiến lược tìm kiếm, thước đo chất lượng thuộc tính ước lượng Có ba loại mơ Filter, Wrapper, Embedded Mơ hình Embedded mơ hình tích hợp thuộc tính lựa chọn xây dựng mơ hình ví dụ thuật tốn định Các chiến lược tìm kiếm bao gồm: Forward, Backward, Floating, Branch & Bound, Randomized Ước lượng việc chọn lựa thuộc tính bao gồm hai nhiệm vụ: so sánh hai giai đoạn: trước sau lựa chọn thuộc tính Hai so sánh hai thuật tốn lựa chọn thuộc tính [1] Tóm lại lựa chọn thuộc tính xem tổng hợp ba thành phần chính: tìm kiếm, đánh giá, chọn lựa mơ hình Hình 2.1 thể lựa chọn thuộc tính theo thành phần nói [3] Hình 1: Các thành phần việc lựa chọn thuộc tính 2.2 Chiến lược tìm kiếm Lựa chọn thuộc tính xem vấn đề tìm kiếm, bước khơng gian tìm ...
ĐẠI HỌC QUỐC GIA TP.HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN
BÁO CÁO PHƯƠNG PHÁP NGHIÊN CỨU KHOA HỌC
TRONG TIN HỌC
ĐỀ TÀI:
MỘT SỐTHUẬTTOÁNCHỌN LỌC TRONG
GIẢI BÀI TOÁN TIN HỌC
GVHD: GS. TSKH. HOÀNG VĂN KIẾM
HVTH: CN. LÊ THANH TRỌNG
KHÓA: 06
MSHV: CH1101052
LỚP: CH CNTT K6
TP. Hồ Chí Minh, tháng 3 năm 2012
MỤC LỤC
LỜI CẢM ƠN 3
Phần I: GIỚI THỆU 3
Phần II: THUẬTTOÁN THAM LAM 6
1. Giới thiệu phương pháp 6
2. Năm thành phần giải thuật tham lam 6
3. Hai thành phần quyết định nhất tới quyết định tham lam 7
3.1. Tính chất lựa chọn tham lam 7
3.2.Cấu trúc con tối ưu 7
4.Mô hình 7
5. Bài toán minh họa: Bài toán Xếp việc 8
5.1. Mô tả bài toán 8
5.2. Thuậttoán 9
5.3. Chương trình minh họa 10
Phần III : THUẬTTOÁN QUAY LUI 16
1. Giới thiệu phương pháp 16
2. Mô hình cho bài toán 16
3. Bài toán minh họa: Tìm đường trong mê cung 19
3.1. Mô tả bài toán 19
3.2. Thuậttoán 20
3.3. Chương trình minh họa 21
Phần IV: THUẬTTOÁN QUY HOẠCH ĐỘNG 28
1. Giới thiệu phương pháp 28
2. Sơ đồ cho bài toán 28
3. Bài tóan minh họa: Tìm các đường ngắn nhất 28
3.1.Mô tả bài toán 28
3.2.Thuật giải 30
3.3. Chương trình minh họa 33
Phần V: KẾT LUẬN 39
Phần VI: TÀI LIỆU THAM KHẢO 39
2
CHƯƠNG 1: LỜI CẢM ƠN
Em xin gửi lời cảm ơn chân thành đến GS.TSKH. Hoàng Văn Kiếm, người đã truyền đạt những
kiến thức quý báu không chỉ là lý thuyết mà còn hướng dẫn cách thức vận dụng chúng vào việc nghiên
cứu khoa học trong tin học. Em xin chân thành cảm ơn Thầy vì sự hướng dẫn của Thầy trong quá trình
thực hiện báo cáo này.
Xin chân thành cảm ơn sự giúp đỡ của các anh chị, bạn bè và những người đã thường xuyên
trao đổi, thảo luận và đóng góp ý kiến cho tôi về các vấn đề liên quan trong thời gian qua.
Mặc dù cố gắng thực hiện báo cáo một cách tốt nhất nhưng chắc chắn rằng không tránh khỏi
những thiếu sót. Mong quý Thầy cô và các bạn góp ý. Tôi xin chân thành cảm ơn!
Sinh viên thực hiện
Lê Thanh Trọng
MSHV: CH1101052
Lớp: CH CNTT K6
MT S THUT TOÁN CHN LC TRONG GII BÀI TOÁN TIN HC
3
CHƯƠNG 2: Phần I: GIỚI THỆU
CHƯƠNG 3:
Thuật toán là một thủ tục tính toán được xác định một cách hợp lý và đúng đắn nhằm giải giải
quyết bài toán cụ thể nào đó. Thuậttoán bao gồm tập giá trị nhập vào (input) và tập giá xuất ra (output).
Vì thế thuậttoán là một tập các bước tính toán có thứ tự nhằm chuyển input thành output. Chúng ta có
thể xem thuậttoán là một công cụ dành để giải quyết bài toán được xác định trước. Mô tả bài toán
chính là các thành phần biểu diễn mối quan hệ giữa input và output.
Chúng ta đều biết máy tính hiện này có thể thực hiện việc tính toán vô cùng nhanh và có bộ nhớ rất
lớn. Một câu hỏi đặt ra là chúng ta có nên học và tìm hiểu các thuậttoán không? Câu trả lời chắc chắn
là “Có” vì đơn giản rằng chúng ta luôn luôn muốn giải pháp giải quyết các vấn đề bằng máy tính sẽ
được có kết quả cuối cùng và kết quả đó là chính xác và giải pháp đó là khả thi và dễ thực hiện vì khả
năng và bộ nhớ của máy tính có giới hạn. Vì vậy mà không gian và thời gian là hai yếu tố rất quan
trọng đối với mộtthuật toán. Trong giải quyết các vấn đề, chúng ta 1 TRẦN XN TIỆP NGHIÊN CỨU MỘTSỐTHUẬT TỐN CHỌN K-LÁNG GIỀNG GẦN TRONG 2D VÀ ÁP DỤNG CHO PHƯƠNG PHÁP RBF-FD GIẢI PHƯƠNG TRÌNH POISSON LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH THÁI NGUN - 2014 ĐẠI HỌC THÁI NGUN TRƯỜNG ĐẠI HỌC CƠNG NGHỆ THƠNG TIN VÀ TRUYỀN THƠNG Số hóa bởi Trung tâm Học liệu http://www.lrc.tnu.edu.vn/ 2 TRẦN XN TIỆP NGHIÊN CỨU MỘTSỐTHUẬT TỐN CHỌN K-LÁNG GIỀNG GẦN TRONG 2D VÀ ÁP DỤNG CHO PHƯƠNG PHÁP RBF-FD GIẢI PHƯƠNG TRÌNH POISSON CHUN NGÀNH: KHOA HỌC MÁY TÍNH MÃ SỐ: 60.48.01 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH NGƯỜI HƯỚNG DẪN KHOA HỌC TS. Đặng Thị Oanh THÁI NGUN - 2014 ĐẠI HỌC THÁI NGUN TRƯỜNG ĐẠI HỌC CƠNG NGHỆ THƠNG TIN VÀ TRUYỀN THƠNG Số hóa bởi Trung tâm Học liệu http://www.lrc.tnu.edu.vn/ i LỜI CAM ĐOAN Tơi xin cam đoan đây là cơng trình nghiên cứu riêng của tơi. Các số liệu, kết quả nêu trong luận văn là trung thực và mới mẻ. Tơi xin cam đoan rằng mọi sự giúp đỡ cho việc thực hiện luận văn này đã được cảm ơn và các thơng tin trích dẫn trong luận văn đã được chỉ rõ nguồn gốc. Học viên thực hiện luận văn Trần Xn Tiệp Số hóa bởi Trung tâm Học liệu http://www.lrc.tnu.edu.vn/ ii LỜI CẢM ƠN Để hồn thành bản luận văn này, bên cạnh sự nỗ lực cố gắng của bản thân còn có sự hướng dẫn nhiệt tình của q Thầy Cơ, cũng như sự động viên ủng hộ của gia đình và bạn bè trong suốt thời gian học tập nghiên cứu và thực hiện luận văn thạc sĩ. Xin chân thành bày tỏ lòng biết ơn đến cơ giáo TS. Đặng Thị Oanh, người đã hết lòng giúp đỡ và tạo mọi điều kiện tốt nhất cho tơi hồn thành luận văn này. Xin gửi lời tri ân nhất của tơi đối với những điều mà cơ đã dành cho tơi. Xin chân thành bày tỏ lòng biết ơn đến tồn thể q Thầy Cơ trong trường Đại học Cơng nghệ thơng tin & Truyền thơng cũng như q Thầy Cơ đã tận tình truyền đạt những kiến thức q báu và tạo mọi điều kiện thuận lợi cho tơi trong suốt q trình học tập, nghiên cứu và cho đến khi thực hiện luận văn. Xin chân thành bày tỏ lòng biết ơn đến gia đình, những người đã khơng ngừng động viên, hỗ trợ và tạo mọi điều kiện tốt nhất cho tơi trong suốt thời gian học tập và thực hiện luận văn. Cuối cùng, tơi xin chân thành bày tỏ lòng biết ơn đến các anh chị và các bạn bè đồng nghiệp đã hỗ trợ cho tơi trong suốt q trình học tập, nghiên cứu và thực hiện luận văn một cách hồn chỉnh. Thái Ngun, tháng 3 năm 2014 Học viên thực hiện Trần Xn Tiệp Số hóa bởi Trung tâm Học liệu http://www.lrc.tnu.edu.vn/ iii DANH MỤC CÁC TỪ VIẾT TẮT Từ Ý nghĩa RBF Radial Basic Function FD Finite Different LLF Lee Liu Fan MQ Multiquadric IMQ Inverse Multiquadric Gauss Gaussian BST Binary Search Tree W33 Wendlend's C 6 RMS Root Mean Square MỘTSỐ HÀM DÙNG TRONG LUẬN VĂN Tên hàm Viết tắt Định nghĩa Multiquadric MQ 2 ()1 mq rr f =+ Inverse Multiquadric IMQ 2 ()11 imq rr f =+ Gausian Gauss 2 () r g re f - = Wendlend's C 6 W33 832 33 (1).(322581)rrrr f + =-+++ Số hóa bởi Trung tâm Học liệu http://www.lrc.tnu.edu.vn/ iv DANH MỤC HÌNH VẼ Trang Hình 1.1 Lưới sai phân 16 Hình 2.1 Cây tìm kiếm nhị phân 21 Hình 2.2 Phân hoạch Kdtree 23 Hình 2.3 Bốn cung phần 73 TẠP CHÍ KHOA HỌC, Đại học Huế, Số 53, 2009 MỘTSỐ PHƯƠNG PHÁP TRÍCHCHỌN ĐẶC TRƯNG HIỆU QUẢ CHO BÀI TOÁN NH ẬN DẠNG CHỮ VIẾT TAY RỜI RẠC Ph m Anh Ph ng Tr ng i h c Khoa h c, i h c Hu TÓM TẮT Trích ch n c tr ng là m t m t xích r t quan tr ng nh h ng tr c ti p n ch t l ng c a m t h th ng nh n d ng. Bài báo này so sánh m t s ph ng pháp trích ch n c tr ng n gi n nh ng hi u qu , có th áp d ng cho bài toán nh n d ng ch vi t tay r i r c. Các k t qu th c nghi m trên t p d li u ch s vi t tay MNIST cho th y m t s c tr ng mà chúng tôi l a ch n cho chính xác cao h n so v i các k t qu ã c công b [9]. I. Giới thiệu Nh ận dạng chữ viết tay đang là vấn đề thách thức lớn đối với các nhà nghiên cứu. Cho đến nay, bài toán nhận dạng chữ viết tay vẫn chưa có được một giải pháp tổng thể. Các k ết quả chủ yếu chỉ tập trung trên các tập dữ liệu chữ số viết tay chuẩn như USPS và MNIST [4,5,8,9], bên c ạnh đó cũng có mộtsố công trình nghiên cứu trên các hệ chữ cái ti ếng La tinh, Hy Lạp, Trung Quốc, Việt Nam tuy nhiên các kết quả cũng chỉ giới h ạn trong một phạm vi hẹp [2,7,10]. Trong l ĩnh vực nhận dạng, vấn đề tríchchọn đặc trưng là một bước rất quan tr ọng, nó có ảnh hưởng lớn đến chất lượng cũng như tốc độ của một hệ thống nhận dạng. Trích ch ọn đặc trưng như thế nào để vẫn đảm bảo không mất mát thông tin và/hoặc thu g ọn kích thước của dữ liệu đầu vào là điều mà nhiều nhà nghiên cứu đang quan tâm. Trong bài báo này, chúng tôi cài đặt thử nghiệm và so sánh mộtsố phương pháp trích ch ọn đặc trưng cho bài toán nhận dạng chữ viết tay rời rạc. Mô hình nhận dạng của chúng tôi được xây dựng trên cơ sở phương pháp véc tơ tựa (SVM – Support Vector Machines), đây là một phương pháp máy học tiên tiến đã có nhiều thành công trong các l ĩnh vực khai phá dữ liệu cũng như nhận dạng [3,6]. Ph ần còn lại của bài báo này có cấu trúc như sau: Phần 2 trình bày kiến trúc của mô hình nh ận dạng chữ viết tay rời rạc. Phần 3 trình bày mộtsố phương pháp tríchchọn đặc trưng có thể áp dụng cho chữ viết tay. Phần 4 trình bày mộtsố kết quả thực nghiệm trên t ập dữ liệu chữ số viết tay MNIST. Cuối cùng là phần kết luận. II. Kiến trúc của mô hình nhận dạng Trong mô hình nh ận dạng (hình 1), công đoạn tiền xử lý bao gồm các chức năng l ọc nhiễu và chuẩn hóa ảnh đầu vào. Việc chuẩn hóa ảnh bao gồm các bước sau: 74 Bước 1: Chuyển đổi ảnh đầu vào sang ảnh trắng đen. B ước 2: Tìm hình chữ nhật R bé nhất chứa các điểm đen trên ảnh. B ước 3: Lấy vùng ảnh I nằm trong vùng hình chữ nhật R. B ước 4: Chuẩn hóa kích thước ảnh I thành 16×16. Hình 1: Mô hình nh n d ng ch vi t tay r i r c Mô hình phân lớp được xây dựng từ các SVM nhị phân theo chiến lược một ch ống một (OVO – One verus One) với các tham số C=100 và sử dụng hàm nhân là hàm Gaussian v ới σ=0,5 [9]. Trong mô hình nh ận dạng ở hình 1, bài báo này chỉ tập trung vào giai đoạn trích ch ọn đặc trưng để đánh giá mộtsố loại đặc trưng được sử dụng cho bài toán nhận chữ vi ết tay. Phần tiếp theo, chúng tôi sẽ trình bày mộtsố phương pháp tríchchọn đặc trưng đơn giản, có thể áp dụng cho việc nhận dạng ký tự viết tay rời rạc. III. M ột số phương pháp tríchchọn đặc trưng Trong ph ần này, chúng tôi sẽ giới thiệu mộtsố phương pháp tríchchọn đặc trưng đơn giản nhưng hiệu quả, có thể áp dụng cho các tập dữ liệu chữ viết tay rời rạc. 3.1. Tr ọng số vùng (Zoning) Hình 2. Trích ch n c tr ng tr ng s vùng D li u hu n luy n Trích ch n c D li u nh n d ng Hu n luy n Mô hình hu n luy n SVM Nh n d ng K t qu nh n d ng Ti n x lý 75 Ảnh ký tự được chia thành N×N vùng (zones). Tổng số điểm đen của mỗi vùng s ẽ được chọn để tạo thành véc tơ đặc trưng. Trong th ực nghiệm, với ảnh kích thước 16×16, chúng tôi chọn N=8, như vậy có 8×8 = 64 đặc trưng. 3.2. Bi ểu đồ chiếu (Projection histograms) Đồ hoạ máy tính - Mộtsốthuậttoán giấu tin trong ảnh Trang - 31 - Với F2: Tính SUM((F2 K) W) = 2 (mod 8) Và vì chuỗi 3 bit tiếp theo cần giấu là 010 = 2 nên d = 0, vậy không cần thay đổi F2 nữa. Với F3: Tính SUM ((F3 K) W) = 2 (mod 8) Và vì chuỗi 3 bít tiếp theo cần giấu là 000 = 0, nên ta cần thay đổi F3 để tăng trọng số lên d = (0-2) mod 8 = 6. Ta xây dựng tập S 6 : Với h = 1: Ta nhận thấy W[4,4] = 8-6 =2 và T[4,4] =1, thoả mãn điều kiện thuật toán, nên S 6 = {(4,4)} , ta chọn luôn ô này để đảo bít . Khi dó, ma trận khối ảnh F3 là : Với F4: Tính SUM ((F4 K) W) = 4 (mod 8) Và vì chuỗi 3 bít tiếp theo cần giấu là 001 = 1, nên ta cần thay đổi F4 để tăng trọng số lên 5,d = (1-4) mod 8 = 5. Ta xây dựng tập S 5 : Với h = 1: S 5 = . Với h = 2 : S 10 = S 2 = { (2,2)}; S (-5) = S 3 = { (1,3), (2,1),(3,2), (3,4)}. Ta chọn đảo bít ở hai ô [F4] 2,2 và [F4] 3,2 Khi đó ma trận khối ảnh của F4 là : Ảnh tạo thành sau khi ghép 4 khối điểm ảnh F11;F22;F33:F44 như sau: 1 1 1 0 0 0 1 1 1 1 0 1 1 0 1 0 F’3 1 0 0 0 1 1 1 0 0 0 1 1 0 1 1 1 Đồ hoạ máy tính - Mộtsốthuậttoán giấu tin trong ảnh Trang - 32 - Như vậy, ta đã giấu xong thông tin B vào trong các khối theo thuậttoán CHEN_PAN_TSENG. 4. Phân tích đánh giá thuậttoán : Độ an toàn của thuậttoán : Đánh giá về độ an toàn của kỹ thuật giấu tin trong ảnh như đã trình bày ở trên, giả sử thuậttoán lập mã là công khai, cũng giả sử thêm rằng ảnh môi trường F, giá trị r, kích thước khối m*n không còn là bí mật. Hơn nữa , nếu người thám tin còn có cả bản mã (ảnh kết quả )F nhưng chưa biết khoá và ma trận trọng số , thì khi đó việc tìm ra thông tin giấu trong F bằng thuậttoán đã nêu ở trên với các tham số được biết vẫn gần như là không thể được. Thật vậy, ta có gần t 1 = 2 mn khả năng lựa chọn khoá K và gần t 2 = C 12 r mn *(2 r -1)!* (2 r -1) mn -( 12 r ) khả năng lựa chọn ma trận trọng số W và do đó có tới t 1 *t 2 cách kết hợp K với W. Khi (m*n) đủ lớn thì số lựa chọn này là rất lớn và gần như không thể tìm ra được bản tin mật. Chẳng hạn, với m = n = 4,r = 4, ta có t 1 =65.536,t 2 = 16*15!*15 = 313.841.848.320.000 Ttrong truờng hợp một phần thông tin B bị lộ và người thám tin biết được hai khối ảnh F i , F j và hai khối ảnh tương ứng sau khi đã lần lượt giấu B i và B j vào trong F i và F j , thì khả năng giải mã được thông tin là có thể xảy ra nếu có thêm mộtsố điều kiện . Nếu F i = F j thì sự khác nhau giữa B i và B j sẽ cho biết mối quan hệ của trọng số tại vị trí mà F i khác F’ j và F j khác F’ j . Hơn nữa, nếu có thêm rằng F i = F’ i = F’ j và chỉ có một bít tại vị trí (a,b) trong F j bị đảo, thì khi đó giá trị của W[a,b] =B j - B i (mod 2 r ) hoặc B i - B j (mod 2 r ). Điều này có thể dễ dàng thấy được nếu ta đặt : d i = B i – SUM((F i K) W) (mod 2 r ) = 0 0 1 0 1 0 1 1 0 1 0 0 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1 1 1 0 1 0 0 0 0 0 1 1 1 1 1 0 1 1 0 1 0 0 1 1 1 0 1 0 0 1 1 1 F’ 1 F’ 2 F’ 3 F’ 4 Đồ hoạ máy tính - Mộtsốthuậttoán giấu tin trong ảnh Trang - 33 - d j = B j – SUM((F j K) W) (mod 2 r ) Nếu mỗi phần tử của W đều có thể được xác định chỉ nhaqnj một trong hai giá trị trên thì số khả năng có thể cho W chỉ còn là 2 mn , giảm đi đáng kể so với ban đầu. Khi ma trận trọng số W bị xác định thì việc tìm khoá trở nên dễ dàng hơn . Chẳng hạn, như với giả thiết F i = F’ i và F j và F j khác F’ j tại một vị trí duy nhất (a,b) thì khi đó K[a,b] có thể được tính bằng cách : Nếu B j - B i ... quảvới liệu 10 không Bài báo giới thiệu số thuật tốn trích chọn thuộc tính cho toán xử lý số liệu lớn, nhiên tùy thuộc vào toán cụ thể loại số liệu mà chọn thuật toán phù hợp Tài liệu tham khảo [1]... giải thuật học hiệu chỉnh lại sai số (do chọn lựa thuộc tính dựa số tiêu chí liệu mà khơng dựa độ xác kết học) kết phân lớp đơi có độ xác khơng cao Một số thuật tốn trích chọn thuộc tính Các thuật. .. thuật toán khai phá liệu Giảm bớt số chiều mẫu theo gọi nén tập liệu, thơng qua trích chọn thuộc tính lựa chọn thuộc tính Quá trình bước việc tiền xử lý liệu Lựa chọn thuộc tính phần vốn có trích