Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 66 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
66
Dung lượng
1,21 MB
Nội dung
BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI - VŨ THỊ KIM HOAN MÔ HÌNH HĨA MỜ VÀ ỨNG DỤNG Chun ngành: Cơng nghệ thơng tin LUẬN VĂN THẠC SỸ KỸ THUẬT NGÀNH: CƠNG NGHỆ THƠNG TIN NGƯỜI HƯỚNG DẪN: PGS.TS Trần Đình Khang HÀ NỘI - 2013 Tôi – Vũ Thị Kim Hoan - - - cam kết Luận văn tốt nghiệp cơng trình nghiên cứu thân tơi hướng dẫn GS.TS Trần Đình Khang, Viện CNTT-TT, Trường Đại học Bách Khoa Hà Nội Các kết nêu Luận văn tốt nghiệp trung thực, không chép tồn văn cơng trình khác Hà Nội, ngày 28 tháng năm 2013 Học viên: Vũ Thị Kim Hoan Lớp : Cao học 10BCNTTHV thầy , PGS.TS Trần Đình Khang thầy riêng Lãnh đạo UBND huyện Sông Lô đồng nghiệp Văn phịng UBND huyện Sơng Lơ MỤC LỤC MỤC LỤC DANH MỤC CHỮ VIẾT TẮT DANH MỤC HÌNH VẼ PHẦN MỞ ĐẦU CHƯƠNG I: TỔNG QUAN 10 1.1 Giới thiệu đề tài 10 1.2 Mục tiêu giải pháp 10 1.2.1 Mục tiêu 10 1.2.2 Giải pháp 10 1.3 Nội dung luận văn 11 CHƯƠNG II: CÁC KHÁI NIỆM CƠ BẢN 12 2.1 Tập mờ, phép toán tập mờ 12 2.1.1 Tập mờ, đặc trưng tập mờ 12 2.1.2 Các phép toán tập mờ 13 2.2 Quan hệ mờ 16 2.3 Suy luận mờ 17 2.3.1 Biến ngôn ngữ mệnh đề mờ 17 2.3.2 Luật hợp thành mờ 19 2.4 Mơ hình hóa mờ 21 2.4.1 Cấu trúc hoạt động mơ hình mờ 21 2.4.2 Phân loại mô hình mờ 24 2.4.3 Kỹ thuật mơ hình hóa mờ 26 2.5 Khám phá tri thức khai phá liệu 28 2.5.1 Quá trình khám phá tri thức 29 2.5.2 Các hư ớng tiếp cậncơ kỹ thuật áp dụng khai phá liệu 30 2.6 Mơ hình mờ dựa phân cụm liệu 31 CHƯƠNG III: XÂY DỰNG MƠ HÌNH MỜ DỰA TRÊN PHÂN TÍCH PHÂN CỤM DỮ LIỆU MỜ 32 3.1 Mơ hình hóa mờ dựa phân tích phân cụm liệu 32 3.2 Định nghĩa biến mờ hàm thuộc 34 3.3 Nhận dạng cấu trúc lựa chọn tham số khởi tạo 35 3.3.1 Giải thuật 1: Giải thuật sinh luật mờ từ liệu vào-ra 35 3.3.2 Gi ải thuật 2: Giải thuật xác định số luật C giá trị tham số khởi tạo 36 3.4 Nhận dạng tham số 38 3.4.1 Giải thuật 3: Tối ưu hóa tham số mơ hình 39 CHƯƠNG IV: BÀI TOÁN ỨNG DỤNG 41 4.1 Phát biểu toán 41 4.2 Đề xuất phương pháp giải 42 4.2.1 Bước tiền xử lý 42 4.2.2 Bước nhận dạng ký tự 43 4.3 Giới thiệu công cụ cài đặt 44 4.3.1 Image Processing Toolbox 44 4.3.2 Fuzzy Logic Toolbox 45 4.4 Phân tích thiết kế hệ thống 46 4.4.1 Phân tích hệ thống 46 4.4.2 Thiết kế 56 4.4.3 Kết thu 62 KẾT LUẬN 63 Các nội dung hoàn thành 63 Hướng phát triển luận văn 63 TÓM TẮT LUẬN VĂN 64 THESIS SUMARY 65 DANH MỤC TÀI LIỆU THAM KHẢO 66 DANH MỤC CHỮ VIẾT TẮT Từ viết tắt Từ đầy đủ FIS Fuzzy Inference Systems ERD Euclidean Relative Distance BLD Biểu đồ luồng liệu LCT Lược đồ cấu trúc PI Performance Index DANH MỤC HÌNH VẼ Hình Hình Hình Hình Hình Hình Hình Hình Hình Hình 10 Hình 11 Hình 12 Hình 13 Hình 14 Hình 15 Hình 16 Hình 17 Hình 18 Hình 19 Hình 20 Hình 21 Hình 22 Hình 23 Hình 24 Hình 25 Hình 26 Hình 27 Hình 28 Hình 29 Hình 30 Hình 31 Hình 32 Hình 33 Hình 34 Thí d ụ biến ngơn ngữ (V,X, T) đư ợc dùng để mô tả tuổi thọ người Cấu trúc mơ hình mờ Mơ hình mờ Mamdani sử dụng tích max Mơ hình mờ Sugeno Mơ hình mờ Tsukamoto Sơ đồ q trình mơ hình hố mờ ba giai đoạn Q trình khám phá tri thức Một ví dụ dạng hàm µ Lựa chọn tập mờ thích hợp Biểu đồ luồng thuật toán nhận dạng Biểu đồ phân cấp chức hệ thống Biểu đồ luồng liệu mức khung cảnh Biểu đồ luồng liệu mức đỉnh Biểu đồ luồng liệu mức đỉnh cho chức Chức tách vùng thẻ nhân viên Chức tách ký tự Trích chọn đặc trưng Chức trích chọn đặc trưng Biểu đồ luồng liệu mức đỉnh ứng với chức Biểu đồ luồng liệu mức với chức nhận dạng ký tự Chức sinh luật khởi tạo tham số hệ thống Chức tối ưu hóa tham số hệ thống Lưu đồ giải thuật nhận dạng Chức tạo FIS Chức suy diễn mờ Chức khử mờ File training data File rule base Các biến mờ đầu File đầu chứa kết nhận dạng Giao diện chương trình Chức Show FIS Chức Show MF Chức Show Rules PHẦN MỞ ĐẦU Ngày Việt Nam bước vào thời kỳ hội nhập chủ động hội nhập với kinh tế toàn cầu khu vực làm cho đời sống xã hội có nhiều biến đổi, biến đổi chất lượng sống Nhiều doanh nghiệp lớn nhỏ đời đòi hỏi phải có quản lý chặt chẽ Nhu cầu tin học hóa giúp doanh nghiệp nhiều việc quản lý Trong năm gần đây, mô hình hóa hệ thống mờ cơng cụ mơ hình hóa hệ thống bật sử dụng việc phân tích liệu theo dạng khơng chắn, khơng rõ ràng Kỹ thuật mơ hình hóa trải qua thời gian chứng tỏ mạnh tầm quan trọng mình, giúp người mơ lại hệ thống thực, bắt chước đủ xác hành vi hệ thống đó, thể qua phản ứng đầu mơ hình có tác động phía đầu vào so với thực nghiệm Mơ hình xây dựng có ý nghĩa quan trọng thực tiễn, giúp người tiết kiệm chi phí hạn chế tổn thất so với thực nghiệm giới thực Bằng việc tiến hành kiểm thử mơ hình tiêu tốn thời gian hơn, cơng việc phải làm đơn giản Trước kinh tế với xu hội nhập, mở cửa, doanh nghiệp ln vận động chuyển theo xu Mỗi bước tiến dù lớn hay nhỏ, đóng góp vào phát triển doanh nghiệp Chấm công phần công việc quan trọng bỏ qua quan trọng công tác quản lý nhân Đây công việc dễ gây nhiều sai sót nhất, gây lãng phí thời gian, người doanh nghiệp Mơ hình nhận dạng mã số nhân viên tự động giúp môi trường làm việc chuyên nghiệp hơn, nâng cao ý thức kỷ luật nhân viên, tạo nên công việc chấm cơng nhân viên Mặt khác, cịn xu đại hố cơng tác quản trị hành Cơng ty, giúp giảm thiểu sai sót giúp người quản lý đánh giá cách xác, tạo hệ thống khen thưởng, kỷ luật môi trường lao động tin cậy Trong khuân khổ luận văn này, em xin trình bày số kiến thức lý thuyết tập mờ, mơ hình hóa mờ sử dụng kỹ thuật mơ hình hóa mờ dựa phân tích phân cụm liệu ứng dụng vào nhận dạng mã số nhân viên quản lý nhân Công ty phanh NISSIN Nghiên cứu tập trung vào đối tượng thẻ nhân viên nhà máy thu thập hình ảnh làm sở liệu cho việc xử lý CHƯƠNG I: TỔNG QUAN 1.1 Giới thiệu đề tài Luận văn "Mơ hình hóa mờ ứng dụng" cơng cụ mơ hình hóa hệ thống bật sử dụng việc phân tích liệu theo dạng không chắn, không rõ ràng Luận văn giúp hiểu rõ lý thuyết tập mờ, mơ hình hóa mờ ứng dụng vào nhận dạng mã số nhân viên qu ản lý nhân Công ty phanh NISSIN Luận văn không giúp ta hiểu lý thuyết tập mờ nâng cao, xây dựng mơ hình hóa mờ mà cịn giúp ta mở rộng hướng phát triển, xây dựng mơ hình với độ xác cao áp dụng vào toán thực tế 1.2 Mục tiêu giải pháp 1.2.1 Mục tiêu Mục tiêu Luận văn nghiên cứu tìm hiểu hệ mờ, mơ hình hóa mờ sử dụng kỹ thuật mơ hình hóa mờ dựa phân tích phân cụm liệu nhằm nhận dạng mã số nhân viên tự động Nghiên cứu tập trung giải tất vấn đề nảy sinh từ việc xử lý ảnh thẻ nhân viên việc đưa xác mã số nhân viên Cụ thể hơn, yêu cầu toán áp d ụng thuật toán thích hợp tìm vùng chứa mã số nhân viên, trích vùng mã số nhân viên, tách ký tự vùng mã số nhân viên đó, cuối áp dụng giải thuật nhận dạng mã số nhân viên 1.2.2 Giải pháp 1.2.2.1 Tìm hiểu logic mờ mơ hình hóa mờ Tìm hiểu lý thuyết logic mờ, tổng quan mơ hình hóa mờ kỹ thuật mơ hình hóa mờ 1.2.2.2 Mơ hình hóa mờ dựa phân tích phân cụm liệu Mục trình bày phương pháp luận giúp nhận dạng hệ mờ Trong bước đầu tiên, xác định hàm khoảng cách (distance function) để tiến hành sinh tự động luật 10 Đặc trưng Nhân viên Kết nhận dạng Đặc Mờ hoá trưng Biến mờ, hàm thuộc Khử mờ Cơ sở luật Kết suy diễn Suy diễn mờ Tạo FIS Tạo sơ luật Tham số hệ thống FIS Hình 20: Biểu đồ luồng liệu mức với chức nhận dạng ký tự a Tạo mơ hình Nhận dạng mơ hình khởi tạo tham số hệ thống: Biến mờ, hàm thuộc, tham số hệ thống Cơ sở luật chưa tối ưu Sinh sở luật Tham số hệ thống (khới tạo) Hình 21: Chức sinh luật khởi tạo tham số hệ thống 52 Giải thuật nhận dạng (giải thuật tối ưu hóa tham số hệ thống): Cơ sở luật Tối ưu hóa tham số hệ thống Tham số hệ thống (tối ưu) Hình 22: Chức tối ưu hóa tham số hệ thống Đặc tả chức Hình 23: Lưu đồ giải thuật nhận dạng b.Dự đốn (test mơ hình) Dùng chức FIS (Fuzzy Inference Systems) fuzzy logic toolbox c Matlab ta dễ dàng tạo fuzzy controller (bộ điều khiển mờ) có chức suy diễn kết từ tập liệu đầu vào tập luật Các hàm đặc biệt FIS: - newfis: tạo FIS 53 - addvar: thêm biến mờ (vào ra) vào FIS - addmf: khai báo term (dạng khoảng giá trị) - addrule: thêm rule base vào FIS - showfis: thị FIS (toàn biến vào ra), trường hợp nhiều hai biến vào có hai biến thị - plotmf: vẽ hàm thuộc biến mờ - evalfis: thực tính toán diễn mờ, nhận đầu vào liệu rõ với FIS, kết trả giá trị rõ Tạo FIS Trước tiến hành suy diễn mờ, việc cần làm tạo FIS cách định nghĩa biến mờ đầu vào, biến mờ đầu ra, thêm sở luật vào FIS Cơ sở luật Biến mờ, hàm thuộc, Tham số hệ thống FIS Tạo FIS Hình 24: Chức tạo FIS Đặc tả chức năng: BEGIN Khởi tạo FIS (rỗng) FOR Xét biến mờ đầu vào Thêm biến mờ vào FIS Thêm hàm thu ộc (tên giá rt ị ngôn ngữ, dạng khoảng giá trị hàm thuộc) 54 END FOR Thêm biến mờ đầu vào FIS Thêm hàm thuộc ứng với biến mờ đầu Thêm sở luật vào FIS END Chức suy diễn mờ Đặc trưng FIS Kết suy diễn Suy diễn mờ Hình 25: Chức suy diễn mờ Đặc tả chức năng: BEGIN Nhập giá trị biến mờ đầu vào (8 giá trị tương ứng với đặc trưng) FOR Với giá trị biến mờ đầu vào IF khoảng giá trị biến vượt ngưỡng Điều chỉnh giá trị cho nằm ngưỡng END IF END FOR Suy diễn mờ END 55 Chức khử mờ Kết nhận dạng Kết suy diễn Khử mờ Hình 26: Chức khử mờ Đặc tả chức năng: BEGIN Lấy kết suy diễn Làm tròn kết suy diễn SWITCH (kết suy diễn) CASE return 'A' CASE return 'B' CASE 35 return '9' OTHERWISE return '0' END SWITCH END 4.4.2 Thiết kế: 4.4.2.1 Bộ liệu huấn luyện: - Có đầu vào (tương ứng với đặc trưng ảnh ký tự) đầu Vì mơ hình có biến mờ đầu vào biến mờ đầu Các biến mờ vào, dạng (9) 56 STT Loại Tên biến input ec input or input ex input hps input vps input hpk input vpk input pe output char Danh sách biến mờ vào - Mỗi biến mờ đầu vào có giá trị ngôn ngữ với khoảng cách Terminput = {Very Small, Small, Medium, Large, Very Large} - Các thao tác vào với sở liệu vào với file Có dạng file dùng chương trình: + File training data testing data có ịnh đ dạng: hàng chứa cột, cột đặc trưng tương ứng với biến mờ đầu vào hệ thống, cột cuối biến mờ đầu (ký tự nhận dạng giống 'a', 'b', '1' ) Hình 27: File training data 57 - File rule chứa tập luật sinh từ thuật tốn Mỗi dịng chứa luật dạng Madani: AND(if (dti = termi)) then y = 'kt' (i=1:13) Trong dt = đặc trưng, term giá trị ngơn ngữ ứng với dt, kt = kí tự Hình 28: File rule base - Biến mờ đầu chứa 35 giá trị ngôn ngữ (26 chữ + số) Chi tiết xem hình bên dưới: Hình 29: Các biến mờ đầu 58 - File result chứa kết nhận dạng mã số thẻ nhân viên ghi text Mỗi dòng mã số thẻ Hình 30: File đầu chứa kết nhận dạng 4.4.2.2 Form Hình 31: Giao diện chương trình Form hệ thống trình bày vào phần riêng rẽ theo chức phần: - Phần 1: Hiển thị kết Bao gồm cửa sổ hình nhỏ 59 - Phần 2: Nhóm chức tiền xử lý Bao gồm buttons, button làm nhiệm vụ riêng biệt trình tiền xử lý ảnh - Phần 3: Nhóm chức tạo mơ hình (training):Bao gồm buttons - Phần 4: Nhóm chức nhận dạng Dữ liệu vào tương tác với hệ thống qua hai thẻ Image Data + Image: bao gồm chức Open Save ảnh + Data: bao gồm chức load data save data Data ma trận ảnh, phần tử ma trận ảnh 4.4.2.3 Chức Show FIS Hình 32: Chức Show FIS 60 4.4.2.4 Chức Show MF Hình 33: Chức Show MF 4.4.2.5 Chức Show Rules Hình 34: Chức Show Rules 61 4.4.3 Kết thu được: 4.4.3.1 Kết cài đặt: - Đã cài đặt chức hệ thống mô tả phần phân tích– thiết kế - Dựa hệ thống xây dựng, mẫu thẻ nhân viên thu thập từ ảnh thực tế đưa vào hệ thống kiểm tra độ xác 4.4.3.2 Kết thử nghiệm: Số lượng mẫu thử: 22 mẫu thu thập điều kiện ánh sáng khác Tỉ lệ mẫu xác chương trình đạt sau: Các cơng đoạn Số mẫu xác Tỉ lệ mẫu xác Tách vùng mã số thẻ 19/22 86.36% Trích chọn đặc trưng 20/22 90.90% Nhận dạng 19/22 86.36% 4.4.3.3 Ưu, nhược điểm hệ thống: - Ưu điểm: + Số lượng đặc trưng trích chọn lớn + Xử lý trích chọn đặc trưng ký tự gốc thay ký tự làm mảnh (skeleton), trình làm mảnh ảnh làm mát thơng tin ảnh + Bước tiền xử lý thu độ xác cao - Hạn chế: + Chưa xét đến trường hợp ảnh thẻ bị nghiêng + Thiếu phép xử lý nâng cao chất lượng ảnh: cân sáng, xử lý độ tương phản ảnh + Số lượng mẫu học hạn chế (mỗi ký tự gồm mẫu học) + Độ xác chưa cao 62 KẾT LUẬN Mơ hình hóa mờ kỹ thuật tính tốn mềm mẻ đầy tiềm áp dụng cho tốn mơ hình hóa hệ thống Trong khn khổ luận văn này, kỹ thuật mơ hình hóa mờ dùng để giải toán nhậ n dạng mã số thẻ nhân viên Công ty phanh NISSIN Các nội dung hoàn thành Hệ thống xây dựng luận văn kết trình giải vấn đề đặt khn khổ tốn: từ phép tiền xử lý ảnh nhị phân hóa ảnh, lọc nhiễu, đánh nhãn bước trích chọn đặc trưng cuối xây dựng nên hệ mờ làm chức nhận dạng ký tự Công cụ môi trường lựa chọn cài đặt Matlab Hệ thống xây dựng dùng để kiểm tra liệu thực tế để thẩm định độ xác Các kết đạt ban đầu cho thấy hệ thống đạt độ xác nhận dạng tương khả quan tiếp tục hoàn thiện thời gian tới Hướng phát triển luận văn Để nâng cao độ xác nhận dạng, cần thiết chắn phải nâng cao độ xác ba cơng đoạn: trích vùng mã số thẻ, tách ký tự mã thẻ nhận dạng mã thẻ Một hướng tiếp cận mờ khác nâng cao độ xác hệ thống đề xuất sau: Xuất phát từ đặc điểm ký tự mã số thẻ ký tự in (có mẫu chuẩn cho ký tự), phương pháp khớp mẫu (matching templates) nghĩ đến lựa chọn mang lại hiệu nhận dạng cao Tuy nhiên, trình tiền xử lý phải đặc biệt tốt để đảm bảo ký tự ảnh "giống" so với ký tự mẫu Bởi thế, thay phương pháp tiền xử lý thơng thường, nên sử dụng kỹ thuật mơ hình hóa mờ (lọc trung vị mờ ảnh ví dụ) để đạt kết tốt 63 TÓM TẮT LUẬN VĂN Trong khuôn khổ luận văn, kỹ thuật mơ hình hóa ứng dụng rộng rãi thực tế: mơ hình hóa mờ áp dụng để giải toán nhận dạng mã số nhân viên thẻ nhân viên công ty phanh NISSIN Q trình mơ hình hóa chia làm hai giai đoạn Giai đoạn giai đoạn tiền xử lý: sử dụng camera chụp vùng chứa mã số nhân viên, chuyển đổi không gian màu, lọc nhiễu, cân sáng, trích vùng mã số nhân viên từ ảnh, tách ký tự vùng mã số Giai đoạn áp dụng kỹ thuật mơ hình hóa mờ dựa phương pháp phân tích phân cụm liệu để nhận dạng mã số nhân viên, có đánh giá sai số hiệu mơ hình 64 THESIS SUMARY In this thesis, an increasingly popular modeling method - fuzzy modelling – is employed to solving employee identification card number of the company employees NISSIN This modeling process can be divided into two phases First is the preprocessing step: using cameras to capture image contains employee to be identified, color space conversion, noise reduction, white balance, extract the area corresponding to the image, character partition Step employs the modeling algorithm based on fuzzy clustering analysis of data to identify characters in the card number and evaluate errors and performance of the model 65 DANH MỤC TÀI LIỆU THAM KHẢO Hồ Văn Sung: Xử lý ảnh số, lý thuyết thực hành với Matlab, Nhà xuất Khoa học kỹ thuật, 2009 Jesse Hansen, Optical Character Recognition (ORC) MathWorks - MATLAB and Simulink for Technical Computing Nguyễn Trọng Thuấn: Điều khiển Logic ứng dụng, Nhà xuất Khoa học kỹ thuật, 2000 Ondrej Martinsky: Algorthimic and Mathematical Principles of Automatic Number Plate Recognition Systems, BRNO 2007, Brno University of Technology P.J Costa Branco, J.A.Dente: Fuzzy systems modeling in practice, Fuzzy Sets and Systems 121 (2001) 73 – 93 Phan Xuân Minh, Nguyễn Doãn Phước: Lý thuyết điều khiển mờ , Nhà xuất Khoa học kỹ thuật 1999 R.A Lotufo, A.D Morgan, and AS Johnson: Automatic Number-Plate Recognition, Proceedings of the IEE Colloquium on Image analysis for Transport Applications, V01.035, pp.6/1-6/6, February 16, 1990 Y.M.Ali, Liangchi Zhang: A methodology for fuzzy modeling of engineering systems, Fuzzy Sets and Systems 118 (2001) 181-197 66 ... MỤC HÌNH VẼ Hình Hình Hình Hình Hình Hình Hình Hình Hình Hình 10 Hình 11 Hình 12 Hình 13 Hình 14 Hình 15 Hình 16 Hình 17 Hình 18 Hình 19 Hình 20 Hình 21 Hình 22 Hình 23 Hình 24 Hình 25 Hình 26 Hình. .. mơ hình mờ Dựa loại chế suy diễn mờ dạng luật mờ sử dụng, phần lớn mơ hình mờ xếp vào ba loại mơ hình sau: Mơ hình mờ Mamdani, mơ hình mờ Takagi-Sugeno, mơ hình mờ Tsukamoto 2.4.2.1 Mơ hình mờ. .. 1.2.2 Giải pháp 1.2.2.1 Tìm hiểu logic mờ mơ hình hóa mờ Tìm hiểu lý thuyết logic mờ, tổng quan mơ hình hóa mờ kỹ thuật mơ hình hóa mờ 1.2.2.2 Mơ hình hóa mờ dựa phân tích phân cụm liệu Mục trình