DSpace at VNU: Tìm hiểu hàm nhân trong máy vector hỗ trợ và ứng dụng trong nhận dạng chữ số viết tay Researching Kernels of Support Vector Machine and Their Applications in Handwriting
TìmhiểuhàmnhânmáyvectorhỗtrợứngdụngnhậndạngchữsốviếttayResearchingKernelsofSupportVectorMachineandTheirApplicationsinHandwriting Recognition NXB H : ĐHCN, 2014 Số trang 52 tr + Chu văn Vinh Đại học Công nghệ Luận văn ThS ngành: Kỹ thuật Phần mềm; Mã số: 60 48 01 03 Người hướng dẫn: TS Nguyễn Văn Vinh Năm bảo vệ: 2014 Keywords: Kỹ thuật phần mềm; Hàm nhân; Máyvectorhỗ trợ; Phương pháp học máy Content Đặt vấn đề, giới thiệu toán Ngày với phát triển mạnh mẽ khoa học kỹ thuật, đặc biệt phát triển mạng máy tính toàn cầu, lượng lớn liệu tạo thường xuyên hàng ngày nhằm đáp ứng nhu cầu thiếu người thơng tin Chúng ta sống xã hội bùng nổ thông tin, ứngdụng công nghệ thông tin vào lĩnh vực đời sống xã hội Thông tin thể nhiều dạng khác như: văn bản, hình ảnh, âm cần nhận dạng, xếp, phân loại để người dễ dàngnhận biết tìm kiếm Học máy lĩnh vực trí tuệ nhân tạo, liên quan đến việc nghiên cứu xây dựng kỹ thuật cho phép hệ thống học tự động từ liệu để giải vấn đề cụ thể Phương pháp học máy thường áp dụng toán như: nhận dạng, phân lớp liệu, xử lý ngôn ngữ, tin sinh học Các phương phương pháp học máy thường sử dụng rộng rãi Mạng nơ-ron nhân tạo, máyvectorhỗ trợ, k-láng giềng gần nhất, Naive Bayes, mơ hình hỗn hợp Gauss Trong đó, thuật tốn máyvectorhỗtrợ (Support Vector Machine) phương pháp tiên tiến, đánh giá cao tính hiệu việc nhậndạng phân lớp liệu Nội dung thuật tốn máyvectorhỗtrợtìm siêu phẳng phân cách tối ưu để phân chia liệu tuyến tính làm hai lớp khác Trong thuật toán máyvectorhỗ trợ, hàmnhân tham số đóng vai trò quan trọng, ảnh hưởng đến tốc độ xử lý huấn luyện tính xác thuật tốn với tốn phân lớp liệu khơng tuyến tính Bài tốn lựa chọn hàmnhân tham số tốt vấn đề mở, tốn khó thuật toán máyvectorhỗtrợTrong nhiều phương pháp đề xuất, thuật tốn tìm kiếm dạng lưới thẩm định chéo phương pháp thơng dụng để tìmhàmnhân tham số tốt khoảng giá trị xác định trước Trên thực tế, máyvectorhỗtrợ cài đặt kiểm chứng cho kết nhận dạng, phân loại tốt với tốn như: nhậndạng hình ảnh, nhậndạngchữviết tay, phân loại văn bản, nhậndạng âm Bài toán nhậndạngchữviếttay vấn đề kinh điển công nghệ thông tin đa dạng thông tin đầu vào thuật tốn q trình hồn thiện để đến kết xác Mục tiêu luận văn Trên sở tính cấp thiết tính thực tiễn vấn đề nêu trên, tơi chọn đề tài “Tìm hiểuhàmnhânmáyvectorhỗtrợứngdụngnhậndạngchữsốviết tay” làm đề tài cho luận văn Mục đích luận văn tìmhiểuhàmnhânmáyvectorhỗ trợ, phương pháp lựa chọn tham số tốt cho hàmnhân khoảng giá trị xác định trước Từ phương pháp đó, tơi tìmhiểu tốn nhậndạngchữviết tay, bước áp dụnghàmnhân toán nhậndạngchữsốviếttay để thực cài đặt đánh giá kết thử nghiệm với hàm nhân, thử nghiệm phương pháp lựa chọn tham số cho hàmnhân Phương pháp phạm vi nghiên cứu luận văn Để đạt mục tiêu luận văn, tơi tìmhiểu tổng hợp kiến thức liên quan đến máyvectorhỗ trợ, hàmnhân thường sử dụngmáyvectorhỗ trợ, phương pháp đánh giá để tìm giá trị tốt cho tham sốhàmnhân khoảng giá trị xác định trước Sau đó, tìmhiểu tốn nhậndạngchữviết tay, q trình áp dụnghàmnhân để giải toán nhậndạngchữsốviếttay để xây dựng chương trình thử nghiệm đánh giá kết nghiên cứu Bên cạnh đó, để đánh giá tốt kết nghiên cứu, độ lớn độ xác tập liệu thử nghiệm quan trọng, tìmhiểu tập liệu sử dụng phổ biến lấy tập liệu MNIST để thử nghiệm chương trình cài đặt Nội dung luận văn Nội dung luận văn chia thành chương có nội dung sau: Chương 1: Thuật tốn máyvectorhỗ Chương trình bày lý thuyết học máy, máyvectorhỗ trợ, phương pháp cải tiến máyvectorhỗtrợ để làm tiền đề cho trình huấn luyện nhậndạng liệu Chương 2: Các hàmnhânmáyvectorhỗtrợ Chương giới thiệu vấn đề liên quan đến hàmnhân thường áp dụngmáyvectorhỗtrợ để giải tốn phân lớp liệu khơng tuyến tính Chương 3: Ứngdụnghàmnhânnhậndạngchữsốviếttay Chương giới thiệu toán nhậndạngchữviết tay, bước áp dụng thuật toán máyvectorhỗtrợhàmnhân để giải toán nhậndạngchữsốviếttay Chương 4: Cài đặt thử nghiệm chương trình Chương giới thiệu chương trình cài đặt, thử nghiệm với 7000 chữsốviếttay mẫu, từ đánh giá hiệu phương pháp tìm kiếm dạng lưới thẩm định chéo lựa chọn hàmnhân tham số cho hàmnhân khoảng giá trị xác định trước Phần kết luận: Tổng kết kết đạt luận văn hướng nghiên cứu, phát triển References Tiếng Việt [1] Trần Uyên Trang, Giáo trình Trí tuệ nhân tạo, 2013 [2] Nguyễn Thị Thảo, Phương pháp phân lớp sử dụngmáyvectorhỗtrợứngdụng tin sinh học, Tạp chí Khoa học Phát triển, 2011 [3] Phạm Anh Phương, “Nghiên cứu ứngdụng phương pháp máy véc tơ tựa nhậndạngchữViệtviếttay rời rạc”, Luận án Tiến sĩ, 2010 Tiếng Anh [4] Henok Girma, “A tutorial on SupportVector Machine”, 2009 [5] Cesar de Souza, “Handwriting Recognition Revisited: Kernel SupportVector Machine”, 2012 [6] Colin Campbell, “Kernel methods: a survey of current techniques”, 2001 [7] Alexandros Karatzoglou, David Meyer, Kurt Hornik “Support Vector Machines in R”, Journal of Statistical Software, 2006 [8] Olivier Chapelle, Vladimir Vapnik, “Choosing Multiple Parameters for SupportVector Machines”, 2001 [9] Ching-Yinn Lee, Shuh-Gi Chern, “Application of a supportvectormachine for liquefaction assessment”, Journal of Marine Science and Technology, Vol.21, No.3, pp.318-324, 2013 [10] Chih-Wei Hsu, Chih-Chung Chang, and Chih-Jen Lin, “A Practical Guide to SupportVector Classification”, 2010 [11] Y LeCun, L Bottou, Y Bengio, and P Haffner "Gradient-based learning applied to document recognition.", Proceedings of the IEEE, 86(11): 2278-2324, 1998 ... hiểu hàm nhân máy vector hỗ trợ ứng dụng nhận dạng chữ số viết tay làm đề tài cho luận văn Mục đích luận văn tìm hiểu hàm nhân máy vector hỗ trợ, phương pháp lựa chọn tham số tốt cho hàm nhân khoảng... quan đến hàm nhân thường áp dụng máy vector hỗ trợ để giải tốn phân lớp liệu khơng tuyến tính Chương 3: Ứng dụng hàm nhân nhận dạng chữ số viết tay Chương giới thiệu toán nhận dạng chữ viết tay, ... đánh giá để tìm giá trị tốt cho tham số hàm nhân khoảng giá trị xác định trước Sau đó, tìm hiểu tốn nhận dạng chữ viết tay, q trình áp dụng hàm nhân để giải toán nhận dạng chữ số viết tay để xây