1. Trang chủ
  2. » Công Nghệ Thông Tin

Nghiên cứu về học chuyển đổi trong GP (genetic programming)

7 12 0

Đang tải... (xem toàn văn)

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 7
Dung lượng 417,82 KB

Nội dung

Bài viết trình bày việc đề xuất mô hình cài đặt học chuyển đổi trong GP. Mô hình học chuyển đổi trong GP được xây dựng bằng cách sao chép các giải pháp tốt từ bài toán nguồn (source) sang dân số của bài toán đích (targe).

TẠP CHÍ KHOA HỌC − SỐ 14/2017 79 NGHIÊN CỨU VỀ HỌC CHUYỂN ĐỔI TRONG GP (GENETIC PROGRAMMING) Ngô Thúy Ngân1 Trường Đại học Thủ Hà Nội Tóm tắt tắt: Trong báo cáo này, đề xuất mơ hình cài đặt học chuyển đổi GP Mơ hình học chuyển đổi GP xây dựng cách chép giải pháp tốt từ toán nguồn (source) sang dân số tốn đích (targe) Mơ hình kiểm thử số lớp tốn Hồi quy ký hiệu có cấu trúc kết thực nghiệm sử dụng Học chuyển đổi giúp GP thực thi tốt lớp toán liên quan Tuy nhiên, chuyển đổi nhiều tri thức làm giảm mức độ thực thi GP chuyển đổi tri thức không cần thiết ảnh hưởng xấu đến chất lượng giải pháp tìm được, tượng cịn gọi negative transfer Do đó, nghiên cứu trả lời câu hỏi "bao nhiêu tri thức cần chuyển từ tốn nguồn sang tốn đích" đóng vai trị quan trọng Trong báo cáo này, chúng tơi cố gắng cung cấp kết trả lời ban đầu cho câu hỏi Từ khóa: khóa Lập trình di truyền, học chuyển đổi MỞ ĐẦU Bài báo đề xuất mơ hình cài đặt học chuyển đổi GP Mơ hình học chuyển đổi GP xây dựng cách chép lời giải tốt từ tốn nguồn sang quần thể tốn đích Mơ hình kiểm thử số lớp toán kết thực nghiệm sử dụng Học chuyển đổi giúp GP thực thi tốt lớp toán liên quan Tuy nhiên, chuyển đổi nhiều tri thức làm giảm mức độ thực thi GP chuyển đổi tri thức không cần thiết ảnh hưởng xấu đến chất lượng giải pháp tìm Do đó, nghiên cứu trả lời câu hỏi "bao nhiêu tri thức cần chuyển từ toán nguồn sang tốn đích" đóng vai trị quan trọng Học chuyển đổi chủ đề nghiên cứu thu hút nhiều ý lĩnh vực học máy thời gian gần Học chuyển đổi cố gắng làm theo trình học người Tuy nhiên, kỹ thuật học máy phổ biến không thiết kế để làm Nhận ngày 11.2.2017; chỉnh sửa, gửi phản biện duyệt đăng ngày 20.3.2017 Liên hệ tác giả: Ngô Thúy Ngân; Email: ntngan@daihocthudo.edu.vn TRƯỜNG ĐẠI HỌC THỦ ĐƠ H 80 NỘI Nói cách khác, thuật toán học máy thường áp dụng riêng lẻ với toán Điều học máy áp dụng cho môi trường động mục tiêu tham số thay đổi trình học Kết từ nghiên cứu trước cho thấy cách tiếp cận học chuyển đổi cải thiện mở rộng khả học máy việc giải toán thực tế Trong lĩnh vực thuật toán tiến hố, Lập trình Di truyền thuật tốn đề xuất gần GP chế thiết kế cho phép quần thể chương trình máy tính tiến hố Từ xuất hiện, GP áp dụng vào nhiều toán thực tế Bài báo đề xuất phương pháp cài đặt học chuyển đổi GP Cụ thể, cố gắng trả lời ba câu hỏi quan trọng cài đặt phương pháp học chuyển đổi Các câu hỏi gồm: Chúng ta nên chuyển đổi từ tốn nguồn sang tốn đích? Làm chuyển đổi kiến thức từ tốn nguồn sang tốn đích? Nên chuyển đổi kiến thức? NỀN TẢNG 2.1 Học chuyển đổi Học chuyển đổi q trình hệ thống nhận dạng áp dụng kiến thức, kỹ học công việc trước vào công việc Các phương pháp học chuyển đổi dựa số kỹ thuật học máy mạng nơron Có nhiều ứng dụng lớn áp dụng thành cơng học chuyển đổi bao gồm phân loại văn bản, phân loại trang web, xác định vị trí wi-fi nhà Học chuyển đổi chí cịn dùng cho vài lĩnh vực thị giác, xử lý ngôn ngữ tự nhiên, phân loại ảnh Tuy nhiên, học chuyển đổi chưa xây dựng cho Lập trình Di truyền 2.2 Lập trình di truyền Lập trình di truyền (GP) phát triển Koza vào năm 1992 Dựa quan sát hệ thống sinh học, sử dụng chế lựa chọn tự nhiên Darwin để tiến hoá quần thể lời giải tốn Nó xem phương pháp học máy để tối ưu quần thể chương trình máy tính để thực cơng việc tính tốn Để áp dụng GP giải toán, bước sau cần xử lý Chọn cách biểu diễn, tập chức kết thúc hàm thích nghi cho toán Khởi tạo quẩn thể cá thể Đánh giá thích nghi (tốt mức nào) cá thể quần thể Nếu điều kiện dừng thoả mãn, kết thúc Ngược lại chuyển sang bước TẠP CHÍ KHOA HỌC − SỐ 14/2017 81 Chọn số cá thể (lời giải ứng viên) sử dụng phương pháp chọn Áp dụng số toán tử di truyền lời giải chọn để sinh quần thể Lặp lại bước tới bước PHƯƠNG PHÁP Phương pháp nhằm trả lời ba câu hỏi sau học chuyển đổi: Chúng ta nên chuyển đổi từ tốn nguồn sang tốn đích? Làm chuyển đổi kiến thức từ tốn nguồn sang tốn đích? Nên chuyển đổi kiến thức? Câu hỏi thứ thứ hai đơn giản Chúng ta chuyển đổi kiến thức từ tốn nguồn vào tốn đích cách lựa chọn số lời giải tốt từ quần thể hệ gần toán nguồn copy chúng sang quần thể hệ tốn đích Câu hỏi thứ ba khó trả lời Nghiên cứu trước tái sử dụng GP thường chuyển đổi tồn kiến thức từ nguồn vào đích Nói cách khác, tồn quần thể hệ cuối toán nguồn copy trực tiếp trở thành hệ toán đích Tuy nhiên, chuyển đồi q nhiều kiến thức dẫn tới chuyển đổi tiêu cực làm giảm hiệu hệ thống học THỬ NGHIỆM Để đánh giá hiệu phương pháp đề xuất, ta tiến hành thử nghiệm nhóm tốn Các tốn khác có dạng đơn giản tới dạng phức tạp Với toán, GP sử dụng để huấn luyện dạng đơn giản (ví dụ F1.1) 20 hệ Sau đó, k% cá thể tốt hệ cuối copy sang hệ toán thứ hai (F1.2) (100-k) % cá thể hế hệ toán thứ hai sinh ngẫu nhiên Q trình lặp lại cho tốn khác toán cuối giải (F1.5) Bảng 1: Một số lớp toán Lớp toán Các toán x2+x (F1.1) x3+x2+x F1 (F1.2) 3 x +x +x +x (F1.3) x +x +x +x +x x +x +x +x +x +x (F1.4) (F1.5) TRƯỜNG ĐẠI HỌC THỦ ĐÔ H 82 Lớp toán NỘI Các toán F2 cos(x)+sin(x) (F2.1) cos(x)+sin(x) + sin2(x) (F2.2) cos(x)+sin(x) + sin2(x) + sin3(x) (F2.3) cos(x)+sin(x) + sin (x) + sin (x) + sin (x) (F2.4) cos(x)+sin(x) + sin2(x) + sin3(x) + sin4(x) + sin5(x) (F2.5) F3 cos(x)+sin(x) (F3.1) cos(x)+sin(x)+ sin(2x) (F3.2) cos(x)+sin(x)+sin(2x)+sin(3x) (F3.3) cos(x)+sin(x)+sin(2x)+sin(3x) +sin(4x) (F3.4) cos(x)+sin(x)+sin(2x)+sin(3x)+sin(4x)+sin(5x) (F3.5) F4 sin(x)-x*cos(x) (F4.1) 2 sin(x)-x*cos(x)+x *cos(x ) (F4.2) sin(x)-x*cos(x)+x2 *cos(x2)-x3*cos(x3) (F4.3) 2 3 sin(x)-x*cos(x)+x *cos(x )-x *cos(x )+x *cos(x4) (F4.4) sin(x)-x*cos(x)+x2 *cos(x2)-x3*cos(x3)+x4 *cos(x4)-x5*cos(x5) (F4.5) Vì có tốn nhóm, nên hàm thích nghi thay đổi lần hàm thích nghi tiến hố 20 hệ, số lượng hệ tối đa 100 Chúng đánh giá khả tổng quát hoá GP học chuyển đổi thông qua lựa chọn cá thể tốt hệ thử nghiệm cá thể tập số liệu độc lập Bảng 2: Giá trị tham số tiến hoá giá trị chạy Tham số Kích thước quần thể Thế hệ Lựa chọn Kích cỡ Tournament Xác suất lai ghép Xác xuất đột biến Độ sâu tối đa khởi tạo Độ xâu tối đa Độ sâu tối đa đột biến Không kết thúc Kết thúc Tập huấn luyện Tập thử nghiệm Thích nghi thô Số lần thử cho xử lý Giá trị 500 100 Tournament 0.9 0.05 15 15 +, -, *, / (protected one), sin, cos, exp, log (protected one) X 60 random points in [-1,1] 60 random points in [-3,3] mean of absolute error on all fitness cases 30 independent runs for each value TẠP CHÍ KHOA HỌC − SỐ 14/2017 83 KẾT QUẢ Với tốn, có biểu đồ khác tương ứng với lượng kiến thức chuyển đổi khác Các lượng bao gồm 0% (không chuyển đổi) tương tự GP chuẩn; 25% (k25-Transferring nghĩa 25% số cá thể quần thể cuối từ toán nguồn chuyển sang tốn đích)…, 100% (k100- chuyển đổi toàn bộ) Các kết thử nghiệm cho thấy chuyển đổi kiến thức giúp ích cho việc áp dụng GP cho nhóm tốn Động có cấu trúc phức tạp tăng lên Best fitenss [mean absolute error] Stan dard GP Generations Best fitenss [mean absolute error] Stand ard GP Generations Standa rd GP Best fitenss [mean absolute error] Best fitenss [mean absolute error] Stan dard GP Generations Hình 1: Đồ thị tập huấn luyện K25Transf er GP K50Transf er GP Generations TRƯỜNG ĐẠI HỌC THỦ ĐÔ H Best fitness [mean absolute error] Stand ard GP K25Transf er GP Generations Stand ard GP Standa rd GP Best fitness [mean absolute error] Generations Best fitness [mean absolute error] NỘI Standa rd GP Best fitness [mean absolute error] 84 Generations K25Transf er GP Generations Hình 2: Đồ thị tập thử nghiệm TÀI LIỆU THAM KHẢO Angeline, P J Pollack (1993), "Evolutionary Module Acquisition", Proceedings of the 2nd Annual Conference on Evolutionary Programming, pp 154-163, MIT Press G.P.C Fung, J.X Yu, H Lu, and P.S Yu (2006), "Text Classification without Negative Examples Revisit", IEEE Trans Knowledge and Data Eng., vol 18, no 1, pp 6-20, Jan G.-R Xue, W Dai, Q Yang, and Y Yu (2008), "Topic-Bridged PLSA for Cross-Domain Text Classification", Proc 31st Ann Int’l ACM SIGIR Conf Research and Development in Information Retrieval, pp 627-634, July H Al Mubaid and S.A Umair (2006), "A New Text Categorization Technique Using Distributional Clustering and Learning Logic", IEEE Trans Knowledge and Data Eng., vol 18, no 9, pp 1156-1165, Sept H Daume´ III and D Marcu (2006), "Domain Adaptation for Statistical Classifiers", J Artificial Intelligence Research, vol 26, pp 101-126 J Blitzer, M Dredze, and F Pereira (2007), "Biographies, Bollywood, Boom-Boxes and Blenders: Domain Adaptation for Sentiment Classification", Proc 45th Ann Meeting of the Assoc Computational Linguistics,pp 432-439 TẠP CHÍ KHOA HỌC − SỐ 14/2017 85 A STUDY ON TRANSFER LEARNING IN GENETIC PROGRAMMING Abstract: Abstract In this paper, we propose a model for implementing transfer learning in Genetic Programming (GP) The model on transfer learning in Genetic Programming is constructed by copying some good solutions from the source problem to the population of the target problem The method is then tested on some families of structured symbolic regression problems and the experimental results show that the using of transfer learning helps Genetic Programming to perform better on families of related problems However, transferring too much knowledge may also degrade its performance leading to negative transfer Therefore, it is important to study how much knowledge we should transfer from the source to the target problem when implementing GP transfer learning system In this paper, we also attempt to give initial answer to this question Keywords: Keywords Genetic Programming, transfer learning ... gồm: Chúng ta nên chuyển đổi từ tốn nguồn sang tốn đích? Làm chuyển đổi kiến thức từ tốn nguồn sang tốn đích? Nên chuyển đổi kiến thức? NỀN TẢNG 2.1 Học chuyển đổi Học chuyển đổi q trình hệ thống... sau học chuyển đổi: Chúng ta nên chuyển đổi từ tốn nguồn sang tốn đích? Làm chuyển đổi kiến thức từ tốn nguồn sang tốn đích? Nên chuyển đổi kiến thức? Câu hỏi thứ thứ hai đơn giản Chúng ta chuyển. .. dụng kiến thức, kỹ học công việc trước vào công việc Các phương pháp học chuyển đổi dựa số kỹ thuật học máy mạng nơron Có nhiều ứng dụng lớn áp dụng thành công học chuyển đổi bao gồm phân loại

Ngày đăng: 09/06/2021, 09:10

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w