Chương 1 Giới thiệu chung
2.2. Đánh giá hiệu quả của phương pháp lai ghép các mơ hình
phương pháp lai tốt thì các mơ hình cơ sở cần được xây dựng càng chính xác, càng đa dạng càng tốt.
2.2. Đánh giá hiệu quả của phương pháp lai ghép các mơ hình các mơ hình
KDD-Cup6 là cuộc thi khai phá dữ liệu nổi tiếng. Kể từ năm 1997, hàng năm, cuộc thi này tổ chức và thu hút nhiều sự quan tâm của các đội khai phá dữ liệu trên tồn thế giới. Các bài tốn trong cuộc thi hầu hết là các chủ đề thực tiễn như phát hiện xâm nhập mạng (2001), dự đốn vị trí của protein và hoạt động của các phân tử sinh học (2001), phát hiện sự tắc nghẽn trong phổi (2006), quản lý mối quan hệ khách hàng (2009), khai phá dữ liệu giáo dục (2010), hệ tư vấn âm nhạc (2011), .... Trong các cuộc thi KDD-Cup vừa qua, trong số các kỹ thuật khác nhau được sử dụng trong các giải pháp, các phương pháp lai ghép các mơ hình đã gây nhiều chú ý nhất và giành chiến thắng trong hầu hết các cuộc đua. Ví dụ, KDD-Cups trong 3 năm (2009-2011), những người chiến thắng ở vị trí thứ nhất và vị trí thứ hai đều sử dụng phương pháp lai ghép, kết hợp mơ hình.
Một cuộc thi nổi tiếng khác, NetFlix Prize7 được tổ chức bởi DVD trực tuyến nhằm tìm kiếm cải thiện độ chính xác của các dự đốn về số lượng người sẽ thích một bộ phim dựa trên sở thích của họ. Nếu một đội tham gia cải thiện thuật tốn
6http://www.sigkdd.org/kddcup/.
riêng của Netflix độ chính xác tăng lên 10% thì sẽ giành được giải thưởng trị giá 1,000,000 USD. Vào 21/9/2009, Nexflix đã trao giải 1,000,000 USD cho đội BellKor’s Pragatic Chaos, giải pháp của họ dựa trên sự kết hợp của nhiều bộ phân lớp bao gồm các mơ hình nhân tố bất đối xứng (anymetric factor model), mơ hình hồi quy, học máy Boltzmann được hạn chế (restricted Boltzmann machines), ma trận thừa (matrix factorization), k người láng giềng gần nhất (K-NN), ...
Ngồi những kết quả ấn tượng trong cuộc thi, phương pháp lai kết hợp các mơ hình cũng đã được áp dụng một cách thành cơng cho nhiều nhiệm vụ thực tiễn đa dạng. Đây là một phương pháp rất hữu ích trong các bài tốn sử dụng kỹ thuật học. Ví dụ, tầm nhìn máy tính cĩ ích rất nhiều từ phương pháp này trong gần như tất cả các chi nhánh như phát hiện, nhận diện và theo dõi đối tượng.
Năm 2000, Huang cùng cộng sự [20] đã thiết kế một kiến trúc lai cho bài tốn nhận diện khuơn mặt người tư thế bất biến, đặc biệt là nhận diện các khuơn mặt với phép quay sâu. Ý tưởng cơ bản là kết hợp một lượng các mạng xoắn được xem cụ thể với một mơ đun kết hợp được thiết kế đặc biệt. Trái ngược với những kỹ thuật thơng thường yêu cầu đầu vào là thơng tin của tư thế, khung làm việc này khơng yêu cầu thơng tin về tư thế, nĩ thậm trí cĩ thể đưa ra các ước tính tư thế cho kết quả nhận diện. Huang cùng cộng sự báo cáo rằng khung làm việc này thậm trí vượt trội so với các kỹ thuật thơng thường. Ngay sau đĩ, năm 2001 Li cùng cộng sự [26] cũng đã sử dụng phương pháp tương tự để áp dụng cho bài tốn nhận diện khuơn mặt người đa cảm xúc.
Thêm nữa, phương pháp lai ghép các mơ hình cịn được đánh giá cao cho việc mơ tả các bài tốn bảo mật máy tính bởi mỗi hành động thực thi trên hệ thống máy tính cĩ thể được quan sát ở nhiều mức độ trừ tượng và các thơng tin liên quan cĩ thể được thu thập từ nhiều nguồn thơng tin [27]. Giacinto cùng cộng sự đã áp dụng phương pháp lai ghép các mơ hình vào việc phát hiện xâm nhập [30][31]. Giacinto cho rằng khi phát hiện xác tấn cơng đã biết, phương pháp này cho hiệu quả rất tốt.