Mô hình phân lớp tổng quát

Một phần của tài liệu Áp dụng máy học để tìm ra các đặc trưng tối ưu trong các bài toán xử lý số liệu lớn (Trang 28)

Một trong các khả năng của mạng nơron đó là phân loại mẫụ Mẫu có thể mô tả một đối tượng, một sự kiện hoặc một hiện tượng. Mạng nơron có thể phân loại các mẫu như sau:

 Mẫu có tính không gian  Mẫu có tính thời gian

Ví dụ các mẫu không gian như các bức tranh, các hình ảnh video, các bản đồ thời tiết hoặc các ký tự dưới dạng các bức tranh. Các mẫu thời gian như các tín hiệu tiếng nói tương tự. Các mẫu thời gian thường bao gồm dữ liệu xuất hiện theo thứ tự

29

thời gian, thay đổi theo thời gian. Mục đích của phân loại mẫu là xác định một đối tượng, sự kiện hay hiện tượng vật lý theo một trong các phân loại cho trước.

Mô hình phân loại và nhận dạng chung được biểu diễn như hình dưới đây

Hình 3.2: Hệ thống phân lớp tổng quát

Ở mô hình trên ta thấy phân lớp là quá trình phức tạp. Hệ thống phân loại bao gồm một bộ chuyển đổi đầu vào (Input transducer) cung cấp mẫu dữ liệu đầu vào cho bộ trích chọn đặc trưng (Feature extractor). Thông thường đầu vào cho bộ trích chọn đặc trưng là tập của các véctơ dữ liệu thuộc một loại nào đó. Giả sử rằng mỗi tập bao gồm các số thực tương ứng với các kết quả đo được trong một tình huống vật lý cụ thể. Dữ liệu được chuyển đổi tại đầu ra của bộ chuyển đổi có thể được nén lại nhưng vẫn làm cho hệ thống chạy bình thường. Dữ liệu được nén lại gọi là các đặc trưng (feature). Bộ trích chọn đặc trưng thực hiện việc giảm số chiều của dữ liệụ Số chiều không gian đặc trưng nhỏ hơn nhiều so với không gian mẫụ Các véctơ đặc trưng sau khi trích chọn vẫn giữ được tính chất chủ yếu của dữ liệu mà không ảnh hưởng đến kết quả nhận dạng của hệ thống, lại giúp hệ thống thao tác với dữ liệu dễ hơn.

Đứng về phía mạng nơron ta có thể chia bài toán thành hai quá trình:

Quá trình học dữ liệu: từ dữ liệu thô được thu nhận và được lưu trữ dưới dạng một không gian mẫụ Các mẫu sẽ được trích chọn đặc trưng và lưu trữ dưới dạng một không gian đặc trưng. Các đặc trưng sẽ là đầu vào cho mạng nơron huấn luyện.

Quá trình phân lớp: dữ liệu cần nhận dạng cũng được xử lý tương tự như trên để thu được các đặc trưng cần phân loạị Sau đó các đặc trưng này sẽ cho qua mạng nơron để phân lớp.

Trong luận văn, giải thuật di truyền được sử dụng như là bộ trích chọn đặc trưng. Cụ thể vấn đề này sẽ được trình bày ở chương 4 của luận văn.

30

Một phần của tài liệu Áp dụng máy học để tìm ra các đặc trưng tối ưu trong các bài toán xử lý số liệu lớn (Trang 28)

Tải bản đầy đủ (PDF)

(62 trang)