Tổng quan về học máy

Một phần của tài liệu Nghiên cứu và ứng dụng kĩ thuật học sâu trong phân tích và dự báo giá cổ phiếu (Trang 31 - 36)

CHƯƠNG 2. HỌC MÁY VÀ KĨ THUẬT HỌC SÂU

2.1. Tổng quan về học máy

2.1.1. Học máy

“Học máy (Machine Learning) là một lĩnh vực của trí tuệ nhân tạo liên quan đến việc nghiên cứu và xây dựng các kĩ thuật cho phép các hệ thống học tự động từ dữ liệu để giải quyết những vấn đề cụ thể.”

Học máy là một trong những lĩnh vực phát triển nhanh nhất trong công nghệ phần mềm. Làm cho máy móc trở nên thông minh; có thể học tập như con người. Ví dụ, chúng ta đang đứng ở một ga tàu đông đúc để đợi một người bạn. Hàng trăm người đi qua, mỗi người mỗi vẻ, nhưng khi bạn của chúng ta đến, chúng ta có thể nhận ra cô ấy trong đám đông. Nhận dạng khuôn mặt là điều mà con người chúng ta làm dễ dàng, nhưng chúng ta sẽ lập trình máy tính như thế nào để nhận dạng một người? Chúng ta có thể cố gắng đưa ra một bộ quy tắc. Ví dụ, bạn của chúng ta có mái tóc đen dài và đôi mắt nâu, nhưng điều đó có thể mô tả hàng tỷ người. Điều gì ở cô ấy mà bạn nhận ra? Nó có phải là hình dạng của mũi của cô ấy? Nhưng chúng ta có thể diễn đạt thành lời không? Sự thật là chúng ta có thể nhận ra mọi người mà không bao giờ thực sự biết chúng ta làm điều đó như thế nào. Chúng ta không thể mô tả mọi chi tiết về cách chúng ta nhận ra ai đó. Chúng ta chỉ biết làm sao để làm điều đó. Vấn đề là để lập trình một máy tính, chúng ta cần chia nhỏ tác vụ thành các chi tiết nhỏ của nó. Điều đó làm cho máy tính rất khó lập trình để nhận dạng khuôn mặt. Ví dụ về nhận dạng khuôn mặt là một nhiệm vụ mà mọi người thấy rất dễ dàng, nhưng điều đó lại rất khó đối với máy tính. Những tác vụ này thường được gọi là trí tuệ nhân tạo.

Học máy hiện nay được áp dụng rộng rãi: phát hiện thẻ tín dụng giả, phân tích thị trường chứng khoán, nhận dạng tiếng nói, chữ viết, dịch tự động, chơi trò chơi và rô- bốt (robot locomotion).

Phương pháp học máy: Máy học liên quan đến một khối lượng lớn dữ liệu cho máy để máy có thể học và đưa ra dự đoán, tìm các mẫu hoặc phân loại dữ liệu. Thuật toán được sử dụng xác định kiểu học máy. Có ba loại học máy: học có giám sát, không giám sát và học tăng cường.

24

• Học có giám sát: Gartner, một công ty tư vấn kinh doanh, dự đoán rằng học có giám sát sẽ vẫn là học máy được sử dụng nhiều nhất trong công nghệ thông tin doanh nghiệp vào năm 2022. Loại máy học này cung cấp dữ liệu đầu vào và đầu ra lịch sử trong các thuật toán máy học, với quá trình xử lý giữa từng cặp đầu vào / đầu ra cho phép thuật toán thay đổi mô hình để tạo ra đầu ra phù hợp nhất với kết quả mong muốn. Các thuật toán phổ biến được sử dụng trong quá trình học có giám sát bao gồm mạng nơ-ron, cây quyết định, hồi quy tuyến tính và máy vectơ hỗ trợ. Loại máy học này có tên Học có giám sát vì máy được "giám sát" trong khi học, có nghĩa là bạn đang cung cấp thông tin thuật toán để giúp máy học. Kết quả bạn cung cấp cho máy là dữ liệu được gắn nhãn và phần còn lại của thông tin bạn cung cấp được sử dụng làm các tính năng đầu vào. Ví dụ: nếu bạn đang cố gắng tìm hiểu về mối quan hệ giữa các khoản nợ không trả được và thông tin về người đi vay, bạn có thể cung cấp cho máy 1500 trường hợp khách hàng không trả được nợ và 1500 trường hợp khác thì không. Dữ liệu được gắn nhãn "giám sát" máy để tìm ra thông tin bạn đang tìm kiếm. Học có giám sát hiệu quả cho nhiều mục đích kinh doanh, bao gồm dự báo bán hàng, tối ưu hóa hàng tồn kho và phát hiện gian lận. Một số ví dụ về các trường hợp sử dụng bao gồm: Dự đoán giá bất động sản; Phân loại các giao dịch ngân hàng có gian lận hay không; Tìm các yếu tố nguy cơ mắc bệnh;

Xác định xem người xin vay có rủi ro thấp hay rủi ro cao; Dự đoán sự cố hư hỏng của các bộ phận cơ khí của thiết bị công nghiệp

• Học không giám sát: Mặc dù học có giám sát yêu cầu người dùng giúp máy học, nhưng học không giám sát không sử dụng cùng một tập hợp và dữ liệu đào tạo được gắn nhãn. Thay vào đó, máy tìm kiếm các mẫu ít rõ ràng hơn trong dữ liệu. Loại máy học này rất hữu ích khi bạn cần xác định các mẫu và sử dụng dữ liệu để đưa ra quyết định. Các thuật toán phổ biến được sử dụng trong học tập không giám sát bao gồm mô hình Markov ẩn, k-mean, phân cụm phân cấp, ...Sử dụng ví dụ từ phương pháp học có giám sát, giả sử bạn không biết khách hàng nào đã hoặc không vỡ nợ. Thay vào đó, bạn sẽ cung cấp cho

25

máy thông tin về người vay và nó sẽ tìm kiếm các mẫu giữa những người đi vay trước khi nhóm chúng thành nhiều cụm. Loại máy học này được sử dụng rộng rãi để tạo ra các mô hình dự đoán. Các ứng dụng phổ biến cũng bao gồm phân cụm, tạo ra một mô hình nhóm các đối tượng lại với nhau dựa trên các thuộc tính cụ thể và liên kết, xác định các quy tắc tồn tại giữa các cụm. Một số trường hợp sử dụng ví dụ bao gồm: Tạo nhóm khách hàng dựa trên hành vi mua hàng; Nhóm khoảng không quảng cáo theo số liệu bán hàng và / hoặc sản xuất; Xác định các liên kết trong dữ liệu khách hàng (ví dụ: khách hàng mua một kiểu túi xách cụ thể có thể quan tâm đến một kiểu giày cụ thể)

• Học tăng cường: là loại học máy gần nhất với cách con người học. Thuật toán hoặc tác nhân được sử dụng học bằng cách tương tác với môi trường của nó và nhận được phần thưởng tích cực hoặc tiêu cực. Các thuật toán phổ biến bao gồm sự khác biệt theo thời gian, mạng lưới đối địch sâu và Q-learning. Quay lại ví dụ về khách hàng vay vốn ngân hàng, bạn có thể sử dụng thuật toán học tăng cường để xem thông tin khách hàng. Nếu thuật toán phân loại chúng là rủi ro cao và chúng mặc định, thuật toán sẽ nhận được phần thưởng tích cực.

Nếu họ không mặc định, thuật toán sẽ nhận được phần thưởng âm. Cuối cùng, cả hai trường hợp đều giúp máy học bằng cách hiểu rõ hơn cả vấn đề và môi trường. Gartner lưu ý rằng hầu hết các nền tảng ML không có khả năng học tăng cường vì nó đòi hỏi khả năng tính toán cao hơn hầu hết các tổ chức có.

Học tăng cường có thể áp dụng trong các lĩnh vực có khả năng được mô phỏng hoàn toàn, ở trạng thái tĩnh hoặc có khối lượng lớn dữ liệu liên quan. Bởi vì loại học máy này yêu cầu quản lý ít hơn so với học có giám sát, nên nó được xem là dễ dàng hơn để xử lý các tập dữ liệu không được gắn nhãn. Các ứng dụng thực tế cho loại máy học này vẫn đang xuất hiện. Một số ví dụ về cách sử dụng bao gồm: Dạy ô tô tự đậu và tự lái, Điều khiển chủ động đèn tín hiệu giao thông để giảm ùn tắc giao thông, đào tạo rô bốt để tìm hiểu các chính sách bằng cách sử dụng hình ảnh video thô làm đầu vào mà chúng có thể sử dụng để tái tạo các hành động mà chúng thấy

26

2.1.1. Mạng nơ ron nhân tạo

“Mạng nơ ron nhân tạo (MNRNT) được thiết kế để mô phỏng mạng nơ ron của não người. Mạng nơ ron nhân tạo được kết hợp từ tập các phần tử xử lý đơn giản được kết nối với nhau. Mỗi phần tử xử lý này chỉ có thể thực hiện được một thao tác tính toán nhỏ, nhưng một mạng lưới các phần tử như vậy có một khả năng tính toán lớn hơn rất nhiều.

Phần tử tính toán cơ bản của mạng nơ ron là một perceptron hay một nơ ron. Mạng nơ ron bao gồm rất nhiều phần tử như vậy liên kết với nhau. Mạng nơ ron là sự kết hợp của của các tầng perceptron hay còn được gọi theo cách khác là perceptron đa tầng (multilayer- perceptron)”.

Hình 1: Mạng nơ ron

Một Mạng nơ ron có chỉ có 1 tầng vào, 1 tầng ra và có thể có nhiều tầng ẩn nhưng. Ba kiểu tầng của mạng nơ ron sẽ có như sau: tầng vào (input layer, tầng ra (output layer), tầng ẩn (hidden layer).

“Một mạng nơ-ron nhân tạo có ba hoặc nhiều tầng được kết nối với nhau. Tầng đầu tiên bao gồm các nơ ron đầu vào. Những nơ ron gửi dữ liệu đến các tầng sâu hơn, đến lượt nó sẽ gửi dữ liệu đầu ra cuối cùng đến tầng ra. Tất cả các tầng bên trong đều bị ẩn và được hình thành bởi các đơn vị giúp thay đổi một cách thích nghi thông tin nhận được từ tầng này sang tầng khác thông qua một loạt các phép biến đổi. Các đơn vị trong tầng cố gắng tìm hiểu về thông tin được thu thập theo hệ thống nội bộ của ANN. Các nguyên tắc này cho phép các đơn vị tạo ra một kết quả được biến đổi, sau đó được cung cấp như một đầu ra cho tầng tiếp theo. Một bộ quy tắc học tập bổ sung sử dụng, quá trình mà qua đó ANN có thể điều chỉnh kết quả đầu ra của mình bằng cách tính đến các lỗi. Mỗi khi đầu ra được

27

gắn nhãn là lỗi trong giai đoạn huấn luyện có giám sát, thông tin sẽ được gửi ngược lại. Do đó, lỗi được sử dụng để hiệu chỉnh lại các kết nối đơn vị của ANN nhằm tính đến sự khác biệt giữa kết quả mong muốn và kết quả thực tế. Trong thời gian thích hợp, ANN sẽ “học”

cách giảm thiểu khả năng xảy ra sai sót và kết quả không mong muốn. Đào tạo một mạng nơ-ron nhân tạo bao gồm việc chọn từ các mô hình được phép có một số thuật toán liên quan. ANN có một số ưu điểm nhưng một trong những ưu điểm được công nhận là nó thực sự có thể học hỏi từ việc quan sát các tập dữ liệu. Theo cách này, ANN được sử dụng như một công cụ xấp xỉ hàm ngẫu nhiên. Các loại công cụ này giúp ước tính các phương pháp lý tưởng và hiệu quả nhất để đạt được giải pháp trong khi xác định các chức năng hoặc phân phối tính toán. ANN lấy mẫu dữ liệu thay vì toàn bộ tập dữ liệu để đưa ra giải pháp, giúp tiết kiệm cả thời gian và tiền bạc. ANN được coi là các mô hình toán học khá đơn giản để nâng cao các công nghệ phân tích dữ liệu hiện có.”

2.1.2. Kĩ thuật học sâu

“Kỹ thuật học sâu (Deep learning) là một thuật toán học máy được xây dựng dựa trên một số ý tưởng mô phỏng hệ thống não bộ của con người. Nó biểu diễn dữ liệu thông qua nhiều tầng từ cụ thể đến trừu tượng qua đó trích rút được các đặc trưng có ý nghĩa”.

Học sâu (tiếng Anh: deep learning) còn được gọi là học có cấu trúc sâu hoặc học phân cấp, là một phần của máy học dựa trên các mạng thần kinh nhân tạo. Việc học có thể được giám sát, bán giám sát hoặc không giám sát. Học sâu là một tập hợp các thuật toán để cố gắng mô hình dữ liệu trừu tượng hóa ở mức cao bằng cách sử dụng nhiều lớp xử lý với cấu trúc phức tạp, hoặc bằng cách khác bao gồm nhiều biến đổi phi tuyến.”

Học sâu là một lĩnh vực của học máy: một phương pháp mới trong việc học các biểu diễn từ dữ liệu nhấn mạnh vào việc học các lớp liên tiếp của các biểu diễn ngày càng có ý nghĩa. "Sâu" trong "học sâu" không phải là tham chiếu đến bất kỳ loại hiểu biết sâu hơn nào mà phương pháp này đạt được; đúng hơn, nó là viết tắt của ý tưởng về các lớp biểu diễn liên tiếp. Có bao nhiêu lớp đóng góp vào một mô hình dữ liệu được gọi là độ sâu của mô hình. Các tên thích hợp khác cho trường có thể là học đại diện theo lớp hoặc học đại diện phân cấp. Học sâu hiện đại thường bao gồm hàng chục hoặc thậm chí hàng trăm lớp đại diện liên tiếp và tất cả chúng đều được học tự động khi tiếp xúc với dữ liệu đào tạo.

28

Trong khi đó, các phương pháp tiếp cận với học máy có xu hướng chỉ tập trung vào việc học một hoặc hai lớp biểu diễn của dữ liệu; do đó, chúng đôi khi được gọi là học tập nông cạn.

Trong học sâu, các biểu diễn phân lớp này được học thông qua các mô hình được gọi là mạng nơ-ron, được cấu trúc theo các lớp nghĩa đen được xếp chồng lên nhau. Thuật ngữ

“mạng nơ ron” đề cập đến mặt sinh học, một số khái niệm trung tâm trong học sâu đã được phát triển một phần bằng cách lấy cảm hứng từ sự hiểu biết của chúng ta về não (đặc biệt là vỏ não thị giác), các mô hình học sâu là mô hình của não. Không có bằng chứng nào cho thấy bộ não thực hiện bất cứ điều gì giống như cơ chế học tập được sử dụng trong các mô hình học sâu hiện đại. Bạn có thể bắt gặp các bài báo khoa học đại tuyên bố rằng học sâu hoạt động giống như bộ não hoặc được mô phỏng theo bộ não, nhưng không phải vậy. Sẽ là khó hiểu và phản tác dụng đối với những người mới tham gia vào lĩnh vực này khi nghĩ rằng học sâu có liên quan đến sinh học thần kinh theo bất kỳ cách nào; bạn không cần phải che đậy sự huyền bí và bí ẩn “giống như tâm trí của chúng ta” và bạn cũng có thể quên bất cứ điều gì bạn có thể đã đọc về mối liên hệ giả định giữa học sâu và sinh học. Học sâu là một khung toán học để học các biểu diễn từ dữ liệu.

Một phần của tài liệu Nghiên cứu và ứng dụng kĩ thuật học sâu trong phân tích và dự báo giá cổ phiếu (Trang 31 - 36)

Tải bản đầy đủ (PDF)

(64 trang)