Tổng quan về trí tuệ nhân tạo [6-9, 21]

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu ứng dụng kỹ thuật máy học để phân tích hình ảnh và nhận dạng phương tiện về hành vi vi phạm luật giao thông đường bộ (Trang 33)

2.1. Trí tuệ nhân tạo

- Hiện nay cả thế giới đang đứng trên cuộc cách mạng cơng nghiệp 4.0 và trí tuệ nhân tạo biết đến như chiếc chìa khĩa để biến những ý nghĩ của con người thành

hiện thực. Trí tuệ nhân tạo hay trí thơng minh nhân tạo (Artificial intelligence -AI) là một ngành thuộc lĩnh vực khoa học máy tính (Computer science). Là trí tuệ do con người lập trình tạo nên với mục tiêu giúp máy tính cĩ thể tự động hĩa các hành vi thơng minh như con người. Trí tuệ nhân tạo khác với việc lập trình logic trong các ngơn ngữ lập trình là ở việc ứng dụng các hệ thống học máy (machine learning) để mơ phỏng trí tuệ của con người trong các xử lý mà con người làm tốt hơn máy tính. Cụ thể, trí tuệ nhân tạo giúp máy tính cĩ được những trí tuệ của con người như: biết suy nghĩ và lập luận để giải quyết vấn đề, biết giao tiếp do hiểu ngơn ngữ, tiếng nĩi, biết học và tự thích nghi,…Tuy rằng trí thơng minh nhân tạo cĩ nghĩa rộng như là trí thơng minh trong các tác phẩm khoa học viễn tưởng, nĩ là một trong những ngành trọng yếu của tin học. Trí thơng minh nhân tạo liên quan đến cách cư xử, sự học hỏi và khả năng thích ứng thơng minh của máy mĩc.

- Thành phần cơng nghệ trí tuệ nhân tạo được chia làm 4 nhĩm chính cụ thể sau:

(1) Nhĩm 1: Cơng nghệ trí tuệ nhân tạo phản ứng cĩ khả năng phân tích những động thái khả thi nhất của chính mình và của đối thủ, từ đĩ, đưa ra được giải pháp tối ưu nhất.

Ví dụ: Điển hình của cơng nghệ trí tuệ nhân tạo phản ứng là Deep Blue. Đây là một chương trình chơi cờ vua tự động, được tạo ra bởi IBM, với khả năng xác định các nước cờ đồng thời dự đốn những bước đi tiếp theo của đối thủ. Thơng qua đĩ, Deep Blue đưa ra những nước đi thích hợp nhất.

(2) Nhĩm 2: Cơng nghệ trí tuệ nhân tạo với bộ nhớ hạn chế là khả năng sử dụng những kinh nghiệm trong quá khứ để đưa ra những quyết định trong tương lai. Cơng nghệ AI này thường kết hợp với cảm biến mơi trường xung quanh nhằm mục đích dự đốn những trường hợp cĩ thể xảy ra và đưa ra quyết định tốt nhất cho thiết bị.

Ví dụ: Đối với xe khơng người lái, nhiều cảm biến được trang bị xung quanh xe và ở đầu xe để tính tốn khoảng cách với các xe phía trước, cơng nghệ AI sẽ dự đốn khả năng xảy ra va chạm, từ đĩ điều chỉnh tốc độ xe phù hợp để giữ an tồn cho xe.

Hình 4: Ứng dụng cơng nghệ trí tuệ nhân tạo với bộ nhớ hạn chế

(3) Nhĩm 3: Lý thuyết trí tuệ nhân tạo này cĩ thể học hỏi cũng như tự suy nghĩ, sau đĩ áp dụng những gì học được để thực hiện một việc cụ thể. Hiện nay, cơng nghệ AI này vẫn chưa trở thành một phương án khả thi.

(4) Nhĩm 4: Cơng nghệ trí tuệ nhân tạo tự nhận thức này cĩ khả năng tự nhận thức về bản thân, cĩ ý thức và hành xử như con người. Thậm chí, chúng cịn cĩ thể bộc lộ cảm xúc cũng như hiểu được những cảm xúc của con người. Đây được xem là bước phát triển cao nhất của cơng nghệ AI và đến thời điểm hiện tại, cơng nghệ này vẫn chưa khả thi.

Hình 5: Ứng dụng cơng nghệ trí tuệ nhân tạo tự nhận thức

2.2. Ứng dụng trí tuệ nhân tạo trong hiện tại và tương lai

- Việc ứng dụng của cơng nghệ phân loại hiện nay đang phát triển rất mạnh ở rất nhiều lĩnh vực (học thuật, kinh doanh, bảo mật, y tế, ...) và các đối tượng (nhà nghiên cứu xã hội, chính phủ và các tổ chức phi lợi nhuận khác). Vì các tổ chức này sở hữu một lượng lớn dữ liệu khơng cĩ cấu trúc và việc xử lý dữ liệu sẽ trở nên dễ dàng hơn rất nhiều nếu như các dữ liệu này được chuẩn hĩa bởi các chủ đề/nhãn. Nền tảng cơng nghệ để thực hiện bài tốn phân loại văn bản chính là trí tuệ nhân tạo áp dụng giải thuật học sâu với mơ hình mạng nơ-ron điển hình như:

(1) Xử lý ngơn ngữ tự nhiên (Natural Language Processing): xử lý văn bản, giao tiếp người - máy.

(2) Nhận dạng (Patten recognition): nhận dạng tiếng nĩi, chữ viết tay, vân tay, thị giác máy, thiên văn học.

(3) Máy tìm kiếm như Google, Yahoo, You tube: các hệ thống này sử dụng các cơng cụ của học máy để phát triển hệ thống.

(4) Chẩn đốn trong y tế: trợ giúp phân tích ảnh X-quang, các hệ chuyên gia chẩn đốn tự động.

(5) Tin sinh học: phân loại và dự đốn chuỗi gene, dự đốn tính chất của thuốc mới.

(6) Phát hiện gian lận tài chính, gian lận thẻ tín dụng, phát hiện dị thường. (7) Phân tích thị trường chứng khốn.

(8) Trị chơi: máy tính chơi cờ Deep blue của IBM chế tạo năm 1998.

(9) Người máy: là tổng hợp của rất nhiều ngành khoa học, trong đĩ học máy tạo nên hệ thần kinh và bộ não của người máy.

- Ví dụ như:

(1) Trong ngành vận tải: Trí tuệ nhân tạo được ứng dụng trên những phương

tiện vận tải tự lái, điển hình là ơ tơ. Sự ứng dụng này gĩp phần mang lại lợi ích kinh tế cao hơn nhờ khả năng cắt giảm chi phí cũng như hạn chế những tai nạn nguy hiểm đến tính mạng. Vào năm 2016, Otto, hãng phát triển xe tự lái thuộc Uber đã vận chuyển thành cơng 50.000 lon bia Budweisers bằng xe tự lái trên quãng đường dài 193 km. Theo dự đốn của cơng ty tư vấn cơng nghệ thơng tin Gartner, trong tương lai, những chiếc xe cĩ thể kết nối với nhau thơng qua Wifi để đưa ra những lộ trình vận tải tốt nhất.

(2) Trong sản xuất: Trí tuệ nhân tạo được ứng dụng để xây dựng những quy trình sản xuất tối ưu hơn. Cơng nghệ AI cĩ khả năng phân tích cao, làm cơ sở định hướng cho việc ra quyết định trong sản xuất.

(3) Trong y tế: Ứng dụng tiêu biểu của trí tuệ nhân tạo trong lĩnh vực y tế là máy bay thiết bị bay khơng người lái được sử dụng trong những trường hợp cứu hộ khẩn cấp. Thiết bị bay khơng người lái cĩ tốc độ nhanh hơn xe chuyên dụng đến 40% và vơ cùng thích hợp để sử dụng ở những nơi cĩ địa hình hiểm trở.

Hình 7: Ứng dụng cơng nghệ trí tuệ nhân tạo cho thiết bị bay khơng người lái

(4) Trong giáo dục: Sự ra đời của trí tuệ nhân tạo giúp tạo ra những thay đổi

lớn trong lĩnh vực giáo dục. Các hoạt động giáo dục như chấm điểm hay dạy kèm học sinh cĩ thể được tự động hĩa nhờ cơng nghệ AI. Nhiều trị chơi, phần mềm giáo dục ra đời đáp ứng nhu cầu cụ thể của từng học sinh, giúp học sinh cải thiện tình hình học tập theo tốc độ riêng của mình. Trí tuệ nhân tạo cịn cĩ thể chỉ ra những vấn đề mà các khĩa học cần phải cải thiện. Chẳng hạn như khi nhiều học sinh được phát hiện là gửi đáp án sai cho bài tập, hệ thống sẽ thơng báo cho giáo viên đồng thời gửi thơng điệp đến học sinh để chỉnh sửa đáp án phù hợp. Cơng nghệ AI cịn cĩ khả năng theo dõi sự tiến bộ của học sinh và thơng báo đến giáo viên khi phát hiện ra vấn đề đối với kết quả học tập của học sinh.

Hơn nữa, sinh viên cịn cĩ thể học hỏi từ bất cứ nơi nào trên thế giới thơng qua việc sử dụng những phần mềm cĩ hỗ trợ AI. Cơng nghệ AI cũng cung cấp dữ liệu nhằm giúp sinh viên lựa chọn được những khĩa học tốt nhất cho mình.

(5) Trong truyền thơng: Đối với lĩnh vực truyền thơng, sự phát triển của trí tuệ

nhân tạo gĩp phần làm thay đổi cách thức tiếp cận đối với khách hàng mục tiêu. Nhờ những ưu điểm của cơng nghệ AI, các cơng ty cĩ thể cung cấp quảng cáo vào đúng thời điểm, đúng khách hàng tiềm năng, dựa trên việc phân tích các đặc điểm về nhân khẩu học, thĩi quen hoạt động trực tuyến và những nội dung mà khách hàng thường xem trên quảng cáo.

(6) Trong ngành dịch vụ: Cơng nghệ AI giúp ngành dịch vụ hoạt động tối ưu

hơn và gĩp phần mang đến những trải nghiệm mới mẻ hơn và tốt hơn cho khách hàng. Thơng qua việc thu thập và phân tích dữ liệu, cơng nghệ AI cĩ thể nắm bắt thơng tin về hành vi sử dụng dịch vụ của khách hàng, từ đĩ mang lại những giải pháp phù hợp với nhu cầu của từng khách hàng [2,7,9].

3. Tổng quan về học máy [6-9, 16-17, 21-23] 3.1. Học máy (Machine Learning)

Là một bộ phận của của trí tuệ nhân tạo (AI), các hệ thống mà sau khi được cung cấp một lượng dữ liệu và thực hiện một hoặc một số thao tác dựa trên những dữ liệu đã được cung cấp để máy cĩ thể học. Machine Learning thường được dùng trong việc xử lý các tác vụ tương tự con người mà khĩ cĩ thể mơ phỏng thành cơng thức cụ thể, ví dụ như nhận diện, đánh giá lựa chọn, ...

3.2. Ứng dụng học máy

Học máy thường được áp dùng trong việc xử lý các tác vụ tương tự con người mà khĩ cĩ thể mơ phỏng thành cơng thức cụ thể, ví dụ như nhận diện, đánh giá lựa chọn,...

3.3. Các phương thức về máy học

- Học cĩ giám sát (dạy học): Học cĩ giám sát là một hướng tiếp cận của máy học để làm cho máy tính cĩ khả năng "học". Trong hướng tiếp cận này, người ta "huấn luyện" máy tính dựa trên những quan sát cĩ dán nhãn. Ta cĩ thể hình dung những quan sát này như là những câu hỏi, và nhãn của chúng là những câu trả lời. Ý tưởng của học cĩ giám sát là: bằng việc ghi nhớ và tổng quát hĩa một số quy tắc từ một tập câu hỏi

cĩ đáp án trước, máy tính sẽ cĩ thể trả lời được những câu hỏi dù chưa từng gặp phải, nhưng cĩ mối liên quan.

Ví dụ ta dạy máy tính "1 + 1 = 2" và hy vọng nĩ sẽ học được phép tính cộng x + 1 và trả lời được là "2 + 1 = 3". Học cĩ giám sát mơ phỏng việc con người học bằng cách đưa ra dự đốn của mình cho một câu hỏi, sau đĩ đối chiếu với đáp án. Sau đĩ con người rút ra phương pháp để trả lời đúng khơng chỉ câu hỏi đĩ, mà cho những câu hỏi cĩ dạng tương tự. Trong học cĩ giám sát, các quan sát bắt buộc phải được dán nhãn trước. Đây chính là một trong những nhược điểm của phương pháp này, bởi vì khơng phải lúc nào việc dán nhãn chính xác cho quan sát cũng dễ dàng. Ví dụ như trong dịch thuật, từ một câu của ngơn ngữ gốc cĩ thể dịch thành rất nhiều phiên bản khác nhau trong ngơn ngữ cần dịch sang. Tuy nhiên, việc quan sát được dán nhãn cũng lại chính là ưu điểm của học cĩ giám sát bởi vì một khi đã thu thập được một bộ dữ liệu lớn được dán nhãn chuẩn xác, thì việc huấn luyện trở nên dễ dàng hơn rất nhiều so với khi dữ liệu khơng được dán nhãn.

Hình 9: Phương thức học cĩ giám sát

Ví dụ: Trong nhận dạng chữ viết tay, ta cĩ ảnh của hàng nghìn ví dụ của mỗi chữ số được viết bởi nhiều người khác nhau. Chúng ta đưa các bức ảnh này vào trong một thuật tốn và chỉ cho nĩ biết mỗi bức ảnh tương ứng với chữ số nào. Sau khi thuật tốn tạo ra một mơ hình, tức một hàm số mà đầu vào là một bức ảnh và đầu ra là một chữ số, khi nhận được một bức ảnh mới mà mơ hình chưa nhìn thấy bao giờ, nĩ sẽ dự đốn bức ảnh đĩ chứa chữ số nào.

Hình 10: Hình mơ tả chữ viết tay

Ví dụ này khá giống với cách học của con người khi cịn nhỏ. Ta đưa bảng chữ cái cho một đứa trẻ và chỉ cho chúng đây là chữ A, đây là chữ B. Sau một vài lần được dạy thì trẻ cĩ thể nhận biết được đâu là chữ A, đâu là chữ B trong một cuốn sách mà chúng chưa nhìn thấy bao giờ

- Học khơng giám sát (tự học): Trong thuật tốn này, chúng ta khơng biết được dữ liệu đầu ra hay nhãn mà chỉ cĩ dữ liệu đầu vào. Thuật tốn Học khơng giám sát dựa vào cấu trúc của dữ liệu để thực hiện một cơng việc nào đĩ, ví dụ như phân nhĩm hoặc giảm số chiều của dữ liệu để thuận tiện trong việc lưu trữ và tính tốn. Một cách tốn học, Học khơng giám sát là khi chúng ta chỉ cĩ dữ liệu vào X mà khơng biết nhãn Y tương ứng. Những thuật tốn loại này được gọi là Học khơng giám sát vì khơng giống như Học cĩ giám sát, chúng ta khơng biết câu trả lời chính xác cho mỗi dữ liệu đầu vào. Giống như khi ta học, khơng cĩ thầy cơ giáo nào chỉ cho ta biết đĩ là chữ A hay chữ B. Cụm khơng giám sát được đặt tên theo nghĩa này.

Hình 11: Phương thức học khơng giám sát về bài tốn phân cụm

- Học bán giám sát (vừa học vừa tự học): Nằm ở đâu đĩ giữa học tập được giám sát và khơng giám sát, vì chúng sử dụng cả dữ liệu được gắn nhãn và khơng dán nhãn để đào tạo - thường là một lượng nhỏ dữ liệu cĩ nhãn và một lượng lớn dữ liệu khơng được dán nhãn. Các hệ thống sử dụng phương pháp này cĩ thể cải thiện đáng kể độ

chính xác của việc học. Thơng thường, việc học bán giám sát được chọn khi dữ liệu được dán nhãn được yêu cầu địi hỏi tài nguyên cĩ kỹ năng và cĩ liên quan để đào tạo/học hỏi từ nĩ. Nếu khơng, dữ liệu được gắn nhãn thường khơng yêu cầu tài nguyên bổ sung.

Hình 12: Phương thức học bán giám sát

4. Các giải thuật về máy học [16-17, 21-23]

4.1. Giải thuật Mạng nơ-ron nhân tạo (Artificial Neural Network - ANN)

- Mạng nơ-ron nhân tạo là sự mơ phỏng chức năng của hệ thần kinh con người với vơ số các nơ-ron được liên kết và truyền thơng với nhau. Giống như mạng nơ-ron của não người, ANN học và lưu những kinh nghiệm và sử dụng trong những tình huống phù hợp. Mạng nơ-ron đã áp dụng thành cơng trong nhiều vấn đề liên quan đến dự báo, phân loại và điều khiển thuộc nhiều lĩnh vực khác nhau, như tài chính, y tế, địa chất và vật lý. Ví dụ như khả năng nhận dạng mặt người, dự báo thời tiết và thiên tai, tự động điều khiển hệ thống lái tàu, hệ thống dự báo sự cố, v.v.

- Kiến trúc chung của một mạng nơ-ron nhân tạo gồm 3 thành phần đĩ là: input layer, hidden layer và output layer. Trong đĩ, hidden layer gồm các thần kinh nhận dữ liệu input từ các neural ở lớp trước đĩ và chuyển đổi các input này cho các lớp xử lý tiếp theo. Trong một ANN cĩ thể cĩ nhiều lớp ẩn.

- Quá trình xử lý thơng tin của một mạng nơ-ron nhân tạo liên quan đến: (1) Lớp Inputs: Dữ liệu nhập tương ứng các thuộc tính của dữ liệu. (2) Lớp Outputs: Kết quả là một giải pháp cho một vấn đề.

(3) Lớp Weights: Trọng số liên kết là thành phần quan trọng thể hiện mức độ quan trọng (độ mạnh) của dữ liệu nhập đối với quá trình xử lý thơng tin (quá trình chuyển đổi dữ liệu từ lớp này sang lớp khác). Quá trình học của ANN thực ra là quá trình điều chỉnh các trọng số của các dữ liệu nhập để cĩ được kết quả mong muốn. Trong đĩ:

(1) Summation Function: hàm tổng tính tổng trọng số của tất cả các dữ liệu nhập đưa vào mỗi neural. Hàm tổng của một nơ-ron đối với n dữ liệu nhập được tính theo cơng thức sau:

1 n i i i Y X W  

(2) Transfer Function: hàm tổng của một neural cho biết khả năng kích hoạt của neural đĩ, cịn gọi là kích hoạt bên trong. Các nơ-ron này cĩ thể sinh ra một kết quả hoặc khơng (nĩi cách khác rằng cĩ thể kết quả của 1 neural cĩ thể được chuyển đến

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu ứng dụng kỹ thuật máy học để phân tích hình ảnh và nhận dạng phương tiện về hành vi vi phạm luật giao thông đường bộ (Trang 33)