ĐỒ ÁN CƠ SỞ Tìm hiểu Deep Learning và ứng dụng Camera an ninh thông minh

MẪU ĐỒ ÁN (HOẶC LUẬN VĂN ) TỐT NGHIỆP BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC NGUYỄN TẤT THÀNH KHOA CÔNG NGHỆ THÔNG TIN ĐỒ ÁN CƠ SỞ Tìm hiểu Deep Learning và ứng dụng Camera an ninh thông minh Giảng viê. Chương I : Deep Learning 1. Giới thiệu về Machine Learning. Machine Learning (ML) – là một nhánh của ngành học Trí tuệ nhân tạo (AI). Là một lĩnh vực nghiên cứu khả năng cải thiện dữ liệu của máy tính dựa trên kho dữ liệu đã được cung cấp và đúc kết từ những kinh nghiệm chúng đã được học. Từ đó dự đoán hoặc đưa ra những quyết định mà không cần người dùng lập trình cụ thể. Machine Learning còn được biết đến như một thuật toán để phân tích dữ liệu, học hỏi hay dự đoán một vấn đề có liên quan. Vậy mối quan hệ giữa Machine Learning và Deep Learning là gì?

Trang 1

BỘ GIÁO DỤC VÀ ĐÀO TẠO

TRƯỜNG ĐẠI HỌC NGUYỄN TẤT THÀNHKHOA CÔNG NGHỆ THÔNG TIN

ĐỒ ÁN CƠ SỞ

Tìm hiểu Deep Learning và ứng dụng Camera anninh thông minh

Giảng viên hướng dẫn: Vương Xuân Chí

Sinh viên thực hiện: Quan Nguyễn Thanh Trúc MSSV: 2000000846

Sinh viên thực hiện: Ngô Phi AnhMSSV: 2000005561 Chuyên ngành: Khoa học dữ liệu

Môn học: Môn Đồ Án Cơ Sở Khoa Học Dữ Liệu Khóa: 2020

Tp.HCM, tháng 9 năm 2022

Trang 2

Trường Đại học Nguyễn Tất Thành

Khoa Công Nghệ Thông Tin

   

CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM

Độc lập – Tự do – Hạnh phúc

   

NHIỆM VỤ ĐỒ ÁN CHUYÊN NGÀNH/CƠ SỞ

(Sinh viên phải đóng tờ này vào báo cáo)

NỘI DUNG VÀ PHƯƠNG PHÁP:

- Giới thiệu Deep learning

- Hệ thống phân tích, định nghĩa một vật thể, khái quát hình ảnh có thể giúp định nghĩa vật thể

- Đưa ra ý tưởng để xây dựng ứng dụng camera an ninh thông minh

YÊU CẦU:

- Có kiến thức, đam mê, hiểu biết về công nghệ mới như Mạng neural, Machine Learning, Deep Learning… Đọc hiểu tài liệu tiếng Anh, kỹ năng trình bày văn bản trên máy tính tốt

- Có tác phong làm việc chăm chỉ, tinh thần trách nhiệm cao, có khả năng làm việc độc lập hoặc làm việc trong nhóm tốt

Trang 4

Lời Mở Đầu

Có lẽ trong chúng ta khó ai có thể tưởng tượng ra nổi những ảnh hưởng của công nghệ mới trong tương lai Ai có thể dự đoán được rằng 1990, khi Internet được thương mại hóa,nó sẽ tác động thế nào đối với kinh doanh âm nhạc? Hoặc trong ngành taxi? Trong các chiến dịch bầu cử chính trị? Trong hầu hết các lĩnh vực xung quanh đời sống chúng ta Máy tính là một công cụ đột biến, không ai biết nó sẽ thay đổi cuộc sống của chúng ta như thế nào.

Sự phát triển gần đây của trí tuệ nhân tạo (AI) được tạo ra bởi các não bộ kỹ thuật đảo ngược (Reverse Engineer Brains) cùng các thuật toán học tập dành cho các môhình mạng Neural được mô phỏng dựa trên các mạng Neural sinh học của con người, chúng giao tiếp và sửa đổi dựa trên kinh nghiệm.

Nhờ có sự kiên trì, dữ liệu lớn (big data) và công suất tính toán lớn học sâu đã tạo nên các bước đột phá trong những vấn đề khó khan nhất của trí tuệ nhân tạo Để từ đó chúng ta có thể dễ phác họa nên bức tranh tương lai với những công cụ trí tuệ nhân tạo tuyệt vời, các công cụ chuẩn đoán cho y học, những phương tiện không người lái hay thậm chí chúng ta có thể tạo nên bản sao bộ não của mình bằng Robot, …

Khó có thể vẽ nên một bức tranh tương lai một các cụ thể ở đây, vì thế chúng tôi đã dựa vào những kiến thức được học để đưa đến một thế hệ công nghệ của Deep Learning thông qua ứng dụng Camera an ninh thông minh.

Chương I sẽ cung cấp những nội dung tổng quan trong ngành học Deep Learning cũng như những cách thức hoạt động căn bản, ưu và nhược điểm của chúng Chương II giải thích rõ hơn về cách thức hoạt động, hệ thống phân tích và định nghĩa một vật thể bằng công nghệ của Deep Learning Và cuối cùng chương III chính là ý tưởng để xây dựng nên hệ thống Camera an ninh.

Trang 5

Lời Cảm Ơn

Trong suốt quá trình học tập ở trường đại học Nguyễn Tất Thành, chúng em luôn được sự quan tâm, hướng dẫn và giúp đỡ tận tình của các thầy cô giáo trong khoa Công nghệ thông tin cùng với sự động viên giúp đỡ của bạn bè.

Lời đầu tiên chúng em xin được bày tỏ lòng biết ơn sâu sắc đến ban giám hiệu trường đại học Nguyễn Tất Thành, các thầy cô khoa Công nghệ thông tin đã tận tình giúp đỡ cho em suốt thời gian học tại trường.

Đặc biệt chúng em xin được gửi lời cảm ơn sâu sắc tới thầy Vương Xuân Chí đã trực tiếp giúp đỡ, hướng dẫn em hoàn thành đồ án này.

Vì kiến thức chuyên ngành còn hạn chế trong quá trình nghiên cứu đề tài nên chúng em vẫn còn nhiều thiếu sót khi tìm hiểu, đánh giá và trình bày về đề tài Chúng em rất mong nhận được sự quan tâm, góp ý của các thầy cô để đề tài chúng em được đầy đủ và hoàn chỉnh hơn.

Chúng em xin trân trọng cảm ơn!

Trang 6

NHẬN XÉT CỦA GIẢNG VIÊN HƯỚNG DẪN

Trang 7

BM-ChT-Môn thi: Lớp học phần:Nhóm sinh viên thực hiện :

Đề tài tiểu luận/báo cáo của sinh viên :

Phần đánh giá của giảng viên (căn cứ trên thang rubrics của môn học):

Tiêu chí (theo

Điểm tốiđa

Điểm đạtđược

Cấu trúc củabáo cáo

Nội dung- Các nội

dung thànhphần

Trang 8

MỤC LỤCChương I: Deep Learning

1.1 Giới thiêu về Machine Learning 11.2 Deep Learning 1-4

1.2.a Khái niệm 1-21.2.b Nguồn gốc 21.2.c Cách thức hoạt động 3-41.3 Sự khác nhau giữa Machine Learning và Deep Learning 41.4 Ưu điểm và nhược điểm của Deep Learning 4-51.5 Sự phát triển của Deep Learning 5-131.6 Khi nào nên sử dụng Deep Learning 11-131.7 Các kỹ thuật của Deep Learning 13-21

Chương II : Hệ thống phân tích, định nghĩa một vật thể, khái quát hình ảnh có thể giúp định nghĩa vật thể.

2.A Sơ Lược 22-262.A.1 Thế nào là hệ thống phân tích, định nghĩa vật thể, khái quát hình ảnh để có thể định hình vật thể? 22-232.A.2 Hệ thống phân tích, định nghĩa, khái quát hình ảnh để định hình vật thể có phải là một khó khăn đối với các ngành công nghệ? 23-242.A.3 Ưu điểm ,Nhược điểm của hệ thống phân tích, định nghĩa, khái quát hình ảnh trong quá trình phát triển 242.A.4 Những tư tưởng cạnh tranh của các hệ chuyên gia trong quá trình phát triển 24-262.B Các thức hoạt động

2.B.a Nguyên tắc về hình ảnh 26-28

Trang 9

Chương III: Chương III: Ý tưởng xây dựng Camera an ninh thông minh

3.1 Mục đích 34-353.2 Yêu Cầu 353.3 Xây Dựng 36-383.4 Ưu điểm và nhược điểm của Camera an ninh 38-393.5 Thực tế 39-42

Lời kết 43

Trang 10

DANH MỤC CÁC BẢNG HÌNH

Hình 1.0 Minh họa Machine LearningHình 1.1 Biểu đồ của trí tuệ nhân tạo Hình 1.2 Minh họa Deep Learning

Hình 1.3 Mô hình hoạt động của ML và DLHình 1.4 Minh họa Deep Learning

Hình 1.10 Minh họa việc phát triển nhận diện giọng nói của Deep Learning

Hình 1.11 Minh họa về sự phát triển của Deep Learning trong việc phát triển y họcHình 1.12 Minh họa về công nghệ giao dịch đầu tư một cách tự động

Hình 1.13 Lee Sedol đối đầu với trí tuệ nhân tạo AlphaGo trong năm ván đấu cờ vây

Hình 1.14 Minh họaHình 1.15 Mạng CNN

Hình 1.16 Boltzmann machineHình 1 17 Autoencoder

Hình 1.18 BackpropagationHình 1.19 Gradient Descent

Hình 2 0 Camera an ninh trong nhận diện ô tôHình 2 1 Minh Họa

Trang 11

Hình 2 3 Bảng màu pixelHình 2 4 Tọa độ hình ảnhHình 2 5 Tỉ lệ khung ảnh

Hình 2 6 Minh họa phân loại hình ảnh

Hình 2 7 Phân loại hình ảnh giữa chó và mèoHình 2 8 Khó khăn trong việc nhận diện vật thểHình 2 9 Sự đa dạng của vật thể

Hình 2.10 Ví dụ về phân chia giữa tập huyến luyện và tập thử nghiệmHình 3.0Minh họa nhận diện của Camera an ninh

Hình 3.1 Minh họa mô hình hoạt động của ML và DLHình 3.2 Camera an ninh

Hình 3.3 Camera an ninhHình 3.4 Camera an ninh

Trang 12

DANH MỤC CÁC TỪ VIẾT TẮT

AL (Artificial Intelligence) Trí tuệ nhân tạo

Trang 13

Chương I : Deep Learning

1 Giới thiệu về Machine Learning.

Machine Learning (ML) – là một nhánh của ngànhhọc Trí tuệ nhân tạo (AI) Là một lĩnh vực nghiêncứu khả năng cải thiện dữ liệu của máy tính dựatrên kho dữ liệu đã được cung cấp và đúc kết từnhững kinh nghiệm chúng đã được học Từ đó dựđoán hoặc đưa ra những quyết định mà không cầnngười dùng lập trình cụ thể.

Machine Learning còn được biết đến như một thuậttoán để phân tích dữ liệu, học hỏi hay dự đoán mộtvấn đề có liên quan

Vậy mối quan hệ giữa Machine Learning và Deep Learning là gì?

2 Deep Learning.a Khái niệm

Ta không thể không nhắc đến Deep Learning khi đang tìm hiểu sâu về Machine Learning Deep

Learning (Học sâu) là một nhánhcủa Machine Learning, có nguồngốc từ toán học, khoa học máytính và khoa học thần kinh Bêncạnh đó, Deep Learning còn đượcxem như là một kỹ thuật để thựchiện hóa Machine Learning ở đócác máy tính sẽ học và cải thiệnchính nó thông qua các thuật toán.

1 0 Minh họa về Deep Learnig (NguồnPinterest)

1 1 Biểu đồ của trí tuệ nhân tạo (Nguồn google)

Trang 14

Deep Learning được xây dựng dựa trên các khái niệm phức tạp hơn rất nhiều, chủ yếu hoạt động với các mạng nơ-ron nhân tạo để bắt chước khả năng tư duy và suy nghĩ của bộ não con người.

b Nguồn gốc

1950, với sự xuất hiện của Trí tuệ nhân tạo (AI) đã có hai tầm nhìn cạnh tranh về cách thức tạo ra trí tuệ nhân tạo: một bên dựa vào logic và các chương trìnhchi phối AI trong nhiều thập kỷ; một bên lại dựa vào việc học trự tiếp từ dữ liệu Vào thời kỳ máy tính còn chưa phát triển và việc lưu trữ dữ liệu quá đắt đỏ so với tiêu chuẩn hiện này thì logic là một biện pháp tối ưu để giải quyết vấn đề Ngày nay năng lực máy tính nâng cao và khả năng lưu trữ dữ liệu lớn (big data) việc giải quyết vấn đề dựa trên thuật toán cũng trở nên phổ biết, vì chúng nhanh hơn, chính xác hơn và hiệu quả hơn.

Mạng nơ-ron nhân tạo chính là động lực chính để phát triển Deep Learning Các mạng nơ-ron sâu (DNN) bao gồm nhiều lớp nơ-ron khác nhau, có khả năng thực hiện các tính toán có độ phức tạp rất cao Deep Learning hiện đang phát triển rất nhanh và được xem là một trong những bước đột phá lớn nhất trong Machine Learning Trong phần dưới đây, chúng ta sẽ làm rõ khái niệm

Deep Learning là gì thông qua cơ chế hoạt động, ưu và nhược điểm của nó

Trang 15

c Cách thức hoạt động.

là một phương pháp của Machine Learning Mạng nơ-ron nhân tạo trong DeepLearning được xây dựng để mô phỏng khả năng tư duy của bộ não con người.Một mạng nơ-ron bao gồm nhiều lớp (layer) khác nhau, số lượng layer càng nhiều thì mạng sẽ càng “sâu” Trong mỗi layer là các nút mạng (node) và được liên kết với những lớp liền kề khác Mỗi kết nối giữa các node sẽ có một trọng số tương ứng, trọng số càng cao thì ảnh hưởng của kết nối này đến mạngnơ-ron càng lớn.

Mỗi nơ-ron sẽ có một hàm kích hoạt, về cơ bản thì có nhiệm vụ “chuẩn hoá” đầu ra từ nơ-ron này Dữ liệu được người dùng đưa vào mạng nơ-ron sẽ đi quatất cả layer và trả về kết quả ở layer cuối cùng, gọi là output layer.

Trong quá trình huấn luyện mô hình mạng nơ-ron, các trọng số sẽ được thay đổi và nhiệm vụ của mô hình là tìm ra bộ giá trị của trọng số sao cho phán đoán là tốt nhất.

1 3 Mô hình hoạt động của ML và DL (Nguồn google)

Trang 16

Các hệ thống Deep Learning yêu cầu phần cứng phải rất mạnh để có thể xử lý được lượng dữ liệu lớn và thực hiện các phép tính phức tạp Nhiều mô hình Deep Learning có thể mất nhiều tuần, thậm chí nhiều tháng để triển khai trên những phần cứng tiên tiến nhất hiện nay.

Nếu những em bé lớn lên từ việc học hỏi mọi thứ xung quanh chúng bằng đôi mắt tinh thường để từ đó đạt được những kỹ năng, sẵn sàng để điều hướng sangmôi trường khác Thì mạng lưới học sâu của Deep Learning được ví như vậy, chúng thu nhập những dữ liệu lớn, “học” cách phân tích các vật thể bằng hình ảnh (con người, động vật, xe cộ, … ) thông qua Thị giác máy tính (Computer Vision) để cải thiện khả năng nhận biết, dự đoán, của mình.

3. Sự khác nhau giữa Machine Learning và Deep Learning.

Machine Learning sử dụng những hướng dẫn đã được lập trình trước để cho phép máy tính nhận ra hình ảnh của vật thể Trong khi đó deep learning nhận dạng vật thể một-cách-tự-động.

4 Ưu điểm và nhược điểm của Deep Learning

Ưu điểm: Deep Learning là một bước ngoặt to lớn trong lĩnh vực trí tuệ nhân tạo,

cho phép khác nhà khoa học dữ liệu xây dựng nhiều mô hình có độ chính xác rất cao trong lĩnh vực nhận dạng ảnh, xử lý ngôn ngữ tự nhiên, xử lý giọng nói,… Một số ưu điểm vượt trội của Deep Learning gồm có:

 Kiến trúc mạng nơ-ron linh hoạt, có thể dễ dàng thay đổi để phù hợp với nhiều vấn đề khác nhau.

 Có khả năng giải quyết nhiều bài toán phức tạp với độ chính xác rất cao. Tính tự động hoá cao, có khả năng tự điều chỉnh và tự tối ưu.

Trang 17

 Có khả năng thực hiện tính toán song song, hiệu năng tốt, xử lý được lượngdữ liệu lớn.

1.4 Minh họa Deep Learning (Nguồn google)

Nhược điểm: Bên cạnh những ưu điểm, mặt khác, hiện nay Deep Learning vẫn

còn nhiều khó khăn và hạn chế, chẳng hạn như:

 Cần có khối lượng dữ liệu rất lớn để tận dụng tối đa khả năng của Deep Learning.

 Chi phí tính toán cao vì phải xử lý nhiều mô hình phức tạp.

 Chưa có nền tảng lý thuyết mạnh mẽ để lựa chọn các công cụ tối ưu cho Deep Learning.

5. Sự phát triển của Deep LearningHọc cách lái xe: Ví dụ điển hình nhất về

mặt phát triển của Deep Learning khôngthể không kể đến các loại xe tự lái Chẳngai lại không mong muốn một chiếc xe thaythế mình di chuyển trên các đoạn đườngxa gần, hay thậm chí hỗ trợ đỗ xe đúngnơi tại các địa điểm công cộng Việc phát

Trang 18

triển các loại xe tự lái cũng giúp giảm thiểu các tai nạn về lái xe khi sử dụng rượu bia hay ngủ gật

Tuy nhiên, xe tự lái sẽ sớm phá hủy kế sinh nhai của hàng triệu tài xế xe tải và taxi, nhiều lĩnh vực kinh doanh liên quan cũng sẽ bị ảnh hương như bảo hiểm xe và cửa hàng phụ tùng Ta có thể thấy Tesla là một hãng xe minh chứng cho sự thành công trong công cuộc phát triển xe tự lái.

Phân tích cảm xúc: Đây là lĩnh vực phân tích cảm xúc của con người thông qua

việc xử lý ngôn ngữ tự nhiên, phân tích văn bản và thống kê Các công ty có thể ứng dụng Deep Learning để hiểu và phán đoán cảm xúc của khách hàng dựa trênnhững đánh giá, bình luận, tweet,… từ đó đưa ra những chiến lược kinh doanh và marketing phù hợp với từng nhóm đối tượng

1.5 Hãng xe Tesla (Nguồn google)

1.6 Minh họa Deep Learning trong vai trò phân tích cảm xúc (Nguồn google)

Trang 19

Học cách dịch: Deep Learning có thể tạo nên một sự thay đổi đột phá của ngành

công nghệ trong việc dịch ngôn ngữ Gần đây, phiên bản mới của Google Translate dựa vào Deep Learning thể hiện bước tiếc vượt bậc về chất lượng và dịch vụ giữa các ngôn ngữ tự nhiên Gần

như việc dịch ngôn ngữ đã chuyển từ mộtcụm lộn xộn trở thành một câu mạch lạcdựa vào phương pháp tìm kiếm sự phụthuộc thông của qua các câu của DeepLearning thay vì các phương pháp kếthợp các từ có thể dịch cùng nhau trước

đó

1.7 Logo Google Translate (Nguồn google)

Trang 20

Trợ Lý Ảo: Trợ lý ảo đang được ứng dụng rất nhiều trong đời sống hàng ngày,

trong đó phổ biến gồm có chatbot, giảng viên online, Google Assistant, Siri, Cortana,… Các trợ lý ảo được xây dựng dựa trên Deep Learning với các thuật toán nhận diện văn bản, xử lý ngôn ngữ tự nhiên, nhận dạng giọng nói,…

1.8 Minh họa về trợ lý ảo

Mạng Xã Hội : Một số nền tảng mạng xã hội lớn như Twitter cũng ứng dụng các

thuật toán Deep Learning để cải thiện các dịch vụ của mình Cụ thể, những trang này sẽ phân tích một lượng lớn dữ liệu thông qua mạng nơ-ron nhân tạo để tìm hiểu về các tuỳ chọn của người dùng Ngoài ra, Instagram cũng sử dụng Deep Learning để tránh các hành vi bạo lực trên không gian mạng, chặn các bình luận vi phạm, không phù hợp,…

Trang 21

Facebook cũng không nằm ngoài danh sách các mạng xã hội ứng dụng Deep Learning vào sản phẩm của mình Các thuật toán mạng nơ-ron sâu được sử dụng để gợi ý trang, bạn bè, dịch vụ, nhân diện khuôn mặt,…

Học cách lắng nghe: Tính năng nhận dạng giọng nói không phụ thuộc vào người

nói không còn bị giới hạn như trước đây Năm 2016, một nhóm nghiên cứu của Microsoft đã thông báo rằng Deep Learning với 120 tầng đã đạt hiệu suất như trình độ con người trong một bài kiểm tra tiêu chuẩn cho khả năng nhận dạng

nhiều giọng nói

1.9 Minh họa về mạng xã hội

1.10 Minh họa việc phát triển nhận diện giọng nói của Deep Learning

Trang 22

Học cách chuẩn đoán trong y học: Với các bệnh ngoài da, việc chuẩn đoán y

học dựa trên hồ sơ của hàng triệu bệnh nhân sẽ trở nên chính xác hơn Một nghiêncứu đã áp dụng Deeplearning vào 130.000 hình ảnh da liễu cho hơn 2.000 bệnh khác nhau – một dữ liệu lớn so với các dữ liệu trước đó Chỉ ít lâu nữa người dung có thể sử dụng tính năng chuẩn đoán bệnh thông qua điện thoại và camera thay vì phải đến phải tới phòng khám, xếp hàng chờ đợi để được chuẩn đoán thương tổn.

Với các bệnh sâu bên trong như ung thư, đây là một vấn đề nhận dạng mẫu mà Deep Learning có thể làm khá tốt Mạng lưới Deep Learning được huấn luyện dựa trên các tập hợp dữ liệu lớn có độ chính xác tương đối cao nhưng không thể sánh bằng so với các chuyên gia ở cùng bộ dữ liệu thử nghiệm Tuy nhiên khi việc dự đoán của Deep Learning có thể kết hợp với các chuyên gia sẽ gần như chính xác tuyệt đối.

Trang 23

1.11 Minh họa về sự phát triển của Deep Learning trong việc phát triển y học

Trang 24

Học cách kiếm tiền: Hơn 75% số lượng giao dịch trên sàn chứng khoán New

York được thực hiện một cách tự động Giao dịch thuật toán trong quy mô thời gian dài hơn sẽ tính đến xu hướng dài hạn trên dữ liệu lớn Deep Learning ngày càng góp phần giúp kiếm được nhiều tiền hơn và mang lại lợi nhuận cao hơn Hàng trăm thuật toán đã được sử dụng và những thuật toán tốt nhất sẽ tiếp tục được kết hợp với nhau để tối ưu hóa lợi nhuận.

1.8 Minh họa về công nghệ giao dịch đầu tư một cách tự động

Trang 26

Học cách chơi cờ vây: Tháng 3 năm 2016, Lee Sedol, người Hàn Quốc với 18

lần vô địch thế giới trong bộ môn cờ vây đã thua một trận gồm năm ván đấu trướcAlphaGo của DeepMind – chương trình chơi cờ vây sử dụng mạng Deep

Learning để đánh giá thế cờ và các nước cờ khả thi Một số mạng học sâu có khả năng đánh giá thế cờ và chọn nước đi một cách tốt nhất, AlphaGo có một hệ thống học hoàn toàn khác biệt, sử dụng để giải quyết bài toán kết nối trách nhiệm tạm thời : nước cờ nào sẽ chiến thắng, nước cờ nào sẽ dẫn đến thất bại Và điều

đáng chú ý là AlphaGo đã tự học chơi cờ vây, rất rất nhiều lần

6. Khi nào nên sử dụng Deep Learning?

1.13 Lee Sedol đối đầu với trí tuệ nhân tạo AlphaGo trong năm ván đấu cờ vây

Trang 27

Tiến sĩ Scott Clark, đồng sáng lập và CEO của SigOpt, cho rằng Deep Learning hiệu quả nhất đối với các dữ liệu không tuân theo một cấu trúc cụ thể Một số ví dụ phổ biến gồm có văn bản, video, hình ảnh hay dữ liệu dạng thời gian Các thuật toán Deep Learning có khả năng tự động xây dựng và khai thác các mẫu có trong dữ liệu để đưa ra được quyết định tối ưu Tuy nhiên, việc này cần rất nhiều dữ liệu và tài nguyên tính toán để có được độ chính xác tốt nhất.

1.14 Minh họa

Mỗi mô hình mạng nơ-ron nhân tạo có thể bao gồm hàng trăm, thậm chí hàng triệutham số khác nhau Vì vậy việc tối ưu các tham số này đòi hỏi người xây dựng mô hình phải có kiến thức chuyên sâu và nhiều kinh nghiệm Bên cạnh đó, các mạng nơ-ron nhân tạo sử dụng nhiều hàm phi tuyến có độ phức tạp cao nên việc hiểu và diễn giải các kết quả từ mô hình cũng là một thách thức lớn với các chuyên gia Vìvậy, với những dự án yêu cầu nhiều tương tác và phản hồi từ con người thì Deep Learning không hẳn là một lựa chọn lý tưởng.

Độ phức tạp và mục tiêu của dự án.

Trang 28

Một trong những lợi thế lớn nhất của Deep Learning chính là khả năng giải quyết các vấn đề phức tạp, phân tích và học được những mỗi quan hệ ẩn trong dữ liệu Deep Learning đặc biệt hữu ích nếu dự án cần xử lý nhiều dữ liệu ở dạng phi cấu trúc, chẳng hạn như phân loại hình ảnh, xử lý ngôn ngữ tự nhiên, nhận diện giọng nói,…

Mặt khác, đối với những vấn đề có độ phức tạp vừa phải, không yêu cầu nặng về mặt tính toán, ít tài nguyên và dữ liệu,… thì các thuật toán Machine Learning sẽ làmột lựa chọn hợp lý hơn.

Tài Nguyên

Bùng nổ dữ liệu lớn trong những năm gần đây đã giúp việc xây dựng các mô hình Deep Learning trở nên dễ dàng hơn Tuy nhiên, đây vẫn là một lĩnh vực vô cùng phức tạp và tốn kém Vì phải xử lý lượng dữ liệu vô cùng lớn nên các mô hình Deep Learning thường rất nặng về mặt tài nguyên tính toán và GPU để có được hiệu năng tốt nhất.

Mặt khác, những thuật toán Machine Learning cổ điển chỉ cần một CPU và phần cứng vừa phải, tốc độ nhanh hơn và có thể dễ dàng thử nghiệm nhiều kỹ thuật, mô hình khác nhau mà không cần lo ngại về tài nguyên và thời gian tính toán.

Số Lượng Dữ Liệu

Thuật toán Deep Learning có thể tìm ra được các mối quan hệ ẩn sâu trong những bộ dữ liệu Tuy nhiên việc này cũng đồng nghĩa với lượng dữ liệu đầu vào (dữ liệuđã được gán nhãn) phải lớn hơn nhiều so với các thuật toán Machine Learning Việc gán nhãn dữ liệu cũng yêu cầu nguồn lực và thời gian lớn, đặc biệt là trong lĩnh vực y tế phải yêu cầu chuyên môn cao mới có khả năng gán nhãn dữ liệu chính xác Trong những trường hợp này, ta có thể nghĩ đến việc sử dụng các thuật

Trang 29

7 Các kỹ thuật của Deep Learning.

Có rất nhiều kỹ thuật và thuật toán Deep Learning khác nhau, từ đơn giản đến vô cùng phức tạp, có thể ứng dụng vào hầu hết các bài toán trong lĩnh vực trí tuệ nhân tạo hiện nay Ở phần cuối của bài viết, ta sẽ tìm hiểu một số kỹ thuật Deep Learning phổ biến nhất hiện nay.

Mạng nơ-ron cổ điển

Kiến trúc cổ điển của mạng nơ-ron là mạng kết nối đầy đủ, thường được xác định bằng các perceptron đa lớp (Perceptron là một thuật toán đơn giản, cho phép tìm một ranh giới siêu phẳng cho các bài toán phân lớp nhị phân) Mạng nơ-ron cổ điển được thiết kế bởi Fran Rosenblatt vào năm 1958, chủ yếu được sử dụng cho các bài toán phân lớp nhị phân Có ba loại hàm thường được sử dụng trong mô hình này là:

Mạng nơ-ron tích chập (CNN)

Mạng nơ-ron tích chập (Convolutional Neural Network – CNN) là một kiến trúc mạng nơ-ron nhân tạo nâng cao, được xây dựng để giải quyết các bài toán phức tạp, đặc biệt là liên quan đến xử lý hình ảnh.

Tích chập là một khái niệm trong xử lý tín hiệu số nhằm biến đổi thông tin đầu vào qua một phép tích chập với bộ lọc, nhằm trả về đầu ra là một tín hiệu mới Tín hiệu này sẽ giảm bớt những đặc trưng mà bộ lọc không quan tâm, giữ lại những đặc trưng chính và quan trọng nhất.

Trang 30

Bên cạnh input layer và output layer, mô hình CNN còn có thêm một sampling layer để giới hạn số lượng nơ-ron tham gia vào các layer tương ứng Việc xây dựng mô hình trải qua ba giai đoạn chính:

 Quá trình tích chập (convolution): Thông qua các tích chập giữa ma trận đầu

vào với bộ lọc để tạo thành các đơn vị trong một tầng mới Quá trình này có thể diễn ra liên tục ở phần đầu của mạng và thường sử dụng kèm với hàm kích hoạt ReLU Mục tiêu của tầng này là trích suất đặc trưng hai chiều.

 Quá trình tổng hợp (max pooling): Giảm kích thước khối ma trận đầu vào

thông qua việc tìm ra 1 giá trị đại diện cho mỗi một vùng không gian mà bộ lọc điqua sẽ không làm thay đổi các đường nét chính của bức ảnh nhưng lại giảm được kích thước của ảnh.

 Quá trình kết nối hoàn toàn (fully connected): Sau khi đã giảm kích thước

đến một mức độ hợp lý, ma trận cần được trải phẳng (flatten) thành một vector và sử dụng các kết nối hoàn toàn giữa các tầng Tầng kết nối hoàn toàn cuối cùng (fully connected layer) sẽ có số lượng đơn vị bằng với số lớp.

Định dạng
Số trang	60
Dung lượng	6,85 MB