1. Trang chủ
  2. » Luận Văn - Báo Cáo

Báo cáo bài tập lớn xây dựng ứng dụng trích xuất thông tin từ căn cước công dân

45 14 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Xây Dựng Ứng Dụng Trích Xuất Thông Tin Từ Căn Cước Công Dân
Tác giả Nguyễn Đức Thiệp, Triệu Quang Trường, Nguyễn Hữu Thảo
Người hướng dẫn ThS. Nguyễn Lan Anh
Trường học Trường Đại Học Công Nghiệp Hà Nội
Chuyên ngành Đồ Án Chuyên Ngành
Thể loại báo cáo bài tập lớn
Năm xuất bản 2022
Thành phố Hà Nội
Định dạng
Số trang 45
Dung lượng 1,97 MB

Nội dung

Mục tiêu/chuẩn đầu ra: Có word báo cáo chương trình3.Sản phẩm nghiên cứu: Xây dựng ứng dụng trích xuất thông tin từ CCCDIII.Nhiệm vụ học tập1.Hoàn thành Tiểu luận, Bài tập lớn,Đồ án/Dự á

Trang 1

XÂY DỰNG ỨNG DỤNG TRÍCH XUẤT THÔNG TIN TỪ CĂN

CƯỚC CÔNG DÂN

Giảng viên hướng dẫn: Ths Nguyễn Lan Anh

Lớp: 20221IT6052001 Khoá K14 Nhóm 13

Sinh viên thực hiện:

Nguyễn Đức Thiệp - 2019605294 Triệu Quang Trường - 2019605040 Nguyễn Hữu Thảo - 2019604211

Hà Nội , 2022

Trang 2

PHIẾU HỌC TẬP NHÓM

I.Thông tin chung

1.Tên lớp : 20221IT6052001 Khóa : K14

2.Tên nhóm :13 Họ và tên thành viên trong nhóm :Nguyễn Đức Thiệp, Nguyễn Hữu Thảo, Triệu Quang Trường

II.Nội dung học tập

1.Tên chủ đề : Xây dựng ứng dụng trích xuất thông tin từ CCCD

2.Hoạt động của sinh viên:

-Hoạt động/Nội dung 1: Xây dựng hệ thống CSDL Mục tiêu/chuẩn đầu ra: Có hệ thống cơ sở dữ liệu

-Hoạt động/Nội dung 2: Xây dựng giao diện chương trình Mục tiêu/chuẩn đầu ra: Có được giao diện chương trình

-Hoạt động/Nội dung 3: Xây dựng mã logic theo từng module Mục tiêu/chuẩn đầu ra:

1.3 Trần Hùng Cường, Nguyễn Phương Nga, Giáo Trình Trí Tuệ Nhân Tạo, Hà

Nội, Nhà Xuất Bản Giáo Dục Việt Nam , 2014

1.4. Nguyễn Văn Hậu, Giáo trình Python cơ bản, Hà Nội, NXB Đại học Quốc

Gia Hà Nội, 2014

1.5. Nguyễn Thị Thanh Huyền, Ngô Thị Bích Thúy, Phạm Thị Kim Phượng,

Giáo trình phân tích thiết kế hệ thống, Hà Nội, NXB Giáo dục VN, 2011.

2.Phương tiện, nguyên liệu thực hiện Tiểu luận, Bài tập lớn,Đồ án/Dự án (nếu có)

Trang 3

KẾ HOẠCH THỰC HIỆN TIỂU LUẬN,BÀI TẬP LỚN,ĐỒ ÁN

Tên lớp : 20221IT6052001 Khoá:K14

Họ và tên sinh viên : Nguyễn Đức Thiệp, Nguyễn Hữu Thảo, Triệu Quang TrườngTên nhóm : 13

Tên chủ đề : Xây dựng ứng dụng trích xuất thông tin từ CCCD

1 Cả nhóm - Tìm hiểu chung nội

dung đề tài

- Chia công việc cho các thành viên

Hiểu biết khái quát những vấn

đề, nội dung cần thực hiện trong đề tài

Sưu tầm tài liệuNghiên cứu tài liệu

Trao đổi qua zoom

Đức Thiệp

- Tìm hi u vềề Machine ểlearning

Hoàn thiện chương 1 Sưu tầm tài liệu

Nghiên cứu tài liệu

Nguyễn

Hữu Thảo

- Tìm hiểu về mạng ron

nơ-Triệu

Quang

Trường

- Tìm hi u vềề Deep ểlearning

Đức Thiệp Tìm hiểu về thị giác

máy tính

Hoàn thiện chương 2

Sưu tầm tài liệuSưu tầm dữ liệuNghiên cứu tài liệu

Nguyễn

Hữu Thảo

Tìm hiểu CNN, mạng UnetTriệu

Quang

Trường

Tìm hiểu về mạng TensorFlow,

tả chi tiết Use case, các biểu đồ use case, bản thiết kế giao diện màn hình

Trao đổi qua zoom, thực hiện bằng các công cụrational rose, balsamiq,…

Trang 4

5 Cả nhóm Code chương trình Chương

trình hoàn thiện

Tổng hợp/ đánh giá

6 Cả nhóm Hoàn thiện báo cáo

word, powpoint,… Báo cáo hoàn thiện

Ngày….tháng… năm

XÁC NHẬN CỦA GIẢNG VIÊN

(Kí,ghi rõ họ tên) Nguyễn Lan Anh

Trang 5

BÁO CÁO HỌC TẬP NHÓM

Tên lớp : 20221IT6052001 Khóa : K14

Họ và tên sinh viên : Nguyễn Đức Thiệp, Nguyễn Hữu Thảo, Triệu Quang Trường

1 Cả nhóm - Tìm hiểu chung nội

Đức Thiệp

- Tìm hi u vềề Machine ểlearning

Hoàn thiện chương 1

Nguyễn

Hữu Thảo

- Tìm hiểu về mạng ron

nơ-Triệu

Quang

Trường

- Tìm hi u vềề Deep ểlearning

Quang

Trường

Tìm hiểu về mạng TensorFlow,

đồ use case, bản thiết

kế giao diện màn hình

5 Cả nhóm Code chương trình Chương trình hoàn

thiện

6 Cả nhóm Hoàn thiện báo cáo

word, powpoint,… Báo cáo hoàn thiện

Ngày….tháng… năm

XÁC NHẬN CỦA GIẢNG VIÊN

(Kí,ghi rõ họ tên)

Trang 6

Nguyễn Lan Anh

Trang 7

MỤC LỤC

DANH MỤC HÌNH ẢNH 1

LỜI CẢM ƠN 2

MỞ ĐẦU 3

CHƯƠNG 1: TỔNG QUAN VỀ BÀI TOÁN NHẬN DẠNG 4

1.1 Machine learning 4

1.2 Mạng nơ-ron ( Neural network) 6

1.2.1 Khái niệm 6

1.2.2 Cấu tạo 7

1.2.3 Phân loại 8

1.2.4 Mục đích 9

1.3 Deep learning 10

1.3.1 Định nghĩa 10

1.3.2 Cơ sở của deep learning 10

1.3.3 Điểm mạnh của deep learning 11

CHƯƠNG 2 : CƠ SỞ LÝ THUYẾT VÀ KỸ THUẬT NHẬN DẠNG 12

2.1 Thị giác máy tính ( Computer vision) 12

2.1.1 Phân loại ảnh (Image classification) 12

2.1.2 Khoanh vùng đối tượng ( Object detection) 13

2.1.3 Phân vùng đối tượng ( Image segmentation) 14

2.2 Mạng nơ-ron tích chập (CNN) 15

2.2.1 Giới thiệu 15

2.2.2 Mô hình 16

2.3 Mạng Unet 16

2.4 Mạng TensorFlow 17

2.4.1 Giới thiệu 17

2.4.2 Lịch sử ra đời và hoạt động 17

2.4.3 Cấu trúc Tensorflow 18

2.5 Tesseract 18

2.5.1 Giới thiệu 19

2.5.2 Lịch sử ra đời và hoạt động 19

2.5.3 Chức năng 19

CHƯƠNG 3: THIẾT KẾ HỆ THỐNG 19

3.1 Biểu đồ CSDL 19

3.2 Biểu đồ Use Case 20

3.2.1 Mô tả use case TrichXuatTT 20

3.2.2 Mô tả use case QuanLyTT 21

3.3 Biểu đồ trình tự các Use case 22

3.3.1 Use case TrichXuatTT 22

3.3.2 Use case QuanLyTT 22

3.3 Biểu đồ phân tích các lớp Use case 23

Trang 8

3.3.2 Use case QuanLyTT 24

3.4 Thiết kế giao diện người dùng các use case 25

3.4.1 Giao diện use case TrichXuatTT 25

3.4.1.1 Hình dung màn hình 25

3.4.1.2 Biểu đồ màn hình 26

3.4.1.3 Biểu đồ cộng tác các màn hình 27

3.4.2 Giao diện use case QuanLyTT 27

3.4.2.1 Hình dung màn hình 27

3.4.2.2 Biểu đồ màn hình 28

3.4.2.3 Biểu đồ cộng tác các màn hình 28

CHƯƠNG 4: CÀI ĐẶT CHƯƠNG TRÌNH 29

4.1 Cài đặt chương trình Phần mềm 29

4.2 Thực hiện cài đặt chương trình 29

4.3 Kết quả thu được 30

CHƯƠNG 5 : KIỂM THỬ HỆ THỐNG 34

5.1 Kế hoạch kiểm thử 34

5.2 Test case 34

KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 35

TÀI LIỆU THAM KHẢO 36

Trang 9

CÁC TỪ VIẾT TẮT

1 API Application Programming Interface

Trang 10

DANH MỤC HÌNH ẢNH

Hình 1 Trợ lý ảo Alexa của Amazon 4

Hình 2 Định nghĩa Neural Network là gì ? 6

Hình 3 Kiến trúc mạng Neural network 8

Hình 4 Deep Learing là gì ? 10

Hình 5 Deep Learing hoạt động như thế nào ? 11

Hình 6 Image Classfication 12

Hình 7 Object detection 13

Hình 8 Image segmentation 15

Hình 9 Bảng ma trận RGB 16

Hình 10 Mô hình CNN 16

Hình 11 Hình ảnh mô tả kiến trúc U-net 17

Hình 12 Kiến trúc TensorFlow 18

Hình 13 Biểu đồ CSDL 20

Hình 14 Biểu đồ Use case 20

Hình 15 Biểu đồ trình tự Use case TrichXuatTT 22

Hình 16 Biểu đồ trình tự Use case QuanLyTT 23

Hình 17 Biểu đồ phân tích lớp Use case TrichXuatTT 24

Hình 18 Biểu đồ phân tích lớp Use case QuanLyTT 25

Hình 19 Hình dung màn hình use case TrichXuatTT 26

Hình 20 Biểu đồ màn hình use case TrichXuatTT 26

Hình 21 Biểu đồ cộng tác các màn hình use case TrichXuatTT 27

Hình 22 Hình dung màn hình use case QuanLyTT 27

Hình 23 Biểu đồ màn hình use case QuanLyTT 28

Hình 24 Biểu đồ cộng tác các màn hình use case QuanLyTT 28

Hình 25 Giao diện quét ảnh 31

Hình 26 Giao diện chọn bản ghi 31

Hình 27 Giao diện chọn ảnh 31

Hình 28 Ảnh được quét 32

Hình 29 Thông tin chi tiết bản ghi ảnh được quét 32

Hình 30 Giao diện quản lý thông tin 32

Hình 31 Giao diện xem thông tin chi tiết 32

Hình 32 Giao diện chọn cách sửa thông tin 33

Hình 33 Giao diện chọn cách sort 33

Hình 34 Giao diện cài đặt ứng dụng 33

Hình 35 Giao diện chỉnh màu ứng dụng 33

Trang 11

LỜI CẢM ƠN

Lời đầu tiên cho phép chúng em gửi lời cảm ơn tới các thầy cô trong khoa Côngnghệ thông tin - Trường Đại học Công Nghiệp Hà Nội, những người đã hết mình truyền đạt và chỉ dẫn cho chúng em những kiến thức, những bài học quý báu và bổ ích.Đặc biệt chúng em xin được bày tỏ chân thành cảm ơn giảng viên Nguyễn Lan Anh người trực tiếp hướng dẫn, chỉ bảo chúng em trong suốt quá trình học tập, nghiên cứu

và hoàn thành được đồ án

Gần đây chắc hẳn các bạn đã nghe nhiều tới các khái niệm như định danh điện

tử, Ekyc, Nếu như trước đây, khách hàng muốn mở tài khoản ngân hàng, mở thẻ ATM sẽ phải đến trực tiếp quầy giao dịch để thực hiện các thủ tục đăng kí, xác minh thông tin, thì giờ đây các thao tác này đều có thể thực hiện qua chiếc điện thoại nhờ giải pháp định danh khách hàng điện tử (eKYC) Và bài toán Trích xuất thông tin từ chứng minh thư chính là bài toán nhỏ trong ứng dụng định danh điện từ này

Đây là một bài toán rất thường gặp trong thực tế và đã có rất nhiều mô hình được đưa ra để giải quyết như: mô hình Naive Bayes, KNN (K-Nearest- Neighbor), Cây quyết định (Decision Tree), Mạng Neuron nhân tạo (Artificial Neural Network) vàSVM (Support Vector Machine) Mỗi mô hình đều cho kết quả khá tốt cho bài toán này, tuy nhiên mô hình phân loại hình ảnh bằng thuật toán CNN được sử dụng phổ biến hơn cả và dễ dàng cài đặt Chính vì vậy chúng em lựa chọn đề tài: “ Xây dựng ứng dụng trích xuất thông tin từ thẻ căn cước công dân“ làm đề tài kết thúc môn học của mình

Trong quá trình nghiên cứu và làm đề tài, do năng lực, kiến thức, trình độ bản thân chúng em còn hạn hẹp nên không tránh khỏi những thiếu sót và chúng em mong mỏi nhận được sự thông cảm và những góp ý từ quý thầy cô cũng như các bạn trong lớp

Chúng em xin chân thành cảm ơn !

11

Trang 12

MỞ ĐẦU

Ngày nay với sự phát triển ngày càng mạnh mẽ của trí tuệ nhân tạo Nó đã đem lại những ứng dụng to lớn trong nhiều lĩnh vực khác nhau như xử lý ngôn ngữ tự nhiên, tựđộng hoá, thị giác máy tính, … Trí tuệ nhân tạo ngày càng trờ thành một phần không thể thiếu của cuộc sống Sự tồn tại và phát triển của một doanh nghiệp, cơ quan, tổ chức nhà nước,…Không thể thiếu sự trợ giúp của trí tuệ nhân tạo Trong việc thu nhận

và xử lý thông tin với khối lượng ngày càng lớn, nhiều lúc với những việc thủ công không đem lại hiệu quả mong muốn, lại tốn nhiều công sức và thời gian Nhằm đem lại sự nhanh chóng và chính xác, giảm thiểu công sức của con người Nhóm em đã chọn đề tài “XÂY DỰNG ỨNG DỤNG TRÍCH XUẤT THÔNG TIN TỪ CĂN

CƯỚC CÔNG DÂN” để nghiên cứu và viết báo cáo.

Để mô tả quá trình nghiên cứu, tìm hiểu, báo cáo được chia thành 3 chương với các nội dung như sau:

Chương 1: Tổng quan về công nghệ sử dụng

Chương 2: Cơ sở lý thuyết

Chương 3: Thiết kế hệ thống

Chương 4: Cài đặt chương trình

12

Trang 13

CHƯƠNG 1: TỔNG QUAN VỀ BÀI TOÁN NHẬN DẠNG

1.1. Machine learning

Những năm gần đây, AI - Artificial Intelligence (Trí Tuệ Nhân Tạo), và cụ thể hơn là Machine Learning (Học Máy hoặc Máy Học) nổi lên như một bằng chứng của cuộc cách mạng công nghiệp lần thứ tư (1 - động cơ hơi nước, 2 - năng lượng điện, 3 - công nghệ thông tin) Trí Tuệ Nhân Tạo đang len lỏi vào mọi lĩnh vực trong đời sống

mà có thể chúng ta không nhận ra Xe tự hành của Google và Tesla, hệ thống gợi ý nhạc của Spotify, hệ thống tự tag khuôn mặt trong ảnh của Facebook, trợ lý ảo Siri và Alexa của Apple và Amazon, hệ thống cửa hàng không nhân viên của Amazon, hệ thống gợi ý phim của Netflix, máy chơi cờ vây AlphaGo của Google DeepMind, …, chỉ là một vài trong vô vàn những ứng dụng của AI/Machine Learning

Hình 1 Trợ lý ảo Alexa của Amazon

Machine learning (ML) là nghiên cứu khoa học về các thuật toán và mô hình thống kê mà các hệ thống máy tính sử dụng để thực hiện hiệu quả một nhiệm vụ cụ thể

mà không cần sử dụng các hướng dẫn rõ ràng, thay vào đó dựa vào các tập mẫu và suyluận Nó được xem như một tập hợp con của trí tuệ nhân tạo Các thuật toán học máy xây dựng một mô h nh toán học của dữ liệu mẫu, được gọi là " dữ liệu huấn luyện ", đểđưa ra dự đoán hoặc quyết định mà không được lập trình rõ ràng để thực hiện nhiệm

vụ Thuật toán học máy được sử dụng trong rất nhiều ứng dụng, chẳng hạn như lọc

Trang 14

email, hỗ trợ con người đưa ra các quyết định, xử lý thông tin tự động Học máy có liên quan chặt chẽ với thống kê tính toán , trong đó tập trung vào việc đưa ra dự đoán bằng máy tính Nghiên cứu về tối ưu hóa toán học cung cấp các phương pháp, lý thuyết và lĩnh vực ứng dụng cho lĩnh vực học máy Thị giác máy tính cũng là một lĩnh vực nghiên cứu trong học máy, và tập trung vào các thuật toán xử lý thông tin từ ảnh,

âm thanh Trong ứng dụng của mình trong các vấn đề kinh doanh, học máy cũng được gọi là phân tích dự đoán

Học máy có liên quan mật thiết đến thống kê, vì cả hai lĩnh vực đều nghiên cứu việc phân tích dữ liệu, nhưng khác với thống kê, học máy tập trung vào sự phức tạp của các giải thuật trong việc thực thi tính toán Nhiều bài toán suy luận được xếp vào loại bài toán NP-khó, v thế một phần của học máy là nghiên cứu sự phát triển các giải thuật suy luận xấp xỉ mà có thể xử lý được

Học máy có hiện nay được áp dụng rộng rãi bao gồm máy truy t m dữ liệu, các

hệ thống hỗ trợ quyết định, chẩn đoán y khoa, phát hiện thẻ tín dụng giả, phân tích thị trường chứng khoán, phân loại các chuỗi DNA, nhận dạng tiếng nói và chữ viết, dịch

tự động, chơi trò chơi và cử động rô-bốt (robot locomotion)

Các thuật toán học máy thường được chia ra thành 2 nhóm lớn

● Học có giám sát (supervise learning)

● Học không giám sát (unsupervise learning)

Trong học có giám sát các thuật toán được xây dựng từ tập mẫu bao gồm cả dữ liệuđầu vào và đầu ra kỳ vọng Ví dụ: nếu bài toán là xác định các con vật có trong ảnh, lúc này dữ liệu cho thuật toán học có giám sát sẽ bao gồm ảnh đầu vào cũng với đầu ratương ứng được đánh nhãn là tên các con vật có trong ảnh Một nhánh nhỏ khác của học có giám sát là học bán giám sát Học bán giám sát là thuật toán được xây dựng trên các tập dữ liệu mà một phần dữ liệu đầu vào có thể không có nhãn

Các thuật toán phân loại và thuật toán hồi quy là các kiểu học có giám sát Các thuật toán phân loại được sử dụng khi các đầu ra bị giới hạn trong một tập hợp các giá trị giới hạn Đối với thuật toán xác định bệnh y khoa, đầu vào sẽ là hồ sơ bệnh án của bệnh nhân và đầu ra sẽ là tên bệnh hoặc tên nhóm bệnh của bệnh nhân đó Đối với thuật toán xác định bệnh ung thư, đầu ra sẽ là dự đoán của " bị ung thư " hoặc "không

bị ung thư", được biểu thị bằng các giá trị Boolean đúng và sai Các thuật toán hồi quy

Trang 15

được đặt tên cho đầu ra liên tục của chúng, có nghĩa là chúng có thể có bất kỳ giá trị nào trong một phạm vi Ví dụ về giá trị liên tục là nhiệt độ, độ ẩm, kích thước hoặc giácủa một vật thể.

Trong học tập không giám sát , thuật toán xây dựng một mô h nh toán học từ một tập hợp dữ liệu chỉ chứa các đầu vào và không có nhãn đầu ra mong muốn Các thuật toán học tập không giám sát được sử dụng để tìm cấu trúc trong dữ liệu, như phân nhóm hoặc phân cụm các điểm dữ liệu Học tập không giám sát có thể khám phá các mẫu trong dữ liệu và có thể nhóm các đầu vào thành các danh mục, như trong học tập tính năng Giảm kích thước là quá trình giảm số lượng "tính năng" hoặc đầu vào trongmột tập hợp dữ liệu

1.2. Mạng nơ-ron ( Neural network)

Hình 2 Định nghĩa Neural Network là gì ?

Trang 16

Neural Network có khả năng thích ứng được với mọi thay đổi từ đầu vào Do vậy, nó có thể đưa ra được mọi kết quả một cách tốt nhất có thể mà bạn không cần phải thiết kế lại những tiêu chí đầu ra Khái niệm này có nguồn gốc từ trí tuệ nhân tạo, đang nhanh chóng trở nên phổ biến hơn trong sự phát triển của những hệ thống giao dịch điện tử

Mạng Neural Network là sự kết hợp của những tầng perceptron hay còn gọi là perceptron đa tầng Và mỗi một mạng Neural Network thường bao gồm 3 kiểu tầng là:

● Tầng input layer (tầng vào): Tầng này nằm bên trái cùng của mạng, thể hiện cho các đầu vào của mạng

● Tầng output layer (tầng ra): Là tầng bên phải cùng và nó thể hiện cho những đầu ra của mạng

● Tầng hidden layer (tầng ẩn): Tầng này nằm giữa tầng vào và tầng ra nó thể hiện cho quá trình suy luận logic của mạng

❖ Lưu ý: Mỗi một Neural Network chỉ có duy nhất một tầng vào và 1 tầng ra nhưng lại có rất nhiều tầng ẩn

Trang 17

Hình 3 Kiến trúc mạng Neural network

Với mạng Neural Network thì mỗi nút mạng là một sigmoid nơron nhưng chúng lại có hàm kích hoạt khác nhau Thực tế, người ta thường sử dụng có cùng loại với nhau để việc tính toán thuận lợi hơn Tại mỗi tầng, số lượng nút mạng có thể khác nhau còn tùyvào bài toán hoặc cách giải quyết

Tuy nhiên, khi làm việc người ta sẽ để các tầng ẩn số với số lượng nowrowrron khác nhau Ngoài ra, những nơron nằm ở tầng thường sẽ liên kết đôi với nhau để tạo thành mạng kết nối đầy đủ nhất Khi đó, người dùng có thể tính toán được kích cỡ của mạng dựa vào tầng và số lượng nơ ron

Trang 18

● Thuật toán truyền ngược : Mạng nơ-ron nhân tạo liên tục học hỏi bằng cách sử dụng vòng lặp phản hồi hiệu chỉnh để cải thiện phân tích dự đoán của chúng Đơn giản mà nói, bạn có thể coi rằng dữ liệu truyền từ nút đầu vào đến nút đầu

ra qua nhiều lối đi khác nhau trong mạng nơ-ron Chỉ có duy nhất một lối đi chính xác, ánh xạ nút đầu vào đến nút đầu ra thích hợp Để tìm ra lối đi này, mạng nơ-ron sử dụng một vòng lặp phản hồi với cách thức hoạt động như sau:

● Mỗi nút đưa ra một dự đoán về nút tiếp theo trên lối đi

● Nút này sẽ kiểm tra tính chính xác của dự đoán Các nút sẽ chỉ địnhgiá trị trọng số cao hơn cho những lối đi tới nhiều dự đoán chính xác hơn và giá trị trọng số thấp hơn cho các lối đi tới dự đoán không chính xác

● Đối với điểm dữ liệu tiếp theo, các nút đưa ra dự đoán mới bằng cách sử dụng các lối đi có trọng số cao hơn rồi lặp lại Bước 1

● Mạng nơ-ron tích chập : Những lớp ẩn trong mạng nơ-ron tích chập thực hiện các chức năng toán học cụ thể, như tóm tắt hoặc sàng lọc, được gọi là tích chập Chúng rất hữu ích trong việc phân loại hình ảnh vì chúng có thể trích xuất các đặc điểm liên quan từ hình ảnh, điều này có lợi cho việc nhận dạng và phân loại hình ảnh Biểu mẫu mới dễ xử lý hơn mà không làm mất đi các đặc điểm quan trọng để đưa ra dự đoán chính xác Mỗi lớp ẩn trích xuất và xử lý các đặc điểm hình ảnh khác nhau, như các cạnh, màu sắc và độ sâu

Bộ não con người chính là nguồn cảm hứng cho kiến trúc mạng nơ-ron Các tế bào não của con người, còn được gọi là nơron, tạo thành một mạng lưới phức tạp, có tính liên kết cao và gửi các tín hiệu điện đến nhau để giúp con người xử lý thông tin

Tương tự, một mạng nơ-ron nhân tạo được tạo ra từ các tế bào nơron nhân tạo, cùng nhau phối hợp để giải quyết một vấn đề Nơ-ron nhân tạo là các mô đun phần mềm,

Trang 19

được gọi là nút và mạng nơ-ron nhân tạo là các chương trình phần mềm hoặc thuật toán mà về cơ bản, sử dụng hệ thống máy tính để giải quyết các phép toán.

1.3. Deep learning

Deep Learning là tập hợp con của Machine Learning và nó có tác dụng hỗ trợ cho máy tính tự huấn luyện chính nó để có thể thực hiện mọi tác vụ tương tự như con người Điều này chính là giúp máy tính bắt chước con người cách học hỏi và suy nghĩ Các hệ thống của Deep Learning có khả năng cải thiện được những hiệu suất của chúng với quyền truy cập vào dữ liệu sẽ được nhiều hơn

Thông thường, phiên bản máy sẽ có nhiều kinh nghiệm hơn; những máy móc đã có

đủ kinh nghiệm thì sẽ được mang đi phục vụ cho những công việc như: lái xe, phát hiện cỏ dại,

Hình 4 Deep Learing là gì ?

Deep Learning có hỗ trợ cho việc dịch ngôn ngữ, phân loại các hình ảnh, nhận dạng giọng nói Chính vì thế, nó có thể được ứng dụng để giải quyết mọi nhu cầu cần nhận dạng mẫu mà không cần đến sự can thiệp của con người

Deep Learning là một phương pháp của Machine Learning Mạng nơ-ron nhân tạo trong Deep Learning được xây dựng để mô phỏng khả năng tư duy của bộ não con người

Trang 20

Một mạng nơ-ron bao gồm nhiều lớp (layer) khác nhau, số lượng layer càng nhiều thì mạng sẽ càng “sâu” Trong mỗi layer là các nút mạng (node) và được liên kết với những lớp liền kề khác Mỗi kết nối giữa các node sẽ có một trọng số tương ứng, trọng

số càng cao thì ảnh hưởng của kết nối này đến mạng nơ-ron càng lớn

Mỗi nơron sẽ có một hàm kích hoạt, về cơ bản thì có nhiệm vụ “chuẩn hoá” đầu ra

từ nơ-ron này Dữ liệu được người dùng đưa vào mạng nơ-ron sẽ đi qua tất cả layer và trả về kết quả ở layer cuối cùng, gọi là output layer

Hình 5 Deep Learing hoạt động như thế nào ?

Trong quá trình huấn luyện mô hình mạng nơ-ron, các trọng số sẽ được thay đổi

và nhiệm vụ của mô hình là tìm ra bộ giá trị của trọng số sao cho phán đoán là tốt nhất

Các hệ thống Deep Learning yêu cầu phần cứng phải rất mạnh để có thể xử lý được lượng dữ liệu lớn và thực hiện các phép tính phức tạp Nhiều mô hình Deep Learning có thể mất nhiều tuần, thậm chí nhiều tháng để triển khai trên những phần cứng tiên tiến nhất hiện nay

Một số ưu điểm vượt trội của Deep Learning gồm có:

● Kiến trúc mạng nơ-ron linh hoạt, có thể dễ dàng thay đổi để phù hợp với nhiều vấn đề khác nhau

● Có khả năng giải quyết nhiều bài toán phức tạp với độ chính xác rất cao

● Tính tự động hoá cao, có khả năng tự điều chỉnh và tự tối ưu

● Có khả năng thực hiện tính toán song song, hiệu năng tốt, xử lý được lượng dữ liệu lớn

Trang 21

CHƯƠNG 2 : CƠ SỞ LÝ THUYẾT VÀ KỸ THUẬT

NHẬN DẠNG 2.1. Thị giác máy tính ( Computer vision)

2.1.1. Phân loại ảnh (Image classification)

Hình 6 Image Classfication

Phân loại hình ảnh (Image classification) hay Nhận dạng hình ảnh (Image recognition) là một trong những tác vụ của thị giác máy tính, ở đó thuật toán xem xét

và dán nhãn cho hình ảnh từ một tập danh mục được xác định và đào tạo trước

Có nhiều thuật toán khác nhau được ứng dụng trong việc phân loại hình ảnh Các thuật toán này được chia thành hai nhóm chính là Học có giám sát (supervised learning) và Học không giám sát (unsupervised learning)

❖ Phân loại có giám sát

Trong học máy có giám sát, thuật toán được huấn luyện trên một tập hình ảnh

đã được dán nhãn Từ dữ liệu mẫu này, thuật toán có thể trích xuất thông tin, phục vụ phân loại ngay cả những hình ảnh chưa từng nhìn thấy trước đó Các phương pháp phân loại phổ biến dựa trên học có giám sát bao gồm:

● Support Vector Machines

● Decision Trees

Trang 22

❖ Phân loại không giám sát

Trong học máy không giám sát, thuật toán chỉ sử dụng dữ liệu thô để đào

tạo.Các nhãn phân loại thường không xuất hiện trong kiểu học này và mô hình học bằng cách nhận dạng các mẫu trong tập dữ liệu huấn luyện

Giống như phân loại có giám sát, các phương pháp dựa trên không giám sát cũng liên quan đến bước trích xuất đặc điểm với các thông tin chi tiết nhất về hình ảnh.Các đặc điểm này sau đó được xử lý bằng các phương pháp phân cụm tham số

(Gaussian Mixture Models) và phi tham số (K-means) hoặc các thuật toán học không giám sát khác

Các thuật toán và kỹ thuật phân loại của thị giác máy tính không chỉ giới hạn trong dữ liệu hình ảnh 2D đơn giản mà còn mở rộng ra dưới dạng Video và ảnh 3D

2.1.2. Khoanh vùng đối tượng ( Object detection)

Hình 7 Object detection

Ngày đăng: 21/03/2024, 17:20

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w