1. Trang chủ
  2. » Luận Văn - Báo Cáo

Báo cáo học phần xử lý ảnh Đề tài chuyển Đổi ký tự trong ảnh thành text

55 0 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Chuyển Đổi Ký Tự Trong Ảnh Thành Text
Tác giả Nguyễn Tiến Hoàng, Lê Văn Nam, Lục Văn Chiều, Lưu Hữu Được
Người hướng dẫn ThS. Phùng Thế Huân
Trường học Trường Đại Học Công Nghệ Thông Tin & Truyền Thông Thái Nguyên
Chuyên ngành Công Nghệ Thông Tin
Thể loại Báo Cáo
Năm xuất bản 2023
Thành phố Thái Nguyên
Định dạng
Số trang 55
Dung lượng 4,64 MB

Nội dung

1.1.3 Các kỹ thuật xử lý ảnh phổ biến Dưới đây là một số kỹ thuật xử lý ảnh phổ biến:  Biến đổi: Biến đổi là các phép toán thay đổi định dạng của ảnh.. trên đặc trưng, nhận dạng dựa trê

Trang 1

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN & TRUYỀN

THÔNG THÁI NGUYÊN KHOA CÔNG NGHỆ THÔNG TIN

BÁO CÁO HỌC PHẦN XỬ LÝ ẢNH

Đề tài:

CHUYỂN ĐỔI KÝ TỰ TRONG ẢNH THÀNH TEXT

Nhóm sinh viên thực hiện: Nguyễn Tiến Hoàng KHMT K19A

Giáo viên hướng dẫn: ThS Phùng Thế Huân

Thái Nguyên, năm 2023

Trang 2

MỤC LỤC

MỞ ĐẦU 5

CHƯƠNG I: TỔNG QUAN XỬ LÝ ẢNH VÀ ĐỀ TÀI 6

1.1 TỔNG QUAN VỀ XỬ LÝ ẢNH 6

1.1.1 Khái niệm cơ bản về ảnh 6

1.1.2 Các lĩnh vực của xử lý ảnh 6

1.1.3 Các kỹ thuật xử lý ảnh phổ biến 7

1.1.4 Các ứng dụng của xử lý ảnh 8

1.1.5 Tương lai của xử lý ảnh 8

1.1.6 Một số kỹ thuật xử lý ảnh nâng cao 8

1.2 GIỚI THIỆU VỀ BÀI TẬP LỚN 10

1.2.1 Bài toán đề tài "Chuyển đổi ký tự trong ảnh thành text" 10

1.2.2 Các kỹ thuật có thể sử dụng 10

2.3 Ứng dụng của đề tài 11

1.2.4 Kết luận 11

1.2.5 Một số vấn đề cần lưu ý 11

CHƯƠNG II: CƠ SỞ LÝ THUYẾT 13

2.1 NGÔN NGỮ CÀI ĐẶT 13

2.1.1 Ngôn ngữ Python 13

1

Trang 3

2.2 CÁC THƯ VIỆN CẦN THIẾT 13

2.2.1 Thư viện Opencv 13

2.2.2 Thư viện Numpy 14

2.2.3 Thư viện EasyOCR 14

2.2.4 Các khái niệm , thao tác cơ bản dùng khi xử lý ảnh 15

2.3 Thuật toán KNN 17

CHƯƠNG III: NHẬN DIỆN KÝ TỰ TRONG ẢNH VÀ CHUYỂN THÀNH TEXT 19

3.1 CÁC BƯỚC XỬ LÝ ẢNH 19

3.1.1 ý tưởng 19

3.1.2 chuyển về ảnh xám 19

3.1.3 chuyển sang ảnh nhị phân 20

3.1.4 Nhận xét 22

3.2 DÙNG THƯ VIỆN EASYOCR ĐỂ ĐỌC HOẠT ĐỘNG KÝ TỰ .22 3.2.1 Gọi và sử dụng thư viện EasyOCR 22

3.3 THAO TÁC XỬ LÝ ĐỂ LẤY TỌA ĐỘ VÀ VĂN BẢN DƯỚI DẠNG TEXT 23

3.3.1 Các hàm sử dụng 23

CHƯƠNG IV: NHẬN DIỆN CHỮ VIẾT TAY TRONG ẢNH 27

4.1 TƯ TƯỞNG 27

Trang 4

4.2 CHUẨN BỊ DỮ LIỆU HUẤN LUYỆN 27

4.3 PHÁT HIỆN ĐƯỜNG VIỀN CỦA CÁC ĐỐI TƯỢNG 29

4.3.1 Khái niệm 29

4.3.2 Cách cài đặt 30

4.4 PHÁT HIỆN ĐỐI TƯỢNG KHÔNG PHẢI KÝ TỰ 31

4.5 CẮT CÁC ĐỐI TƯỢNG VÀ RESIZE GIỐNG ẢNH TRONG TẬP DỮ LIỆU MẪU 33

4.6 SỬ DỤNG KNN ĐỂ DỰ ĐOÁN KÝ TỰ 34

4.7 KẺ KHUNG VIẾT KÝ TỰ DỰ ĐOÁN TRÊN KHUNG VÀ HIỂN THỊ RA MÀN HÌNH 35

CHƯƠNG V: ĐÁNH GIÁ KẾT QUẢ THỰC HIỆN 37

5.1 ĐỐI VỚI NHẬN DIỆN CÁC FONT CHỮ PHỔ BIẾN TRÊN CÁC THIẾT BỊ ĐIỆN TỬ 37

5.1.1 Ưu nhược điểm 37

5.2 ĐỐI VỚI NHẬN DIỆN ẢNH CHỮ VIẾT TAY 38

5.2.1 Ưu nhược điẻm 38

5.2.2 Các ảnh đã nhận dạng 38

CHƯƠNG VI: TỔNG KẾT 45

6.1 MỤC TIÊU ĐẠT ĐƯỢC 45

6.1.1 Kiến thức 45

6.1.2 Ứng dụng 45

3

Trang 5

6.2 MỤC TIÊU CHƯA ĐẠT ĐƯỢC 46

KẾT LUẬN 47 TÀI LIỆU THAM KHẢO 49

Trang 6

MỞ ĐẦU

Ngày nay, công nghệ thông tin phát triển đồng nghĩa với việc pháttriển các phần mềm ứng dụng Xử lý ảnh đóng vai trò quan trọng trongnhiều lĩnh vực ứng dụng khác nhau Trong lĩnh vực xử lý ảnh, việcchuyển đổi chữ viết tay sang dạng văn bản thường gặp, đóng góp mộtphần quan trọng trong quá trình tự động hóa công tác xử lý tài liệu vàtìm kiếm thông tin

Đề tài này tập trung vào việc nghiên cứu và ứng dụng các phươngpháp xử lý ảnh để chuyển đổi chữ viết tay thành dạng văn bản Qua quátrình nghiên cứu và thực nghiệm, chúng tôi hy vọng đem đến một giảipháp hiệu quả và đáng tin cậy trong việc xử lý tài liệu chữ viết tay.Báo cáo này sẽ bao gồm các phần chính như mục tiêu và phạm vi

đề tài, các khái niệm cơ bản, phương pháp nghiên cứu và kết quả đạtđược Cuối cùng, chúng tôi sẽ đánh giá các kết quả và đề xuất hướngphát triển tiếp theo của đề tài

Chúng em xin chân thành cảm ơn sự hướng dẫn và hỗ trợ nhiệttình của các thầy cô trong quá trình thực hiện đề tài này Mong rằng báocáo này sẽ đem lại giá trị thực tiễn và mang lại những góp ý cần thiết đểphát triển hơn nữa trong tương lai

Em xin chân thành cảm ơn!

5

Trang 7

từ ảnh hoặc tạo ra các hình ảnh mới từ ảnh.

1.1.1 Khái niệm cơ bản về ảnh

Một ảnh số là một ma trận các điểm ảnh, mỗi điểm ảnh được biểu diễn bằng một số hoặc một bộ số Số lượng điểm ảnh trong một ảnh được gọi là độ phân giải của ảnh Độ phân giải càng cao thì ảnh càng chi tiết

Các thông tin trong ảnh được thể hiện bởi các giá trị của các điểm ảnh Các giá trị này có thể được biểu diễn bằng các số nguyên, số thực hoặc

số phức

1.1.2 Các lĩnh vực của xử lý ảnh

Xử lý ảnh có thể được chia thành nhiều lĩnh vực khác nhau, bao gồm:

 Thu nhận ảnh: Đây là quá trình thu thập ảnh từ thế giới thực

Trang 8

 Cải thiện ảnh: Đây là quá trình cải thiện chất lượng của ảnh, chẳnghạn như loại bỏ nhiễu, tăng cường độ tương phản hoặc sửa đổi màu sắc.

 Phân tích ảnh: Đây là quá trình trích xuất thông tin từ ảnh, chẳng hạn như nhận dạng đối tượng, phát hiện khuôn mặt hoặc đo kích thước

 Tạo ảnh: Đây là quá trình tạo ra các hình ảnh mới từ ảnh, chẳng hạn như chỉnh sửa ảnh hoặc tạo hình ảnh tổng hợp

1.1.3 Các kỹ thuật xử lý ảnh phổ biến

Dưới đây là một số kỹ thuật xử lý ảnh phổ biến:

 Biến đổi: Biến đổi là các phép toán thay đổi định dạng của ảnh Các biến đổi phổ biến bao gồm biến đổi Fourier, biến đổi Laplace

và biến đổi wavelet

 Lọc: Lọc là các phép toán làm thay đổi giá trị của các điểm ảnh trong ảnh Các bộ lọc phổ biến bao gồm bộ lọc trung bình, bộ lọc làm mờ và bộ lọc làm nét

 Phân đoạn: Phân đoạn là quá trình chia ảnh thành các khu vực riêng biệt Các thuật toán phân đoạn phổ biến bao gồm phân đoạn dựa trên ngưỡng, phân đoạn dựa trên vùng và phân đoạn dựa trên cấu trúc

 Nhận dạng: Nhận dạng là quá trình xác định các đối tượng trong ảnh Các thuật toán nhận dạng phổ biến bao gồm nhận dạng dựa

7

Trang 9

trên đặc trưng, nhận dạng dựa trên mô hình và nhận dạng dựa trên học máy.

1.1.4 Các ứng dụng của xử lý ảnh

Xử lý ảnh có nhiều ứng dụng trong thực tế, bao gồm:

 Công nghệ y tế: Xử lý ảnh được sử dụng trong chẩn đoán bệnh, phẫu thuật và nghiên cứu y học

 Cảnh sát và an ninh: Xử lý ảnh được sử dụng trong theo dõi, nhận dạng và phân tích hình ảnh

 Công nghệ video: Xử lý ảnh được sử dụng trong xử lý video, phát hiện chuyển động và theo dõi đối tượng

 Công nghệ giải trí: Xử lý ảnh được sử dụng trong chỉnh sửa ảnh, tạo hiệu ứng hình ảnh và tạo hình ảnh 3D

1.1.5 Tương lai của xử lý ảnh

Xử lý ảnh là một lĩnh vực rộng lớn và đang phát triển nhanh chóng Các kỹ thuật xử lý ảnh mới được phát triển liên tục để đáp ứng nhu cầu của các ứng dụng thực tế

1.1.6 Một số kỹ thuật xử lý ảnh nâng cao

Ngoài các kỹ thuật xử lý ảnh phổ biến đã đề cập ở trên, còn có một số kỹ thuật xử lý ảnh nâng cao, chẳng hạn như:

Trang 10

 Xử lý ảnh dựa trên học máy: Các thuật toán học máy được sử dụng để tự động hóa các tác vụ xử lý ảnh, chẳng hạn như nhận dạng đối tượng và phân đoạn ảnh.

 Xử lý ảnh đa hướng: Các thuật toán xử lý ảnh đa hướng được sử dụng để xử lý ảnh từ nhiều nguồn khác nhau, chẳng hạn như ảnh

từ máy ảnh, ảnh từ cảm biến và ảnh từ video

 Xử lý ảnh 3D: Các thuật toán xử lý ảnh 3D được sử dụng để tạo

và xử lý ảnh 3D

Những kỹ thuật này đang được nghiên cứu và phát triển để mở rộng khả năng của xử lý ảnh trong các ứng dụng thực tế

9

Trang 11

1.2 GIỚI THIỆU VỀ BÀI TẬP LỚN

1.2.1 Bài toán đề tài "Chuyển đổi ký tự trong ảnh thành text"

Mục tiêu của đề tài này là phát triển các kỹ thuật để tự động chuyển đổi các ký tự trong ảnh thành văn bản Để giải quyết bài toán này, cần giải quyết một số vấn đề sau:

 Phân đoạn ký tự: Đây là quá trình chia ảnh thành các khu vực chứa ký tự Các khu vực này có thể có kích thước và hình dạng khác nhau

 Chuẩn hóa ký tự: Đây là quá trình điều chỉnh kích thước, độ nghiêng và độ xoay của các ký tự để chúng có cùng kích thước và định hướng

 Nhận dạng ký tự: Đây là quá trình xác định các ký tự trong các khu vực đã được chuẩn hóa

1.2.2 Các kỹ thuật có thể sử dụng

Để giải quyết các vấn đề này, có thể sử dụng một số kỹ thuật sau:

 Kỹ thuật dựa trên đặc trưng: Các đặc trưng được sử dụng để mô tảcác ký tự Các thuật toán phân đoạn và nhận dạng ký tự dựa trên việc so sánh các đặc trưng của các ký tự trong ảnh với các đặc trưng của các ký tự trong bộ dữ liệu huấn luyện

Trang 12

 Kỹ thuật dựa trên học máy: Các thuật toán học máy được sử dụng

để học mối quan hệ giữa các đặc trưng của các ký tự trong ảnh và các ký tự tương ứng của chúng

2.3 Ứng dụng của đề tài

Đề tài này có nhiều ứng dụng trong thực tế, bao gồm:

 Chuyển đổi tài liệu giấy thành văn bản điện tử: Đây là một ứng dụng quan trọng trong lĩnh vực lưu trữ và xử lý tài liệu

 Chuyển đổi văn bản từ các ngôn ngữ khác nhau: Đây là một ứng dụngquan trọng trong lĩnh vực dịch thuật tự động

Cung cấp thông tin cho người khiếm thị: Đây là một ứng dụng quan trọng trong lĩnh vực trợ giúp người khuyết tật

1.2.4 Kết luận

Đề tài "Chuyển đổi ký tự trong ảnh thành text" là một đề tài có nhiều tiềm năng ứng dụng Để giải quyết đề tài này, cần phát triển các kỹthuật mới để cải thiện độ chính xác và hiệu quả của các thuật toán phân đoạn, chuẩn hóa và nhận dạng ký tự

1.2.5 Một số vấn đề cần lưu ý

Đề tài này có một số vấn đề cần lưu ý, bao gồm:

11

Trang 13

 Độ chính xác: Các thuật toán phân đoạn, chuẩn hóa và nhận dạng ký

tự cần có độ chính xác cao để đảm bảo kết quả chuyển đổi chính xác

 Hiệu quả: Các thuật toán cần có hiệu quả cao để đảm bảo thời gian chuyển đổi nhanh chóng

 Khả năng mở rộng: Các thuật toán cần có khả năng mở rộng để hỗ trợcác kiểu ký tự khác nhau từ các ngôn ngữ khác nhau

Để giải quyết các vấn đề này, cần phát triển các kỹ thuật mới và cải thiệncác kỹ thuật hiện có

Trang 14

CHƯƠNG II: CƠ SỞ LÝ THUYẾT

2.1 NGÔN NGỮ CÀI ĐẶT

2.1.1 Ngôn ngữ Python

Python là một ngôn ngữ lập trình được sử dụng rộng rãi trong các ứng dụng web, phát triển phần mềm, khoa học dữ liệu và máy học (ML).Các nhà phát triển sử dụng Python vì nó hiệu quả, dễ học và có thể chạy trên nhiều nền tảng khác nhau Phần mềm Python được tải xuống miễn phí, tích hợp tốt với tất cả các loại hệ thống và tăng tốc độ phát triển

2.2 CÁC THƯ VIỆN CẦN THIẾT

2.2.1 Thư viện Opencv

2.2.1.1 Khái niệm:

OpenCV là tên viết tắt của open source computer vision library –

có thể được hiểu là một thư viện nguồn mở cho máy tính Cụ thể hơn OpenCV là kho lưu trữ các mã nguồn mở được dùng để xử lý hình ảnh, phát triển các ứng dụng đồ họa trong thời gian thực

2.2.1.2 Chức năng:

OpenCV được cho là một phần mềm đa nhiệm Nó được ứng dụngtrong rất nhiều trường hợp khác nhau OpenCV được dùng để khởi tạo ra

13

Trang 15

những hình ảnh 3 chiều phức tạp Hoạt động này rất được yêu thích, nhất

là trong thời đại trí tuệ nhân tạo AI phát triển như thế này

2.2.1.3 Ứng dụng trong thực tế, hình minh họa:

Tất cả những ứng dụng công nghệ như robot, xe tự lái, bảng cảm ứng thông minh… đều có sự góp mặt của OpenCV trong khâu xử lý hìnhảnh Hệ thống mở khóa điện thoại bằng cách nhận diện khuôn mặt ngườidùng

2.2.2 Thư viện Numpy

Numpy là một thư viện lõi phục vụ cho khoa học máy tính của Python, hỗ trợ cho việc tính toán các mảng nhiều chiều, có kích thước lớn với các hàm đã được tối ưu áp dụng lên các mảng nhiều chiều đó Numpy đặc biệt hữu ích khi thực hiện các hàm liên quan tới Đại Số Tuyến Tính

2.2.3 Thư viện EasyOCR

EasyOCR là một thư viện Python sử dụng trí tuệ nhân tạo để nhận dạng và đọc ký tự trong ảnh Thư viện này được sử dụng để phát hiện văn bản và trích xuất nội dung từ hình ảnh EasyOCR hỗ trợ nhiều ngôn ngữ và cung cấp khả năng nhận dạng văn bản tiếng Anh và tiếng Việt cũng như nhiều ngôn ngữ khác

Trang 16

2.2.4 Các khái niệm , thao tác cơ bản dùng khi xử lý ảnh

2.2.4.1 pixel là gì?

Trong tạo Ảnh kỹ thuật số, một pixel hay một điểm ảnh (tiếng Anh: pixel hay pel, viết tắt picture element) là một điểm vật lý trong mộthình ảnh raster, hoặc một khối màu rất nhỏ và là đơn vị cơ bản nhất để tạo nên một bức ảnh kỹ thuật số

Hình ảnh minh họa

2.2.4.2 Biểu diễn các pixel dưới dạng ma trận

Trong hình ảnh xám, mỗi pixel được biểu diễn bằng một giá trị độ sáng duy nhất Ma trận pixel cho hình ảnh xám là một ma trận hai chiều (hoặc mảng hai chiều) với mỗi phần tử của ma trận thể hiện giá trị độ sáng tại một vị trí cụ thể trên hình ảnh Giá trị này thường nằm trong

15

Trang 17

khoảng từ 0 đến 255, với 0 thể hiện màu đen và 255 thể hiện màu trắng Điều này cho phép biểu diễn hình ảnh xám dưới dạng ma trận số nguyên.

Hình ảnh minh họa 2.4.3 xử lý màu

Trong hình ảnh màu, mỗi pixel thường được biểu diễn bằng ba giátrị độ sáng tương ứng với ba kênh màu chính: đỏ (R), xanh lá cây (G), vàxanh dương (B) Mỗi kênh màu là một ma trận hai chiều riêng biệt, và các ma trận này có cùng kích thước Giá trị của từng kênh màu cho biết

độ sáng của pixel tại một vị trí cụ thể

Trang 18

Lớp (nhãn) của một đối tượng dữ liệu mới có thể dự đoán từ các lớp (nhãn) của k hàng xóm gần nó nhất.

Trang 19

ảnh minh họa

Ví dụ : Dự đoán tính cách của một bạn nào đó thì có thể dựa vào tính

cách của nhóm mà bạn ấy chơi thân

2.3.2 Ý tưởng của KNN

Thuật toán KNN cho rằng những dữ liệu tương tự nhau sẽ tồn tại gần nhau trong một không gian, từ đó công việc của chúng ta là sẽ tìm k điểm gần với dữ liệu cần kiểm tra nhất Việc tìm khoảng cách giữa 2 điểm củng có nhiều công thức có thể sử dụng, tùy trường hợp mà chúng

ta lựa chọn cho phù hợp Đây là 3 cách cơ bản để tính khoảng cách 2 điểm dữ liệu x, y có k thuộc tính:

Trang 20

- Cần nhiều thời gian để thực hiện do phải tính toán khoảng cách với tất cả các đối tượng trong tập dữ liệu.

- Cần chuyển đổi kiểu dữ liệu thành các yếu tố định tính

19

Trang 21

CHƯƠNG III: NHẬN DIỆN KÝ TỰ TRONG ẢNH VÀ CHUYỂN THÀNH TEXT

3.1 CÁC BƯỚC XỬ LÝ ẢNH

3.1.1 ý tưởng

 Dùng thư viện opencv đọc ảnh đầu vào

 Chuyển ảnh màu vào thành ảnh màu xám

 Đưa về ảnh nhị phân

 Dùng thư viện easyocr để đọc các ký tự

 Thao tác lấy ký tự và tọa độ các ký tự đọc được , vẽ khung cho ký

tự và viết ký tự tương ứng lên các khung đó

Trang 22

tại mỗi pixel, thay vì có thông tin về màu sắc Từ đó sẽ dễ giàng cho việcchuyển đổi ảnh nhị phân để dễ xử lý và nhận dạng

ảnh trước chuyển

ảnh sau chuyển

3.1.3 chuyển sang ảnh nhị phân

21

Trang 23

1.3.1 Khái niệm :

Ảnh nhị phân là ảnh cũng gần tương tự như xám đó là ở mỗi một pixel chỉ mang một giá trị màu là đen (0) hoặc trắng (255) dưới dạng biểu diễn số nguyên

Mục tiêu : giúp ảnh trở đen tối giản nhất , làm nổi bật vùng cần nhận dạng

1.3.2 : Các bước thực hiện

- Thiết lập ngưỡng để nhị phân ảnh hóa

- Áp dụng ngưỡng vào ảnh xám để tạo ảnh nhị phân hoặc áp dụng giải thuật nhị phân hóa ảnh Các pixel có giá trị lớn hơn ngưỡng tathiết lập bằng 255 (hoặc 1), nhỏ hơn ngưỡng ta thiết lập bằng 0

Ví dụ : Áp dụng ngưỡng để tạo ảnh nhị phân

binary_image = cv2.threshold(gray, 170, 255,

v2.THRESH_BINARY_INV)

Trong ví dụ này sử dụng hàm cv2.threshold để hỗ trợ nhị phân , ngưỡng chọn ở đây là 170 , rồi sau đó sẽ đảo ngược màu

Trang 24

Ảnh sau khi nhị phân

23

Trang 25

3.1.4 Nhận xét

Trong bài em sử dụng những ảnh test đơn giản cũng như dễ phát hiện ngưỡng phù hợp để nhị phân nên sử dụng áp ngưỡng thủ công , nhưng trong thực tế sẽ dẫn đến các trường hợp bị sai , làm mất vùng cần nhận diện.Để giảm các trường hợp đó sẽ có phương án là dùng ngưỡng

tự động

Trong opencv có hỗ trợ việc xác định ngưỡng tự động và tư tưởng chính: +cv2.ADAPTIVE_THRESH_GAUSSIAN_C là một hằng số được sử dụng trong thư viện OpenCV, một thư viện phổ biến trong lĩnh vực xử lý ảnh và thị giác máy tính Nó liên quan đến kỹ thuật ngưỡng hóa thích nghi (adaptive thresholding) Kỹ thuật ngưỡng hóa thích nghi được sử dụng để chuyển đổi một hình ảnh thành hình ảnh nhị phân (đen

và trắng) bằng cách xem xét các vùng xung quanh của các pixel thay vì

áp dụng một ngưỡng toàn cục đơn lẻ cho toàn bộ hình ảnh

3.2 DÙNG THƯ VIỆN EASYOCR ĐỂ ĐỌC HOẠT ĐỘNG

KÝ TỰ

3.2.1 Gọi và sử dụng thư viện EasyOCR

Thư viện easyocr là thư viện hỗ trợ rất nhiều trong các bài toán nhận diện Sau khi cài đặt thư viện , có thể áp dụng vào bài này toán nhận dạng:

Trang 26

VD : reader = easyocr.Reader(['en'], gpu=False)

- gpu=False : sử dụng CPU để xử lý hình ảnh (không sử dụng GPU)

-

3.3 THAO TÁC XỬ LÝ ĐỂ LẤY TỌA ĐỘ VÀ VĂN BẢN DƯỚI DẠNG TEXT

3.3.1 Các hàm sử dụng

- cv2.rectangle() :là một hàm trong thư viện OpenCV (Open

Source Computer Vision Library) được sử dụng để vẽ hình chữ nhật trên hình ảnh Hàm này cho phép bạn tạo các đường chữ nhật để xác định vùng cụ thể trên hình ảnh hoặc để tạo khung bao quanh các đối tượng được nhận dạng

25

Trang 27

Cách sử dụng :

- cv2.rectangle(image, pt1, pt2, color, thickness)

Trong đó:

- image: Là hình ảnh mà bạn muốn vẽ hình chữ nhật lên.

- pt1: Là tọa độ của góc trái trên của hình chữ nhật (x1, y1).

- pt2: Là tọa độ của góc phải dưới của hình chữ nhật (x2, y2).

- color: Là màu sắc của hình chữ nhật, có thể là một tuple BGR

(Blue, Green, Red) hoặc một giá trị màu duy nhất (ví dụ: (0, 255, 0) cho màu xanh lá cây)

- thickness: Là độ dày của đường viền của hình chữ nhật Nếu bạn

muốn hình chữ nhật được vẽ bên trong mà không có đường viền, bạn có thể đặt thickness thành -1

cv2.putText :là một hàm trong thư viện OpenCV (Open Source

Computer Vision Library) được sử dụng để viết văn bản lên hình ảnh

Ngày đăng: 18/01/2025, 23:04