1. Trang chủ
  2. » Luận Văn - Báo Cáo

bài tập lớn học phần xử lý ảnh và thị giác máy tính bài toán phân loại tin tức

34 1 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Cấu trúc

  • CHƯƠNG I: TỔNG QUAN VỀ XỬ LÍ ẢNH VÀ THỊ GIÁC MÁY TÍNH (6)
    • 1.1. Tổng quan (6)
      • 1.1.1. Giới thiệu chung (6)
      • 1.1.2. Lịch sử phát triển (6)
      • 1.1.3. Ý nghĩa (8)
    • 1.2. Xử lý ảnh (9)
    • 1.3. Thị giác máy tính (12)
    • CHƯƠNG 2: THUẬT TOÁN VÀ PHƯƠNG PHÁP (15)
      • 2.1. Thuật toán Convolutional Neural Network (CNN) (15)
        • 2.1.1. Định nghĩa (15)
        • 2.1.2. Quy trình làm việc (16)
        • 2.1.3. Ví dụ minh họa (17)
        • 2.1.4. Ưu điểm của CNN (17)
        • 2.1.5. Nhược điểm của CNN (18)
      • 2.2. Thuật toán Support Vector Machine (SVM) (18)
        • 2.2.1. Định nghĩa (18)
        • 2.2.2. Ví dụ minh họa (18)
        • 2.2.3. Ưu điểm của thuật toán (19)
        • 2.2.4. Nhược điểm của thuật toán (20)
      • 2.3. Thuật toán Logictics Regression (20)
        • 2.3.1. Định nghĩa (20)
        • 2.3.2. Cách thức hoạt động (21)
      • 2.3. Thuật toán Naive Bayes (MultinomialNB) (24)
        • 2.3.2. Quy trình làm việc (24)
        • 2.3.3. Xây dựng mô hình Naive Bayes (25)
        • 2.3.4. Ưu điểm thuật toán (25)
        • 2.3.5. Nhược điểm thuật toán (25)
    • CHƯƠNG 3: KẾT QUẢ NGHIÊN CỨU (27)
      • 3.2. Bộ dữ liệu (28)
      • 3.3. Tiêu chí đánh giá (29)
      • 3.4. Huấn luyện mô hình (30)
      • 3.5. Đánh giá mô hình trên tập thử nghiệm (30)
  • KẾT LUẬN (32)
  • TÀI LIỆU THAM KHẢO (34)

Nội dung

TỔNG QUAN VỀ XỬ LÍ ẢNH VÀ THỊ GIÁC MÁY TÍNH

Tổng quan

 Xử lý ảnh và Thị giác máy tính là một lĩnh vực nghiên cứu và ứng dụng trong khoa học máy tính liên quan đến việc xử lý và hiểu các hình ảnh và video bằng các thuật toán và phương pháp tính toán Xử lý ảnh và Thị giác máy tính đóng vai trò quan trọng trong nhiều lĩnh vực, từ y tế và an ninh cho đến công nghiệp và giao thông.

 Các phương pháp trong xử lí ảnh và thị giác máy tính thường dựa trên các thuật toán máy học và học sâu, bao gồm mạng nơ-ron nhân tạo, mạng nơ- ron tích chập (CNN), mạng nơ-ron hồi quy (RNN), và nhiều mô hình khác Những mô hình này được đào tạo trên dữ liệu ảnh và video lớn để nhận biết các mẫu, đặc trưng và mối quan hệ giữa các thành phần trong hình ảnh.

 Xử lí ảnh và thị giác máy tính đã tạo ra những tiến bộ đáng kể trong nhiều lĩnh vực, từ công nghiệp, y học, an ninh, giải trí cho đến cuộc sống hàng ngày Các ứng dụng thực tế của chúng bao gồm nhận dạng khuôn mặt, phân loại hình ảnh, xe tự hành, hệ thống giám sát và nhiều hơn nữa.

Lịch sử phát triển của xử lý ảnh và thị giác máy tính có nguồn gốc từ nhiều ngành khoa học khác nhau và đã trải qua nhiều giai đoạn phát triển quan trọng

Thập kỷ 1960-1970: Trong thập kỷ này, các nghiên cứu đầu tiên về xử lý ảnh và thị giác máy tính được tiến hành Các nhà khoa học nổi tiếng như David Marr, David Huffman và David Waltz đã đóng góp quan trọng trong việc phát triển các thuật toán và phương pháp xử lý ảnh đầu tiên.

Thập kỷ 1980: Trong giai đoạn này, sự phát triển của vi xử lý, khả năng tính toán và bộ nhớ đã mở ra nhiều cơ hội mới cho lĩnh vực xử lý ảnh và thị giác máy tính Các thuật toán như lọc Gaussian, biến đổi Fourier và phân đoạn hình ảnh đã được phát triển và áp dụng rộng rãi.

 Giai đoạn phát triển nhanh

Thập kỷ 1990-2000: Trong giai đoạn này, sự phát triển của máy tính và công nghệ kỹ thuật số đã thúc đẩy mạnh mẽ sự phát triển của xử lý ảnh và thị giác máy tính Các thuật toán phân loại, nhận dạng đối tượng và nhận dạng khuôn mặt đã được phát triển và sử dụng trong nhiều ứng dụng thực tế Các phương pháp học máy và học sâu, như mạng nơ-ron nhiều tầng (MLP) và mạng nơ-ron tích chập (CNN), đã xuất hiện và mang lại những tiến bộ lớn.

Thập kỷ 2010 đến nay: Trong giai đoạn này, xử lý ảnh và thị giác máy tính đã trở thành một lĩnh vực quan trọng và đầy triển vọng Sự kết hợp của học máy, học sâu và khả năng tính toán mạnh mẽ đã tạo ra những tiến bộ đáng kể trong việc nhận dạng vật thể, phân loại ảnh, nhận dạng khuôn mặt và nhận dạng chữ viết Công nghệ thị giác máy tính đã được áp dụng rộng rãi trong nhiều lĩnh vực, bao gồm y tế, an ninh, giao thông, công nghiệp và giải trí.

Trong các năm gần đây, các công nghệ mới như thị giác máy tính 3D, xử lý ảnh trên di động và thị giác máy tính theo thời gian thực đang phát triển nhanh chóng và mang đến nhiều tiềm năng ứng dụng mới Sự tiến bộ trong lĩnh vực phần cứng và phần mềm cũng tiếp tục tạo điều kiện thuận lợi cho sự phát triển của xử lý ảnh và thị giác máy tính trong tương lai.

Xử lý ảnh và thị giác máy tính có ý nghĩa vô cùng quan trọng trong nhiều lĩnh vực đời sống Dưới đây là một số ứng dụng quan trọng của xử lý ảnh và thị giác máy tính:

 Phân tích và nhận dạng: Xử lý ảnh và thị giác máy tính cung cấp khả năng phân tích và nhận dạng đối tượng, khuôn mặt, biểu đồ và các thành phần khác trong hình ảnh và video Điều này có ảnh hưởng đến nhiều lĩnh vực như giao thông, y tế, an ninh và công nghiệp, giúp tự động hóa quá trình kiểm tra, giám sát và đưa ra quyết định.

 Truyền thông và giải trí: Xử lý ảnh và thị giác máy tính đã thay đổi cách chúng ta tận hưởng nội dung truyền thông và giải trí Từ công nghệ hiệu ứng đặc biệt trong phim, trò chơi điện tử cho đến các ứng dụng nhận dạng khuôn mặt, gợi ý nội dung và tạo ra trải nghiệm tương tác mới, xử lý ảnh và thị giác máy tính đã làm thay đổi cách chúng ta tương tác và tiếp cận với nội dung giải trí.

 Y tế và chăm sóc sức khỏe: Xử lý ảnh và thị giác máy tính đã mang lại nhiều tiềm năng trong lĩnh vực y tế và chăm sóc sức khỏe Chúng có thể hỗ trợ trong việc chẩn đoán bệnh, phát hiện sớm các vấn đề sức khỏe, theo dõi quá trình điều trị và giúp nâng cao chất lượng chăm sóc y tế Ví dụ, việc nhận dạng và phân tích hình ảnh y tế có thể giúp phát hiện ung thư, bệnh tim mạch và các bệnh lý khác một cách sớm và chính xác.

 Giao thông và xe tự hành: Xử lý ảnh và thị giác máy tính đóng vai trò quan trọng trong việc phân tích và nhận dạng biển báo giao thông, điểm dừng,người đi bộ và các phương tiện khác trên đường Điều này giúp tạo ra hệ thống giao thông thông minh, giảm tai nạn và cải thiện hiệu suất giao thông Ngoài ra, trong lĩnh vực xe tự hành, xử lý ảnh và thị giác máy tính được sử dụng để phát hiện và theo dõi đối tượng, định vị và nhận dạng các yếu tố xung quanh để điều khiển xe tự động.

Hình 1 Ý nghĩa của xử lí ảnh và thị giác máy tính trong giao thông

 Công nghiệp và tự động hóa: Xử lý ảnh và thị giác máy tính có thể được áp dụng trong các quy trình công nghiệp và tự động hóa Chúng có thể giúp phát hiện lỗi, kiểm tra chất lượng, theo dõi quá trình sản xuất và tăng cường hiệu suất Việc sử dụng hệ thống thị giác máy tính trong môi trường công nghiệp giúp giảm thiểu sai sót do yếu tố con người và nâng cao độ tin cậy và hiệu suất của quy trình sản xuất.

Xử lý ảnh

 Xử lí ảnh là tất cả các kỹ thuật và các thuật toán để tính toán, từ một hình ảnh đầu vào, đầu ra là một hình ảnh mới nơi thông tin được đánh dấu Nó cho phép chúng ra hiểu được ảnh

Xử lí mức trung bình Xử lí mức cao

Vào: Ảnh Ra: Ảnh Ví dụ: Loại bỏ nhiều, tăng cường độ sắc nét ảnh

Vào: Ảnh Ra: Các thuộc tính Ví dụ: Nhận dạng đối tượng, phân vùng ảnh

Vào: Các thuộc tính Ra: Hiểu ảnh

Ví dụ: Hiểu cảnh, hệ thống tự vận hành

 Xử lí ảnh là một khoa học nhằm trang bị ý tưởng, phương phát luận và các kỹ thuật để máy tính có khả năng xử lý ảnh, và hiểu được ảnh như con người

 Xử lí ảnh là một quá trình phức tạp và đa dạng liên quan đến nhiều lĩnh vực khác nhau o Xử lí ảnh: Ảnh đầu vào -> ảnh đầu ra o Phân tích ảnh: Đo lường ảnh đầu ra o Hiểu ảnh: Mô tả mức cao đầu ra

 Xử lí ảnh số tập trung vào hai nhiệm vụ chính: o Cải thiện thông tin bằng hình ảnh để giải thích, giúp cho con người hiểu rõ hơn về hình ảnh o Xử lí dữ liệu hìn hảnh để truyền, lưu trữ và biểu diễn cho nhận thức máy tự động

 Từ xử lí ảnh đến thị giác máy tính có thể chia thành các quá trình từ xử lí mức độ thấp, mức độ trung bình đến mức độ cao

 Một số ví dụ về xử lí ảnh: o Tăng cường ảnh (Image enhancement): Một trong những ứng dụng phổ biến nhất của các kỹ thuật xử lý ảnh số

Hình 2 Ứng dụng tăng cường ảnh trong xử lí ảnh o Xử lý trong y học:

Hình 3 Ứng dụng của xử lí ảnh trong y học o Hệ thống nhận diện khuân mặt

Hình 4 Ứng dụng nhận diện khuân mặt trong xử lí ảnh

Thị giác máy tính

 Thị giác máy tính (Computer vision) tập trung vào việc hiểu, giải thích và phân tích hình ảnh và video Nó đòi hỏi khả năng của máy tính để nhận dạng và hiểu được các đối tượng, khuôn mặt, vật thể, cấu trúc không gian và các thông tin khác từ hình ảnh Thị giác máy tính sử dụng các phương pháp và thuật toán để trích xuất các đặc trưng, phân loại, nhận dạng và theo dõi các đối tượng trong hình ảnh.

 Với sự phát triển của công nghệ và khả năng tính toán, thị giác máy tính và xử lý ảnh ngày càng gần nhau và tương hỗ nhau trong nhiều ứng dụng Thị giác máy tính thường sử dụng các kỹ thuật xử lý ảnh để tiền xử lý dữ liệu hình ảnh trước khi áp dụng các thuật toán phân loại, nhận dạng, theo dõi và hiểu thông tin từ hình ảnh Xử lý ảnh cung cấp các công cụ và phương pháp để làm sạch, cải thiện chất lượng, loại bỏ nhiễu và phân tách đối tượng trong hình ảnh, từ đó hỗ trợ các nhiệm vụ của thị giác máy tính.

Hình 5 Ứng dụng của thị giác máy tính

 Thị giác máy tính bao gồm các lĩnh vực sau: o Xử lí hình ảnh: Phát triển các thuật toán xử lí ảnh như tăng/giảm chất lượng ảnh, lọc nhiễu o Nhận diện mẫu: Giải thích các kỹ thuật khác nhau để phân loại mẫu. o Quang trắc: Liên quan đến việc thu thập các số đo chính xác từ hình ảnh.

 Một số ví dụ về thị giác máy tính: o Phân loại hình ảnh

Hình 6 Phân loại hình ảnh với thị giác máy tính o Phát hiện đối tượng:

Hình 7 Phát hiện đối tượng với thị giác máy tính o Tái thiết hình ảnh

Hình 8 Tái thiết hình ảnh với thị giác máy tính o Theo dõi đối tượng:

Hình 9 Theo dõi đối tượng với thị giác máy tính

THUẬT TOÁN VÀ PHƯƠNG PHÁP

2.1 Thuật toán Convolutional Neural Network (CNN)

CNN (Convolutional Neural Network) là một mô hình mạng nơ-ron sâu được sử dụng rộng rãi trong lĩnh vực xử lí ảnh và thị giác máy tính Nó được thiết kế để tự động rút trích và hiểu các đặc trưng từ dữ liệu hình ảnh

CNN là một kiến trúc mạng nơ-ron sâu có khả năng tự học các đặc trưng từ dữ liệu hình ảnh thông qua các lớp tích chập và pooling Nó sử dụng các bộ lọc tích chập để tìm kiếm các đặc trưng như cạnh, góc, texture, và các đặc trưng cao cấp hơn từ các vùng nhỏ của hình ảnh Sau đó, thông qua các lớp pooling,CNN giảm kích thước của đặc trưng và tạo ra các biểu diễn tổng quát của hình ảnh.

Hình 10 Tổng quan thuật toán CNN

 Bước 1: Tiền xử lí: Ảnh đầu vào được chuẩn hóa kích thước và điều chỉnh độ sáng.

 Bước 2: Lớp tích chập: Các bộ lọc tích chập được áp dụng trên ảnh để rút trích các đặc trưng như cạnh, góc, texture Các lớp tích chập này bao gồm các bộ lọc với trọng số được học để tìm ra các đặc trưng quan trọng.

 Bước 3: Lớp pooling: Lớp pooling giảm kích thước của đặc trưng bằng cách giữ lại các giá trị quan trọng nhất Các phép lọc pooling thường là phép lọc tối đa (max pooling) hoặc phép lọc trung bình (average pooling).

 Bước 4: Flatten: Các đặc trưng được làm phẳng thành một vectơ để đưa vào các lớp kết nối đầy đủ (fully connected layers).

 Bước 5: Lớp kết nối đầy đủ: Lớp kết nối đầy đủ nhận các đặc trưng đã được làm phẳng và thực hiện phân loại các lớp dựa trên các đặc trưng đó.

 Bước 6: Đầu ra: Đầu ra cuối cùng của CNN là xác suất phân loại cho mỗi lớp.

Hình 11 Quy trình làm việc thuật toán CNN

Một ví dụ đơn giản về CNN là việc phân loại ảnh chó và mèo CNN sẽ học các đặc trưng như mắt, mũi, tai và các chi tiết khác của chó và mèo từ các bức ảnh huấn luyện Sau khi huấn luyện, CNN có thể dự đoán xác suất một bức ảnh mới là chó hoặc mèo.

Hình 12 Ví dụ minh họa thuật toán CNN

 Có khả năng tự động rút trích các đặc trưng từ dữ liệu hình ảnh.

 Phù hợp với việc xử lý dữ liệu ảnh 2D và dữ liệu không gian.

 Hiệu suất tốt trong việc phân loại hình ảnh và nhận dạng đối tượng.

 Giảm số lượng tham số cần huấn luyện thông qua các lớp tích chập và pooling.

 Yêu cầu lượng dữ liệu huấn luyện lớn để đạt được hiệu suất tốt.

 Đòi hỏi tài nguyên tính toán cao, đặc biệt là khi mạng rất sâu và kích thước hình ảnh lớn.

 Khả năng hiểu và diễn giải các quyết định của CNN không được rõ ràng.

2.2 Thuật toán Support Vector Machine (SVM) 2.2.1 Định nghĩa

Support Vector Machine (SVM) là một mô hình phân loại hoạt động bằng việc xây dựng một siêu phẳng (hyperplane) có (n - 1) chiều trong không gian n chiều của dữ liệu sao cho siêu phẳng này phân loại các lớp một cách tối ưu nhất.

Nói cách khác, cho một tập dữ liệu có nhãn (học có giám sát), thuật toán sẽ dựa trên dữ liệu học để xây dựng một siêu phẳng tối ưu được sử dụng để phân loại dữ liệu mới Ở không gian 2 chiều thì siêu phẳng này là 1 đường thẳng phân cách chia mặt phẳng không gian thành 2 phần tương ứng 2 lớp với mỗi lớp nằm ở 1 phía của đường thẳng.

Ta có các điểm dữ liệu như hình dưới đây với mỗi điểm thuộc 1 trong 2 lớp cho trước:

Hình 13 Ví dụ mô hình thuật toán SVM

Một đường thẳng phân cách có thể được vẽ như sau:

Hình 14 Ví dụ mô hình thuật toán SVM Đường thẳng này chia cách khá tốt 2 lớp trên mặt phẳng Tất cả những điểm dữ liệu nằm bên trái đường thẳng đều thuộc về lớp hình tròn và những điểm nằm ở bên phải thuộc về lớp hình vuông Nhiệm vụ của SVM chính là tìm ra đường thẳng / siêu phẳng phân cách cách sao cho phân loại dữ liệu tốt nhất có thể.

2.2.3 Ưu điểm của thuật toán

Là một kĩ thuật phân lớp khá phổ biến, SVM thể hiện được nhiều ưu điểm trong số đó có việc tính toán hiệu quả trên các tập dữ liệu lớn Có thể kể thêm một số ưu điểm của phương pháp này như:

 Xử lý trên không gian số chiều cao: SVM là một công cụ tính toán hiệu quả trong không gian chiều cao, trong đó đặc biệt áp dụng cho các bài toán phân loại văn bản và phân tích quan điểm nơi chiều có thể cực kỳ lớn

 Tiết kiệm bộ nhớ: Do chỉ có một tập hợp con của các điểm được sử dụng trong quá trình huấn luyện và ra quyết định thực tế cho các điểm dữ liệu mới nên chỉ có những điểm cần thiết mới được lưu trữ trong bộ nhớ khi ra quyết dịnh

 Tính linh hoạt - phân lớp thường là phi tuyến tính Khả năng áp dụng Kernel mới cho phép linh động giữa các phương pháp tuyến tính và phi tuyến tính từ đó khiến cho hiệu suất phân loại lớn hơn.

2.2.4 Nhược điểm của thuật toán

 Bài toán số chiều cao: Trong trường hợp số lượng thuộc tính (p) của tập dữ liệu lớn hơn rất nhiều so với số lượng dữ liệu (n) thì SVM cho kết quả khá tồi

 Chưa thể hiện rõ tính xác suất: Việc phân lớp của SVM chỉ là việc cố gắng tách các đối tượng vào hai lớp được phân tách bởi siêu phẳng SVM Điều này chưa giải thích được xác suất xuất hiện của một thành viên trong một nhóm là như thế nào Tuy nhiên hiệu quả của việc phân lớp có thể được xác định dựa vào khái niệm margin từ điểm dữ liệu mới đến siêu phẳng phân lớp mà chúng ta đã bàn luận ở trên.

KẾT QUẢ NGHIÊN CỨU

3.1 Bài toán phân loại tin tức

 Bài toán phân loại tin tức là một bài toán quan trọng trong lĩnh vực xử lý ngôn ngữ tự nhiên và học máy Với sự phát triển của internet và các trang web tin tức, việc phân loại các tin tức theo chủ đề đã trở nên càng quan trọng hơn bao giờ hết Bài toán này yêu cầu phân loại một bài báo hoặc tin tức vào một trong các chủ đề khác nhau, chẳng hạn như thể thao, kinh tế, giải trí, chính trị, v.v.

 Để giải quyết bài toán phân loại tin tức, ta cần có một tập dữ liệu được gán nhãn chính xác với các chủ đề tương ứng Tập dữ liệu này sẽ được sử dụng để huấn luyện các mô hình học máy Tiếp theo, ta cần thực hiện các bước tiền xử lý dữ liệu như Tokenization, Stopwords removal, Stemming, v.v để loại bỏ các từ không cần thiết và chuẩn hóa các từ trong văn bản.

 Sau khi đã tiền xử lý dữ liệu, ta có thể sử dụng các mô hình học máy như SVM, Naive Bayes, Random Forest, mạng neural, v.v để phân loại các bài báo hoặc tin tức vào các chủ đề khác nhau Các mô hình này sẽ học từ tập dữ liệu đã được gán nhãn để tạo ra một mô hình phân loại chính xác cho các bài báo hoặc tin tức mới.

 Các mô hình học máy có thể được kết hợp với các kỹ thuật nhúng từ (word embeddings) để cải thiện độ chính xác của mô hình Các kỹ thuật nhúng từ là một phương pháp biểu diễn các từ trong không gian vector, giúp các mô hình học máy hiểu được các từ trong ngữ cảnh của chúng.

 Việc phân loại tin tức có nhiều ứng dụng thực tế, chẳng hạn như giúp các công ty và tổ chức theo dõi các chủ đề quan tâm của khách hàng và đối tác, hoặc giúp người dùng lọc các tin tức theo chủ đề mà họ quan tâm trên các trang web tin tức Ngoài ra, bài toán này còn có thể được ứng dụng trong các lĩnh vực khác như phân tích cảm xúc và phát hiện tin giả.

Bộ dữ liệu News Category Dataset Bộ dữ liệu này chứa khoảng 210 nghìn tiêu đề tin tức từ năm 2012 đến năm 2022 từ HuffPost Đây là một trong những bộ dữ liệu tin tức lớn nhất và có thể dùng làm chuẩn cho nhiều nhiệm vụ ngôn ngữ tính toán HuffPost đã ngừng duy trì kho lưu trữ rộng rãi các bài báo sau khi tập dữ liệu này được thu thập lần đầu vào năm 2018, vì vậy không thể thu thập tập dữ liệu như vậy vào thời điểm hiện tại Do những thay đổi trên trang web, có khoảng 200 nghìn dòng tiêu đề trong khoảng thời gian từ năm 2012 đến tháng 5 năm 2018 và 10 nghìn dòng tiêu đề trong khoảng thời gian từ tháng 5 năm 2018 đến năm 2022 Mỗi bản ghi trong tập dữ liệu bao gồm các thuộc tính sau:

 Thể loại: thể loại mà bài báo đã được xuất bản.

 Tít: đầu đề bài báo.

 Các tác giả: danh sách các tác giả đã đóng góp cho bài viết.

 Liên kết: liên kết đến bài báo gốc.

 short_description: Tóm tắt bài báo.

 date: ngày xuất bản bài viết.

 Có tổng cộng 42 danh mục tin tức trong tập dữ liệu 15 danh mục hàng đầu và số lượng bài viết tương ứng như sau:

Hiệu suất của hệ thống trong phân loại được đo bằng cách sử dụng ma trận nhầm lẫn (Confusion matrix) để đạt được độ chính xác, recall, precision và đánh giá F1 Phương trình được sử dụng để xác định độ chính xác của hệ thống trong việc phân loại:

 Dương tính thật (TP): Mô hình đã dự đoán nhãn và khớp với nhãn thực tế.

 Âm tính thật (TN): Mô hình không dự đoán nhãn và không phải là một phần của nhãn thực tế.

 Dương tính giả (FP): Mô hình đã dự đoán một nhãn, nhưng nó không phải là một phần của nhãn thực tế (Lỗi Loại I).

 Âm tính giả (FN): Mô hình không dự đoán nhãn, nhưng nó là một phần của nhãn thực tế (Lỗi Loại II).

 Chương trình trên bao gồm hai phần chính:

 Huấn luyện mô hình mạng neural đa nhiệm để dự đoán thể loại của các bài báo dựa trên nội dung văn bản và hình ảnh Cụ thể, chương trình sử dụng thư viện Keras để xây dựng mô hình mạng neural đa nhiệm với hai đầu vào là văn bản và hình ảnh, và đầu ra là các nhãn thể loại Sau đó, chương trình huấn luyện mô hình trên dữ liệu huấn luyện bao gồm các đầu vào văn bản và hình ảnh, và nhãn thể loại tương ứng Cuối cùng, chương trình sử dụng mô hình đã huấn luyện để dự đoán nhãn thể loại cho các bài báo trong tập kiểm tra.

 So sánh kết quả dự đoán của mô hình với phương pháp SVM sử dụng TF-IDF để trích xuất đặc trưng Cụ thể, chương trình sử dụng thư viện scikit-learn để huấn luyện mô hình SVM trên các vector đặc trưng được tạo ra từ tập huấn luyện bao gồm các đặc trưng văn bản Sau đó, chương trình sử dụng mô hình đã huấn luyện để dự đoán nhãn thể loại cho các bài báo trong tập kiểm tra Cuối cùng, chương trình tính toán độ chính xác của phương pháp SVM trên tập kiểm tra và so sánh với kết quả của mô hình mạng neural đa nhiệm.

 Kết quả cho thấy rằng mô hình hệ thống được sử dụng có thể phân loại các nhãn với độ chính xác tốt nhất ở tập đánh giá là khoảng 94%.

Vì vậy, chúng tôi quyết định giữ lại mô hình được huấn luyện để đánh giá trên tập thực nghiệm.

3.5 Đánh giá mô hình trên tập thử nghiệm

Tên loại tin tức Precision recall f1-score support

Bảng 1 Kết quả đánh giá trên tập thử nghiệm

Số lượng bài báo đã dự đoán đúng trên tập kiểm tra

1100Số lượng bài báo đã trên tập kiểm tra 1600

Tỷ lệ dự đoán chính xác trên tập kiểm tra 0.69

Bảng 2 Kết quả đánh giá

Bảng trên cho thấy mô hình có độ chính xác chưa thực sự cao, nguyên nhân được đánh giá là do số lượng trường hợp chưa nhiều và dữ liệu hình ảnh của những trường hợp này có nhiều đặc trưng tương đồng với các trường hợp khác khiến mô hình huấn luyện chưa dự đoán tốt Trong tương lai, điều này có thể khắc phục bằng cách thêm dữ liệu, thực hiện kỹ thuật làm giàu dữ liệu, huấn luyện với nhiều epochs hơn và huấn luyện với mạng nơ-ron phức tạp hơn.

Ngày đăng: 01/07/2024, 11:32

HÌNH ẢNH LIÊN QUAN

Bảng 1. Kết quả đánh giá trên tập thử nghiệm - bài tập lớn học phần xử lý ảnh và thị giác máy tính bài toán phân loại tin tức
Bảng 1. Kết quả đánh giá trên tập thử nghiệm (Trang 31)
Bảng 2. Kết quả đánh giá - bài tập lớn học phần xử lý ảnh và thị giác máy tính bài toán phân loại tin tức
Bảng 2. Kết quả đánh giá (Trang 32)

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w