1. Trang chủ
  2. » Thể loại khác

đề tài thực tập cơ sở

33 8 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 33
Dung lượng 1,43 MB

Nội dung

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG KHOA CÔNG NGHỆ THÔNG TIN BÙI ĐỨC CÔNG TÌM HIỂU SVM LỀ MỀM VÀ ỨNG DỤNG TRONG TRA CỨU ẢNH DỰA VÀO NỘI DUNG ĐỀ TÀI THỰC TẬP CƠ SỞĐỀ TÀI THỰC TẬP CƠ SỞ N[.]

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG KHOA CƠNG NGHỆ THƠNG TIN BÙI ĐỨC CƠNG TÌM HIỂU SVM LỀ MỀM VÀ ỨNG DỤNG TRONG TRA CỨU ẢNH DỰA VÀO NỘI DUNG ĐỀ TÀI THỰC TẬP CƠ SỞ NGÀNH CÔNG NGHỆ THÔNG TIN THÁI NGUYÊN, NĂM 2022 TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG KHOA CÔNG NGHỆ THÔNG TIN ĐỀ TÀI THỰC TẬP CƠ SỞ Ngành Cơng nghệ thơng tin Đề tài: TÌM HIỂU SVM LỀ MỀM VÀ ỨNG DỤNG TRONG TRA CỨU ẢNH DỰA VÀO NỘI DUNG Sinh viên thực hiện: BÙI ĐỨC CÔNG Lớp: CNTT_K18_CLC Giảng viên hướng dẫn: ĐÀM THANH PHƯƠNG Thái Nguyên, năm 2022 MỤC LỤC ĐỀ TÀI THỰC TẬP CƠ SỞ .1 SỞ MỤC LỤC LỜI MỞ ĐẦU LỜI CẢM ƠN CHƯƠNG 1: CƠ SỞ LÝ THUYẾT 1.1 Tổng quan Support Vector Machine (SVM) 1.1.1 Giới thiệu Support Vector Machine (SVM) .7 1.1.2 Sort margin Support Vector Machine (SVM lề mềm) 11 1.2 Tổng quan python 13 1.2.1 Đặc điểm python 14 1.2.2 Ứng dụng python .16 1.2.3 Cách cài đặt python 18 CHƯƠNG TRA CỨU ẢNH DỰA VÀO NỘI DUNG 19 2.1 Lý mục tiêu .19 2.2 Những thành phần tra cứu ảnh dựa vào nội dung .20 2.2.1 Trích chọn đặc trưng (Features Extraction,Vector hóa hình ảnh): 21 2.2.2 Tính khoảng cách Vector (Euclid distance) 25 CHƯƠNG ÁP DỤNG VÀ CÀI ĐẶT 26 3.1 Tải liệu 26 3.2 Kết thử nghiệm 26 3.2.1 Một số kết thử nghiệm 29 KẾT LUẬN 30 TÀI LIỆU THAM KHẢO .31 NHẬN XÉT CỦA GIÁO VIÊN HƯỚNG DẪN .32 LỜI MỞ ĐẦU Từ mạng internet tồn cầu hố kéo theo mở rộng nội dung đa phương tện như: ảnh, âm nhạc, video, v.v…, khiến cho nhu cầu chia sẻ tìm kiếm loại tài nguyên tăng theo cách nhanh chóng Và số tài ngun phải kể đến liệu hình ảnh Mỗi người tìm kiếm hình ảnh theo mục đích khác nhau, lại người dùng muốn tìm kiếm thơng tin kèm theo hình ảnh mà họ cần số khác lại tìm kiếm hình ảnh để xác nhận tính xác thơng tin họ nhận Các liệu hình ảnh phục vụ cho nhiều lĩnh vực quan trọng sống hệ thống bảo mật, an ninh, y tế, hay hệ thống phát chuyển động … Vì việc nghiên cứu phát triển hệ thống tra cứu ảnh ngày trở nên cấp thiết LỜI CẢM ƠN Trước tiên với tình cảm sâu sắc chân thành nhất, cho phép em bày tỏ lòng biết ơn đến tất người tạo điều kiện hỗ trợ, giúp đỡ em suốt trình học tập nghiên cứu đề tài Trong suốt thời gian từ bắt đầu học tập trường đến nay, em nhận nhiều quan tâm, giúp đỡ quý thầy bạn bè Với lịng biết ơn sâu sắc nhất, em xin gửi đến quý thầy cô khoa Công nghệ thông tin truyền đạt vốn kiến thức quý báu cho chúng em suốt thời gian học tập trường Nhờ có lời hướng dẫn, dạy bảo thầy cô nên đề tài nghiên cứu em hồn thiện tốt đẹp Một lần nữa, em xin chân thành cảm ơn thầy Đàm Thanh Phương người trực tiếp giúp đỡ, quan tâm, hướng dẫn em hoàn thành tốt báo cáo thời gian qua Vì thời gian có hạn nên khơng tránh khỏi thiếu sót, em mong nhận ý kiến đóng góp quý báu quý Thầy Cô để kiến thức em lĩnh vực hồn thiện đồng thời có điều kiện bổ sung, nâng cao kiến thức Em xin chân thành cảm ơn! CHƯƠNG 1: CƠ SỞ LÝ THUYẾT 1.1 Tổng quan Support Vector Machine (SVM) 1.1.1 Giới thiệu Support Vector Machine (SVM) Support Vector Machine (SVM) mơ hình Học máy mạnh mẽ linh hoạt, có khả thực phân loại tuyến tính phi tuyến tính, hồi quy chí phát ngoại lai Đây mơ hình phổ biến Học máy quan tâm đến Học máy nên có hộp cơng cụ họ SVM đặc biệt phù hợp để phân loại liệu phức tạp có kích thước vừa nhỏ Mục tiêu SVM tìm siêu phẳng không gian N chiều (ứng với N đặc trưng) chia liệu thành hai phần tương ứng với lớp chúng Nói theo ngơn ngữ đại số tuyển tính, siêu phẳng phải có lề cực đại phân chia hai bao lồi cách chúng 1.1.1.1 SVM tuyến tính Hình SVM khơng gian hai chiều ba chiều Trong không gian chiều, ta biết khoảng cách từ điểm có toạ độ (xo,yo) tới đường thẳng có phương trình : w1x + w2y + b = xác định Trong không gian ba chiều, khoảng cách từ điểm có toạ độ (x0,y0,z0) tới mặt phẳng có phương trình : w1x + w2y +w3z + b = xác định : Hơn nữa, ta bỏ dấu trị tuyệt đối tử số, xác định điểm nằm phía đường thẳng hay mặt phẳng xét Những điểm làm cho biểu thức dấu giá trị tuyệt đối mang dấu dương nằm phía (tơi tạm gọi phía dương đường thẳng), điểm làm cho biểu thức dấu giá trị tuyệt đối mang dấu âm nằm phía cịn lại (tơi gọi phía âm) Những điểm nằm đường thẳng/măt phẳng làm cho tử số có giá trị 0, tức khoảng cách Việc tổng quát lên không gian nhiều chiều: Khoảng cách từ điểm (vector) có toạ độ xo tới siêu mặt phẳng (hyperplane) có phương trình : wᵀx + b = xác định 1.1.1.2 Margin SVM (Lề SVM) Margin khoảng cách siêu phẳng đến điểm liệu gần tương ứng với phân lớp Trong ví dụ táo lê đặt mặt bán, margin khoảng cách que hai táo lê gần Điều quan trọng phương pháp uả táo lê Nhờ vậy, SVM giảm thiểu việc phân lớp sai (misclassification) điểm liệu đưa vào 1.1.1.3 Lập trình tìm nghiệm cho toán SVM 1.1.1.4 Kết luận SVM 10 Python nhiều công ty, trường học sử dụng để dạy lập trình cho trẻ em người lần đầu học lập trình Bên cạnh tính khả tuyệt vời cú pháp đơn giản dễ sử dụng lý cho việc 1.2.3 Cách cài đặt python Hiện có nhiều phần mềm hộ trợ code python Pycharm,Thonny,Visual Studio Code ,Jupyter Notebook, … v v Các bạn tải IDE python Pycharm : https://www.jetbrains.com/pycharm/ Thonny : https://thonny.org Visual Studio Code : https://code.visualstudio.com/download 19 CHƯƠNG TRA CỨU ẢNH DỰA VÀO NỘI DUNG 2.1 Lý mục tiêu Trong thời đại bùng nổ tìm kiếm thơng tin nay, ngồi việc tìm kiếm văn nội dung việc tìm kiếm ảnh có xu hướng trở nên phổ biến Với nguồn tài nguyên ảnh vô to lớn mạng internet, việc tìm kiếm xác ảnh với yêu cầu người dùng khó khả thi Chúng ta khó tìm kiếm ảnh theo cách thơng thường, có nghĩa việc tìm kiếm thực ảnh tìm thấy ảnh có nội dung cần tìm Với lại nguồn tài nguyên ảnh mạng internet ngày nhiều theo phát triển công nghệ số tương lai  Mục tiêu : Do đó, nhu cầu thật địi hỏi phải có cơng cụ hỗ trợ cho việc tìm kiếm ảnh sớm tốt 20 2.2 Những thành phần tra cứu ảnh dựa vào nội dung Tải liệu ảnh Vector hoá ảnh liệu lưu trữ, ta có tập vector V có N vector Vector hố ảnh cần tìm kiếm Tính tốn khoảng cách từ vector v đến tất vector tập V Hiển thị K ảnh có khoảng cách gần 21 2.2.1 Trích chọn đặc trưng (Features Extraction,Vector hóa hình ảnh): Các đặc trưng ảnh bao gồm đặc tính đặc tính ngữ nghĩa/logic Các đặc tính là: màu sắc (color), hình dạng (shape), kết cấu (texture), vị trí khơng gian (spatial location) Chúng trích xuất tự động bán tự động Đặc tính logic cung cấp mơ tả trừu tượng liệu hình ảnh cấp độ khác Thơng thường, đặc tính logic chiết xuất tay bán tự động Một nhiều đặc trưng sử dụng ứng dụng cụ thể 2.2.1.1 Đặc trưng màu sắc (color): Đặc trưng màu sắc đặc tính sử dụng phổ biến tra cứu ảnh Màu sắc định nghĩa không gian màu lựa chọn Sự đa dạng khơng gian màu có sẵn, chúng thường dùng cho ứng dụng khác Không gian màu thể gần gũi với nhận thức người sử dụng rộng rãi RGB, LAB, HSV, … Đặc trưng màu sắc phổ biến mô tả hệ thống CBIR bao gồm: ma trận hiệp biến màu, biểu đồ màu, moment màu, véc-tơ kết hợp màu [5] Vào năm 1999, Gevers cộng quan tâm đến đối tượng lấy từ điểm quan sát khác chiếu sáng Theo kết quả, tập điểm bất biến đặc trưng màu tính tốn Các bất biến màu xây dựng sở “hue”, “cặp hue-hue”, ba đặc trưng màu tính tốn từ mơ hình đối xứng Việc lựa chọn đặc trưng màu phụ thuộc vào kết 22 phân đoạn Ví dụ, việc phân đoạn cung cấp đối tượng mà khơng có màu đồng nhất, rõ ràng màu trung bình khơng phải lựa chọn tốt Với ứng dụng đặc biệt sở liệu khuôn mặt người, miền tri thức khai thác để gán trọng số cho điểm ảnh việc tính tốn vùng màu 2.2.1.2 Đặc trưng kết cấu (texture): Kết cấu không định nghĩa đầy đủ đặc trưng màu sắc, mà số hệ thống không sử dụng đặc trưng kết cấu Tuy nhiên, kết cấu cung cấp thông tin quan trọng việc phân loại ảnh, mơ tả nội dung nhiều ảnh thực là: vỏ trái cây, mây, cây, gạch, vải Do đó, kết cấu tính quan trọng việc định nghĩa ngữ nghĩa mức cao cho mục đích tra cứu ảnh [5] Các đặc trưng kết cấu thường sử dụng hệ thống tra cứu ảnh bao gồm đặc trưng phổ, chẳng hạn đặc trưng bao gồm sử dụng lọc Gabor biến đổi wavelet, thống kê đặc trưng kết cấu cách đo độ thống kê cục bộ, sáu đặc trưng kết cấu Tamura, đặc trưng wold đề xuất Liu cộng vào năm 1996 2.2.1.3 Đặc trưng dựa hình dạng (shape): Hình dạng khái niệm định nghĩa tốt Đặc trưng hình dạng ứng dụng nói chung bao gồm: tỷ lệ aspect, tuần hồn, mơ tả Fourier, bất biến thời điểm, phân đoạn đường bao liên tiếp, … Đặc trưng hình dạng đặc trưng ảnh quan trọng, chúng chưa sử dụng rộng rãi CBIR đặc trưng màu đặc trưng kết cấu [5] Đặc trưng hình dạng thể tính hữu ích nhiều miền ảnh đặc biệt đối tượng nhân tạo Đối với ảnh màu sử dụng hầu hết loại giấy tờ, nhiên, lại khó khăn để áp dụng đặc trưng 23 hình dạng so với màu sắc kết cấu thiếu xác phân đoạn Mặc dù gặp khó khăn, đặc trưng hình dạng sử dụng số hệ thống cho thấy tiềm có ích cho CBIR Ví dụ, vào năm 2003, Mezaris cộng sử dụng đặc trưng hình dạng đơn giản chẳng hạn như: độ lệch tâm định hướng Một hệ thống mà Wang cộng vào năm 1999 sử dụng tiêu chuẩn hố qn tính thứ tự từ 1-3 để mơ tả hình dạng khu vực 2.2.1.4 Đặc trưng không gian (spatial location): Các vùng đối tượng với thuộc tính màu sắc kết cấu tương tự nhận cách dễ dàng ràng buộc khơng gian [5] Ví dụ, vùng có bầu trời biển màu xanh có biểu đồ màu tương tự, lại có vị trí khơng gian ảnh khác Vì thế, vị trí khơng gian vùng (hoặc đối tượng) mối liên hệ không gian nhiều vùng ảnh hữu dụng cho việc tra cứu ảnh Một biểu diễn mối liên hệ không gian sử dụng rộng rãi “2D strings” Chang cộng đưa vào năm 1987 Kỹ thuật xây dựng cách chiếu ảnh theo trục x y Cho hai tập ký hiệu V A, định nghĩa phép chiếu Cứ ký hiệu V biểu diễn đối tượng ảnh Còn ký hiệu A biểu diễn loại liên hệ không gian đối tượng Nếu chúng khác nhau, kỹ thuật “2D G-string” cắt tất đối tượng dọc theo đường bao hộp nhỏ mở rộng mối liên hệ không gian vào hai tập tốn tử khơng gian Một tập tốn tử định nghĩa mối liên hệ khơng gian cục Và tập cịn lại định nghĩa mối liên hệ khơng gian tồn cục, phép chiếu hai đối tượng tách ra, nối liền xác định vị trí Ngồi ra, kỹ thuật “2D C-string” đề xuất 24 Lee cộng vào năm 1990 để cực tiểu số đối tượng cắt Còn kỹ thuật “2D B-string” lại giới thiệu vào năm 1992 Yang cộng Kỹ thuật biểu diễn đối tượng hai ký hiệu, thay cho việc mở đầu kết thúc đường bao đối tượng Hầu hết phương pháp tạo ba kiểu truy vấn Kiểu truy vấn tìm tất ảnh chứa đối tượng O1, O2, …, On Kiểu truy vấn tìm tất ảnh chứa đối tượng mà có mối liên hệ chắn đối tượng khác, khoảng cách chúng khơng có nghĩa Cuối cùng, kiểu truy vấn tìm tất ảnh mà có liên kết khoảng cách chắn với đối tượng khác Ngoài kỹ thuật “2D string” trên, cịn có kỹ thuật khác như: “spatial quad-tree” giới thiệu vào năm 1984 Samet, “symbolic image” giới thiệu vào năm 1995 Gudivada Raghavan Hai kỹ thuật dùng để biểu diễn thông tin không gian Tuy nhiên, tra cứu ảnh dựa mối liên hệ khơng gian vùng tốn khó nghiên cứu tra cứu ảnh dựa nội dung Bởi vì, phân đoạn đối tượng vùng đáng tin cậy thường không khả thi trừ ứng dụng giới hạn Mặc dù, số hệ thống đơn giản phân chia ảnh vào khối chuẩn, mà đạt thành công nhỏ với phương pháp phân chia không gian từ hầu hết ảnh tự nhiên không bị nén vào khối chuẩn Để giải vấn đề này, phương pháp dựa kỹ thuật “Radon transform”, kỹ thuật mà khai thác đặc trưng trực quan xếp không gian mà không cần phân đoạn phức tạp Phương pháp đề xuất vào năm 1998 Guo cộng 25 ... THÔNG KHOA CÔNG NGHỆ THÔNG TIN ĐỀ TÀI THỰC TẬP CƠ SỞ Ngành Cơng nghệ thơng tin Đề tài: TÌM HIỂU SVM LỀ MỀM VÀ ỨNG DỤNG TRONG TRA CỨU ẢNH DỰA VÀO NỘI DUNG Sinh viên thực hiện: BÙI ĐỨC CÔNG Lớp:... PHƯƠNG Thái Nguyên, năm 2022 MỤC LỤC ĐỀ TÀI THỰC TẬP CƠ SỞ .1 SỞ MỤC LỤC LỜI MỞ ĐẦU LỜI CẢM ƠN CHƯƠNG 1: CƠ SỞ LÝ THUYẾT 1.1 Tổng quan Support... biết ơn đến tất người tạo điều kiện hỗ trợ, giúp đỡ em suốt trình học tập nghiên cứu đề tài Trong suốt thời gian từ bắt đầu học tập trường đến nay, em nhận nhiều quan tâm, giúp đỡ quý thầy bạn bè

Ngày đăng: 21/04/2022, 18:51

HÌNH ẢNH LIÊN QUAN

Support Vector Machine (SVM) là một mô hình Học máy rất mạnh mẽ và linh - đề tài thực tập cơ sở
upport Vector Machine (SVM) là một mô hình Học máy rất mạnh mẽ và linh (Trang 8)
w