Tiền xử lý dữ liệu

Một phần của tài liệu Phân loại phong cách thiết kế nội thất dùng học sâu và ứng dụng thực tế đồ án tốt nghiệp khoa đào tạo chất lượng cao ngành công nghệ thông tin (Trang 122 - 128)

CHƯƠNG 4 THỰC NGHIỆM VÀ KẾT QUẢ

4.5. Quy trình thực nghiệm lần 2

4.5.3. Tiền xử lý dữ liệu

Nhóm sẽ sử dụng bộ dữ liệu đã được cải thiện ở lần cuối cùng của quy trình thực nghiệm lần 1. Nhóm nhận thấy được sự vấn đề khơng gian khi xử lý đơn giản chỉ là thay đổi kích thước của ảnh thơ về kích thước có tỉ lệ 1: 1. Nhóm đã đề xuất ý tưởng sau:

• Chọn giá trị kích thước (ta quy ước chiều ngang w và chiều dọc h) cho ảnh đầu ra. Cụ thể nhóm đã chọn kích thước 𝑤𝑡 = 512, ℎ𝑡 = 512. Phù hợp với tỉ

lệ 1: 1.

Lặp lại các bước sau đến khi khi hết tập dữ liệu:

• Nhận các kích thước đầu vào của ảnh thô. So sánh chiều ngang ảnh w và chiều dài ảnh h. Chọn ra một kích thước nhỏ hơn. Ta có tỉ lệ sau:

𝑟 = min(𝑤𝑡, ℎ𝑡) min(𝑤, ℎ) =

512 min(𝑤, ℎ)

Khi đó ta có tỉ lệ mới để thay đổi kích thước cho ảnh là:

𝑤𝑛 = 𝑟 × 𝑤 = 512 × 𝑤 𝑚𝑖𝑛(𝑤, ℎ)

ℎ𝑛 = 𝑟 × ℎ = 512 × ℎ min(𝑤, ℎ)

Ví dụ: Khi ảnh đầu vào có kích thước 400 × 600.

𝑤 = 400, ℎ = 600 → 𝑟 = 512 min(400, 600)= 512 400 → 𝑤𝑛 = 𝑟 × 𝑤 = 512 × 400 400 = 512 → ℎ𝑛 = 𝑟 × ℎ = 512 × 600 400 = 768

Như vậy từ ảnh đầu vào có kích thước 400 × 600 ta có thể thay đổi kích

thước thành kích thước mới 512 × 768.

Với cách thay đổi kích thước này chúng ta có thể thay đổi kích thước mà

khơng làm thay đổi tỉ lệ không gian (độ biến dạng) của ảnh, điều này giúp rất giúp ích cho việc mơ hình có thể học được những đặc tính của ảnh tốt hơn.

Trang | 106

• Tiếp theo ta sẽ cắt từng khung ảnh với khung trượt bằng với kích thước ảnh mong muốn đầu ra (nhóm đã chọn kích thước 512 × 512) trong ảnh đã thay đổi sang kích thước mới. Ở bước này ta sẽ có 2 trường hợp để trượt khung cắt ảnh đó là hoặc sẽ trượt dọc với chiều dọc dài hơn chiều ngang và trượt ngang với trường hợp còn lại. Ta sẽ trượt với bước nhảy 100𝑝𝑥.

• Ta chuyển cách ảnh đã xử lý về thư mục với nhã tương ứng. Khi thực hiện hóa có thể xem các ví dụ ở dưới đây:

Trường hợp 1: chỉ cắt 1 ảnh duy nhất.

Hình 4.40: Ảnh với kích thước ban đầu (trường hợp w ≅ h).

Hình 4.41: Ảnh sau khi thay đổi kích thước

(trường hợp w ≅ h).

Hình 4.42: Ảnh sau khi được cắt

Trang | 107

Trường hợp 2: cắt ảnh với chiều ngang bé hơn chiều dọc.

Hình 4.43: Ảnh với kích thước ban đầu

(trường hợp w < h)

Hình 4.44: Sau khi thay đổi kích thước (trường

hợp w < h).

Trang | 108

Trường hợp 3: cắt ảnh với chiều ngang lớn hơn chiều dọc.

Hình 4.46: Ảnh với kích thước ban đầu (trường hợp w > h).

Hình 4.47: Sau khi thay đổi kích thước (trường hợp w > h).

Trang | 109 Nhóm sử dụng phương pháp đề xuất ở trên để triển khai trên toàn mẫu ảnh trên tập dữ liệu. Sau khi thực hiện xử lý ảnh, ta chia bộ dữ liệu thẩm định ra làm 2 nửa là tập thẩm định mới và tập thử nghiệm34. Ta có các số liệu thống kê sau:

Bảng 4.10: Số lượng mẫu của bộ dữ liệu sau khi tiền xử lý dữ liệu

Nhãn Huấn luyện Thẩm định Thử nghiệm Tổng

ArtDecor 1386 350 500 2236 HiTech 1622 400 500 2522 Indochina 1888 470 500 2858 Industrial 1503 370 500 2373 Scandinavian 1348 340 500 2188 Tổng 7747 1930 2500 12177

Hình 4.49: Biểu đồ số lượng mẫu ở mỗi nhãn trong tập dữ liệu sau khi tiền xử lý dữ liệu.

34 Sau khi xử lý dữ liệu một số mẫu khơng trịn số nên đã chuyển một vài mẫu từ tập huấn luyện sang tập thẩm định.

Trang | 110

Hình 4.50: Tỉ lệ phần trăm giữa tập huấn luyện và tập thẩm định.

Hình 4.51: Tỉ lệ phần trăm giữa tập huấn luyện, tập thẩm định và tập thử nghiệm.

Sau khi đã xử lý xong bộ dữ liệu ta có thể xử dụng chúng để huấn luyện mơ hình. Và quá trình chuẩn bị huấn luyện sẽ được mô tả trong phần tiếp theo sau.

Trang | 111

Một phần của tài liệu Phân loại phong cách thiết kế nội thất dùng học sâu và ứng dụng thực tế đồ án tốt nghiệp khoa đào tạo chất lượng cao ngành công nghệ thông tin (Trang 122 - 128)