3.1. Kết quả
Tôi cho thử nghiệm chương trình với dữ liệu đầu vào là 500 ảnh ngẫu nhiên được chọn từ ảnh sản phẩm thật của công ty. Số lượng ảnh đa dạng về nền cũng như chất lượng ảnh. Kích thước ảnh giao động từ 1600 => 4000px. Bộ số đầu vào mặc định, lề mỗi chiều 5% và nền trắng. Grab-cut lặp 30 lần.
Kết quả như sau:
Số ảnh đáp ứng được yêu cầu đầu ra là 91 ảnh đạt 18.2% Thời gian xử lý trung bình mỗi ảnh: 1 phút 55 giây
Tuy nhiên, nếu để ý một chút, tôi nhận ra 91 ảnh đó đến từ 8 khách hàng (nhóm ảnh), nếu chọn 3 khách hàng có số ảnh trong đó nhiều, tối có 57 ảnh, 3 khách hàng này có 77 ảnh tham gia thử nghiệm trong tổng 500 ảnh, vì vậy tỷ lệ thành công của nhóm ba khách hàng này là 74.02%.
Tiếp tục, tôi lấy thêm 500 ảnh khác của nhóm 3 khách hàng đó để chạy lại, thì kết quả có 393 ảnh đạt chất lượng tốt, 21 ảnh là có thể tạm chấp nhận về chất lượng như của công ty đang áp dụng, đạt tỷ lệ 82.8%
Số lần lặp trong grabcut Độ chính xác Độ chính xác trong bộ đầu vào chọn Thời gian (phút:giây) 1 14.4% 80.8% 0:03 30 18.2% 82.8% 1:08 80 19.8% 83.2% 1:55 160 19.8% 83.2% 3:30
Hình 3-2. Kết quả chạy thử nghiệm
Qua bảng trên có thể thấy số lần lặp grabcut nhiều không ảnh hưởng quá nhiều đến độ chính xác của đầu ra, mà thời gian thì lại gần như tỷ lệ thuận với số lần lặp. Chính vì vậy chọn số lần lặp phù hợp ở mức trung bình là tốt hơn.
3.2. Đánh giá và so sánh 3.2.1.Độ chính xác 3.2.1.Độ chính xác
Như kết quả ở trên độ chính xác trong tập ảnh sản phẩm đầu vào ngẫu nhiên đạt 18.2%, nếu chọn lựa nhóm ảnh có nền đơn giản thì tỷ lệ thành công đạt khoảng 70-80%. Nếu cẩn thận lựa chọn tham số đầu vào phù hợp
Lấy 5 ảnh được xử lý chính xác và 5 ảnh xử lý không chính xác của chương trình tải lên hai website cho phép làm tự động Background Removal (BR
freebackgroundremoval.com), và Background Burner (BB bonanza.com). Kết quả trong 10 ảnh tải lên, BR chỉ đúng 3 trường hợp, BB đúng 2 trường hợp. Các trường hợp ảnh có biên yếu đều bị sai.
Nếu so với con người xử lý ảnh đó trên phần mềm Photoshop thì đương nhiên chất lượng người xử lý cao hơn rất nhiều, đặc biệt là với đường viền ảnh. Vì người thường sử dụng cộng cụ Pen để tạo các đường vector bao quanh ảnh, thay vì phân tách dựa vào ngưỡng điểm ảnh như chương trình.
3.2.2.Thời gian xử lý
Với khoảng gần 2 phút xử lý cho mỗi ảnh trên máy tính cá nhân, thời gian đó là lâu hơn thời gian xử lý trên hai website tự động là BB và BR. Tuy nhiên nếu giảm kích thước file để làm mẫu phân tách xuống 200px và giảm số lượt lặp Grab-cut xuống còn 1 lần, thì thời gian tính của chương trình tương đương với hai website đó.
Nếu so sánh thời gian xử lý với con người xử lý trên phần mềm Photoshop, thì tất nhiên xử lý bằng máy tính nhanh hơn rất nhiều. Bên cạnh đó, phần mềm xử lý có thể đặt trực tiếp trên server, vì vậy không cần tốn thời gian và băng thông tải file về máy client.
Kết luận
Kết quả đạt được
Luận văn đã thực hiện nghiên cứu và thử nghiệm tách đối tượng tự động trên nền ảnh của ảnh chụp dùng trong thương mại điện tử. Ảnh đầu ra cần qua một bước lọc bằng con người đầu cuối, trước khi đăng tải lên website bán lẻ. Tỷ lệ lọc bỏ nền chính xác (theo tiêu chuẩn đang được áp dụng tại công ty removethebackground) cho một số nhóm ảnh đạt tỷ lệ 70-80%. Đây là một tỷ lệ đáng chú ý, vì những nhóm ảnh này lại thường chiếm số lượng lớn ảnh cần phải xử lý.
Kết quả lớn nhất đạt được là tôi đã có được một cái nhìn tổng thể về các hướng tiếp cận một bài toán tách đối tượng trong ảnh, và hiểu ý tưởng cơ bản thuật toán Grab-cut. Tôi cũng đã hiểu cách xây dựng một ứng dụng, các phương pháp đơn giản trong việc chọn tham số, tối ưu thời gian và nâng cao chất lượng đầu ra.
Với kết quả đã ghi nhận ở đầu ra, tôi vui mừng khi luận văn đã đáp ứng được với mục đích bạn đầu khi bắt tay vào làm đề tài này. Tôi tự tin hơn vào tính ứng dụng thực tế của luận văn, và hướng phát triển trong thời gian tới.
Tính ứng dụng thực tiễn
Hiện tại với một khối lượng ảnh khổng lồ dùng trong thương mại điện tử như hiện nay, thì việc có một ứng dụng giúp giải quyết một phần tự động trong việc xử lý những ảnh sản phẩm cũng sẽ mang lại những giá trị không nhỏ. Tính ổn định và chính xác của ảnh sản phẩm đầu ra có thể được thực hiện thêm bước giám sát của con người ở bước cuối của quá trình xử lý. Việc phân loại ảnh đạt chất lượng hay chưa sẽ tiết kiệm nhiều công sức hơn là phải tự làm ảnh đó.
Hướng nghiên cứu tiếp theo
Trong các bài toán về xử lý ảnh luôn đòi hỏi một quy trình trong việc chọn tham số phù hợp, và đây cũng không là ngoại lệ. Việc xây dựng thuật toán để tính ra tham số trước hoặc trong quá trình xử lý có thể sẽ là một hướng nghiên cứu mới giúp nâng cao chất lượng ảnh đầu ra, cũng như nâng cao sự chính xác của ảnh đầu ra. Các lý thuyết về trí tuệ nhân tạo có thể được áp dụng, vì quy trình có sự phân loại giám
sát của con người ở bước cuối, đây sẽ là một dữ liệu học rất tốt cho hệ thống ra quyết định.
Tài liệu tham khảo
[1] Lương Mạnh Bá, Nguyễn Thanh Thủy (2003), Nhập môn xử lý ảnh số, nhà xuất bản khoa học kỹ thuật, Hà Nội.
[2] Nguyễn Quang Hoan - Trung tâm đào tạo bưu chính viễn thông 1, (2006), Xử lý ảnh, Hà Nội.
[3] Yuri Y. Boykov and Marie-Pierre Jolly, (2001), Interactive graph cuts for optimal boundary and region segmentation of objects in N-D images,
Proceedings of “Internation Conference on Computer Vision” vol.1, pp 105- 112.
[4] Carsten Rother, Vladimir Kolmogorov and Andrew Blake - Microsoft Research Cambridge UK, (2004), GrabCut: Interactive foreground extraction using iterated graph cuts, Trans. Graph. vol.23, pp. 309-314. [5] N. R. Pal and S. K. Pal (1993), A review on image segmentation
techniques, Pattern Recognition vol.26 no.9, pp.1277-1294. [6] OpenCV documentation http://docs.opencv.org/