Hình 48. Kết quả dự đốn trọng số đối với ảnh aspen_1080p_432_qp40
Hình 50. dự đốn trọng số đối đối với ảnh Jockey_1920x1080_120fps_420_8bit_YUV_130_qp24
Học viên đã sử dụng phương pháp để dự đoán chất lượng ảnh đối với bộ ảnh trên, và thu được kết quả rất khả quan với PLCC: 0.892; SRCC: 0.916
3.3. So sánh một số phương pháp đánh giá chất lượng ảnh và đánh giá phương pháp nghiên cứu
Để đánh giá phương pháp đang nghiên cứu, học viên đã so sánh với hiệu suất với một số phương pháp khác trên bộ ảnh CSIQ. Cơ sở dữ liệu hình ảnh này phịng thí nghiệm phân tích và mã hóa hình ảnh tại Đại học Bang Oklahoma cung cấp. Bộ ảnh bao gồm 30 hình ảnh gốc. Mỗi hình ảnh gốc trong cơ sở dữ liệu bị bóp méo bằng cách sử dụng sáu loại biến dạng khác nhau với bốn đến năm mức. Các biến dạng được sử dụng trong CSIQ là: nén JPEG, nén JPEG-2000, giảm độ tương phản toàn cục, nhiễu Gaussian cộng thêm màu hồng và làm mờ Gaussian. Điều này dẫn đến có 866 phiên bản ảnh bị biến dạng[25]. S TT Loại biến dạng DIQaM-FR- TID 2013 WaDIQaM- FR-TID 2013 DIQaM-FR- LIVE WaDIQaM- FR-LIVE
HMI-IQA-Aver HMI-IQA- Sal Proposed
SRCC PLCC SRCC PLCC SRCC PLCC SRCC PLCC SRCC PLCC SRCC PLCC SRCC PLCC 1 1 AWGN 0.9170 0.9315 0.9067 0.9172 0.8838 0.8740 0.9370 0.9448 0.9349 0.9019 0.9391 0.9101 0.9382 0.9210 2 2 Jpeg 0.8548 0.9429 0.9479 0.9750 0.8872 0.9153 0.9376 0.9551 0.9418 0.9652 0.9435 0.9679 0.9512 0.9667 3 3 Jpeg 2000 0.8463 0.9012 0.9696 0.9653 0.8954 0.8990 0.9581 0.9671 0.9673 0.9714 0.9691 0.9747 0.9501 0.9765 4 4 Fnoise 0.8967 0.8982 0.9277 0.9340 0.8973 0.9013 0.8630 0.8469 0.9379 0.9439 0.9314 0.9378 0.9322 0.9287 5 5 Blur 0.9004 0.913 0.9469 0.9399 0.9322 0.9293 0.9580 0.9600 9414 0.9267 0.9496 0.9380 0.9288 0.9418 6 6 Contrast 0.9150 0.9239 0.9180 0.9128 0.9287 0.9166 0.9185 0.9221 0.9163 0.9118 0.9169 0.9193 0.9056 0.9212
Bảng 2. So sánh hiệu suất của phương pháp nghiên cứu với một số phương pháp khác
DIQaM-FR-TID 2013: DIQaM không trọng số huấn luyện trên TID2013 [1]
WaDIQaM-FR-TID 2013: DIQaM có trọng số huấn luyện trên TID2013 [1]
DIQaM-FR-TID 2013: DIQaM không trọng số huấn luyện trên LIVE [1]
WaDIQaM-FR-TID 2013: DIQaM có trọng số huấn luyện trên LIVE [1]
HMI-IQA-Aver: Phương pháp theo [2] trung bình; HMI-IQA- Sal: Phương pháp theo [2] có trọng số
Từ bảng so sánh trên, phương pháp nghiên cứu cho thấy được kết qủa rất khả quan khi các chỉ số SRCC và PLCC khá tốt. Đối với biến dạng Jpeg 2000 phương pháp nghiên cứu còn cho thấy chỉ số tốt nhất so với các phương pháp còn lại với
DANH MỤC CƠNG TRÌNH KHOA HỌC CỦA TÁC GIẢ LIÊN QUAN ĐẾN LUẬN VĂN
[1] Tung Pham Thanh; Chau Ma Thi; Tuan Nguyen Manh; Linh Le Dinh; Ha Le Thanh, ("Compression Artifacts Image Patch database for Perceptual Quality Assessment," 2020 12th International Conference on Knowledge and Systems Engineering (KSE))
KẾT LUẬN
Đề tài nghiên cứu là sự tổng hợp kiến thức giữa khoa học máy tính và kĩ thuật phần mềm, do đó để thực hiện đề tài trên cần phải có hiểu biết về thị giác máy tính, xử lý, đánh giá chất lượng hình ảnh và kĩ năng lập trình phần mềm.
Qua quá trình nghiên cứu, học viện đã xây dựng phần mềm, kết hợp với thiết bị đọc chuyển động mắt, tiến hành tổ chức thực nghiệm thu thập dữ liệu. Tuy nhiên ngồi những khó nhăn về người tham gia như đã trình bày trong chương 2, thì thiết bị đóng vai trị lớn trong sự chính xác của dữ liệu. Thiết bị được học viên sử dụng trong thực nghiệm là Tobii EyeTracking 4C, tuy nhiên đây là thiết bị được thiết kế chủ yếu để hỗ trợ chơi game trên máy tính và thuộc một những phiên bản đầu tiên của dòng sản phẩm này. Sau này, các nhiều sản phẩm được nâng cấp ra đời, mang lại độ chính xác cao hơn. Đến thời điểm hiện tại, dòng sản phẩm này cũng chưa phổ biến rộng rãi tại Việt Nam.
Kết quả nghiên cứu là phương pháp đánh giá chất lượng ảnh sử dụng thiết bị đọc mắt. So sánh với các phương pháp phổ biến trước đó, kết quả rất khả quan. Tuy nhiên, học viên nhận thấy, nếu có điều kiện tốt hơn về số lượng, chất lương thiết bị cùng việc có thể mời gọi thêm số lượng người tham gia thì kết quả sẽ tốt hơn nữa.
Qua nghiên cứu học viên tích lũy thêm cho một về kiến thức về đánh giá chất lượng ảnh, và đặc biệt là kỹ năng xây dựng phần mềm có khả năng kết hợp với thiết bị bên ngoài. Học viên mong muốn có điều kiện tốt hơn, mở rộng nghiên cứu, để xây dựng bộ dữ liệu đủ lớn có thể phân tích đặc điểm thị giác của từng đặc điểm người quan sát.
TÀI LIỆU THAM KHẢO Tiếng Anh
[1] Tung Pham Thanh; Chau Ma Thi; Tuan Nguyen Manh; Linh Le Dinh; Ha Le Thanh, ("Compression Artifacts Image Patch database for Perceptual Quality Assessment," 2020 12th International Conference on Knowledge and Systems Engineering (KSE))
[2] Tung, Pham Thanh; Xiem Van Hoang; Nghia; Nguyen Trung Duong; Dinh Trieu; Ha Le Thanh, “End-to-End Image Patch Quality Assessment for Image/Video With Compression Artifacts,” in IEEE Access, vol. 8, 2020
[3] H.L.F. von Helmholtz, Handbook of Physiological Optics, first ed., Voss, Hamburg and Leipzig, Germany, 1896.
[4] H.R. Blackwell, Luminance difference threshold, in: D. Jameson, L.M. Murvich (Eds.), Handbook of Sensory Physiology, Springer-Verlag, New York, 1972, pp. 78–101.
[5] G. Buchsbaum, An analytical derivation of visual nonlinearity, IEEE Trans. Biomed. Eng. BME-27 (5) (1980) 237–242.
[6] D.H. Kelly, Motion and vision. II. Stabilized spatio-temporal threshold surface, J. Opt. Soc. Am. 69 (10) (1979) 1340–1349.
[7] S. Winkler, Digital Video Quality: Vision Models and Metrics, Wiley, 2005.
[8] I. R. Assembly and I. T. Union, Methodology for the Subjective Assessment of the Quality of Television Pictures. International Telecommunication Union, 2003.
[9] P. Marziliano, F. Dufaux, S. Winkler, T. Ebrahimi, A no-reference perceptual blur metric, in: Proceedings of IEEE International Conference on Image Processing IEEE, vol. 3, 2002, pp. 57–60.
[10] R. Soundararajan, A.C. Bovic, Video quality assessment by reduced reference spatio-temporal entropic differencing, IEEE Trans. Circuits Syst. Video Technol. 23 (4) (2013) 684–694.
[11] D. Huynh-Thu, M. Ghanbari, Scope of validity of PSNR in image/video quality assessment, Electron. Lett. 44 (13) (2008) 800–801.
[12] Z. Wang, A. Bovik, Mean squared error: love it or leave it? IEEE Signal Process. Mag. (2009) 98–117.
[13] B. Girod, What’s wrong with mean squared error? Digital Images and Human Vision, MIT Press, 1998.
[14] F. Zhang, D. Bull, Quality assessment method for perceptual video compression, in: Proceedings of the IEEE International Conference on Image Processing, 2013.
[15] Z. Wang, A. Bovik, H. Sheikh, E. Simoncelli, Image quality assessment: from error visibility to structural similarity, IEEE Trans. Image Process. 13 (2004) 600–612.
[16] Z. Wang, A.C. Bovic, A universal image quality index, Signal Process. Lett. 9 (2002) 81–84.
[17] Z. Wang, E. Simoncelli, Translation insensitive image similarity in complex wavelet domain, in: EEE International Conference of Acoustics, Speech and Signal Processing, 2005, pp. 573–576.
[18] Z. Wang, E.P. Simoncelli, A.C. Bovik, Multi-scale structural similarity for image quality assessment, in: Proceedings of the Asilomar Conference on Signals, Systems and Computers, IEEE, vol. 2, 2003, p. 1398.
[19] Z. Wang, L. Lu, A.C. Bovik, Video quality assessment based on structural distortion measurement, SignalProcess. Image Commun. 19 (2) (2004) 121– 132.
[20] H.R. Sheikh, A.C. Bovik, Image information and visual quality, IEEE Trans. Image Process. 15 (2006) 430–444.
[21] L. Lu, Z. Wang, A. Bovic, J. Kouloheris, Full-reference video quality assessment considering structural distortion and no-reference quality evaluation of MPEG video, in: Proceedings of the IEEE International Conference on Multimedia & Expo, IEEE, 2002, pp. 61–64.
[22] A. Shnayderman, A. Gusev, A. Eskicioglu, Multidimensional image quality measure using singular value decomposition, in: Proceedings of the SPIE— International Society Opt. Eng., SPIE, vol. 5294, 2003.
[23] Saining Xie; Ross Girshick; Piotr Dollar; Zhuowen Tu; Kaiming He, “Aggregated Residual Transformations for Deep Neural Networks,” available at https://arxiv.org/pdf/1611.05431v2.pdf
[24] S. Bosse, D. Maniry, K. Müller, T. Wiegand and W. Samek, "Deep Neural Networks for No-Reference and Full-Reference Image Quality Assessment," in IEEE Transactions on Image Processing, vol. 27, no. 1, pp. 206-219, Jan. 2018
[25] Oklahoma State University, "Categorical Image Quality (CSIQ) Database", available at:
https://qualinet.github.io/databases/image/ categorical_image_quality_csiq_database/ [26] Pedram Mohammadi; Abbas Ebrahimi-Moghadam; and Shahram Shirani, "Subjective and Objective Quality Assessment of Image: A Survey", in Elsevier, 2014
[27] Kaiming He; Xiangyu Zhang; Shaoqing Ren; Jian Sun, "Deep Residual Learning for Image Recognition", in Microsoft Research, 2015
[28] “Tobii/ Deverlop Zone”, Internet: https://developer.tobii.com/product- integration
[29] “Windows Presentation Foundation ” Internet: https://docs.microsoft.com [30] Carol Britto, Jill Doake, " A Student Guide to Object-Oriented Development ", in Elsevier, 2015
[31] Cat Can; Trang Nguyen; Duy Nguyen Dung; Ngo Luong Nguyen, “The Cargo Carriage System”, in IEEE, 2014