CHƯƠNG 3. Nâng cao chất lượng quá trình số hóa bề mặt 3D
3.2 Nâng cao chất lượng ảnh độ sâu
Chất lượng của ảnh độ sâu là một yếu tố quan trọng liên quan đến chất lượng của đám mây điểm sau khi quét. Cảm biến độ sâu của Kinect v2, mặc dù sử dụng công nghệ mới, nhưng do tối ưu về chi phí nên ảnh độ sâu có chất lượng không cao. Các ảnh độ sâu thu được từ thiết bị này luôn luôn tồn tại nhiễu, các cạnh và hốc dao động gần biên giới đối tượng. Bên cạnh đó, việc thu nhận từng khung hình riêng lẻ cũng chịu ảnh hưởng của nhiễu vốn có cũng như các sai số của cảm biến IR và công nghệ của nó. Hầu hết các hiện tượng này đều đã quan sát thấy trong các thí nghiệm trong chương 2. Chính vì vậy, việc nâng cao chất lượng ảnh độ sâu trước khi xây dựng đám mây điểm nhằm tăng tốc độ
tính toán và cải thiện chất lượng đám mây điểm sẽ thực hiện đồng thời hai giải pháp. Thứ nhất, cần sử dụng bộ lọc nhiễu để loại bỏ bớt nhiễu ra khỏi ảnh độ sâu. Thứ hai, tiến hành lấy trung bình các ảnh độ sâu liên tiếp trước khi xây dựng đám mây điểm.
3.2.1. Loại bỏ nhiễu trong ảnh độ sâu 3.2.1.1. Cơ sở lý thuyết
Để lọc nhiễu trên ảnh, có nhiều kỹ thuật lọc nhiễu đã được nghiên cứu và phát triển, trong đó bộ lọc nhiễu được biết đến nhiều nhất là bộ lọc trung vị [75]. Đây là phương pháp sử dụng thống kê thứ tự phi tuyến để loại bỏ nhiễu.
Bộ lọc này được thực hiện với một ảnh bằng cách sử dụng mặt nạ có độ dài lẻ di chuyển qua ảnh. Tại mỗi điểm ảnh trung tâm, giá trị trung bình của dữ liệu trong mặt nạ được lấy làm đầu ra. Khi bắt đầu hay kết thúc, mặt nạ của bộ lọc được đặt ở giữa ảnh đầu vào. Lúc đó một số giá trị phải được gán cho các vị trí khảo sát trống, do đó có thể áp dụng chiến lược nối tiếp giá trị đầu tiên và giá trị cuối cùng. Ngoài ra ở viền của ảnh được lọc bằng cách nhân đôi các giá trị ngoài cùng. Tuy nhiên vì cả giá trị trung bình và độ lệch chuẩn đều đặc biệt nhạy cảm với nhiễu và làm ảnh hưởng tới giá trị độ sâu của điểm ảnh nên bộ lọc này không được sử dụng trong ảnh độ sâu.
Một phương pháp lọc nhiễu khác dựa trên tập hợp dữ liệu thông qua độ lệch tuyệt đối trung vị (Median Absolute Deviation - MAD) đã được đề xuất trong [76]. Trung vị, giống như trung bình, là phép đo theo xu hướng trung tâm với lợi thế là không nhạy cảm với sự hiện diện của các điểm ngoại lai. Chỉ số đặc trưng của sự không nhạy cảm này là điểm suy giảm. Điểm suy giảm của một sự ước lượng là tỷ lệ quan sát tối đa có thể nhận được sao cho sự ước lượng đó không mang một giá trị sai. Cụ thể, khi một quan sát đơn lẻ có giá trị vô cùng, giá trị MAD của tất cả các quan sát tiến ra giá trị vô cùng, do đó điểm suy giảm của trung vị bằng 0. Ngược lại, giá trị MAD được giữ không đổi. Trung vị không thể tính toán khi hơn50% các quan sát có giá tr vô cùng. Như vậy MAD là một công cụ ước lượng tỷ lệ rất hiệu quả. Hơn nữa, MAD hoàn toàn không ảnh hưởng bởi kích thước mẫu. Chính vì vậy, phương pháp này được sử dụng để lọc nhiễu trong ảnh độ sâu thu được từ Kinect v2.
Giả sử Kinect v2 thu nhận được số lượng ảnh độ sâu là N, mỗi ảnh có độ phân giải là Upixel×V pixel. Một vị trí thực P(x, y, z) tương ứng với mỗi điểm ảnhp(u, v)tồn tại N mẫu dữ liệu trong đó chứa các điểm ảnh ngoại lai do nhiễu vốn có của thiết bị gây ra. Do đó, các điểm ảnh ngoại lai này cần phải được loại bỏ trong N mẫu dữ liệu này. Dựa trên độ lệch tuyệt đối trung vị của dữ liệu, các điểm ảnh ngoại lai sẽ được loại bỏ theo các tiêu chí cho trước. Theo tài liệu [76], độ lệch tuyệt đối trung vị được xác định bởi công thức
MAD =bãM(|xi−M(X)|) (3.2) trong đó M là trung vị phụ thuộc các tập dữ liệu cho trước; X là tập hợp chứa N mẫu dữ liệu;xi là từng mẫu riêng lẻ trong tập dữ liệuX. Giả sử giá trị độ sâu
tuân theo phân phối chuẩn, giá trị b = 1,4826, một hằng số liên quan đến giả định về tính quy phạm của dữ liệu, bỏ qua sự bất thường gây ra bởi các ngoại lai, được chọn theo nghiên cứu trong tài liệu [76].
Tiêu chí để phát hiện các ngoại lai trong ảnh độ sâu là một giá trị ngưỡng được đặt dựa trên giá trị của độ lệch tuyệt đối trung vị. Công thức mô tả tiêu chí được biểu diễn như sau
|xi−M(X)|6σãMAD (3.3)
Cụ thể, một mẫu xi cho trước của tập dữ liệu X thỏa mãn bất phương trình 3.3, mẫu này thuộc về tập dữ liệu. Tùy thuộc vào hệ số ngưỡng σ, tiêu chí loại bỏ dữ liệu có chứa nhiễu sẽ được xác định. Theo công bố của Miller [77], có 3 hệ số ngưỡng cho tiêu chí để phát hiện các ngoại lai: hệ số ngưỡng mức rất cao ứng với giá trị σ= 3, hệ số ngưỡng mức trung bình ứng với giá trị σ= 2,5 và hệ số ngưỡng mức dễ dàng ứng với giá trị σ = 2.
3.2.1.2. Thực nghiệm và đánh giá
Dựa trên lý thuyết nêu trên, một thuật toán 3.2 được xây dựng. Sau đó, một chương trình con được viết bằng mã Matlab và trình bày trong phụ lục 3.3.
Thuật toán 3.2 Lọc nhiễu trong các ảnh độ sâu liên tiếp INPUT : X: Tập hợp ảnh độ sâu liên tiếp
OUTPUT: output: Thứ tự ảnh độ sâu bị loại bỏ
1: Gán các giá trị mặc định
2: Tính giá trị trung vị của tập hợp ảnh độ sâu liên tiếp
3: Tính giá trị độ lệch tuyệt đối trung vị MAD 4: if T hreshold≤V alue then
5: Thứ tự ảnh độ sâu bị loại bỏ
6: else
7: Thứ tự ảnh độ sâu giữ lại
8: end if
Thực nghiệm lần lượt với 3 hệ số ngưỡng nêu trên. Kết quả thí nghiệm lọc nhiễu cho ảnh độ sâu với hệ số ngưỡng mức độ rất cao σ = 3 cho kết quả tốt nhất và được minh họa trong hình 3.16.
Sau khi quá trình lọc nhiễu, ảnh độ sâu được phát hiện và loại bỏ ra khỏi tập hợp dữ liệu các ảnh độ sâu liên tiếp, các ảnh độ sâu liên tiếp còn lại của giá trị độ sâu được lấy trung bình để thu được giá trị có độ chính xác tốt hơn cho vị trí điểm ảnhp(u, v) trong ảnh độ sâu của góc chụp đã chọn.
(a) Trước khi lọc nhiễu (b) Sau khi lọc nhiễu Hình 3.16: Ảnh độ sâu khi xét xét đến ảnh hưởng của nhiễu
3.2.2. Lựa chọn số lượng ảnh độ sâu liên tiếp 3.2.2.1. Mô tả thí nghiệm
Trong mục này, ảnh hưởng của số lượng ảnh độ sâu liên tiếp đến quá trình số hóa bề mặt bằng Kinect v2 sẽ được khảo sát. Một phân tích thống kê với một mẫu lớn của 200 ảnh độ sâu liên tiếp sẽ được thực hiện. Một quá trình số hóa bề mặt chi tiết cơ khí được lặp lại nhiều lần từ một góc chụp duy nhất. Các trạng thái quan sát đám mây điểm tại các vị trí 10, 20, 30, 40, 50, 60, 70, 80, 90 100, 150 và 200 ảnh độ sâu liên tiếp sẽ được phân tích.
Cụ thể, vật mẫu vật liệu nhôm kích thước 120mm×120mm×14mm và hệ thống hỗ trợ quá trình quét trong các thí nghiệm ở mục 2.4 trong chương 2 được sử dụng lại trong thí nghiệm này. Vật mẫu được đặt trong khu vực làm việc của Kinect v2 sao cho trục quang học của cảm biến IR đi qua tâm của vật mẫu.
Đám mây điểm sẽ được thu nhận với kích thước 70mm×70mm×5mm để hạn chế thấp nhất những ảnh hưởng của nhiễu tới quá trình số hóa bề mặt. Đặc biệt, vật mẫu cũng được tạo lớp phủ chống phản xạ bề mặt. Khoảng cách từ mặt phẳng tham chiếu tới gốc tọa độ của hệ tọa độ máy ảnh là 1168,8mm.
Một chương trình máy tính viết bởi mã Matlab nhằm thu thập và xử lý thông tin của thí nghiệm đã được hoàn thành và biểu diễn trong phụ lục 3.4. Thời gian thực hiện thu thập dữ liệu bằng Kinect v2 là 100 giây.
3.2.2.2. Kết quả và đánh giá
Với các kết quả đám mây điểm thu được ở các vị trí quan sát, tổng số điểm thu được, các giá trị tọa độ z trung bình và độ lệch chuẩn của phép đo sẽ được
tính toán và biểu diễn trong hình 3.17. Cụ thể tổng số điểm thu được thay đổi từ 481 điểm khi số lượng ảnh độ sâu liên tiếp bằng 10 đến 484 điểm khi số lượng ảnh độ sâu liên tiếp bằng 30 và giữ nguyên cho đến kết thúc thí nghiệm. Giá trị trung bình tọa độ z của các điểm trong đám mây điểm thay đổi không đáng kể và dao động quanh giá trị tham chiếu. Giá trị độ lệch chuẩn của tọa độ z của các điểm trong đám mây điểm giảm dần khi số lượng ảnh độ sâu tăng dần. Điều này cho thấy, độ chính xác thiết bị tăng lên khi phép đo khoảng cách được thực hiện theo ảnh độ sâu trung bình.
20 40 60 80 100 120 140 160 180 200
0.5 0.6 0.7 0.8
20 40 60 80 100 120 140 160 180 200
1154.5 1154.6 1154.7 1154.8 1154.9
20 40 60 80 100 120 140 160 180 200
481 482 483 484 485
PSfrag replacements Số ảnh độ sâu liên tiếp
Hình 3.17: Kết quả khảo sát ảnh hưởng của số lượng ảnh độ sâu liên tiếp đến quá trình số hóa bề mặt
Qua kết quả thí nghiệm cho thấy, ảnh hưởng của số lượng ảnh độ sâu liên tiếp tác động đến độ lệch chuẩn khá nhỏ từ 30 ảnh độ sâu liên tiếp đến 200 ảnh độ sâu liên tiếp. Như vậy, để nâng cao chất lượng và giảm thời gian tính toán trong quá trình thu thập thông tin, số ảnh độ sâu liên tiếp hợp lý được lựa chọn cho mỗi góc chụp là 50 ảnh.