Phân tích các phương pháp

Một phần của tài liệu Nghiên cứu ứng dụng trí tuệ nhân tạo trong thiết kế 3d từ hình ảnh 2d (Trang 56 - 59)

Biểu diễn dữ liệu 3D

Hình 4-1 Biểu diễn dữ lệu 3D (nguồn internet)

Khơng giống như một hình ảnh 2D chỉ có một biểu diễn ở định dạng máy tính (pixel), có nhiều cách để biểu diễn dữ liệu 3D ở định dạng kỹ thuật số. Chúng đi kèm với những ưu điểm và nhược điểm riêng, vì vậy việc lựa chọn biểu diễn dữ liệu ảnh hưởng trực tiếp đến phương pháp có thể được sử dụng.

47

4.1.1 Dạng được gắn chặt (Voxel network)

Có thể áp dụng trực tiếp CNN

Hình 4-2 Empty Voxels (nguồn internet)

Mỗi ô màu xanh là một voxel duy nhất, hầu hết các voxel đều trống.

Voxel, viết tắt của volumetric pixel, là phần mở rộng trực tiếp của pixel lưới khơng gian thành voxel lưới thể tích. Vị trí của mỗi voxels cùng nhau xác định cấu trúc duy nhất của dữ liệu thể tích này, do đó, giả định về địa phương của ConvNet vẫn đúng ở định dạng thể tích.

48

Tuy nhiên sự đại diện này là thưa thớt và lãng phí. Mật độ của các voxels hữu ích giảm khi độ phân giải tăng lên.

Ưu điểm: Có thể áp dụng trực tiếp CNN từ biểu diễn 2D sang 3D.

Nhược điểm: Biểu diễn lãng phí, đánh đổi cao giữa chi tiết và tài nguyên (tính

tốn, bộ nhớ).

4.1.2 Dạng hình học

Khơng thể áp dụng trực tiếp CNN

Hình 4-4 Point Cloud đại diện cho một chiếc ghế. (nguồn internet)

Lưới đa giác: là tập hợp các đỉnh, các cạnh và các mặt xác định bề mặt của vật

thể theo 3 chiều. Nó có thể nắm bắt các chi tiết nhỏ trong một biểu diễn khá nhỏ gọn.

Đám mây điểm: Tập hợp các điểm trong tọa độ 3D (x, y, z), các điểm này kết

hợp với nhau tạo thành một đám mây giống với hình dạng của vật thể trong 3 chiều. Bộ sưu tập điểm càng lớn thì càng có nhiều chi tiết. Tập hợp các điểm giống nhau theo thứ tự khác nhau vẫn đại diện cho cùng một đối tượng 3D.

Ưu điểm: Hình biểu diễn nhỏ gọn, tập trung vào bề mặt chi tiết của vật thể 3D.

49

Một phần của tài liệu Nghiên cứu ứng dụng trí tuệ nhân tạo trong thiết kế 3d từ hình ảnh 2d (Trang 56 - 59)