Như đã có trình bày trong mục 3.1 của bài luận này, rằng bảng được cấu thành từ những cột, dòng và ô (cell). Vì vậy, sau khi phát hiện được các khối đại diện cho các cột, chúng ta tiếp tục phân tích các khối này để hình thành những cấu trúc phức tạp hơn của bảng. Căn cứ vào cách phân lớp cho một khối nào đó được phát hiện ra như trong mục 3.3, ta có hai lớp chứa các khối. Đối với các khối thuộc lớp thứ nhất thì ta phân tích mỗi hàng của khối này thành một ô của bảng (Hình
3.9a). Đối với các khối thuộc lớp thứ hai thông thường chứa cấu trúc của một đoạn văn bản nhưng cũng có thể chứa các dòng văn bản trong cùng một ô. Có rất nhiều trường hợp để phân tích thành các ô cho các khối thuộc lớp thứ hai. Ở đây chúng ta chọn một loại cấu trúc điển hình là: Khối thuộc lớp thứ hai nằm liền kề với khối thuộc lớp thứ nhất và ta tiến hành phân tích khối thuộc lớp thứ hai này thành các ô tương ứng song song với các ô của khối thuộc lớp thứ nhất. Để thực hiện việc phân tích này ta phối hợp với kỹ thuật phát hiện đường kẻ của Kasturi, theo đó ta phân đoạn những dòng của khối thuộc lớp thứ nhất và trên cơ sở đó ta kẻ những đường kẻ ngang kéo dài nơi ranh giới của những dòng này thì cũng sẽ phân tích được các ô của khối thuộc lớp thứ hai. Hình 3.9b đưa ra một ví dụ trong đó hai cột phía bên trái là hai khối thuộc lớp thứ nhất, cột còn lại phía bên phải là khối thuộc lớp thứ hai. Trong đó các ô trong cột của khối phía bên phải được phân tích nhờ vào việc kéo dài các đoạn thẳng phân định các ô của hai cột bên trái.