Nhưđã trình bày ở những chương trước, một bài toán quan trọng của quảng cáo trên máy tìm kiếm đó là việc xếp hạng các quảng cáo theo độ phù hợp với truy vấn của người dùng. Từ những phương pháp được trình bày ở Chương II, cho thấy việc lựa chọn các đặc trưng cho việc biểu diễn quảng cáo là hết sức quan trọng. Có những trường hợp giữa quảng cáo và từ khóa có sự phù hợp lớn, tuy nhiên tập từ vựng sử dụng trong quảng cáo và truy vấn là khác nhau. Do vậy, bên cạnh các đặc trưng về từ khóa, việc sử dụng một số đặc trưng ở mức trừu tượng cao hơn là rất cần thiết. Những nghiên cứu của Andrei và các cộng sự [11] đã cho thấy, việc sử dụng các đặc trưng mở rộng như phân lớp truy vấn, cụm từ Prisma đem lại những kết quả khả quan. Đặc biệt là nghiên cứu của Lê Diệu Thu [27]
đã chỉ ra rằng, việc sử dụng chủ đề ẩn trong quảng cáo theo ngữ cảnh nhằm mở rộng tập từ vựng của quảng cáo cũng như trang web đem lại kết quả rất khả quan.
Trong phần này, ta sẽ trình bày một mô hình quảng cáo trực tuyến trên máy tìm kiếm sử dụng kĩ thuật phân tích chủ đề ẩn và tính hạng. Khác với mô hình đã được xây dựng bởi Lê Diệu Thu [27], mô hình của chúng ta được xây dựng nhằm mục đích xếp hạng quảng cáo trên máy tìm kiếm theo truy vấn của người dùng. Kĩ thuật chủđề ẩn được sử dụng trong việc xây dựng những đặc trưng mới để biểu diễn quảng cáo. Ngoài ra, mô hình còn khai thác một lượng lớn các query logs nhằm xây dựng tập dữ liệu học.