Hệ thống hỏi đáp tự động và hệ thống hỏi đáp cộng đồng có những điểm khác nhau như sau:
• Sự khác nhau đầu tiên đó là loại câu hỏi. Hầu hết câu hỏi trong hệ thống hỏi đáp QA tự động là câu đơn (câu hỏi chỉ gồm 1 câu). Trong khi đó câu hỏi trong hệ thống CQA là câu phức tạp, câu hỏi gồm nhiều câu, nhiều ý hỏi. Ví dụ câu hỏi trong hệ thống hỏi đáp Yahoo!answer như sau:
"Em năm nay 16t ạ . Cao 1m6 nhưng lại có 36kg rất gầy luôn ạ nên đi đâu cũng bị hỏi và chê gầy @@ điều đó làm em khó chịu và đau đầu . Mặc dù em đã sử dụng sữa bột tăng cân , sữa bí đỏ tăng cân , ăn đêm , ăn nhiều . Nhưng số cân nặng đó vẫn duy trì từ lớp 6 tới lớp 10 luôn ạ :(( em tính chuyển qua dùng thuốc tăng cân thì có nên ko ? Dùng thuốc nào ? Hay có
• Điểm khác nhau thứ hai là sự khác nhau về nguồn câu trả lời. Hệ thống QA câu trả lời được lấy ra từ nguồn văn bản đối với những hệ thống QA nguồn đóng hoặc từ dữ liệu trên web với QA nguồn mở. Còn đối với hệ thống CQA câu trả lời được lấy từ kho dữ liệu CQA được đóng góp từ người dùng. Do người dùng khác nhau dẫn tới độ dài nội dung, cấu trúc và phong cách viết của mỗi người khác nhau cho nên chất lượng câu trả lời khác nhau. Đây cũng là thách thức trong hệ thống CQA khi đánh giá chất lượng câu trả lời.
• Điểm thứ ba là về chất lượng câu trả lời, liên quan tới chất lượng của hệ thống hỏi đáp. Hệ thống QA trích rút câu trả lời từ những nguồn có uy tín nên câu trả lời đáng tin cậy. Tuy nhiên trong hệ thống CQA do câu trả lời được đóng góp từ nhiều người dùng khác nhau với mức độ uy tín khác nhau. Việc xác định chất lượng câu trả lời trở thành bài toán quan trọng trong hệ thống CQA khi một câu hỏi có nhiều câu trả lời.
• Điểm khác nhau thứ tư là liên quan tới việc khai thác một số đặc trưng có sẵn trong hệ thống CQA như các bình chọn tích cực hoặc tiêu cực cho câu trả lời. Những thuộc tính này tạo ra tương tác giữa người dùng, từ đó làm giàu thêm thông tin cho hệ thống CQA đồng thời góp phần cho việc xác định chất lượng câu hỏi. Trong khi đó hệ thống QA thông thường không chứa những thuộc tính này.
• Điểm khác biệt cuối cùng đó là độ trễ khi nhận được câu trả lời của hệ thống. Đối với hệ thống QA, câu trả lời được thực hiện trích rút tự động từ văn bản nên hệ thống gần như không có độ trễ. Còn trong hệ thống CQA thì thời gian nhận câu trả lời phụ thuộc vào người dùng trả lời câu hỏi. Tất cả những đặc điểm trên dẫn tới các bài toán nghiên cứu chính của hệ thống CQA liên quan tới việc phân tích câu hỏi mà sử dụng ngôn ngữ tự nhiên trong hệ thống và liên quan tới xác định chất lượng câu trả lời. Cụ thể các bài toán và các thách thức được trình bày trong phần tiếp theo dưới đây.