Công cụ hỗ trợ việc thu thập tin tức từ các báo điện tử khác

Một phần của tài liệu Tài liệu Luận văn tốt nghiệp "Xây dựng tòa soạn điện tử có hỗ trợ lấy tin từ các website khác” pdf (Trang 39 - 41)

3. CÔNG CỤ HỖ TRỢ VIỆC LẤY TIN TỰ ĐỘNG

3.2. Công cụ hỗ trợ việc thu thập tin tức từ các báo điện tử khác

khác

Một tòa soạn điện tử ngoài việc sản xuất tin bài bằng đội ngũ phóng viên của mình, việc thu thập tin bài từ các báo khác sẽ làm phong phú và đa dạng hóa tờ báo của mình.

Tuy nhiên, việc thu thập tin dựa vào công nghệ XPATH, một công nghệ đòi hỏi tính chính xác và những yêu cầu nhất định về kiến thức XML. Điều này sẽ là trở ngại đối với những đơn vị muốn lập website nhưng thiếu nhân lực có chuyên môn về XML và XPATH. Chính vì vậy, sự ra đời của một công cụ có khả năng hỗ trợ lấy tin chỉ bằng những thao tác đơn giản, trực quan sẽ giúp giải quyết trở ngại trên. Từ những lý do trên cộng với tính khả thi của việc lấy tin tự động từ các website khác, nhóm quyết định xây dựng một công cụ với những tính năng sau đây :

 Phân tích cấu trúc của một trang web mẫu do người dùng chọn

 Trả về các câu truy vấn XPATH tương ứng với những nội dung mà người dùng cần lấy từ một trang website khác

 Thực hiện thu thập thông tin từ các trang báo khác dựa vào các câu truy vấn mà người dùng đã chọn.

Chương 2. PHÂN TÍCH HIỆN TRẠNG

Khoa Kinh tế trực thuộc Đại học Quốc gia Thành phố Hồ Chí Minh (ĐHQG TpHCM)là đơn vị dự định triển khai ứng dụng mà nhóm đang xây dựng. Những thông tin sau được thu thập từ việc khảo sát hiện trạng tại đơn vị này.

 Khoa Kinh tế trực thuộc ĐHQG TpHCM. Mặc dù được gọi là “Khoa” Kinh tế nhưng đây là một đơn vị ngang bằng với các trường thành viên khác của Đại học Quốc gia như Đại học Khoa học Tự Nhiên, Đại học Khoa học Xã hội & Nhân văn... Khoa Kinh tế đào tạo sinh viên hai hệ : Hệ chính qui và Hệ vừa học vừa làm (hệ tại chức cũ). Ngoài việc đào tạo hệ chính qui tập trung tại trường, Khoa Kinh tế còn có cơ sở đào tạo tại các tỉnh trên khắp cả nước. Vì vậy, việc đảm bảo thông tin thông suốt từ cơ sở chính đến các cơ sở đào tạo tuyến tỉnh là một nhu cầu thiết yếu và cực kì quan trọng.

 Trước tình hình mới hiện nay, khi mà nhu cầu thông tin về trường cũng như nhu cầu cung cấp thông tin mới, thông tin cần thiết đến sinh viên ngày một tăng lên, Khoa Kinh tế quyết định thành lập một website chính thức cho mình. Tuy nhiên, qua một thời gian hoạt động, website được xây dựng không đáp ứng được nhu cầu đặt ra, một phần vì website không theo kịp những yêu cầu mới của Khoa.

 Những nhu cầu mới nói trên phát sinh từ việc Khoa Kinh tế muốn làm phong phú thêm website của mình. Thay vì như trước đây, website chỉ phục vụ việc cập nhật những thông tin liên quan đến Khoa, những thông báo…Hiện nay, Khoa muốn website của mình còn là nơi đăng tải những thông tin mới nhất về Chương trình đào tạo, Tuyển sinh, tình hình Kinh tế trong và ngoài nước. Không những thế, website còn là nơi sinh viên có thể tìm kiếm được các kiến thức bổ trợ về khoa học kĩ thuật, tin học, giải trí; hoặc có thể là nơi tổ chức các diễn đàn giao lưu giữa sinh viên với nhau hay giữa giảng viên và sinh viên trong và ngoài Khoa.

 Thực hiện ý tưởng đó, trước hết, Khoa đã xây dựng một đội ngũ phụ trách về nội dung của website bao gồm các giảng viên, sinh viên trong khoa, một số cán bộ

kĩ thuật tin học. Đội ngũ này sẽ vận hành giống như một tòa soạn báo điện tử : có những phóng viên thực hiện thu thập tin tức và viết bài; có biên tập viên phụ trách việc biên tập và chỉnh sửa tin bài của phóng viên; có tổng biên tập phụ trách kiểm duyệt những thông tin quan trọng và nhạy cảm hoặc quản lý về mặt nhân sự của website; có một số kĩ thuật viên chịu trách nhiệm xây dựng một bộ khung ban đầu cho website và duy trì sự hoạt động của website…

 Với tình hình một đội ngũ phụ trách nội dung của tờ báo trong tương lai như vậy, Khoa Kinh tế đặt ra những yêu cầu cần phải có của một website mới nhằm đảm bảo việc đáp ứng tốt nhu cầu hiện tại và tương lai của Khoa.

Một phần của tài liệu Tài liệu Luận văn tốt nghiệp "Xây dựng tòa soạn điện tử có hỗ trợ lấy tin từ các website khác” pdf (Trang 39 - 41)

Tải bản đầy đủ (DOC)

(60 trang)
w