3. Những đặc trƣng cơ bản của báo chí trực tuyến: 1 Đặc trƣng cập nhật phi định kỳ:
3.4. Đặc trƣng lƣu trữ và tìm kiếm thông tin:
Khi gọi Internet là kho thông tin của nhân loại, siêu xa lộ thông tin trên hành tinh v.v… ngƣời ta không chỉ nghĩ đến khả năng lƣu trữ tài nguyên thông tin mà còn nói đến khả năng tìm kiếm, xử lý tuyệt vời của nó. Đây cũng là một đặc trƣng quan trọng của phƣơng tiện truyền thông này. Báo trực tuyến hình thành trên cơ sở phát hành nội dung thông tin trong lòng Internet, nói đúng hơn, bản thân báo trực tuyến cũng là một thực thể Internet nên nó mang đƣợc thuộc tính này nhƣ một đặc trƣng riêng mà các loại hình báo chí khác không thể có hoặc hạn chế.
Nếu phát thanh – truyền hình truyền thống, thông tin đƣợc chuyển tải theo tuyến thời gian, chỉ có thể lƣu trữ bằng trí nhớ (xét trong góc độ quá trình truyền thông) thì báo in có thế mạnh với bản chất "mang thông tin một lần" của tờ báo (do đặc thù phƣơng tiện chuyên chở thông tin: giấy – in ấn). Thông tin trên báo in có thể đọc đi đọc lại, có thể lƣu giữ những tờ báo để học tập và nghiên cứu. Thế nhƣng, với những tờ báo hiện đại ở nƣớc ngoài hiện nay, mỗi số báo có thể lên tới vài trăm trang thì việc lƣu giữ này hết sức cồng kềnh, tốn kém và báo in cũng chỉ lƣu giữ hình thức văn bản và hình ảnh tĩnh. Trong khi đó, các dữ liệu văn bản, hình ảnh (tĩnh và động), âm thanh v.v… với sự tiến bộ của công nghệ đã đƣợc số hóa hoàn toàn. Phát thanh – truyền hình (truyền thống) trên lý thuyết, cũng có thể lƣu giữ băng từ, đĩa kỹ thuật số các dữ liệu đã phát sóng, nhƣng đó là việc của nhà truyền thông. Đối tƣợng công chúng tiếp nhận khó có cơ hội làm chủ đƣợc kho dữ liệu ấy để tìm kiếm, truy xuất. Vì thế, so với báo in, phát thanh và truyền hình, báo chí trực tuyến còn có khả năng lƣu trữ, bảo quản thông tin hiệu quả, gọn nhẹ, đỡ tốn kém và phục vụ kịp thời cho việc tra cứu
theo yêu cầu. Tra cứu trên báo trực tuyến là tra cứu trên một kho dữ liệu bình đẳng, hầu nhƣ không có “vùng cấm” trong thông tin nếu thông tin đó đã đƣợc phát hành (public). Và tất nhiên đó là khả năng tra cứu “điện tử”: chính xác và khoa học. Nếu có trong tay một tờ báo in, nhƣng đó là những nhật báo dày nhƣ Washington Post hay New York Times, thì việc tìm một bài báo đã đăng trong số báo ấy không đơn giản chút nào nhƣng với báo trực tuyến, chỉ cần gõ một vài từ khóa. Khả năng tìm kiếm của báo trực tuyến cho phép chúng ta tìm lại những bài viết cách đây nhiều năm, hoặc nhiều bài viết của nhiều nguồn về cùng một đề tài. Khả năng lƣu trữ và tìm kiếm còn đƣợc kết hợp với đặc trƣng trình bày (khả năng liên kết siêu văn bản) của báo trực tuyến để giúp cho việc sử dụng báo chí hiệu quả hơn. Một ngƣời yêu thích đội tuyến bóng đá Liverpool (Anh) có thể tìm ngay cho mình những bài báo mới nhất về đội bóng đó bằng tiếng Việt phát hành ngày hôm nay. Một sinh viên báo chí có thể tập hợp đƣợc rất nhanh những tất cả những bài báo viết về vụ “xâm hại lòng hồ thủy điện Trị An” từ trƣớc đến nay trên các báo, một ngƣời hâm mộ có thể tìm kiếm những bài viết về hoa hậu Mai Phƣơng Thuý sau thành công của cô tại vòng chung kết hoa hậu thế giới ở Ba Lan tháng 9 – 2006 tới nay. Một ngƣời lớn tuổi thƣờng xuyên đọc báo in có thể tìm một bài báo mình chƣa đọc (vì quên mua số báo đó) trên tờ báo trực tuyến của nó dễ dàng, dù bài báo đƣợc đƣa lên Internet khá lâu v.v…
Càng ngày, thiết bị lƣu trữ (tài nguyên nhớ) càng rẻ tiền hơn nên việc khai thác thế mạnh này đã đƣợc các báo hết sức lƣu tâm. Không phải ngẫu nhiên mà trên trang web các báo đều có công cụ tìm kiếm. Bên cạnh đó, hiện có rất nhiều website có chức năng nhƣ một công cụ tìm kiếm (search engine) nổi tiếng nhƣ Google, Yahoo, Alta Vista v.v… Hầu hết các cơ chế tìm kiếm trên Internet hiện nay đều dựa trên khả năng xét chuỗi ký tự của văn bản. Việc tìm kiếm ảnh chụp, hình tĩnh hoặc video còn đang trong bƣớc mày mò về mặt công nghệ.
Thế mạnh của tìm kiếm trực tuyến lại cũng chính là “gót chân A-sin” của công nghệ này: thông tin trên Internet quá nhiều và không phải website nào cũng đáng tin cậy, đồng thời, việc tìm kiếm bằng chuỗi ký tự phụ thuộc vào khả năng
tính toán khoa học trong quá trình tìm kiếm. Bản chất của quy trình tìm kiếm trên Internet là xét văn bản, vì vậy, khi chuỗi ký tự nhập vào không chính xác, kết quả tìm kiếm sẽ không chính xác. Ví dụ, để tìm những bài báo tiếng Việt viết về một nhà khoa học nƣớc ngoài, nếu gõ vào chuỗi ký tự tìm kiếm tên riêng nhà khoa học đó bằng những cách khác nhau (để nguyên dạng, phiên âm…) sẽ cho những kết quả khác nhau. Có khi cho một kết quả sai. Ngay cả trong một từ tiếng Việt, cách đánh dấu trên nguyên âm khác nhau cũng cho ra những kết quả khác nhau. Có một thời gian khá dài, những website ở Việt Nam nói chung và báo trực tuyến nói riêng sử dụng không thống nhất mã font cho tiếng Việt trên Internet, việc tìm kiếm - vì thế - hết sức khó khăn. Hiện nay, việc Chính phủ thống nhất dùng font Unicode trên các website trong nƣớc đã khắc phục đƣợc trở ngại này. Việc tìm kiếm trên báo trực tuyến còn phụ thuộc vào khả năng tìm kiếm của ngƣời sử dụng, bởi nếu không biết khu biệt phạm vi tìm kiếm, chúng ta có thể chết ngộp trong khối thông tin trùng lắp, đúng sai trong “siêu xa lộ”. Ví dụ: Khi gõ vào chuỗi ký tự “Đặng Thuỳ Trâm” (trong dấu ngoặc kép), Google
tìm kiếm đƣợc 44.300 website có tên ngƣời nữ anh hùng liệt sĩ đó. Nhƣng khi nhập chuỗi “Đặng Thùy Trâm” thì kết quả lại khác: Có 241.000 website chứa chuỗi ký tự này. Núi thông tin khổng lồ ấy sẽ làm nản lòng ngƣời tra cứu ngay từ những giây đầu tiên.
“Internet là kho dữ liệu” xét ở khía cạnh lý thuyết. Trong thực tế, không phải tƣ liệu nào cần cũng có thể tìm kiếm đƣợc. Một tờ báo trực tuyến có thể
“xóa” các dữ liệu nội dung báo quá cũ khi tài nguyên nhớ của máy chủ không cho phép. Và có những tƣ liệu chúng ta cần đôi khi không thể có trong các báo trực tuyến tiếng Việt, điều này đòi hỏi ngƣời sử dụng còn phải biết ngoại ngữ, ít nhất là tiếng Anh. Các loại ngôn ngữ có chữ viết tƣợng hình nhƣ Trung Quốc, Nhật Bản, Hàn Quốc… hoặc chữ viết của các ngôn ngữ khối Ả-rập không phải ai trong chúng ta cũng có khả năng tìm kiếm thông tin hoặc nếu có thì cũng đòi hỏi máy tính có cài đặt trình điều khiển gõ chữ tƣơng ứng trên bàn phím có ký tự Latinh của đa số máy tính.
Từ những phân tích trên, thiết nghĩ, không nên tuyệt đối hóa khả năng lƣu trữ và tìm kiếm thông tin của báo chí trực tuyến. Nhƣng mặt khác, phải biết tận dụng, khai thác nó tối đa và hƣớng dẫn ngƣời sử dụng biết khai thác khoa học để phát huy đƣợc đặc trƣng này.