Khai Thác Search Engine Cho Nhu Cầu Học Tập Nghiên Cứu - I vietsciences-Võ Quang Nhân ngày 01 tháng 07 năm 2004 Các bạn thân mến, Trong đời sống ngày nay, phương tiện thiếu cho việc học tập nghiên cứu khoa học biết tận dụng khả cuả tin học Trong đó, việc sử dụng Internet cách hiệu góp phần giúp bạn đẩy nhanh tiến độ cuả đề án cơng cụ khơng thể thiếu cho việc tự trao dồi, cập nhật hoá kiến thức nghiên cứu Loạt viết nhằm đáp ứng phần việc giúp bạn có thêm kĩ để xử dụng mức phương tiện Internet (Hi hi! 'chat' thường khơng có ích ngoại trừ dùng để tìm bạn chiều!), đặc biệt máy truy tìm liệu (search engine) Bài giảng bao gồm nhiều phần, phần kết chúng tơi trình lại tất tài liệu tham khảo mà tác giả dùng để viết nên loạt Các tài liệu hữu bạn có trình độ Anh ngữ đề nghị đọc thêm chúng để có dịp hiểu chi tiết thêm chi tiết mà chúng tơi khơng đề cập đến Search engine gì: - Mụch đích cuả phần trình bày kiến trúc cuả search engine Có nắm bắt nguyên lý hoạt động cuả search engine việc xử dụng có nhiều hiệu nhanh chóng .1.1 Khái quát search engine Search engine (tạm dịch - máy truy tìm) -nguyên thuỷ- cơng cụ phần mềm nhằm tìm trang mạng dưạ vào thơng tin mà có Dữ lượng thông tin cuả search engine thực chất loại cở sở liệu (database) cực lớn Công cụ tìm tài liệu dưạ từ khố (keyword) trả danh mục cuả trang có chưá từ khố of 1.1.1 Spider: Cơ sở liệu cuả search engine cập nhật hố chương trình đặc biệt thường gọi "robot", "spider" hay "Webcrawler" Các chương trình tự động dị tìm phân tích từ trang có sẵn sở liệu để kiếm nối kết (links) từ trang trở lại bổ xung liệu cho search engine sau phân tích Các chương trình báo cáo liên kết bị đào thải Từ khoá mà bạn bỏ vào search engine kiếm bảng số cuả Kết xếp thứ tự Trang tiếng dùng nguyên tắc www.google.com 1.1.2 Meta-search engine: Trên loại search engine "nguyên thuỷ" Ngày nay, người ta lợi dụng search engine sẵn có để thiết kế thành loại search engine gọi meta-search engine (tạm dịch máy truy tìm ảo) Nguyên tắc cuả loại search engine đơn giản Nó khơng có sở liệu Khi hoạt động gởi từ khố đến search engine khác Một cách đồng loạt nhận tất kết tìm (Ui chao! giống kí sinh trùng !) Và nhiệm vụ cuả phân tích hay xếp lại tài liệu tìm cho thân chủ Cái hay cuả loại meta-search engine lợi dụng sở liệu cuả search engine nguyên thuỷ để tìm nhiều kết Nhưng loại meta-search engine tồn có search engine nguyên thuỷ nên gọi meta- (tiếp đầu ngữ meta thường dịch 'siêu hình' hay 'ảo') Điển hình of http://www.metacrawler.com/ Ngoài hai loại search engine ngưòi ta đề cập đến 1.1.3 Thư mục đối tượng (Subject Directories): Cịn gọi máy truy tìm theo phân lớp (hierarchical search engine) search engine kiểu phân lớp sẵn đối tượng vào thư mục người dùng lưạ rẻ nhánh từ từ tìm trang WEB mà muốn Kiểu dể cho người cập có điểm yếu khơng thể bao gồm hết chủ đề mà muốn kiếm Hơn nưã, phân loại đơi khơng đầy đủ xác (Ngồi ra, cịn chứa đống trang 'shopping' phù hợp cho phái nữ hì hì) Điển hình cuả loại www.yahoo.com Chúng ta không bàn sâu loại thư mục đối tượng 1.1.4 Các sở liệu đặc biệt: Đặc điểm cuả loại liệu kiếm khơng thực có điạ trang WEB cụ thể qua search engine; liệu tồn sở liệu cuả computer mà trang WEB phép sử dụng Đặc biệt, trang WEB nghiên cứu cuả ĐH hay học viện http://lii.org/ , http://www.academicinfo.net/ , http://infomine.ucr.edu/ (Xin nhớ cho sở liệu cuả quan nghiên cứu nha!) of Ngồi ra, lợi dụng google hay yahoo ta tìm tài liệu sở liệu cách thêm vào từ khố chữ: "database" Nghiã là: thay dùng từ khố "helium laser" viết thành "helium laser database" Các trang WEB mô tả gọi invisible WEB (tạm dịch 'vô kiến WEB' ) 1.2 Đặc điểm phân loại search engine: 1.2.1 Các đặc điểm: of Như vậy, tuỳ theo keyword mà tìm số trang liên hệ hay nhiều Trong nhiều trường hợp, số trang tìm có đến hàng triệu trang vấn đề đặt cho search engine la xếp thứ hạng trang để người dùng có nhiều hội tìm liệu muốn nhất? Cách thức xếp thứ hạng (ranking): Hầu hết search engine xếp hạng ưu tiên theo kiểu mà người design nghĩ trang tìm thấy phù hợp với từ khoá điều kiện cho thêm cuả người dùng máy (chẳng hạn máy bên Pháp trang tiếng Pháp có ưu tiên tùy theo cách cho từ khoá đủ "hẹp" thị trường tìm kiếm) Mặc dù vậy, chưa quen dùng "tìm" đống liên kết (links) khơng vưà ý nhiều lúc chúng hồn tồn vơ dụng Lý người dùng khơng hiểu rõ kĩ thuật tìm kiếm cuả máy ngược lại kĩ thuật cuả máy truy tìm chưa đủ sức để "hiểu" ngưịi dùng muốn gì! (bởi phải tả rõ cho 'nàng' search engine hiểu 'chàng' muốn gì) Đa số cách xếp thứ hạng dựa vào "số lần xuất hiện" (còn gọi tần xuất) cuả từ khố trang Nghiã trang có xuất từ khoá nhiều hiển thị trước tiên search engine trả lời (Người thiết kế search engine cho tài liệu lập lại nhiều lần từ khố hữu dụng nên xếp hàng cuả trang trả lời!) Bởi bạn tra tìm trang WEB mà lại dùng từ khố chung chung từ có nhiều nghiã bạn khơng tìm trang chưá muốn Trong trường hợp bạn phải tìm từ khố khác hơn/chi tiết dùng kĩ thuật hổ trợ từ search engine mà đề cập phần sau cuả viết Có số search engine ngồi việc xác định tần xuất cuả từ khố chúng cịn dựa vào khả xuất sớm cuả từ khoá hồ sơ tìm thấy tưạ đề (title), đầu trang (header), Hoặc giả, họ xác định quan trọng cuả trang WEB cách đếm số trang có liên kết từ trang khác tới (Một trang WEB có hay có quan trọng tui cho 'link' 'reference' trang WEB cuả tui !) Cũng lí này, đa số search engine lớn có thêm chức "advanced" hay "advanced search" để giúp bạn tìm bạn cần dể 1.2.2 Phân loại search engine: Phân loại theo kiến trúc hoạt động: Theo phân định cuả Berkeley có loại cơng cụ tìm kiếm (search tool): search engine tồn dựa chưong trình spider, search engine theo thư mục đối tượng, invisible WEB Phân loại theo chức năng: Theo cách phân loại tùy theo đối tượng tìm kiếm mà có: Kiếm địa of trang WEB, kiếm điạ e-mail, hay kiếm tin tức người ( http://www.nwbuildnet.com/nwbn/fouremail.html) hay tổ chức (http://www.freeality.com/findrev.htm ), kiếm việc làm, kiếm đồ ( www.mapquest.com ) Chúng ta không đề cập sâu phần (xem tập mà Có muốn tìm người yêu cũ tự lo kiếm lấy nhờ tui!) 1.2.3 Các Search Engine nên biết: www.google.com Được xem search engine kiểu spider tốt (4 lần thắng Search Engine Watch lưạ chọn) Bằng google, bạn dùng để tìm ảnh, bàn luận có Usenet, newsgroups (tạm dịch nhóm tin tức) Nó cung cấp chức kiểm lỗi tả, tra cứu từ điển (hầu hết viết cuả tác giả mượn trang để tra từ điển) tìm giá chứng khoáng, đồ đường, số điện thoại vv Google đề án từ ĐH Stanford cuả sinh viên Larry Page Sergey Brin lúc gọi BackRub Năm 1988, tên đổi thành Google dự án tung thị trường trở thành công ty tư nhân tên Google www.yahoo.com Xuất năm 1994 ban đầu trang thiết kế theo phương pháp thư mục Cho đến tháng 11 năm 2002 yahoo thêm vào chức spider lấy từ Google (để tăng sức cạnh tranh) tháng 2004 Hiện yahoo tự có kĩ thuật tìm kiếm độc lập Đây trang "số 1" cho người thích mua sắm cách phân loại theo đối tượng dể cho người tiêu dùng tìm đến sản phẩm cần thiết Kĩ thuật spider cuả yahoo kết nối kĩ thuật cuả Altavista, AllTheWeb, cuả Inktomi (một đề án serach engine phát khởi từ UC Berkeley) www.askjeeves.com Khởi từ năm 1998 đến 1999 trở thành seaech engin có "ngơn ngữ tự nhiên": Nó cho phép bạn đặt câu hỏi (dĩ nhiên tiếng Anh thứ tiếng mà hổ trợ) trả lời bạn tất dường Thật ra, đằng sau "kĩ thuật cao" cơng ty có khoảng trăm chuyên viên có nhiệm vụ khảo sát ghi nhận tìm kiếm từ tìm dường trang cho tìm kiếm Ask Jeeves cịn hổ trợ thêm vào chức gọi "smart search" (tạm dịch dị kiếm tinh khơn) chức cung cấp thêm phân loại tối thiểu loại đối tượng mà bạn muốn tìm (hình ảnh, phim, nhạc, ) cách chọn biểu tượng cho kết xác nhiều www.vivisimo.com meta-search engine www.surfwax.com meta-search engine of www.copernic.com meta-search engine www.metacrawler.com - meta-search engine http://lii.org/ adcademic search database http://www.academicinfo.net/ adcademic search database http://infomine.ucr.edu/ adcademic search database Trong kì tới khảo sát sâu chức nâng cao kĩ cần thiết để tận dụng search engine ©Vietssciences-Võ Quang Nhân ` of Ngày 01 tháng 07 năm 2004 Khai Thác Search Engine Cho Nhu Cầu Học Tập Nghiên Cứu - II vietsciences-Võ Quang Nhân ngày 19 tháng 07 năm 2004 Các hổ trợ nâng cao phép tốn thơng dụng m truy tìm: Bài giảng phần nói nhiều đặc điểm chuyên biệt cuả search engine dựa đặc điểm cuả chúng mà bạn có nhiều phương pháp để tìm, tra cứu tài liệu cách hữu hiệu Chúng mổ xẻ chi tiết cá khả chuyên biệt cuả thiết bị truy tìm 2.1 Các Phép Tốn đơn giản: phép dùng để nâng cao hiệu cuả việc tìm kiếm Trong hầu hết trang truy tìm, việc dùng dấu hổ trợ +, - ngoặc kép thuận tiện 2.1.1 Dùng dấu '+': Khi bạn muốn tìm trang có mặt tất chữ mà bạn muốn khơng theo thứ tự viết nối chữ với dấu + (và nhớ chưà khỏang trống giưã chữ) Thí dụ muốn tìm trang nói cách thức viết Linux scrips bạn điền vào tìm từ khố: +Linux +script +tutor of 11 Hình1: tự học Linux script search engine Làm có trang có đủ chữ nêu tìm Bằng cách bạn lọc bớt số lớn trang khơng cần tìm 2.1.2 Dùng dấu '-': Nhiều lúc bạn muốn loại bỏ bớt trang có (hay nhiều) chữ mà bạn khơng muốn có dùng dấu - trường hợp Chẳng hạn tìm tin tức loại xe dùng kỹ thuật lai chưa có bán thị trường khơng muốn trang bán xe lọt vào thử từ khoá: car +hibrid -sale -Prius -Insight (Prius and Insight hai kiểu xe hibrid có bán thị trường cuả Toyota va Honda) 2.1.3 Dùng ngoặc kép " ": để tìm cụm từ nguyên văn Nhiều bạn muốn tìm viết nguyên văn cuả câu nói, tên cuả người hay cụm từ để tất vào ngoặc kép Phương pháp tiện lợi cho việc tìm kiếm trang đặc biệt (thí dụ thử đánh nguyên văn câu thơ "Quả cau nho nhỏ miếng trầu ôi" vào google tìm xem viết câu này? Hè hè! zầy mà thi thả thơ tui thắng hết 99% of 11 phần xui hông In-tờ-nét) Hình2: 0.14 giây tìm tác giả cuả câu "quả cau nho nhỏ"! Để tìm tài liệu viết nhà khoa học Von Neumann gõ nguyên tên "von neumann" Chú ý: Phương pháp hiệu bạn đánh sai tả kể "bán luá giống" (hãy thử đánh tìm chữ "Q cau" xem tui nói có hơng!) 2.2 Các phép tốn Boolean Các mệnh lệnh truy tìm dùng đại số boolean phát triển từ nhiều năm Mặc dù vậy, chúng khó xử dụng so với trình độ người trung bình Hầu hết search engine có chấp nhận mệnh lệnh kiểu này.Tuy nhiên, hầu hết trường hợp bạn tiịm cần mà khơng phải xài tới chúng Các phép tốn thơng dụng thường search engine hổ trợ OR, AND, NOT NEAR Lưu ý: dùng mệnh lệnh Boolean tốn tử phải viết chữ hoa of 11 4.2 Chống hội tụ (cluster): lúc tìm kiếm search engine thấy trang tìm chung trang nguồn chọn trang đại diện trang khác xếp gọn vào bạn khai triển rộng thành nhiều trang muốn tìm kiếm dể bị "nhiểu loạn" thơng tin cuả trang Hình3: Các hổ trợ cuả google Những trang có chức là: AltaVista(Additional relevant pages from this site), AllTheWeb(more hits from), Excite, Google(More results from), HotBot, MSN, Northern Light 4.3 Trang Tương Tự (similar) trang có tả gần giống Trong số trường hợp chức tìm trang tương tự trang mà serach engine tìm hữu dụng Để dùng chức bạn việc bấm vào liên kết tương ứng Riêng google cịn có link gợi ý thêm cho việc truy tìm chữ "Did you mean " Các trang có chức tìm trang tương tự là: AltaVista (similar pages, related pages), AOL Search (Show me more like this), Google (did you mean, similar pages) 4.4 Trang có từ nối dài (stemming): Đây khả cuả số máy truy tìm cho phép tìm trang có chữ mà có chưá từ khố bên Thí dụ, thay vi tìm chữ tutor trang tìm ln chữ tutors, tutorial, AOL Search (mặc định), Direct Hit, HotBot(Enable Word Stemming) of 4.5 Dùng chức tồn trữ (cache) cuả google: Có nhiều trường hợp trang WEB bị xố sổ khơng thể hiển thị nưã thơng tin cuả sở liệu cuả máy try tìm vẩn cịn mà cần dùng đến Trong thời gian tin tức chưa bị xố khỏi search engine bạn đọc nhờ vào chức đạc biệt cuả google Hình4: Thơng tin cũ tồn đọng 'cache' Ngồi ra, google, bạn dùng từ khố qui ước 'cache' để đọc trực tiếp thông tin (Hà hà! Trong vài trường hợp bạn dùng kĩ thuật để lôi thông tin bị di chuyển nơi khác cuả hackers!) Ví dụ: cache:cnn.com 4.6 Chuyển Dịch (translation) Một số trang cho khả dịch lại trang tìm thấy sang thứ tiếng mà người dùng có (thường có dịch Anh Pháp Đức hay Tây Ban Nha thôi! Nhưng trặc trẹo lắm) Như vậy, bạn nắm phần thơng tin dịch Các trang có chức chuyển dịch là: Google(Translate this page) 5.7 Điạ search engine thông dụng: 5.7.1 Trang kiểu Spider of AltaVista (Translate), Google: www.google.com Ask Jeeves www.ask.com/ Teoma: www.teoma.com/ Altavista: www.altavista.com/ Excite: www.excite.com/ Gigablast: www.gigablast.com/ lycos: www.lycos.co.uk/ Nothern Light www.nlsearch.com 5.7.2 Kiểu Meta: tìm LookSmart, GoTo.com, Dog Pile www.dogpile.com Thunderstone, Yahoo!, Open Directory, About.com, Direct Hit, Lycos, and AltaVista Meta Find www.metafind.com tìm Meta Find Infoseek, and WebCrawler Excite, AltaVista, Meta crawlwr www.metacrawler.com tìm Lycos, WebCrawler, Infoseek, Excite, Thunderstone, AltaVista, GoTo, Yahoo 5.7.3 Kiểu Directory: Yahoo: www.yahoo.com Librarians's Index to the Internet: lii.org/ Infomine: infomine.ucr.edu/ Academic Info: www.academicinfo.net About: www.about.com 5.8 Phần mềm search engine: Một số nhà sản xuất có viết phần mềm để hổ trợ cho việc tìm kiếm thơng tin Internet phần mềm bán (từ 25.00 USD trở lên) hay cho miển phí tiêu biểu là: copernic: www.copernic.com/ webFerret www.ferretsoft.com Seeker www.bluesquirrel.com/store/ Kì tới: Dùng search engine theo lời khuyên cuả chyên gia phân tích kỹ of © http://vietsciences.free.fr Võ Quang Nhân ` of Khai Thác Search Engine Cho Nhu Cầu Học Tập Nghiên Cứu - IV vietsciences-Võ Quang Nhân ngày 05 tháng 08 năm 2004 Sử dụng chổ search engine theo lời khuyên cuả nhà chuyên môn: Mỗi máy truy tìm có điểm mạnh yếu riêng Tuỳ theo mụch đích, nội dung, cấp độ cuả thông tin cần thiết mà bạn nên lưạ chọn trang truy tìm cho thích hợp Sau số hướng dẫn (và đánh giá) chung Với tìm kiếm sơ xài khơng q chun sâu rõ ràng việc lưạ chọn máy truy tìm khơng cần thiết; bạn chọn loại tiện lợi quen dùng 6.1 Những tìm kiếm liệu thơng thường Thế gọi thơng thường? Thực khơng có biên giới cấp độ sâu hay nông cuả thơng tin Người ta thường có xu huớng muốn nhận nhiều chi tiết việc tốt (hà hà nhiều có nhiều q lại cần không n hay dở tổ mệt thêm) Đơi giá phải trả cho chi tiết lại khơng xứng với cơng sức bỏ (thơì gian đầu tư) điều đáng suy nghĩ Theo chúng tôi, cấp độ học vấn thông thường (từ Đại Học tốt nghiệp đại học trở xuống) việc tìm kiếm liệu cần loay hoay máy truy tìm thơng dụng (như google, altavista, yahoo) đủ cho nhu cầu 6.1.1 Kỹ Năng lưạ chọn từ khoá yêu cầu tối thiểu : Nếu xử dụng máy truy tìm việc gõ vào tìm kiếm từ khoá Việc tưởng chừng dể dàng (như ăn cơm với mắm zậy mà) thực tế nhiều khơng đơn giản tí Nhiều gõ vào chữ mà sốt trang tìm đến ngàn biết trang trang cần mở ra? (mở hết overload mà trang mở ngẫu nhiên lại dỏm ) Ngược lại, có lúc gõ vào lại nhận qúa hay khơng có thơng tin nào! Có nhiều ngun Khách quan hạn chế cuả khả truy tìm cuả search engine, số người đăng 'đề tài' q hay hồn tồn khơng có (nhưng hai nguyên đáng ngờ hổng lẽ trăm triệu trang WEB khơng có trang hợp nhãn sao) Nếu loại bỏ nguyên nhân khách quan, thất bại người dùng thiếu kỹ viết xuống từ khố thích hợp khơng đáp ứng số điều kiện tối thiểu 6.1.2 Những yêu cầu thiết yếu: Vốn sinh ngữ: Nếu bó buộc thơng tin Việt ngữ chắn bạn bị trở ngaị lớn (Các thống kê cho biét số dân Đại Cồ Việt có WEB site riêng triêu/ 80 triệu dân) Đa số trang WEB thông tin ngôn ngữ riêng hoạ hoằng trình bày thêm ngoại ngữ thường lại tiếng Anh (hi hi nói chơi thơi muốn tìm tin tức khủng bố học tiếng Ả Rập bắp rang) Như vậy, việc có vốn ngoại ngữ (ít đọc hiểu) khơng thể tránh khỏi Tuỳ theo mụch đích mà dùng ngoại ngữ thích hợp Tuy nhiên, hoàn cảnh, Anh ngữ thường yêu cầu lớn (Dẫu ti việc biết nhiều ngoại ngữ có lợi cho việc tìm kiếm thơng tin.) Ngoại trừ tìm tài liệu chun biệt loại ngôn ngữ, dùng Anh ngữ để gõ từ khố sác xuất tìm lớn Mặc dù vậy, dùng từ chung chung số lượng trang tìm q nhiều bạn phải có khả để tìm từ (hay cụm từ) khác chuyên biệt nhằm thu hẹp lại số trang tìm Ngồi việc gõ sai tả gây khơng of 11 Vốn chuyên môn: Bạn học toán nhân (x) chưa biết toán cộng (+) Cũng tương tự, truy tìm tài liêu chuyện điều kiện bạn phải thỏa mãn yêu cầu kiến thức tối thiểu chuyện Hiểu biết nhiều việc tìm kiếm hiệu (Ai mà biểu tui tìm tài liệu lọc khói ống bơ xe đời kể l ngồi việc thay nhớt xe tui chả có tí kiến thức nào) Một tí kiên trì: Làm yêu cầu tối thiểu phải kiên nhẫn Nếu lỡ gõ vào từ khoá mà nhiều kết hay kết khơng ý bạn nên nghĩ lại xem từ khố có xác khơng nên thêm hay bớt chữ Ngược lại mà máy truy tìm khơng tìm hết việc trước tiên xem lại có viết tả khơng Từ khố điền vào có rõ đầy đủ khơng (nhiều dịch từ tiếng việt tiếng Anh gõ đại vào nhận toàn thứ khơng vưà ý chẳng qua dùng sai chổ/chữ) Dùng thêm hổ trợ cuả sách tra cứu hay sách giáo khoa: Tại phải có thứ lỉnh kỉnh này? Thật ra, để tìm từ vựng chi tiết xác đề tài mà kiếm cách hay có từ điển sách giáo khoa để xem lại nhiều bạn khơng thể tìm trang WEB từ khố mà bạn nghĩ tới q nhiều nghiã (ambiguous) hay chung chung (common/generic meaning) Dùng từ điển hay sách tra cứu để kiếm chữ khác đặc biệt, đi sát với đề tài bạn tìm lại khơng hàm chưá nhiều ý nghiã khác Ngồi ra, u cầu tìm kiếm tài liệu việc viết tả dùng khái niệm từ vựng khoa học để đặt vào từ khố cần yếu Như trình bày, từ điển nguồn hổ trợ để "mài duã" lại từ khoá cho bén nhạy Trên google bạn dùng từ khố mặc định define: để tra cứu định nghiã cuả khái niệm hay chữ (ví dụ define:LASER ) 6.1.3 Kỹ lựa chọn từ khố: Ln ln nhớ cho bạn người chủ động thơng minh cịn computer máy nhanh thật ngờ nghệch Hãy xử dụng khơn khéo cuả kết hợp với nhanh cuả máy đừng làm ngược lại! Cần phải biết thật rõ bạn muốn đào kiếm bao sâu Trong truy tìm liệu cho việc nghiên cứu học tập search engine việc lưạ chọn từ khố quan trọng Nên ý thêm rằng, máy truy tìm khơng thể tìm viết có từ đồng nghiã với từ khoá từ lại khơng có mặt thân cuả từ khố mà bạn điền vào truy tìm Từ khố chuyên sâu đạt kết cao Ở bạn dùng từ khố mơ tả xác chi tiết muốn kết tìm gặp cao Nên nhớ nhiều trạng từ hay liên từ thường từ khơng đóng vai trị quan trọng (trừ đứng cụm từ trích dẫn " " ) thường bị search engine bỏ qua (Trong Anh ngữ tránh dùng chữ: a, an, the, is, and, or, of, you, me, my trừ đứng ngoặc kép cuả trích dẫn) Ví dụ: Khi install Redhat 7.3, số máy compaq hiệu 1850R bị treo Bạn muốn tìm giải pháp cuả chứng Internet Bạn tự so sách kết viêc dùng từ khoá sau: Linux hang Redhat 7.3 install Redhat 7.3 1850R hang Redhat 7.3 1850R intall hang Nếu nhận xét bạn dể dàng tìm lời giải cách đọc vài trang tìm thấy google với hai từ khoá thứ hay (và điạ cuả cách giải (có thể) nằm trang đầu tìm kiếm) dùng hai từ khố đầu khó of 11 http://forums1.itrc.hp.com/service/forums/bizsupport/questionanswer.do?threadId=206270 http://www.van-dijk.net/mailarchive/vandijk0304/0000.html "Cụm" từ khoá tổ hợp từ khoá: Như thấy dùng tổ hợp từ khoá có ảnh hưởng nhiều đến việc truy tìm ( đảo thứ tự từ khố có ảnh hưởng đến xếp thứ tự trang tìm bạn tự so sánh dùng từ khoá 4a: hang install Redhat 7.3 1850R so với từ khoá xem ) Trong nhiều trường hợp việc dùng ngoặc kếp để bảo vệ nguyên văn cụm từ tìm có vai trị quan trọng (nhất trường họp bạn muốn tìm lại văn cuả b viết đặc biệt đó) thí du: Bạn muốn tìm nhiều tốt viết người tên Nguyễn Khắc Hiếu lại khơng phải "Tản Đà" ban thấy kết khác vơ cuả hai từ khố: Nguyễn Khắc Hiếu -Tản -Đà -phố "Nguyễn Khắc Hiếu" -Tản -Đà -phố hình1a: Dấu ngoặc kép giúp truy tìm xác (chỉ cịn 384 trang) Hình 1b: Khơng có ngoặc Kép có đến 2000 trang! (kể trường hợp "lắm mối, tối nằm chơi" ) Ví dụ2: biomedical engineering" AND cancer cho nhiều kết liên quan đến chương trình học bạn loại bớt chúng từ khố "biomedical engineering" cancer -"Department of" -"School of" Biến chiêu (với phép tốn) Ngồi dấu + - việc tận dụng phép tốn giúp qúa trình tìm kiếm thông tin nhanh hiệu (Rất tiếc, google lại khơng hổ trợ tốt phép tốn Boolean Altavista) Xin đơn cử ví dụ bạn muốn tìm tài liệu để tự học Linux script ( Tạm dịch: văn lệnh cuả hệ thống Linux) Trong tiếng Anh tài liệu dẫn thường viết tutor (n) tutorial (adj) guide, howto (chữ guide thường mức độ sơ sài hơn) Như ta thử dùng từ khố (trong Altavista): "Linux script" AND (tutor OR tutorial OR Howto OR guide) Lưu ý: Phép toán phân nhánh Altavista hổ trợ mức thấp nghiã bạn lồng hai hay nhiều dấu ngoặc đơn vào Biết nhiều ngoại ngữ: Tiếng Anh thứ tiếng thông dụng giới (kế đến tiếng Tàu Nhưng tiếc, khơng có viết nghiên cứu khoa học thứ tiếng tượng hình ngoại trừ dân xứ mà xứ lại cịn bị giới hạn nhiều of 11 thứ) Nếu kể số lượng tài liệu khoa học chuyên khảo bên cạnh tiếng Anh cịn có Tiếng Đức, Tây Ban Nha, Pháp Nhiều tài liệu mà bạn muốn tìm lại khơng viết tiếng Anh! Do đó, biết nhiều thứ tiếng có lợi Ngay việc tìm tài liệu nghiên cứu Việt Nam việc biết thêm Anh hay Pháp ngữ vơ quan trọng (để biết nhìn khách quan cuả người nước ngoài) Bạn thử so sánh số trang tìm cuả hai từ khố sau đâu Ampere: "Andre Marie Ampere" (Anh) "André Marie Ampère" (Pháp) rõ Dùng từ tương đương hay đồng nghiã: Trong ví dụ việc tìm học Linux script, chúng a dùng kĩ thuật từ tương đương hay đồng nghiã Vấn đề số tác giả thích dùng chữ mà lại khơng dùng chữ kia, đó, bạn bỏ sót từ đồng nghiã X (hay từ tương đương X) có nghiã bạn hẳn hội tìm viết cuả tác giả thích dùng từ X (Ngộ nhở lại cuả tác giả xuất sắc lại uổng hơn) Ngoài ra, việc dùng ACRONYM ( tạm dịch: chữ viết tắt) thêm vào từ khoá cuả danh từ khoa học quan trọng thí dụ người hay dùng chữ LED ( đi-ốt phát quang) tài liệu chữ nguyên gốc "light emitting diode" Cũng cho chữ laser Dùng từ chuyên khoa: Khi bạn tìm chuyên khảo ngành nghề việc hiểu viết nhiều từ vựng ngành giúp bạn nhiều việc "tinh lọc" thơng tin nhận Thí dụ trường hợp bạn tìm tài liệu nghiên cứu kí sinh trùng sốt rét ác tính ngồi chữ intensive malaria bạn thay tên khoa học cuả kí sinh trùng (Plasmodium Falciparum) để thêm vào từ khố 6.2 Tìm Kiếm Đề Tài có Mụch tiêu Xác Định: Trước tiên xử dụng cách thức thông thường (Vì điạ cuả google dể nhớ ! Hi hi ) thông thường Nếu bạn vẩn muốn tìm thêm liệu thử ghi tùy theo mụch tiêu truy tìm 6.2.1 Dữ liệu đặc biệt: Hãy dùng đến trang chưá sở liệu Nhắc lại từ có nhiều thơng tin cất giữ riêng sở liệu mà tìm vào trang riêng biệt để tìm chúng Một vài trang chứa sở liệu http://lii.org/ adcademic search database http://www.academicinfo.net/ adcademic search database http://infomine.ucr.edu/ adcademic search database http://www.invisible-web.net/ invisible WEB http://www.rdn.ac.uk/ Resouce Discovery Network http://turbo10.com/cgi-bin/showdeepnet.cgi Turbo 10 http://www.freepint.com/gary/direct.htm Direct Search http://www.noodletools.com/debbie/literacies/information/5locate/advicedepth.html Noodle tools http://www.lib.berkeley.edu/Collections/acadtarg.html Thư mục cuả Đại hoc Berkely Trong nhiều trưòng hợp bạn muốn truy tìm tin tức từ sở liệu việc thêm vào từ khoá chữ "database" vị trí cuối cuả từ khố 6.2.2 Dữ liệu có liên quan đến cấu trúc viết chữ từ khố (chính tả, đồng nghiã, câu cú, chữ hoa hay chữ thường): Trong trườn hợp cách tốt bỏ chữ vào ngoặc kép giải vấn đề of 11 6.2.3 Truy tìm định nghiã, khái niệm, tài liệu tham khảo hay dịch nghiã: Nếu muốn biết tả dùng từ làm từ khoá vã gõ vào google đọc chức hổ trợ có dịng "did you mean " Đây là chức có khả chỉnh tả Nếu để tra ý nghiã chữ, khái niệm, hay danh từ khoa học dùng từ khố qui ước define: google (ví dụ define:OLED) Ngồi ra, bạn lên trang tự điển để tra cứu chẳng hạn như: http://www.yourdictionary.com http://dictionary.reference.com/ http://www.reference.com/ http://www.britannica.com/ http://www.search.com/search?channel=19 http://www.iTools.com/research-it Các tài liệu tham khảo chung cịn có http://www.odci.gov/cia/publications/factbook/index.html : the world fact book cuả CIA http://www.guinnessworldrecords.com/ : Trang Guiness kỉ lục giới http://portal.unesco.org: Trang cuả tổ chức Văn hoá Giáo dục Khoa Học cuả Liên Hợp Quốc http://www.noodletools.com/debbie/resources/math/stats.html trang liên kết liệu thống kê 6.2.4 Tìm thư viện: Các thư viện WEB cung cấp nhiều thơng tin q báu: http://www.ipl.org/ Thư viện Internet công cộng http://www.lib.berkeley.edu/ Thư viện cuả ĐH Berkeley http://web4.si.edu/sil/onlineexhibitions/oe_search2.cfm Thư viện WEB cuả Smithsonian Institution Các trước tác: http://libweb.sonoma.edu/assistance/subject/primaryonline.html : Nguồn link cuả trước tác (primary source) Đây nguồn liên kết sưu tầm lớn tài liệu từ thư viện http://www.cyberschoolbus.un.org/infonation/info.asp so sánh thơng tin điạ lý quyền nước http://www.uidaho.edu/special-collections/iil.htm Bộ sưu tập lớn liên kết tới trang WEB cuả quốc gia http://www.tulane.edu/~lmiller/ArchivesResources.html thư viện NET go http://vlib.org/Overview.html Thư viện ảo http://www.loc.gov/rr/askalib/ Hỏi thủ thư viện Thơng tin vấn đề Nóng: http://infodome.sdsu.edu/research/guides/hot/supersites.shtml http://www.publicagenda.com/issues/issuehome.cfm 6.2.5 Các trích dẫn câu phát biểu (Quotation): http://www.quoteland.com http://www.quotationspage.com/search.php3 http://www.aphids.com/quotes/index.shtml http://creativequotations.com (Những phát biểu liên quan tới sáng tạo) 6.2.6 Truy tìm phương thức giải quyết: Các viết cách thức làm hay giải vấn đê thường có chữ đặc trưng "howto" ,"how to", "instruction", "do it yourself", "DYI", of 11 Trong nhiều trường hợp có vấn đề kĩ thuật, bạn viết thẳng câu hỏi Anh ngữ lên xem từ khố (Dĩ nhiên phải văn phạm tả) Thí dụ: Bạn muốn tìm tài liệu để chế tạo thiết bị Laser thử từ khoá google: How to build a laser device Bạn nhận kết thú vị bất ngờ Tương tự mà bạn gặp hư hỏng hay trục trặc trình xử dụng computer hay phần mềm chép nguyên văn (hay phần lớn) dịng báo lỗi lên làm thành từ khố Sau thêm vào số chi tiết để lọc bớt thơng tin Thí dụ: đơi dùng X-window cuả Linux bạn gặp trục trặc mà máy báo lổi sau: "Could not init font path element Unix/:7100, removing from list!" Bạn dùng câu báo lỗi làm từ khoá va bỏ vào google để tìm viết cách giải quyết: "Could not init font path element Unix/:7100" Bạn tìm nhiều viết việc Dĩ nhiên bạn phải thêm vào từ khoá vài chi tiết để t`im cách giải thoả đáng Ngồi ra, bạn trực tiếp đặt câu hỏi giải khó khăn forum mà trang sau chổ tập trung links: http://www.forumone.com/index/ 6.2.7 Truy tìm tài liệu học vấn (MÃ NGUỒN, BÀI VỞ ): Hãy ý đến từ khoá tutor, tutorial, research, database, how-to, instruction, source, source code, schematic, flow chart, circuit, theorem, proof, bạn muốn tìm hiểu mơt định lý hay lí thuyết việc đánh thẳng tên (nếu có) cuả định lí hay lí thuyết làm từ khố xem Từ kết bạn lọc lại cách thêm vào từ khoá phép toán (dùng dấu - hay NOT) Ngay trường hợp nhớ phần cuả tên hữu dụng Thí dụ bạn thử đánh Cauchy theorem google xem tìm dược định lí Cauchy khác 6.2.8 Truy tìm tin tức: Tin tức có nhiều bật là: http://dailynews.yahoo.com Yahoo news http://news.google.com Google news Tin tức với bình luận va phân tích: http://www.rdn.ac.uk/bth/ BBC news http://www.usnews.com/usnews/briefings/nbhome.htm Trang WEB cuả hãng thông lớn: www.cnn.com CNN http://www.ap.org/ AP http://www.afp.com/english/home/ AFP http://www.cbs.com/ CBS http://nbcpublish.console.net/ NBS Trang liên kết trang tin tức: http://www.headlinespot.com Truy tìm tin tức từ khiá cạnh http://www.alltheweb.com/advanced?c=news&cs=utf-8 (bằng nhiều ngôn ngữ): 6.2.9 Truy tìm loại tệp văn bản: Hãy dùng từ khố qui ước filetype: www.google.com để tìm cá loại tệp văn có format riêng Hoăc dùng advanced search từ MSN: http://search.msn.com/advanced.aspx?FORM=HP of 11 6.2.10 Truy tìm quan hệ: Một số trường hợp bạn lại muốn tìm trang có thêm quan hệ giưã từ khố trang search engine say cung cấp thơng tin thú vị http://www.kartoo.com/flash04.php3 cuả trang Kart00 ví dụ: từ khố gasoline electric car cho kết nhiều đồ liên hệ: Hình2: Kart00 Tương tự có trang http://www.webbrain.com/html/default_win.html 6.2.11 Truy tìm loaị liệu văn (nhạc, hoạ, phim hình) Có thể dùng trang www.Altavista.com Rồi bấm vào đề mục (như images, MP3/Audio, video) http://memory.loc.gov/ammem/collections/finder.html sưu tập thể loại nghệ thuật Tìm hình ảnh dùng: www.google.com hay www.ask.com http://classroomclipart.com Các loại hình ảnh computer http://www.si.umich.edu/Art_History/ Thư viện nghệ thuật tranh-ảnh cuả ĐH Michigan http://www.thinker.org/fam/about/imagebase/subpage.asp?subpagekey=420 Trang thư viện hội hoạ cuả San Francisco of 11 Trang có chưá nhiều tập tin âm thanh: http://www.findsounds.com 6.2.12 Truy tìm người, đia số phone: Truy tìm thông tin nhân vật tiếng: http://www.infoplease.com/people.html http://www.biography.com/search/ Các nhân vật tiếng chết: http://amillionlives.com Truy tìm người thường hay thơng tin cá nhân: Hãy thử gõ tên tả tên cuả ngưịi cần tìm www.google.com Các trang truy tìm người thông tin cá nhân: http://people.yahoo.com http://www.nwbuildnet.com/nwbn/fouremail.html http://www.freeality.com/findrev.htm http://find.intelius.com/ 6.2.13 Các báo cáo Khoa Học NSDL (National Science, Technology, Engineering, and Mathematics Education Digital Library) Trang cuả Internet Scout Project chuyên chở báo cáo lãnh vực Khoa học Ki thuật Toán Giáo dục Thư viện số cuả quan nghiên cứu: http://scout.cs.wisc.edu/index.php 6.2.14 Thu nhận ý kiến thăm dò (kết qủa): http://www.opinion-pages.org http://www.pollingreport.com http://blogdex.net Các đánh giá chất lượng: http://www.rateitall.com 6.2.15 Hỏi ý kiến cuả chuyên gia: http://www.vrd.org/locator/ Dành cho câu hỏi giáo dục lớp bậc trung học cuả giáo dục Hoa kì http://www.allexperts.com/index.htm Trang WEb cuả chuyên gia thiện nguyện http://experts.mediamap.com/(dx3lkv553etvqg55ys1njhqb)/search.aspx Dùng để tìm chuyên gia ngành nghề http://www.ibiblio.org/slanews/internet/experts.html dòng liên kết tới trang WEB chuyên ngành 6.2.16 Tìm Bản đồ: http://plasma.nationalgeographic.com/mapmachine/ Trang cuả National Gepgraphic http://atlas.geo.cornell.edu/webmap/ Bản đồ điạ lí giới http://www.mapsarea.com/ Tập trung lnk đồ đủ loại 6.2.17 Tải software: Có lẽ thưà tơi trình bày với bạn nước đâu để kiếm phần mềm (vưà rẻ vưà tốt) Tuy nhiên, nguồn tải phần mềm hợp pháp lớn là: http://www.shareware.com/ www.download.com 6.2.18 Các liên kết khoa Học: Ngoài điạ giớo thiệu, link sau giúp bạn có thêm tài liệu Khoa học giáo khoa bậc ĐH http://www.martindalecenter.com/ Mantidale Reference Desk of 11 http://www.sciencegems.com/ Frank Potter's Science Gems chủ yếu cho Khoa Vật Lý http://explanation-guide.info/ Cho nhiều giải thích tượng hiệu ứng http://searchenginewatch.com/links/science.html Có links trang khoa học http://searchenginewatch.com/links/medical.html Có link trang y hoc Giới thiệu số máy truy tìm cuả quốc gia khác Hoa kì: Phụ Lục: 7.1: Kĩ thuật trình bày META TAG cho trang WEB: Như đề cập I, số máy truy tìm dùng thông tin cho META TAG để xếp hạng viết Nếu bạn chưa rõ cách thức xếp hạng cuả máy truy tìm xin xem lại I Nhiều bạn tìm tài liệu chuyên khoa hoc lại có nhiều trang quảng cáo vè chuyện hoàn toàn khác lọt vào danh mục tìm thấy Đó trang (vơ duyên) dùng đến kĩ thuật nhồi nhét 'từ khoá' mà họ cho quan trọng vào META TAG cuả họ Hiểu biết META TAG giúp bạn việc lọc lưạ thơng tin xuất máy truy tìm cách điều chỉnh từ khoá 7.1.1 META TAG gì: Về mặt mã nguồn bạn tìm thấy META TAG nằm phần đầu cuả tất trang WEB Thí du: Các META TAG dùng để thị thêm cho WEB Browser (tạm dịch Máy truy Cập WEB) thêm số thông tin đặc biệt định nghiã, mô tả, yêu cầu đặc trưng để tải, Một phận quan trọng cuả META TAG cung cấp thêm liệu 'từ khố' cho máy truy tìm Do đó, trang có META soạn thảo cách kĩ lưỡng có nhiều hội để máy truy tìm đưa lên thứ tự ưu tiên danh mụch kiếm theo từ khố bắt gặp Ngược lại nhiều trang WEB trang WEB cuả người khơng chun mơn cách trình bày META cho WEB site hội cuả họ xếp cao danh mục tìm thấy thấp khó tìm (mặc dù thường viết chứa thơng tin mà bạn cần) Các nội dung cuả META TAG bao gồm Content (nội dung) Subcategory (phân lớp), Access level (cấp độ xử dụng) Access Restriction Requirements (các yêu cầu giới hạn xử dụng), Expiry Date (thời hạn), Publisher (nhà xuất bản), Keywords (từ khố) Description (mơ tả) of 11 7.1.2 Đặc Điểm: Tuỳ theo cấu trúc cuả máy truy tìm mà META TAG có ảnh huởng khác đến việc xếp hạng Trong thời gian gần tầm quan trọng cuả META TAG có suy giảm lạm dụng cuả trang quảng cáo (họ nhồi nhét dủ thứ vơ để đánh lưà máy truy tìm) dẫn đến việc người soạn thảo máy truy tìm thay đổi phương án xây dựng số cho sở liệu (hạ thấp vai trò cuả META TAG) Các thông tin META TAG ngoại trừ việc xử dụng cho Máy truy cập máy truy tìm, khơng hiển thị trang WEB Những từ vựng viết "title", "description", hay "keyword" ảnh hưởng đến cách xắp xếp cuả search engine Khơng có biện pháp tuyệt hảo để giúp cho trang WEB đứng đầu vĩnh viễn danh mục truy tìm theo 'từ khoá' cố định Lý thay đổi cách làm việc cuả máy truy tìm thay đổi cuả META TAG trang khác trở nên hiệu trang vốn đứng đầu danh mục 7.1.3 Vài cách thức để áp dụng cho trang WEB: Chúng nêu thêm dành cho bạn để điều chỉnh trang WEB cuả để tạo thêm hội cho nhiều người tìm đến đọc: Bạn dùng hai dạng quang trọng sau: