Paieškos serveriai Iš pirmo žvilgsnio atrodytų, kad "Internet" yra ištisas informacijos vandenynas, - tik semk ir naudok. Tačiau, kai prireikia labai tikslios žinutės, pakerta rankas, - kaip surasti šapą putojančiame kalnų sraute? Puslapiai atsiranda ir išnyksta, - jų tūkstančiai ir milijonai. Jie buvo, yra arba dar tik bus. Paprašysiu, kad surastų visus puslapius apie "maistą", - gausiu kelių šimtų tūkstančių sąrašą. Nurodysiu "grybai" - vėl kažkas panašaus. O man reikia "maisto su grybų padažu"! Paieškos paslaugos "Internet" yra veltui, - tačiau mano laikas yra brangus. Todėl aš noriu surasti, kaip efektyviai panaudoti šiuos galingus įrankius. Ar įsivaizduojate, kaip ieškotumėte reikiamo puslapio jei jų nebūtų? Kurtumėt savą puslapių kartoteką ar aklai (tarsi neregiai įsitvėrę virvės) eitumėte per nuorodas. Ne visi paieškos serveriai yra tapatūs savo galimybėmis. Visų pirma skiriasi informacinė struktūra. Gali būti indeksai ir katalogai. Indeksai yra milžiniškos duomenų bazės apie milijonus WWW puslapių. Pagal pateiktą žodį arba frazę (ir, gal būt, papildomas užklausos komandas) sukuriamas WWW puslapių, kuriuose yra ieškoma frazė, sąrašas. Indeksus kuria programos-kirminai ("crawlers"), kurios nuskaito puslapius, juos peržiūri ir indeksuoja, juose suranda nuorodas į kitus WWW puslapius, kurias panaudoja tolimesnėms paieškoms. Web katalogai yra WWW puslapių hypersąrašai pagal hierarchiją suskirstyti į temas bei kategorijas: menas, sportas, kompiuteriai ir t.t. Keliaudami šiuo medžiu žemyn pasiekiame ieškomą puslapį. Katalogus dažniausiai kuria "gyvi" žmonės, o ne programiniai robotai. Jie aprėpia mažiau, tačiau yra geriau organizuoti. Indeksai yra aklas kompiuterinis voratinklyje esančios informacijos perrinkimas, nors kai kurios programas atlieka sudėtingą paiešką. Kai kurios jų žodžiams, priklausomai kur jie sutinkami, priskiria skirtingus prioritetus - svarbesni žodžiai yra antraštėse, raktinių žodžių sąrašuose. Žodžio dažnis puslapyje irgi yra svarbus veiksnys. Kai kurios paieškos programos indeksuoja tik reikšminius terminus. Katalogai kryptingesni, - jie tiksliau nurodo kelią, kuriuo reikia eiti. Jaučiasi tvirta juos kūrusio žmogaus ranka. Kai kurie paieškos serveriai (AltaVista arba HotBot) yra klasikiniai indeksai. Kiti (InfoSeek arba WebCrawler) - hibridai. Magelan ir Yahoo! labiau katalogai, nors pirmasis ir turi 15 mln. WWW puslapių bazę. Yahoo! turi kai kurias paieškos galimybes, tačiau dažnai užklausą peradresuoja AltaVista serveriui. "PC Magazine" geriausiais išrinko Excite, leidžiantį surūšiuoti paieškos rezultatus pagal puslapį, nurodyti raktinių žodžių svarbą; HotBot, kurį mėgstu ir aš, derinantį milžinišką duomenų bazę su sudėtinga vartotojo sąsaja. Galima nurodyti daug įvairių filtrų sukuriant sudėtingą užklausą; ir Yahoo! - geriausias katalogas, turintis 14 kategorijų ir tūkstančius subkategorijų. Asmeniškai aš mėgstu ir dažnai naudoju InfoSeek, kuri pasižymi naudojimosi paprastumu ir labai tinka naujokams. "Baltieji puslapiai" ("White Pages") padeda surasti reikiamus asmenis, jų E-mail adresus ar telefono numerius. Jie peržiūri įvairius viešus informacijos šaltinius: iš universitetų, labdaros organizacijų, kai kuriuos verslo šaltinius ir telefonų knygas. Galite pabandyti keletą:
http://www.bigfoot.com
http://www.four11.com
http://www.iaf.net
http://www.switchboard.com
http://www.whowhere.com