Pastaba: šis tekstas rašyti 1997 m. spalio pradžioje ir publikuotas "Monitoriuje". Kaip užsirišti kaklaraištį? Kai neabejotinai reikia sužinoti, kas yra Šri Lankos sostinė, ar prieš eidami į "InfoBalt" parodą negalite užsirišti kaklaraiščio, pašalinti kavos dėmes, atsiradusias po vakarykščių vaišių, sudėti Rubiko kubą ar rasti Siksto katedros freskas - naršote Voratinklį. Tik va iškart labai sunku rasti tai, ko jums reikia - juk pasaulyje yra keliasdešimt milijonų WWW puslapių. Tenka naudotis paieškos sistemomis. Tačiau jos yra labai kvailas įrankis, priimantis tik paprastą užklausą - vieną žodį ar frazę. Pavyzdžiui, man reikia piešinuko su konservų dėžute. Beviltiška nurodyti žodį "can" (angl. konservai), nes šis žodis bus beveik visuose anglų kalba ruoštuose WWW puslapiuose, juk "can" taip pat yra nepaprastai dažnai naudojamas modalinis veiksmažodis (reiškiantis "galėti"). Tad šią užklausą tenkins beveik milijonas WWW puslapių. Ar jau pakėlėte rankas? Nenusiminkite, jei tikrai žinote ko reikia
dar galite kovoti. Jei reikia žuvies konservų, galite pabandyti
junginį, paprašyti, kad paieškos sistema nurodytų tuos puslapius,
kuriuose yra ir žodis "konservai" ir "žuvis" ("fish").
O prisiminę anglų kalbą vietoje "can" nuspręsite naudoti "canned"
(konservuotas). Jau kenčiama? Naudojantis "Altavista" sistema
aprašytu atveju reikia išvardinti visus
ieškosimus žodžius, prieš juos padėję pliusuką, t.y. +canned +fish Taip pat priminsiu, kad norint ieškoti tikslios frazės, reikia ją imti į kabutes, pvz., "canned fish". Šiuo atveju bus pateikti tik tie WWW puslapiai, kuriuose yra ši frazė, t.y. abu žodžiai yra greta. Bet vis tiek lieka keli šimtai puslapių, kuriuos reikia perversti, norint surasti tą "vienintelį" reikalingą. Pakeliui panervina, kad kartais net per 20% sąraše pateikti puslapiai yra "mirę", t.y. neegzistuoja ar jau nukeliavę kitur. Paieškos sistemos tiesia ranką padėti, bet ypatingai padėti dar negali. Niekam nebus siurprizas, kad paieškos sistemos yra didžiausia "Internet" apkrova. Tai įrodo ir tai, kad penki (iš kokių devynių) "tikrieji" ieškai yra labiausiai lankomų Voratinklio svetainių dešimtuke (daugiau pasiskaitinėti apie lankomumą galite užsukę į http://www.npd.com:80/c_pctopweb.htm) Reikia jus įspėti, kad dažnai neteisingai naudojamas paieškos sistemos ("search engine") terminas. juk ne kiekvienas limonadas yra "Coca-Cola" ir ne kiekvienas kopijavimo įtaisas - "Xerox" gaminys. Iš tikro, pasaulyje veikia nedaug paieškos sistemų. Dažniau susiduriame su katalogais, "geltonaisiais" ir kitų spalvų puslapiais, meta-ieškikliais, saitų sąrašais. Daug šiais metais rašyta apie "Internet" paieškos sistemas, stengiantis sekti jų teikiamų paslaugų kitimus, naujoves. Viskas keitėsi ir kartais buvo sunku į tą patį iešką įbristi du kartus. Šiame straipsnelyje bandysiu pateikti kitur nepaminėtus niuansus. Viena iš populiariausių ir dažnai pripažįstama geriausias yra "Yahoo!" paieškos tinklapis. Jis nepasižymi didžiausia indeksuotų žodžių baze, kaip "Altavista", tačiau turi puikiausią katalogų sistemą. Nusižiūrėję "Yahoo!" šį skaidymą pagal temas ir potemius (Laisvalaikis, žaidimai, skaitiniai ir t.t.) mėgdžioja ir kiti, tačiau nesugeba tai daryti taip sėkmingai, kaip šis veteranas. Nepaprastai padeda, kad galima ieškoti tik šių atskirų temų viduje. "Excite" siūlo "Web" tinklapių apžvalgas, "geltonuosius puslapius", reguliuojamą "Mano kanalą", planus ir žemėlapius bei informaciją apie orus. Labai daug visko vienoje vietoje: naujienos ir verslo informacija, "gyvas" pokalbis, įdomūs pasiskaitymai ir t.t. "Lycos" labai patogi, kai reikia surasti ne tekstą, o kitus objektus: piešinius, garso įrašus ir t.t. Apie ją šį pavasarį rašė popierinis "Vartiklis", tačiau ji neseniai pakeitė savo drabužėlius, paieškos objektą (pvz., nurodyti, kad ieškome piešinio) leisdama pasirinkti iš pagrindinio puslapio. Be šių paminėtų yra per pora šimtų kitų paieškos sistemų. Jos visos varžosi tarpusavyje, save vadina geriausiomis. Ką pasirinkti? Gal pabandyti ieškoti iškart keliose? Tokios Barbės devyndarbės yra vadinamosios paieškos metasistemos. Jos pačios neieško, bet analizuoja ir pateikia kitų paieškos sistemų rezultatus. Pabandykite "Dogpile". Ji ypač naudinga, kai pabandėt "Yahoo!" ir negavot atsakymo (arba gavot tik kelis), o pabandę "AltaVista" buvote "prislėgti" 30 tūkst. atsakymų šūsnimi. Ji elgiasi labai protingai - pradeda nuo tos paieškos sistemos, kuri gali duoti tiksliausią rezultatą ("Yahoo!"), o po to pereina prie kitų, gražinančių didesnius atsakymų kiekius. Taip palaipsniui ji gali pereiti per 20 skirtingų paieškos sistemų. Kai paieškos sistemai siunčiate užklausą, ji nepuola naršyti po visą Voratinklį, o peržiūri sukauptą duomenų bazę, į kurią, tarsi skruzdėlės, "šapus" - informacijos bitus neša jos robotai (daugiau apie juos skaitykite "InfoBalt laike"), kurie, tarsi kokie parazitai ar virusai naršo po "Internet" tinklą skaitydami pakeliui sutiktus WWW puslapius, o dar noriau jų antraštes, o jose - <META> direktyvas. Šiuose puslapiuose esančias nuorodas panaudoja tolimesnėms paieškoms. Aišku, dažniau peržiūrimi yra populiarūs puslapiai, į kuriuos yra daugiau nuorodų. Nuo šių robotų strategijos ir aktyvumo (bei nuo paieškos sistemos leistinos DB dydžio)
priklauso paieškos sistemos "galia". O kad jos nepražiopsotų jūsų kūrinio,
daugelis jų priima lankytojų nurodytus naujus "taikinius". O dabar
pasitikrinkite savo puslapio "svarbą" pasauliui.
Visi praeitų metų straipsniai apie paieškos sistemas |