Pretraživanje interneta – alati i strategija
Vratimo se malo u školske klupe. Da bi smo shvatili kako funkcionira svijet koji se nalazi iza monitora naših računala treba dobro utvrditi gradivo te usvojiti par osnovnih definicija.
Pa krenimo.
Da bismo mogli lakše pronalaziti informacije na internetu, postoje moćni alati koji nam osiguravaju te olakšavaju pristup velikoj količini materijala na Internetu.
To su Internet pretraživači (search engines).
Imamo tri primarna tipa mjesta za pretraživanje, i to:
1. Internet indeksi ili pretraživači (Web indexes, search engines), koji koriste specijalne programe (roboti ili pauci, spiders, ili crawlers) za pronalaženje Internet stranica i indeksiranje svih riječi; oni zato prekrivaju veći informacijski prostor negoli:
2. Internet imenici ili adresari (Web directories) koje uređuju urednici ili izučeni znanstvenici klasificiranjem Internet mjesta prema tematskim vrstama; imenici su selektivniji negoli indeksi.
3. Specijalizirane baze podataka internet izvora to su najusmjereniji alati, gdje su informacije ograničene na specijalne teme. Te baze podataka nisu one uobičajene kojima su vlasnici velike kompanije, već ih stvaraju sami pretraživači kao vlastite baze podataka.

Kada pretražujemo internet da bi smo došli do određenih informacija ili podataka, mi ga u biti NE pretražujemo direktno, jer internet nije moguće pretraživati direktno.
Da bismo mogli pretraživati Internet, preko svojega se računala, možemo se priključiti na nekoliko baza podataka i/ili Internet stranica koje sadrže izbor Internet stranica koje su organizirane tako da dopuštaju da pronađemo druge stranice i katkad druge baze podataka.
Mi u biti koristimo te alate za pretraživanje koji nas mogu opskrbiti s Internet adresom određenog izvora (URL) za prijelaz na druge Internet stranice.
Trenutno se alati za pretraživanje mogu podijeliti u ove kategorije: pretraživači i meta pretraživači, tematski imenici, tematski vodiči i specijalizirane baze podataka.
Pretraživači su skloni konstantnim izmjenama; izgled, namjena, udruživanje pretraživača. Zato ne smijemo ovu podjelu prihvatiti kao konačnu.
Internet pretraživači (roboti, indeksi) koriste specijalne automatizirane programe za “gmizanje” po Internetu (“to crawl the web”) koji se nazivaju Internet crawlers (gmizavci) ili spiders (pauci). Oni idu od jednog mjesta na internetu do drugog preko poveznika, prikupljajući naslove svih mjesta, URL-ove, te neke od njihovih sadržaja. Kada nađu mjesto, oni pretražuju, skeniraju (scan) Internet stranice toga mjesta i snimaju odnosno zapisuju (record) sve informacije u indeks.
Program kojemu je funkcija indeksiranje vadi informacije iz dokumenata i sprema ih u svoju bazu podataka. Cilj je „spidera“ posjetiti milijune Internet mjesta i ostati s njima u vezi koliko god je moguće. U svojemu hodu po mreži spideri raznih pretraživača međusobno dijele više baza podataka koje dotiču.
Drugi dijelovi Internet pretraživača (programi) omogućuju pretraživanje u katalogu. Slijedeći dijelovi (programi) rangiraju zatim stranice u skladu s njihovom relevantnošću prema pretraženim riječima.
Što se sprema u bazu podataka ovisi o određenom pretraživaču. Neki indeksiraju svaku riječ iz Internet dokumenata, a drugi indeksiraju samo naslov.
Kada se provodi pretraživanje preko ključne riječi ili fraze, cijela je baza podataka pretraživana, ali u rezultatu se pokazuju samo Internet stranice u kojima je nađena ta ključna riječ ili fraza.
Rezultat je lista Internet mjesta smještenih u bazu podataka s hipertekstom. Korisnici pretražuju baze podataka utipkavanjem ključne riječi ili fraze.
Što je dobra strategija pretraživanja?
Da bismo našli pravi pretraživač i dobar put pretraživanja treba imati na umu:
- tražimo li informacijski izvor ili konkretan podatak;
- odabrati ključne riječi (samo jedna ključna riječ možda će nam dati previše pogodaka);
- odrediti sinonime
- postaviti ograničenja, filtre (jezik, domena, tip dokumenta, datum, naslovi, URL, poveznici, i drugo).
Popularity: 4%
vezani članci:














[...] kod se može i prilagoditi ako bi željela naglasiti spiderima tražilica da li želim ili ne da slijede link prilikom indeksiranja moje Internet stranice. Sada [...]