Motori di ricerca: guida per i meno esperti |
| 1991: nasce il World Wide Web, ideato da Tim Berners-Lee (CERN). 1993: nasce Mosaic, il primo browser grafico (della NCSA - National Center of Supercomputing Applications). 1994 : nasce Netscape Navigator... Ora, appena 7 anni dopo la nascita del web, ci sono milioni di pagine web sulla rete...milioni di informazioni e spesso cercare qualcosa e' un problema. Per questa ragione tempo fa qualcuno ebbe l' idea di sviluppare un motore di ricerca. Un motore di ricerca e' un programma software che ricerca le informazioni sulla rete con l' ausilio di parole chiave. Bene, prima di tutto devi sapere che quasi tutti i motori di ricerca (tranne alcuni) ricercano le informazioni sul web. Ma Internet non e' solo web, percio' quando usi un motore di ricerca non potrai accedere alle informazioni contenute all' interno dei database listserv o all' interno del gopherspazio per esempio. Percio' ricorda: ci sono parecchi posti dove puoi ricercare informazioni, come i database listserv, il gopherspazio, i newsgroups, gli archie server, wais ed altri ancora. Ma in questi posti non puoi effettuare interrogazioni con i motori di ricerca. I motori di ricerca effettuano ricerche solo all' interno del web. Come lavorano i motori di ricerca? I motori di ricerca (chiamati anche robot, crawler, worm o spider) girano sul web, leggono le pagine HTML, le analizzano, estraggono le 'parole chiave' aggiornano i loro database con tali parole e rispondono alle richieste degli utenti. Come fanno a girare sul web? Beh, semplicemente seguono i link delle pagine web incontrate. Cosi' - seguendo link dopo link - leggono tutto il web! Ma una pagina non verra' mai trovata se non e' linkata da altre pagine. Quando un motore di ricerca legge una pagina web, l' analizza cercando delle parole chiave da estrarre. Poi segue i link di quella pagina. Cosi' raggiunge un' altra pagina web, l' analizza e segue i suoi link e cosi' via. Cosa sono le 'parole chiave'? Le parole chiave (keywords) sono tutte le parole contenute all' interno di una pagina web che il motore di ricerca considera 'importanti'. Questa fase e' chiamata 'indicizzazione'. Infatti queste parole importanti sono degli indici che puntano a quella pagina web. Alcuni motori di ricerca registrano intere pagine (motori di ricerca 'full text') percio' quasi tutte le parole contenute in quelle pagine sono degli indici. Comunque alcune parole - chiamate stopwords - sono ignorate dai motori di ricerca. Tali parole sono gli articoli o le preposizioni ed altre parole o simboli che sono senza alcun significato per i motori di ricerca. Vediamo questa interrogazione: il naso del gatto Bene, quando digiti questa frase su un modulo di un motore di ricerca e premi il bottone submit, prima di tutto il motore di ricerca trasforma questa interrogazione. Cosi': naso gatto infatti il motore di ricerca assume che alcune parole siano poco importanti ai fini della ricerca (in questo caso 'il' e 'del'). Per questa ragione questa interrogazione ritornera' tutte le pagine web contenenti la parola 'naso' o la parola 'gatto'. In altre parole otterrai una enorme quantita' di pagine e di informazioni inutili. Comunque alcuni motori di ricerca ritorneranno solo i documenti contenenti entrambe le parole. Infatti ogni motore di ricerca segue le proprie regole. Ma, cosa succede se occorre effettuare una ricerca sul titolo di un libro, esattamente come scritto? Supponi di voler trovare tutte le pagine web contenenti il titolo del libro: il naso del gatto come puoi forzare i motori di ricerca costringendoli a considerare anche gli articoli e le preposizioni? Beh, potresti inserire l' interrogazione tra doppi apici. Cosi' quando scrivi "il naso del gatto" otterrai solo quei documenti contenenti l' esatta frase. Ora sai che ci sono alcune parole ignorate dai motori di ricerca. Ma quali sono le parole 'importanti' per loro? Bene, di solito i motori di ricerca seguono alcune regole:
Percio' quando sottometti un' interrogazione, pensa al titolo della pagina. Dovresti 'indovinare' le parole contenute nel titolo della pagina che vorresti trovare! Inoltre dovresi usare gli operatori booleani. Gli operatori booleani sono AND OR e NOT. Per esempio, supponi di dover ricercare 'macchine rosse'. Bene, se digiti cosi': macchine rosse potresti ottenre un immenso elenco di link a documenti trovati dal motore di ricerca. Infatti potresti ottenere tutti i documenti contenenti la parola macchine o la parola rosse. Ma tu vuoi entrambe le parole: macchine E rosse! Percio' devi usare l' operatore booleano E (in inglese: AND) Cosi': macchine AND rosse E se vuoi ottenere 'macchine rosse' ma NON vuoi trovare 'ferrari'? Beh, devi usare l' operatore booleano NO (in inglese: NOT). Cosi': macchine AND rosse NOT ferrari Comunque questi sono solo degli esempi, percio' dovresti conoscere le regole dei tuoi motori di ricerca preferiti. Cosi' quando effettui una ricerca dovresti seguire queste fasi:
Per saperne di piu' sulle regole usate dai motori di ricerca, visita questa pagina di wowarea: aiuto su alcuni motori di ricerca. |
Home Pag. prec. Chi siamo? Scrivici!
Copyright (c) 1998-2006 Wowarea