|
|
Los buscadores de información
en Internet
Interfase: ¿Cómo funcionan y cuáles
son los más comunes?
Alejandro Rulfo Méndez |
Los
motores de recuperación de información en Internet,
son pequeños grandes programas que localizan temas, nombres
y el ordenamiento de caracteres a una velocidad impresionante entre
miles de servidores distribuídos e todo el mundo. Es tan simple
como introducir en un espacio específico el tema o palabra
que buscamos y de ahí, determinar algunos criterios –o
ninguno– en la selección del tema y de inmediato obtenemos
una respuesta.
El Ask Jeeves español se conoce también como Pregunta.com
(http://www.pregunta.com). El
usuario introduce su pregunta en lenguaje natural (en español)
en el campo de texto y el sistema le responde presentando:
a) Una o más preguntas relacionadas con la suya para las cuales
tiene respuesta. El usuario escoge aquella pregunta que considera
que más se aproxima a la suya, y entonces el sistema le muestra
la página web que contesta a tal pregunta. En algunos casos
las preguntas del sistema contendrán una lista de elementos
y el usuario deberá escoger uno de ellos para completar la
pregunta.
b) Una lista de sitios que les han parecido interesantes a algunas
personas con preguntas similares.
c) Un menú desplegable con las correspondencias que le ha proporcionado
el metabuscador MetaCrawler.
Además Pregunta.com también ofrece un directorio de
categorías para explorar mediante navegación. Al igual
que sucede con Yahoo!, se utiliza el símbolo ‘@’
para indicar las referencias cruzadas. Cuando llegamos a las hojas
de ese árbol de navegación, los resultado que nos muestra
Ask Jeeves son una selección, según cierto criterio
de popularidad, extraída del directorio Open Directory (http://dmoz.org/World/Espa%f1ol/),
el directorio más completo de la Web que ha sido creado por
editores voluntarios.
fast (http://www.alltheweb.com)
Para abril del 2001, fast es el segundo buscador en cuanto a tamaño
(575 millones de páginas indexadas). Tanto la búsqueda
simple como la avanzada de fast nos facilita el uso de operadores
booleanos mediante la indicación de que busque “all
of the words” (operador and) o bien “any of the words”
(operador or). También en ambos casos podemos buscar la frase
exacta.
Los filtros de palabras de la búsqueda avanzada nos permiten
especificar nuestra consulta con mayor detalle, pudiendo añadir
palabras que deseemos incluir “must include” o excluir
“must not include” de los resultados.
También podemos utilizar los filtros para dar más
relevancia a aquellos documentos que contengan ciertas palabras
“should include”.
Los filtros de dominio nos permiten especificar qué dominios,
de primer o segundo nivel, deseamos considerar o excluir en nuestra
búsqueda. Eso nos permite centrar nuestra búsqueda
en una organización, por ejemplo “only include uv.mx”
restringiría la búsqueda a cualquiera de los servidores
web de otras universidades. fast permite también indicar
cuántos resultados queremos visualizar por página
(10, 25, 50, 75 ó 100).
Altavista (http://www.altavista.com)
Para abril del 2001, AltaVista es el tercer buscador en cuanto a
tamaño (550 millones de páginas indexadas) y el segundo
buscador más utilizado (50 millones de consultas diarias).
Tenemos la posibilidad de usar el buscador restringido a España
(http://es-es.altavista.com/),
pudiendo además seleccionar el idioma de la búsqueda.
Altavista ofrece una búsqueda simple y una avanzada con sintaxis
diferentes. En el caso de la búsqueda simple, AltaVista utiliza
un algoritmo de puntuación para determinar el orden en el
que aparecen los documentos encontrados en la página de resultados.
Cada documento obtiene una puntuación según la cantidad
de términos de la búsqueda que contiene, según
el lugar que ocupan las palabras en el documento y según
la proximidad que existe entre ellas. No se permite el uso de los
operadores boléanos (and, or y not), sin embargo sí
puede especificarse la inclusión (‘+’) o exclusión
(‘-’) de ciertas palabras en los resultados. Para indicar
la búsqueda de una frase, ésta ha de escribirse entre
comillas. Altavista permite además la búsqueda de
texto en ciertas partes del documento (título, nombre del
fichero de las imágenes, texto de los enlaces, etc.), así
como restringir o excluir la búsqueda en un determinado dominio
o host.
En la búsqueda avanzada sí se pueden utilizar los
operadores and, or y not, así como el operador de adyacencia
near. También nos permite realizar una restricción
por intervalos de tiempo o fechas. En el siguiente Interfase continuamos
con el tema. La dirección arulfo@uv.mx está disponible
para comentarios, sugerencias, y demás.
*La bibliografía para la elaboración de este artículo
fue proporcionada por la Adelaida Delgado Domínguez, maestra
de la Universidad de las Islas Baleares en Palma de Mallorca (España).
|
|
|
|
|
|