Año 2 • No. 62 • mayo 20 de 2002 Xalapa • Veracruz • México
Publicación Semanal


 Páginas Centrales

 Compromiso Social

 Información General

 Date Vuelo

 Arte Universitario

 Foro Académico

 Halcones al Vuelo

 Contraportada


 Números Anteriores


 Créditos

 

 

  Los buscadores de información en Internet
Interfase: ¿Cómo funcionan y cuáles
son los más comunes?
Alejandro Rulfo Méndez
Los motores de recuperación de información en Internet, son pequeños grandes programas que localizan temas, nombres y el ordenamiento de caracteres a una velocidad impresionante entre miles de servidores distribuídos e todo el mundo. Es tan simple como introducir en un espacio específico el tema o palabra que buscamos y de ahí, determinar algunos criterios –o ninguno– en la selección del tema y de inmediato obtenemos una respuesta.
El Ask Jeeves español se conoce también como Pregunta.com (http://www.pregunta.com). El usuario introduce su pregunta en lenguaje natural (en español) en el campo de texto y el sistema le responde presentando:
a) Una o más preguntas relacionadas con la suya para las cuales tiene respuesta. El usuario escoge aquella pregunta que considera que más se aproxima a la suya, y entonces el sistema le muestra la página web que contesta a tal pregunta. En algunos casos las preguntas del sistema contendrán una lista de elementos y el usuario deberá escoger uno de ellos para completar la pregunta.
b) Una lista de sitios que les han parecido interesantes a algunas personas con preguntas similares.
c) Un menú desplegable con las correspondencias que le ha proporcionado el metabuscador MetaCrawler.
Además Pregunta.com también ofrece un directorio de categorías para explorar mediante navegación. Al igual que sucede con Yahoo!, se utiliza el símbolo ‘@’ para indicar las referencias cruzadas. Cuando llegamos a las hojas de ese árbol de navegación, los resultado que nos muestra Ask Jeeves son una selección, según cierto criterio de popularidad, extraída del directorio Open Directory (http://dmoz.org/World/Espa%f1ol/), el directorio más completo de la Web que ha sido creado por editores voluntarios.

fast (http://www.alltheweb.com)

Para abril del 2001, fast es el segundo buscador en cuanto a tamaño (575 millones de páginas indexadas). Tanto la búsqueda simple como la avanzada de fast nos facilita el uso de operadores booleanos mediante la indicación de que busque “all of the words” (operador and) o bien “any of the words” (operador or). También en ambos casos podemos buscar la frase exacta.
Los filtros de palabras de la búsqueda avanzada nos permiten especificar nuestra consulta con mayor detalle, pudiendo añadir palabras que deseemos incluir “must include” o excluir “must not include” de los resultados.
También podemos utilizar los filtros para dar más relevancia a aquellos documentos que contengan ciertas palabras “should include”.
Los filtros de dominio nos permiten especificar qué dominios, de primer o segundo nivel, deseamos considerar o excluir en nuestra búsqueda. Eso nos permite centrar nuestra búsqueda en una organización, por ejemplo “only include uv.mx” restringiría la búsqueda a cualquiera de los servidores web de otras universidades. fast permite también indicar cuántos resultados queremos visualizar por página (10, 25, 50, 75 ó 100).

Altavista (http://www.altavista.com)

Para abril del 2001, AltaVista es el tercer buscador en cuanto a tamaño (550 millones de páginas indexadas) y el segundo buscador más utilizado (50 millones de consultas diarias).
Tenemos la posibilidad de usar el buscador restringido a España (http://es-es.altavista.com/), pudiendo además seleccionar el idioma de la búsqueda. Altavista ofrece una búsqueda simple y una avanzada con sintaxis diferentes. En el caso de la búsqueda simple, AltaVista utiliza un algoritmo de puntuación para determinar el orden en el que aparecen los documentos encontrados en la página de resultados. Cada documento obtiene una puntuación según la cantidad de términos de la búsqueda que contiene, según el lugar que ocupan las palabras en el documento y según la proximidad que existe entre ellas. No se permite el uso de los operadores boléanos (and, or y not), sin embargo sí puede especificarse la inclusión (‘+’) o exclusión (‘-’) de ciertas palabras en los resultados. Para indicar la búsqueda de una frase, ésta ha de escribirse entre comillas. Altavista permite además la búsqueda de texto en ciertas partes del documento (título, nombre del fichero de las imágenes, texto de los enlaces, etc.), así como restringir o excluir la búsqueda en un determinado dominio o host.
En la búsqueda avanzada sí se pueden utilizar los operadores and, or y not, así como el operador de adyacencia near. También nos permite realizar una restricción por intervalos de tiempo o fechas. En el siguiente Interfase continuamos con el tema. La dirección arulfo@uv.mx está disponible para comentarios, sugerencias, y demás.
*La bibliografía para la elaboración de este artículo fue proporcionada por la Adelaida Delgado Domínguez, maestra de la Universidad de las Islas Baleares en Palma de Mallorca (España).