Búsqueda y Recuperación de la Información
|
Búsqueda y Recuperación de la Información. Es el paso que sigue a la determinación de las necesidades informativas. Se puede recuperar a través de diferentes herramientas: bases de datos, Internet, tesauros, ontologías. Conocer y manejar estas herramientas contribuye a una recuperación de calidad. Contempla las actividades intelectuales y los mecanismos necesarios para obtener la información deseada de modo eficiente.
Sumario
- 1 Caracterización
- 2 Variables generales
- 3 Tipos de búsqueda de información
- 4 Proceso de búsqueda de información relevante
- 5 Etapas del proceso de búsqueda de información
- 6 Estrategia de búsqueda
- 7 Expresiones de búsqueda
- 8 Formulación y tácticas de búsqueda
- 9 Los operadores y sus tipos
- 10 Evaluación de los resultados de la búsqueda
- 11 Fuentes
Caracterización
Proceso donde se realizan una serie de actividades orientadas a buscar y encontrar información relevante que ayude a satisfacer una necesidad de información. El proceso se lleva a cabo mediante consultas a la base de datos donde se almacena la información estructurada, mediante un lenguaje de interrogación adecuado.
La Búsqueda y Recuperación de la Información (BRI) es un tema que se hace cada día más relevante, la enorme cantidad de volúmenes de datos y recursos de información disponibles en Internet, la disparidad en las calidades de los contenidos y la dificultad de encontrar información relevante con cierta rapidez y eficiencia, ponen de manifiesto la necesidad de hacer más efectiva la búsqueda y recuperación de la información en diferentes fuentes, con el objetivo de encontrar la información verdaderamente relevante y pertinente a la necesidad informativa.
El acceso a la información se debe realizar sobre la base de sólidos conocimientos de las herramientas y mecanismos de búsqueda y recuperación; si no es así, a pesar de disponer de una gran cantidad de datos estos no se llegarán a convertir nunca en información que se pueda integrar como conocimiento.
Variables generales
- Colección de documentos o bases de datos
- Representación de la información
- Usuarios
- Consultas y estrategias de búsqueda
- Intermediarios de búsqueda
- Proceso de búsqueda
- Evaluación de la recuperación
Tipos de búsqueda de información
Considerando las diferentes necesidades y expectativas de información de los usuarios, Rosenfeld (1998) identifica cuatro tipos de búsqueda:
- Búsqueda de elemento conocido: consiste en una búsqueda acotada. Cuenta con preguntas (queries) bien definidas y con pocas alternativas de (o sólo una) respuesta posible. Habitualmente se conoce dónde buscar y es el tipo de búsqueda más sencillo.
- Búsqueda de existencia: en este tipo de búsqueda existe una respuesta clara, pero se desconoce cómo realizar adecuadamente la pregunta. Se trata habitualmente de una búsqueda de información en que el valor del contexto es muy importante y suele tratarse de temas complejos que articulan distintas variables o de temas poco conocidos.
- Búsqueda exploratoria: se trata de una búsqueda en la que se desconoce exactamente lo que se quiere encontrar. En este caso el tema de búsqueda es amplio y por ende no existe una pregunta definida. Habitualmente, la expectativa es conocer algo en términos generales o introducirse en un tema.
- Búsqueda global: el objetivo de esta búsqueda es conocer con profundidad un tema. Se trata de inspeccionar todos los aspectos y detalles de una materia, para lo cual habrá que formular la pregunta combinando variables en las que la query incluya términos asociados”.
Estos tipos de búsqueda no son estáticos, durante el proceso podrán variar las necesidades de información, con lo cual el tipo de búsqueda a realizar cambiará de manera correspondiente o pueden darse situaciones en las que se combinen diferentes tipos de búsquedas.
Proceso de búsqueda de información relevante
Es muy importante "tener acceso a la información relevante", así como ser capaz de "descartar la irrelevante". La necesidad de encontrar información pertinente, precisa y en el momento oportuno, en el volumen de documentos cada día más creciente, que además son heterogéneos, provoca la necesidad de estar bien preparados en el proceso de búsqueda y manejo de la información, así como poseer la capacidad de localizar, evaluar y utilizar eficazmente la información requerida. La capacidad para acceder a la información relevante de manera eficiente es un elemento esencial de la alfabetización informacional.
El nuevo paradigma tecnológico a partir del surgimiento de los ambientes virtuales del acceso a la información, permite realizar el manejo de la información equivalente al que tiene lugar en la realidad presencial, aunque desligadas de muchos de los condicionamientos que imponen los parámetros espacio-tiempo.
Este nuevo entorno comunicativo e informacional que se deriva de la aplicación de nuevas tecnologías plantea nuevos problemas: la búsqueda y el acceso a la información debe ser eficaz, rápido y sencillo. También es deseable que en el mismo entorno se integren diferentes tipos de la información: texto escrito, la voz, la imagen, la gráfica.
Etapas del proceso de búsqueda de información
En las actividades cotidianas, donde el propósito de una búsqueda de información es la de responder una pregunta sencilla, usualmente no se lleva a efecto un proceso complejo en que puedan identificarse etapas. No obstante, en tareas más difíciles, cuando para satisfacer los requerimientos informativos es necesario adquirir nuevos conocimientos, el proceso de búsqueda de información puede ser analizado en seis etapas: iniciación, exploración, selección, formulación, recopilación y presentación.
Cada una de estas etapas presenta patrones comunes de pensamiento, sentimiento y acción. Los nombres de las etapas representan la tarea principal en cada momento del proceso. Aunque la secuencia de tareas puede ser más reiterativa que estrictamente lineal, el proceso transcurre de su iniciación a su terminación.
Estrategia de búsqueda
La ejecución de la consulta no es un proceso banal y sencillo. La falta de un plan de acciones, pensado previamente y aplicado a la hora de ejecutar esta operación dificulta la búsqueda. Este plan ideal llamado “estrategia de búsqueda” es el que debe acompañar todo el proceso. Una estrategia de búsqueda es un plan desarrollado de interrogación a la base de datos para dar respuesta a una demanda de información.
La búsqueda de información es un proceso interativo y comprende la realización sucesiva de varias sesiones de trabajo, que deben ser bien planeadas antes de llevarse a efecto.
El primer paso en el proceso de búsqueda de información es delimitar claramente cuáles son las necesidades de información, es decir, plantear la pregunta sobre lo que se desea conocer. La pregunta se formula primeramente en lenguaje natural y luego debe “traducirse” a los términos adecuados para la base de datos utilizada y en una sintaxis válida para el Sistema de Recuperación de Información (SRI) empleado.
Expresiones de búsqueda
Las demandas planteadas al SRI se denominan “expresiones de búsqueda”. Estas expresiones están formadas por los términos de búsqueda, vinculados mediante operadores que son los encargados de expresar las relaciones que mantienen entre sí los términos que pueden definir las necesidades informativas del usuario y deben reflejar adecuadamente los contenidos que se pretenden recuperar.
Formulación y tácticas de búsqueda
La representación de una necesidad mediante el empleo de diversas expresiones, combinadas para obtener un resultado único final, se denomina “formulación de búsqueda”. Estas pueden plantearse en diversos niveles de complejidad. Las acciones desarrolladas durante la búsqueda de información se denominan “tácticas de búsqueda”.
Los operadores y sus tipos
Los operadores expresan las relaciones que mantienen entre sí los términos que definen las necesidades informativas del usuario. La utilización de operadores en un lenguaje de interrogación aumenta la precisión en la búsqueda y se distinguen diferentes tipos, entre ellos: operadores lógicos o booleanos: permiten convertir las relaciones entre conceptos como relaciones entre conjuntos. Las ecuaciones de búsqueda pueden transformarse en ecuaciones matemáticas, que ejecutan operaciones sobre los conjuntos, lo que da como resultado otro conjunto. Son los más utilizados en numerosos sistemas y las operaciones lógicas básicas que permiten son:
- Intersección o producto de conjuntos (AND / Y): operador que indica que deben estar incluidos en los resultados de la búsqueda los términos unidos por esta partícula. Es un operador restrictivo, puesto que elimina aquellos documentos en los que no aparecen todos los términos de la expresión de búsqueda.
- Unión o suma de conjuntos (OR / O): indica que cualquiera de las palabras que estén unidos por este operador deben aparecer en el documento, las restantes no tienen que estar presentes. Es un operador de ampliación, pues sólo deberá aparecer uno o alguno de los términos de la expresión de búsqueda.
- Exclusión, resta o negación de conjuntos (NO / NOT): operador que excluye de un documento la palabra no deseada. Es un operador de restricción, pues se seleccionan aquellos documentos que contienen el primer término de búsqueda, pero no el segundo.
A su vez estos operadores pueden combinarse entre sí, generando operaciones más complejas. Por ello es necesario conocer el sistema para saber las prioridades a la hora de su ejecución. A menudo, estas prioridades vienen marcadas por el uso de paréntesis, de manera que se ejecuta en primer lugar el operador que une los términos que están entre paréntesis. Operadores posicionales': Toman como punto de partida la consideración del valor significativo del término dentro del documento y permiten especificar la posición de las palabras dentro del contexto. Se dividen en dos tipos:
- Posicionales absolutos: son aquellos que permiten buscar un término en un lugar dado del documento, por lo general son operadores de campo, es decir, permiten fijar en qué campo o campos presentes en la estructura de la base de datos debe aparecer el término buscado, por ejemplo en el campo título, autor, url, etc.
- Posicionales relativos: también llamados de proximidad o adyacencia, se trata de operadores que permiten establecer la posición de un término respecto a otro dado, o sea términos que estén juntos, separadas por varias palabras o caracteres, que se encuentren en una misma frase o un mismo párrafo. Existe una gran variedad de operadores de adyacencia:
- Cerca (NEAR y NEAR/N, aquí N es sustituido por la distancia en palabras que deben estar separados los términos de búsqueda).
- Junto (ADJ).
Operadores de truncamiento: este tipo de operador permite la posibilidad de cortar o truncar una palabra de búsqueda. Puede utilizarse en situaciones en las cuales sea necesario utilizar no un término simple, sino también sus derivados, fijados por prefijación o sufijación. Su presencia puede sustituir a un carácter o a un conjunto de caracteres, situados a la izquierda, dentro o a la derecha del término en cuestión. Se representa normalmente por símbolos como *, $. Operadores de comparación: Especifican el rango de búsqueda, fijando unos límites para la misma que pueden ser numéricos o alfabéticos, correspondiendo los operadores a formas del tipo “mayor que”, “menor o igual que”.
En los sistemas de recuperación actuales es posible encontrar todos estos tipos de operadores que pueden combinarse entre sí en la elaboración de ecuaciones búsqueda complejas para reflejar con bastante precisión los conceptos y sus relaciones. La combinación de los operadores debe respetar un conjunto de reglas del sistema que establecen las prioridades y formas de ejecución de ecuaciones complejas.
Evaluación de los resultados de la búsqueda
Los resultados obtenidos deben ser evaluados respecto a los objetivos que motivaron la búsqueda de información. Esta depende de las respuestas que se deriven de las preguntas siguientes:
- ¿Fueron satisfechas las necesidades informativas que motivaron la búsqueda?
- ¿En qué medida se obtuvo la información requerida?
- ¿Se recuperó la mayor parte de la información requerida o solamente una parte mínima?
- ¿Se obtuvieron resultados satisfactorios en el tiempo disponible?
- ¿Los costos y esfuerzos produjeron beneficios adecuados?
Para poder dar respuesta a esas preguntas debe haberse alcanzado una clara comprensión del problema que originó la demanda, y una precisa determinación del tipo de información que se requiere. A partir de ese conocimiento se ha de evaluar cuáles de los registros recuperados son adecuados para cubrir la necesidad de información.
A la propiedad de un registro de proporcionar información útil para la satisfacción de la demanda se le denomina RELEVANCIA. La relevancia de los registros recuperados puede medirse en relación con la formulación de búsqueda (efectividad del sistema) o con la satisfacción del usuario (pertinencia).‘‘‘ Los resultados de una búsqueda se pueden valorar cuantitativamente utilizando los parámetros: Precisión y el Recobrado.
Fuentes
- Sokol, Natalia. (2008). Búsqueda y Recuperación de la Información. La Habana, Cuba: Editorial Félix Varela. 61p.