WooRank of recuperacioninformacion2011.blogspot.com

Recuperación de información

jueves, 10 de marzo de 2011

LA EXPANSIÓN DE CONSULTAS EN RECUPERACIÓN DE INFORMACIÓN

Los experimentos en expansión de consultas se basan en métodos que permiten detectar, a partir de la consulta de un usuario, aquello que constituye el núcleo de la consulta (la necesidad informativa del usuario) para expandirla con variantes y encontrar así aquellos documentos que aporten la información más relevante. La primera dificultad con la que se encuentran estos experimentos es precisamente que la consulta no suele ofrecernos suficientes datos para distinguir la información relevante de la relacionada temáticamente (Strzalkowski et al. 1999:136).
Durante los años 90, los métodos de expansión de consultas más usuales han sido la expansión únicamente por términos ( only-term expansion ) y la expansión de texto completo ( full-text expansion ). En el primer caso, la técnica probabilística establece un peso mayor para los términos frecuentes de documentos relevantes, y se suele completar con otros métodos automáticos, como la retroalimentación de relevancia ( relevance feedback method ), o con métodos manuales, como la intervención del usuario en la determinación de la relevancia. En el segundo caso, las consultas se expanden a partir de oraciones o de párrafos, extraídos de documentos considerados relevantes o no.
En los dos casos, el reto más importante es llegar a controlar el contenido semántico y pragmático, que no siempre es explícito a través de las formas de los textos. El procesamiento del lenguaje natural necesita aún bastante desarrollo en representación semántica y pragmática, para evitar que las expansiones partan simplemente de la identificación de unidades léxicas y del establecimiento de correlaciones con variantes morfológicas, equivalentes interlingüísticos o combinaciones léxicas, pero se ha avanzado bastante en los últimos años. En el proyecto RICOTERM-2 nos proponemos abordar el diseño del reelaborador de consultas sobre economía a partir de los dos métodos principales: la expansión a partir de términos y la expansión a partir de textos.

Expansión de consultas a partir de textos
Los sistemas basados en la expansión de consultas a partir de textos suelen presentar unos resultados de satisfacción sobre un 40% de precisión (Strzalkowski et al. 1999:136), resultados demasiado bajos para usuarios-profesionales que buscan información específica y que tienen expectativas muy distintas a los usuarios comunes que simplemente navegan por la red. Además de la compleción y verificación de la búsqueda a través de la intervención manual del usuario o mediante técnicas automáticas, las soluciones propuestas para mejorar los resultados se basan fundamentalmente en criterios de restricción sobre los textos utilizados en la expansión:
  • Restricción estructural: un conjunto estructurado de textos.
  • Restricción temática: únicamente documentos de un determinado ámbito.
Expansión de consultas a partir de ontologías
Los sistemas de expansión de consultas que, en los últimos años, están mejorando ostensiblemente sus resultados son los que interactúan con ontologías o jerarquías léxicas. Las ontologías son construcciones formales que representan nodos conceptuales y expresan las relaciones conceptuales que establecen entre sí. Su complejidad y su atomización suele ser mayor que en el caso de los tesauros, ya que su finalidad no es clasificar documentos y localizarlos, sino que se construyen con el fin de ordenar "los conceptos del mundo" [3] y relacionarlos con las expresiones lingüísticas que los vehiculan. Nos referiremos más adelante a los problemas teóricos y aplicados que presentan la construcción de ontologías, pero veamos ahora qué han aportado las ontologías a los sistemas de expansión de consultas.
Cada vez son más las voces que califican la utilización de una ontología para la recuperación de información como un método eficaz, que puede superar a otros métodos en precisión y relevancia. Los sistemas de expansión de consultas que utilizan ontologías, o alternativamente tesauros, se basan en el criterio de expansión de términos o expansión léxica ( only-term expansion ), es decir que a partir del léxico identificado como relevante en un documento se establecen correlaciones con conceptos u otras unidades léxicas que representan estos conceptos o conceptos afines. Desde un punto de vista lingüístico, podríamos decir que a partir de una palabra, un sintagma o un conjunto de palabras de la consulta, el sistema buscaría en la ontología otras palabras o sintagmas que expresaran conceptos próximos. Esta proximidad se correspondería, en lingüística y por regla general, con sinónimos o variantes, con hiperónimos o clases de conceptos, y con cohipónimos o conceptos que pertenecen a una misma clase; difícilmente encontraremos en este tipo de sistemas otro tipo de relaciones conceptuales como las de causalidad o de secuencia temporal.

LA EXPANSIÓN DE LAS CONSULTAS EN INTERNTE. [Término de búsqueda]. [En línea]. Disponible en: http://www.hipertext.net/web/pag259.htm

1 comentario:

  1. Es interesante saber como son las consultas que haceb los usuarios a traves de la red, y a su vez como son clasificadas, de acuerdo a cada necesidad del usuario, además esto permite evaluar con mayor exactitud la calidad de información que se encuentra en la internet.

    ResponderEliminar