WooRank of recuperacioninformacion2011.blogspot.com

Recuperación de información

viernes, 8 de abril de 2011

LOS DOCUMENTOS DE TEXTO Y SU ESTRUCTURA.

Es una lectura bastante interesante ya que nos permite analizar de una manera más global la importancia de los documentos, sus caracteristicas y cada uno de sus complementos, además de eso nos cuenta lo interesante de los metadatos y sus caracteristicas, teniendo en cuenta los lenguajes de marcado y como se debe hacer la búsqueda de información en los documentos de texto, teniendo en cuenta las necesidades de información de los usuarios y cómo realizan la búsqueda para suplir dicha necesidad.

LOS DOCUMENTOS DE TEXTO Y SU ESTRUCTURA
El proceso del conocimiento, de alguna forma, necesita ser comunicado o trasmitido y el texto es la principal manera en que esto puede ser logrado. Un documento se considera como una unidad de información digitalizada, con un contenido específico, contiene texto codificado, audio y video. Texto se define como un conjunto de símbolos consecutivos con una sintaxis determinada que comunica algún conocimiento con un estilo específico.
Un documento puede contener o no una estructura asociada, donde se habla de documentos estructurados y documentos no estructurados, e incluso otra clasificación de documentos semiestructurados. Los documentos hacen uso de los metadatos para definir su estructura y son expresados en lenguaje de marcado.
Tipos de documentos según su estructura:
-Estructurados: contienen información tabulada, está grabada en una base de datos o un archivo.
-Semiestructurados: datos que carecen de rigidez, cambios constantes en el esquema. Es posible marcar los datos de un documento de texto, agregar nuevos datos, marcar los documentos y dividir sus datos.
-No estructurados: cualquier tipo de texto, en formato delimitado. Esto significa que las partes de un documento de texto no pueden ser diferenciadas a un nivel básico, el documento en sí funciona como un único dato en la interfaz. Este tipo de documento se hace necesario transformarlo, para que pueda ser manipulado y obtener de él la información necesaria, rápida y precisa.
METADATOS
Los tratamientos de información llevan consigo los metadatos, definidos normalmente como una información de la manera en que se organizan los datos de un documento. Resumido en la frase “los metadatos son datos acerca de los datos”, “información acerca de la información”. Los tres aspectos fundamentales de los metadatos son: la funcionalidad, el contexto y el interlocutor (hombre o máquina).
Formatos y aplicaciones de los metadatos: Se puede hablar de un formato de metadatos MARC, el cual es uno de los más usados para los registros de bibliotecas, con diferentes campos para definir atributos de una entrada bibliográfica. También está el conjunto de elementos de metadatos “Dublín Core” define 15 campos para describir un documento. Está el estándar RDF, que consiste en una descripción de nodos en la red.
Metadatos descriptivos Vs metadatos semánticos: tipos de metadatos, según su clasificación: “metadatos administrativos o factuales”, “metadatos estrictamente descriptivos”, “metadatos independientes y dependientes del contenido”, “metadatos basados en el contenido directo”, “metadatos descriptivos del contenido”, “metadatos independientes del dominio” y “metadatos de un dominio específico”.
LENGUAJES DE MARCADO: Básicamente consiste en elementos nuevos dentro del texto que ayudan a describir la información, estos elementos tienen un modo de empleo definido que se conoce como lenguaje de marcado, este lenguaje es el SGML y de él se deriva el XML, como un subconjunto, su importancia radica en entender específicamente XML.
LA BÚSQUEDA DE INFORMACIÓN EN LOS DOCUMENTOS DE TEXTO
La enorme cantidad de información, hace necesario disponer de algún mecanismo que satisfaga todas las necesidades de información de cierto usuario, siendo necesario disponer de la información adecuada en un tiempo adecuado.
Necesidades de información: dentro de los metadatos, se enumeran una serie de necesidades de información, que satisfacen la búsqueda dentro de esos formatos. El usuario necesita reconocer la existencia de recursos, para recuperar o descubrir fuentes de información. El usuario que utiliza la red, debe disponer de amplia información. El usuario debe conocer la propiedad intelectual del documento y conocer las condiciones de acceso al mismo, como usuario consumidor.
Recuperación de información Vs extracción de información: a la hora de trabajar con documentos de texto, consiste en encontrar de entre una gran cantidad de estos documentos, aquellos que se ajusten a una necesidad de información específica. Dentro de la recuperación de información, se obtiene un conjunto de documentos relevantes para una consulta y se analizan los documentos, y la extracción de la información obtiene características o hechos de los documentos, estas características, son equivalentes a los metadatos.

LOS DOCUMENTOS DE TEXTO Y SU ESTRUCTURA. Texto tomado de Resumen de Andrea Yesenia Martínez Cely. [En línea]. Disponible en:  http://uvirtual.lasalle.edu.co/file.php/562/Bibliografia/LOS_DOCUMENTOS_DE_TEXTO_Y_SU_ESTRUCTURA.pdf

No hay comentarios:

Publicar un comentario