WooRank of recuperacioninformacion2011.blogspot.com

Recuperación de información

domingo, 6 de febrero de 2011

RECUPERACIÓN DE INFORMACIÓN Vs EXTENSIONES DE FORMATOS

Para poder tener una óptima Recuperación de Información debemos identificar las diferentes extensiones en las que se pueden encontrar los archivos donde reposa la información aquí encontraremos algunos formatos en los que iremos trabajando atraves de este semestre y les iremos informando en nuestras notas:
·         .EML
·         .HTML
·         .TXT
·         .MBOX
·         .CBR
·         .JAR
·         .PDB
·         .EPUB
·         .CHM
    

EML: extensión de archivo es más comúnmente asociado con un correo electrónico de Outlook Express (Correo Electrónico) archivo. EML archivos de texto plano son archivos que se usan para almacenar un mensaje de correo electrónico, y al mismo tiempo que son utilizadas principalmente por Microsoft Outlook Express, la mayoría de los otros clientes de correo electrónico puede importar y leerlos.
EML archivos están estructurados en el mismo formato que MHT (MIME HTML), lo que significa que también puede ser abierto en los navegadores web como Internet Explorer, Mozilla Firefox y Opera. EML archivos también pueden contener enlaces o archivos adjuntos vinculados, por lo que si bien no plantean ningún riesgo a sí mismos, pueden vincular a programas maliciosos, tales como virus o spyware, por lo que debe tenerse cuidado al abrir archivos EML, en particular, de remitentes desconocidos.

HTML es el acrónimo de HyperText Markup Language (Lenguaje de Marcado de Hipertexto) y es el lenguaje que se utiliza para crear las páginas web. Este lenguaje indica a los navegadores cómo deben mostrar el contenido de una página web.
El lenguaje html contiene dos partes:
El contenido, que es el texto que se verá en la pantalla de un ordenador,
Y las etiquetas y atributos que estructuran el texto de la página web en encabezados, párrafos, listas, enlaces, etc. y normalmente no se muestra en pantalla. Las etiquetas, que son un conjunto de caracteres que rodean partes del documento, están formadas por el símbolo

TXT: Los archivos de texto plano (en inglés plain text) son aquellos que están compuestos únicamente por texto sin formato, sólo caracteres. Estos caracteres se pueden codificar de distintos modos dependiendo de la lengua usada. Algunos de los sistemas de codificación más usados son: ASCII, ISO-8859-1 o Latín-1, Unicode, etc...
Se les conoce también como archivos de texto llano, o texto simple, por carecer de información destinada a generar formatos (negritas, subrayado, cursivas, tamaño, etc.) y tipos de letra (por ejemplo, Arial, Times, Courier, etc.). El término texto plano proviene de una traducción literal del término inglés plain text, término que en lengua castellana significa texto simple o texto sencillo.
MBOX: es un término genérico para una familia de formatos de fichero que se usan para almacenar conjuntos de correos electrónicos. Todos los mensajes en un buzón mailbox están concatenados en un único fichero. El principio de cada mensaje está marcado por una línea que empieza por las cinco letras "From" (Desde), y una línea en blanco marca el final. Durante un tiempo el formato mbox fue popular debido a que las herramientas de procesado de archivos de texto se podían usar muy fácilmente sobre el archivo de texto usado para almacenar los mensajes.


CBR: Esto es una forma de visualizar libros y comic. Un fichero comprimido en .CBR no es otra cosa que una carpeta llena de imágenes, de páginas escaneadas por un freak y puestas a disposición del público en la red.

·                     ¿Cómo se abre?
·                     Se puede abrir con el WinRar de toda la vida (cambiando la extensión del fichero a abrir a .RAR)
·                     (Para cambiar extensiones de ficheros primero hay que verlas:
·                     En una carpeta: Herramientas | Opciones de Carpeta | Ver | Ocultar las extensiones para archivos…
Otra opción es hacerse con un programa de lectura de cómics. Si te has descargado un comic por Internet (comprimido en RAR) y lo abres y lo “lees”, te pasarás un buen rato desplazando ratón o las barras para “centrar” las viñetas, amén del fastidioso plan de cambiar de página.

JAR: Extensión de archivo JAR es más comúnmente asociado con un archivo de Java, que a menudo se utiliza para envasar y distribuir las clases Java y metadatos en entornos de desarrollo. JAR también se puede encontrar a contener temas y add-ons para Mozilla Firefox navegador web o cliente de correo Thunderbird.
JAR se puede abrir por abrir el archivo en una máquina con el entorno de ejecución Java instalado, que está disponible en Windows, Solaris, Mac y Linux plataformas. JAR también puede ser abierto en los navegadores web con soporte Java. Alternativamente, JAR paquetes se pueden abrir cualquier archivo utilizando el software con la capacidad y descomprimir el contenido extraído, aunque la mayoría de los recursos ya están compilados y, por tanto, no legible por humanos

PDB: Extensión de archivo APP es más comúnmente asociado con archivos de base de datos de Palm Desktop. AP archivos son un formato estándar utilizado por un número de diferentes aplicaciones que se ejecutan en los PDA de Palm. La extensión de archivo AP también puede referirse a un programa de archivo de base de datos, que pueden contener ya sea definida por el usuario o la aplicación específica de los datos. Aunque menos comunes, archivos PDB puede referirse a los archivos del Banco de Datos de Proteínas, que almacenan las coordenadas 3D de los átomos dentro de los compuestos químicos. Varios Palm uso de aplicaciones basadas en archivos PDB, y puede contener datos tales como la palabra procesa documentos, hojas de cálculo, bases de datos o imágenes.

EPUB: ePub – es un nuevo estándar de libros digitales de código abierto creado por el International Digital Publishing Forum (IDPF ). EPUB esta basado en XML y es apoyado por la mayoría de empresas del sector de la publicación. La mayor ventaja de ePub es que su contenido adapta automaticamente al tamaño de la pantalla, o mejor decir que ePub es un formato readaptable.

CHM Decoder es una sencilla herramienta que sirve para decompilar archivos de ayuda HTML (de extensión .chm). El programa extrae todos los archivos fuente HTML en una nueva carpeta, y opcionalmente genera un práctico arbol de navegación Java para movernos con mayor fluidez.

Una utilidad como CHM Decoder resulta francamente útil a la hora de convertir CHM a HTML, por ejemplo para publicar en web o visualizar nuestro trabajo en cualquier dispositivo que no tenga soporte para el formato CHM.

No podemos pasar por alto tampoco dos opciones que aumentan notablemente la funcionalidad y facilidad de operación del programa: CHM Decoder tiene soporte para línea de comandos, y también para procesar muchos archivos al mismo tiempo (procesamiento por lotes).

No hay comentarios:

Publicar un comentario