Diferencia entre revisiones de «Odt2txt»
| Línea 1: | Línea 1: | ||
| − | |||
{{Mejorar}} | {{Mejorar}} | ||
{{Ficha_Software | {{Ficha_Software | ||
| Línea 5: | Línea 4: | ||
|imagen= | |imagen= | ||
|descripción= Un convertidor | |descripción= Un convertidor | ||
| − | + | |creador= | |
|desarrollador= | |desarrollador= | ||
|lanzamiento inicial= | |lanzamiento inicial= | ||
| Línea 20: | Línea 19: | ||
== Características == | == Características == | ||
| − | + | Aplicación. odt2txt es una herramienta en [[Linux]]para ser utilizada mediante la líena de comando desde una terminal, el cual extrae textos de un documento ODT, como los producidos por OpenOffice.org, KOffice, StarOffice entre otros. | |
Puede también extraer texto de varios archivos con formatos similares al ODT, | Puede también extraer texto de varios archivos con formatos similares al ODT, | ||
como pueden ser OpenOffice.org XML(*.sxw), cual fue usado por OpenOffice.org | como pueden ser OpenOffice.org XML(*.sxw), cual fue usado por OpenOffice.org | ||
| − | versión 1.x y versiones mayores del StarOffice. También puede ser útil para extraer contenidos de documentos de hoja de cálculos(*.ods) y documentos de | + | versión 1.x y versiones mayores del StarOffice. También puede ser útil para extraer contenidos de documentos de hoja de cálculos(*.ods) y documentos de presentación (*.odp). |
| − | |||
| − | + | ==Opciones== | |
| − | |||
| − | |||
--width=WIDTH | --width=WIDTH | ||
| − | + | Permite encapsular los caracteres del texto a una anchura especificada. Por defecto el valor es 65, lo cual quiere decir que cualquier palabra que se extienda mas allá de la columna 65 es movido para una nueva linea. | |
| − | |||
| − | que se extienda mas allá de la columna 65 es movido para una nueva linea. | ||
| − | |||
| − | |||
Si WIDTH es modificado y puesto en -1 entonces ninguna linea será dañada. | Si WIDTH es modificado y puesto en -1 entonces ninguna linea será dañada. | ||
| − | |||
| − | |||
--output=FILE | --output=FILE | ||
| − | + | Escribe la salida en un fichero especificado. | |
| − | |||
| − | |||
--subst=SUBST | --subst=SUBST | ||
| − | + | Remplaza caracteres extraños dependiendo de la entrada especificada. | |
| − | |||
Los valores válidos para SUBST son: all, some y none. | Los valores válidos para SUBST son: all, some y none. | ||
| + | --subst=all | ||
| − | + | Substituye todos los caracteres por el cuál la substitución sea conocida. | |
| − | |||
| − | |||
| − | conocida. | ||
| − | + | --subst=some | |
| − | + | Substituye todos los caracteres en el cual la salida no contiene el que tiene por defecto. | |
| − | + | --subst=none | |
| + | No substituye ningún caracter. | ||
| − | |||
| − | |||
| − | |||
| − | |||
| − | |||
| − | |||
| − | |||
| − | |||
--encoding=X | --encoding=X | ||
| + | No intenta auto detectar la codificación de la terminal, pero convierte el documento hacia una codificación especificada, en que la codificación de la terminal estará usando el modo automático, usa --encoding=show. | ||
| − | |||
| − | |||
| − | |||
| − | |||
| − | |||
| − | |||
--raw | --raw | ||
| + | Imprime el XML puro. | ||
| − | |||
| − | |||
| − | |||
| − | |||
| − | |||
==Ejemplos de uso== | ==Ejemplos de uso== | ||
| Línea 94: | Línea 63: | ||
odt2txt --output=Ecured.txt Escritorio/Ecured1.odt | odt2txt --output=Ecured.txt Escritorio/Ecured1.odt | ||
| − | + | En este caso “Ecured.txt” es el fichero que se generará con el resultado devuelto por la línea antes mostrada. | |
odt2txt –encoding=show | odt2txt –encoding=show | ||
| − | + | Insertando lo anterior en una terminal le muestra la codificación que tiene activada en mi caso me devolvió UTF-8. | |
odt2txt --encoding=ISO-8859-1 Escritorio/Ecured1.odt | odt2txt --encoding=ISO-8859-1 Escritorio/Ecured1.odt | ||
| − | + | La línea anterior devuelve el documento “Ecured1.odt” en texto plano utilizando el estándar de codificación ISO-8859-1. | |
odt2txt --output=ecuredall.txt --subst=all Escritorio/Ecured1.odt | odt2txt --output=ecuredall.txt --subst=all Escritorio/Ecured1.odt | ||
| − | + | En este caso remplazo todos los caracteres extraños conocidos(ej: remplazo « » por << >>, ü por uu, etc) que tienen el documento “Ecured1.odt” y lo salvo en el fichero “ecuredall.txt”. | |
odt2txt --output=ecuredxml.txt --raw Escritorio/Ecured1.odt | odt2txt --output=ecuredxml.txt --raw Escritorio/Ecured1.odt | ||
| − | + | En éste extraigo en formato xml puro todo el documento “Ecured1.odt” y lo guardo en el fichero “ecuredxml.txt”. | |
==Licencia== | ==Licencia== | ||
| − | Usted puede redistribuirlo y/o modificado con | + | Usted puede redistribuirlo y/o modificado con algunos términos de la Licencia Pública General GNU, versión 2 publicada por la fundación de software libre. |
| − | algunos términos de la Licencia Pública General GNU, versión 2 publicada por la | ||
| − | fundación de software libre. | ||
==Fuente== | ==Fuente== | ||
| − | Ayuda y Soporte de Ubuntu | + | *Ayuda y Soporte de Ubuntu |
| − | http://stosberg.net/odt2txt/ | + | *http://stosberg.net/odt2txt/ |
[[Category:Software]] | [[Category:Software]] | ||
Revisión del 13:20 6 dic 2011
| ||||
odt2txt. Un simple convertidor de documentos con formatos ODT, convirtiendo estos a texto plano.
Características
Aplicación. odt2txt es una herramienta en Linuxpara ser utilizada mediante la líena de comando desde una terminal, el cual extrae textos de un documento ODT, como los producidos por OpenOffice.org, KOffice, StarOffice entre otros. Puede también extraer texto de varios archivos con formatos similares al ODT, como pueden ser OpenOffice.org XML(*.sxw), cual fue usado por OpenOffice.org
versión 1.x y versiones mayores del StarOffice. También puede ser útil para extraer contenidos de documentos de hoja de cálculos(*.ods) y documentos de presentación (*.odp).
Opciones
--width=WIDTH
Permite encapsular los caracteres del texto a una anchura especificada. Por defecto el valor es 65, lo cual quiere decir que cualquier palabra que se extienda mas allá de la columna 65 es movido para una nueva linea.
Si WIDTH es modificado y puesto en -1 entonces ninguna linea será dañada.
--output=FILE
Escribe la salida en un fichero especificado.
--subst=SUBST Remplaza caracteres extraños dependiendo de la entrada especificada. Los valores válidos para SUBST son: all, some y none.
--subst=all
Substituye todos los caracteres por el cuál la substitución sea conocida.
--subst=some
Substituye todos los caracteres en el cual la salida no contiene el que tiene por defecto.
--subst=none No substituye ningún caracter.
--encoding=X No intenta auto detectar la codificación de la terminal, pero convierte el documento hacia una codificación especificada, en que la codificación de la terminal estará usando el modo automático, usa --encoding=show.
--raw Imprime el XML puro.
Ejemplos de uso
odt2txt --width=100 Escritorio/Ecured1.odt
odt2txt --output=Ecured.txt Escritorio/Ecured1.odt En este caso “Ecured.txt” es el fichero que se generará con el resultado devuelto por la línea antes mostrada.
odt2txt –encoding=show Insertando lo anterior en una terminal le muestra la codificación que tiene activada en mi caso me devolvió UTF-8.
odt2txt --encoding=ISO-8859-1 Escritorio/Ecured1.odt La línea anterior devuelve el documento “Ecured1.odt” en texto plano utilizando el estándar de codificación ISO-8859-1.
odt2txt --output=ecuredall.txt --subst=all Escritorio/Ecured1.odt En este caso remplazo todos los caracteres extraños conocidos(ej: remplazo « » por << >>, ü por uu, etc) que tienen el documento “Ecured1.odt” y lo salvo en el fichero “ecuredall.txt”.
odt2txt --output=ecuredxml.txt --raw Escritorio/Ecured1.odt En éste extraigo en formato xml puro todo el documento “Ecured1.odt” y lo guardo en el fichero “ecuredxml.txt”.
Licencia
Usted puede redistribuirlo y/o modificado con algunos términos de la Licencia Pública General GNU, versión 2 publicada por la fundación de software libre.
Fuente
- Ayuda y Soporte de Ubuntu
- http://stosberg.net/odt2txt/