sábado, 2 de abril de 2022

Tutorial: ¿Cómo descargar y alinear los Diarios Oficiales de la Unión Europea? (actualización)


La descarga de los Diarios Oficiales de la Unión Europea (que ya comentamos anteriormente aquí) ha cambiado. Ahora, para obtener una versión alineada con estos útiles documentos utilizando petraREV es preciso seguir estos pasos:

1. Navega hasta la página donde se encuentran los diarios:

https://data.europa.eu/data/datasets/official-journals-of-the-european-union-2021?locale=en

2. Busca el idioma que desees (por ejemplo, ES para español y EN para inglés).

3. Para descargar los archivos, elige la opción Download que aparece junto a cada idioma y aparecerá un pequeño menú con dos opciones. Elige downloadURL para descargar un archivo txt con una lista con todos los archivos.

4. Abre el archivo con un editor de texto y reemplaza todas las ocurrencias de «","» por tabuladores y pégalo en un documento de texto.

5. Crea una tabla utilizando los tabuladores como separadores. Solo nos interesa la última columna, en la que aparecen cosas como:

http://publications.europa.eu/resource/cellar/35908f2f-5089-11eb-b59f-01aa75ed71a1.0006.02/zip

6. Pega esta columna en un documento de texto y ahora sustituye la marca de párrafo por « | wget». Debería quedar una única línea muy larga similar a la siguiente:

wget http://publications.europa.eu/resource/cellar/35908f2f-5089-11eb-b59f-01aa75ed71a1.0006.02/zip | wget http://publications.europa.eu/resource/cellar/10986470-5153-11eb-b59f-01aa75ed71a1.0006.02/zip | ...

7. Abre una terminal y dirígete a la ubicación donde deseas guardar los archivos. Pega esta línea y ejecútala. Comenzarán a descargarse los archivos.

8. Cuando la descarga haya terminado, descomprime los archivos. Es posible que la extensión de los archivos no sea la correcta, así que puede renombrar los archivos para cambiarla. Para ello, la manera más fácil suele ser eliminar primero todos los puntos de los nombres de los archivos y luego utilizar el patrón Número + .zip para definir el nombre de todos los archivos.

9. Cuando estén descomprimidos todos los archivos, borra los archivos .zip y los archivos .tif. En general, solo deben quedar archivos con formato xml.

10. Repite el proceso anterior para el otro idioma que quieres alinear. Al final, debes tener una carpeta con todos los archivos del idioma de origen y otra con todos los archivos del idioma de destino.

11. Una vez que todos los archivos se encuentren en una carpeta, abre petraRev y elige Herramientas → Revisar. En la pantalla de revisión, borra todas las operaciones con Marcar todo → Quitar. Ahora, escribe Alinear lotes de archivos y haz doble clic en esta operación para añadirla a la lista de operaciones.

12. Haz doble clic ahora en esta operación para configurar esta operación. Solo tienes que indicar dónde se encuentran la carpeta con los archivos de origen y la carpeta con los archivos de destino. Si lo deseas, también puedes indicar dónde quieres que se guarden los archivos alineados.

13. Haz clic en Revisar y, después de una breve espera, se alinearán los archivos y se cargarán en la herramienta. Puedes hacer clic en Archivo → Exportar para exportar la traducción al archivo que desees.

El archivo resultante será completamente funcional, pero para agilizar las búsquedas, puede ser interesante eliminar todas las repeticiones y, en lugar de exportarlo directamente, emplear la operación Dividir traducción para obtener archivos más pequeños. Por ejemplo, si se divide en 20 archivos, los archivos tendrán unos 10 MB de tamaño, lo cual es bastante razonable.

Y, si tienes alguna duda, no dudes en compartirla en los comentarios.

martes, 14 de enero de 2020

Tutorial: Cómo descargar la traducción completa de Ubuntu

Al participar en la traducción un texto, poder consultar la traducción ya realizada es de vital importancia, ya que no solo nos aseguraremos que somos coherentes con la terminología ya utilizada, sino que además nos podremos avanzar más rápido al no tener que repetir las búsquedas de terminología que otros traductores ya han llevado a cabo.

Para descargar la traducción completa de Ubuntu, podemos consultar la documentación de sobre traducciones de Ubuntu, donde se nos indica que hay que seguir estos pasos:
  1. Abrir la página principal de la traducción de la distribución. Por ejemplo, en el caso de Ubuntu 18.04 (Eoan Ermine) sería:
    https://translations.launchpad.net/ubuntu/eoan/
  2. Elegir la opción See all language packs.
  3. Descargar los paquetes completo y delta más recientes.

El archivo descargado tendrá un volumen considerable, ya que incluye todos los idiomas. Si solo nos interesa un idioma concreto, basta con descomprimirlo y eliminar todos los demás idiomas.

Para realizar las búsquedas, podemos utilizar cualquier herramienta que nos permita realizar búsquedas de texto. También podemos utilizar la página de búsqueda en traducciones de OpenTranslation o descargar petraREV, una herramienta que nos permite cargar archivos .po y realizar búsquedas avanzadas.

Búsquedas avanzadas en petraREV

martes, 21 de mayo de 2019

Descuartizando las búsquedas

¿Habéis tenido que hacer alguna vez una traducción Frankenstein? Es decir, una traducción en la que todo el texto ya figura en la memoria de traducción del cliente y basta con unir fragmentos de aquí y allá para que el texto final conserve el estilo de la traducción ya existente.


Por cómodas que puedan parecer estas traducciones, dado que la memoria de traducción resuelve la mayoría de los problemas, en ocasiones requieren más tiempo que una traducción a partir de cero a causa de la cantidad de búsquedas que hay que hacer. Si la terminología que utiliza la memoria no coincide con la que solemos utilizar, es fácil que tomemos decisiones de terminología y estilo que luego habrá que deshacer cuando nos demos cuenta de que el cliente, por ejemplo, tiene una opinión diferente sobre cómo traducir Failed to..., lo que nos obliga a volver atrás y cambiar decenas de segmentos, dejándonos con la duda de que se nos haya pasado por alto algún caso.

La solución está en buscar todo lo que pueda plantearnos alguna duda, lo que lamentablemente reduce la productividad. En concreto, cuando hay que que traducir términos o estructuras sintácticas compuestas por bastantes palabras, aún así es fácil quedarse con la duda de si, aunque hayamos encontrado la traducción de cada elemento por separado, no habrá una traducción que combine varios elementos de una manera diferente a la que hemos supuesto. Otro caso que puede ralentizar la traducción en este tipo de traducciones es cuando tenemos que traducir una enumeración que en la memoria de traducción aparece dividida en segmentos diferentes.

Para resolver este problema hemos incluido una nueva función en petraREV: la búsqueda seccionada, que «descuartiza» el texto en palabras y luego busca las combinaciones de la mayor longitud posible. Por ilustrarlo con un ejemplo, imaginemos que buscamos en la memoria de traducción el siguiente texto:

 The user must open the Delete data screen from the lower menu bar.

Para realizar esta búsqueda, basta con acceder a la ventana de búsqueda (Control + F o Edición → Buscar) y marcar la casilla de verificación Búsqueda seccionada. Los resultados que obtendríamos serían:


Vemos que la búsqueda muestra dos segmentos muy relevantes para el texto buscado. De un solo vistazo, podemos ver que uno tiene una estructura muy similar, mientras que uno de los términos que faltan aparece en otro segmento. Además, podemos tener la seguridad de que la palabra lower no aparece en ningún segmento de la memoria de traducción en la que hemos realizado la búsqueda. Una gran cantidad de información muy resumida que nos permitirá darnos por satisfechos con la traducción sin perder el tiempo en búsquedas innecesarias, con la importante ventaja de que esta búsqueda apenas tarda más que una búsqueda ordinaria.

Al ser una nueva función, nos gustaría particularmente recibir cualquier comentario sobre ella. ¿Os parece útil? ¿Encontráis que tiene algún defecto o podría mejorarse para que fuera más cómoda? Para cualquier duda, no dudéis en poneros en contacto con nosotros.

jueves, 18 de octubre de 2018

petraREV: Versión 2.4

Acabamos de publicar la versión 2.4 de petraREV, la herramienta gratuita para revisar traducciones. Además de la ampliación de sus diccionarios las habituales mejoras y correcciones de errores, esta versión incluye un nuevo tipo de búsqueda: la búsqueda seccionada. 


Aunque próximamente dedicaremos una entrada del blog a explicar cómo se utiliza esta función, sirve para buscar las diferentes palabras que contiene un texto, con la ventaja de ser muy rápida y buscar un elevado número de combinaciones.

También hemos añadido un nuevo icono que permite acceder rápidamente la configuración, lo que resulta ideal especialmente cuando para cambiar el pretratamiento del texto. Es decir, podemos definir que se eliminen ciertos segmentos, se reemplace un texto por otro o se quiten las etiquetas sin tener que repetir estas operaciones una y otra vez.

Para probarla, solo tienes que descargarla desde la página de OpenTranslation.

Esperamos que esta nueva versión resulte útil y, para cualquier comentario, no dudéis en escribirnos.

martes, 20 de marzo de 2018

petraREV: Llega la versión 2.3

Tras algo más de un año sin ninguna actualización, hoy acabamos de publicar la nueva versión de petraREV., que se puede descargar gratis de http://www.opentranslation.es/petrarev/descarga.htm.

Se trata de una actualización más que recomendable, dado que mejora la aplicación prácticamente en todos los aspectos, aunque tal vez la novedad más importante sea la mejora de la compatibilidad con los archivos de SDL Trados y memoQ. También es la primera versión que va más allá de la combinación de idiomas inglés→español y permite definir nuestra combinación entre los idiomas disponibles. Próximamente iremos desglosando algunas de las novedades más destacadas de esta versión.

Como siempre, nos encantaría conocer vuestra opinión sobre esta nueva versión. ¿Cuál es la función que más os ha llamado la atención? ¿Hay alguna novedad que aún echáis en falta? Para cualquier comentario, no dudéis en escribir un comentario en este blog o escribirnos directamente a nuestra dirección de correo.

sábado, 16 de septiembre de 2017

petraSearch: ¡Nueva versión con un flamante modo gramatical!

La principal novedad de la versión 1.1 de petraSearch es el nuevo modo gramatical, que nos permite buscar no solo cadenas de texto, sino también secuencias de palabras con una sintaxis intuitiva y cómoda.

Para ilustrarlo con el texto de ejemplo que incluye la nueva versión de petraSearch, imaginemos que queremos saber los adjetivos que utilizó Bécquer para el sustantivo «voz» en su famosa obra «El monte de las ánimas». Solo tenemos que activar el modo gramatical pulsando el botón «G» y escribir en el cuadro de búsqueda:

voz -a%

Nos aparecerán todas las veces que aparece el sustantivo «voz» seguido de un adjetivo y, además, también veremos al final una lista con todos estos adjetivos ordenados por frecuencia:


Aparte de su utilidad para realizar estudios de estilo, esta función también resulta muy práctica cuando estamos redactando un texto y no conseguimos encontrar una palabra concreta. Por ejemplo, ¿queremos añadir un adverbio al verbo «creer» y no encontramos el que nos guste? Solo hay que activar el modo gramatical, escribir «creer -r%» y veremos una lista de los adverbios que se utilizan en los textos que nos interesan. En este sentido, esta función viene a ofrecer un diccionario de colocaciones, solo que dinámico y específico de los textos que decidamos.

Pero, ¿cómo funciona esta sintaxis? Tan solo tenemos que escribir las palabras que queremos buscar separándolas por espacios. Si en un lugar de una palabra concreta queremos especificar una categoría gramatical, basta con escribir un guión seguido de una letra para identificar la categoría en cuestión:

-v (verbo), -n (nombre), -a (adjetivo), -r (adverbio), -s (preposición), -d (determinante), etc.

Para ver la lista completa de categorías gramaticales, puedes consultar la descripción completa en la ayuda de petraREV.

Si no indicamos que queremos buscar una palabra literalmente, se buscarán todas sus posibles formas. Por ejemplo, para «decir», se buscará «digo», «dices», «dices», «decimos», etc. Para indicar que queremos buscar una única forma de una palabra, hay que precederla con un signo igual. Por ejemplo:

=dije

Busca únicamente aquellos casos en los que aparece la palabra «dije». Por tanto, es importante escribir la forma canónica de una palabra cuando queramos buscar todas sus posibles formas. Es decir, infinitivo para los verbos, singular para los nombres, etc.

Cuando queramos aceptar cualquier palabra, solo hay que escribir un punto. Por ejemplo:

noche . -a

Admite tanto «noche tan bonita» como «noche más hermosa».

Por último, cuando queramos realizar un análisis rápido de frecuencia solo tenemos que añadir un % a la palabra que nos interesa. Por ejemplo:

noche . -a%

Realiza un análisis de la frecuencia con la que aparecen los adjetivos según este patrón, pero:

noche .% -a

Realiza un análisis de la frecuencia de las palabras que aparecen entre «noche» y un adjetivo.

Dado que es la primera vez que incorporamos esta función, nos encantaría saber qué os parece y si se os ocurren mejoras que podrían mejorar su utilidad. ¡Esperamos vuestros comentarios!

jueves, 6 de julio de 2017

petraREV: Cómo crear una planificación de archivos a partir de un recuento

Aparte de las funciones para revisar traducciones, petraREV también incluye varias opciones para facilitar el trabajo de traducción. Por ejemplo, al traducir un proyecto, particularmente si se trata de uno extenso o con muchos archivos, es muy útil saber en todo momento en qué punto del proyecto estamos, es decir, cuánto hemos traducido o revisado ya y cuánto nos queda todavía pendiente. Todos los programas de traducción incorporan funciones que nos ofrecen esta información, pero con frecuencia cometen errores o son demasiado lentos. Por ejemplo, muchas veces los problemas con las penalizaciones hacen que lo que debería aparecer como texto 100% traducido se contabilice como texto al 99%, lo que puede darnos algún susto. Además, las planificaciones también son útiles para repartir el trabajo entre varios traductores o programarnos el tiempo que vamos a dedicar al proyecto.

Pero, ¿qué es una planificación? Se trata sencillamente de una hoja de cálculo donde aparece junto al nombre de cada archivo el número de palabras de cada tipo que tiene. Por ejemplo, el siguiente corresponde al recuento de un proyecto ficticio:


Gracias a las funciones de las hojas de cálculo, podemos hacemos un montón de operaciones con el recuento, como por ejemplo, dar prioridad a los archivos más pequeños o a lo más grandes y, sobre todo, asegurarnos rápidamente de que el volumen del trabajo que estamos a punto de comenzar coincide con el que nos han asignado.

Crear un recuento de este tipo con petraREV es muy fácil, basta con abrir la aplicación o, si no la hemos descargado todavía, conseguirla de manera gratuita de http://www.opentranslation.es/petrarev/descarga.htm.

Una vez abierta, basta con elegir HerramientasGestión de proyectos o, si preferimos usar el teclado, pulsar Control + O. Aparecerá el siguiente cuadro de diálogo:


Ahora debemos elegir en el cuadro de texto Archivo de recuento la ruta donde está el archivo con el recuento que hemos creado con nuestro programa de traducción asistida. Si queremos guardar el recuento, también tendremos que elegir en el cuadro de texto Archivo de plan, la ruta donde queremos que lo guarde.

Una vez especificada esta información, solo queda hacer clic en Convertir y habremos generado una completa planificación.

Una última nota, aparte de guardar el plan donde le hemos indicado, también se mostrará siempre el recuento en pantalla, de una manera similar a la siguiente:

Si preferimos este formato o tenemos cualquier problema al generar el archivo, también podemos copiar y pegar esta tabla, ya sea en una hoja de cálculo o en un procesador de textos.

Por el momento, solo se admiten esta función solo es compatible con los recuentos de algunas herramientas, pero si necesitáis algún formato en concreto, podéis escribirnos para contarnos los formatos que necesitáis.