Compatibility

Guía de compatibilidade de OmegaT

Esta guía fala da compatibilidade de OmegaT con outros produtos de software.

Comentarios xerais

Dado que é un procedemento habitual no mundo da tradución recibir e enviar os textos en formato dixital, as persoas que empregan OmegaT están interesadas na súa compatibilidade con outros produtos de software. Nesta guía atopará información sobre este tema.

Observación xeral: en poucas ocasións se pode falar da \xABcompatibilidade\xBB como unha cuestión de branco ou negro, de \xABsi\xBB ou \xABnon\xBB. Cando o vendedor dun software asegura que o seu produto é compatible con outro software, case nunca se trata dunha compatibilidade do 100 %. En cambio, cando dous produtos non son compatibles, en moitas ocasións é posible atopar métodos para que poidan traballar xuntos. A cuestión é se estes procesos merecen a pena en relación ao esforzo necesario e o resultado obtido, algo que variará para cada persoa. Dito doutra forma, a \xABcompatibilidade\xBB non só está relacionada cos produtos, senón tamén coa forma de traballar.

Sistemas operativos

OmegaT funciona en calquera sistema operativo no que unha versión adecuada do Java Runtime Environment (JRE) poida ser instalada. Nestes momentos isto inclúe todas as versións de Microsoft Windows a partir de Windows 98, Mac OS X e a maioría das distribucións de Linux.

Textos de orixe (ficheiros para traducir)

No manual de usuario de OmegaT poderá atopar unha lista actualizada de todos os formatos de ficheiro compatibles. Non é unha lista exhaustiva de todos os formatos de ficheiro compatibles con OmegaT, senón que está limitada a aqueles que resultan especialmente interesantes para os usuarios típicos.

Memorias de tradución

Existe un estándar internacional para as memorias de tradución: TMX, ou Translation Memory eXchange. Foi amplamente adoptado e é compatible con case todas as ferramentas de tradución asistida actuais.

O estándar TMX existe en diferentes versións e diferentes niveis. Esta distinción é importante de cara á compatibilidade. O estándar inda está en desenvolvemento; a isto se refiren as versións. Os niveis refírense á información de formato que conteñen os ficheiros TMX:

Certas ferramentas de tradución (como TRADOS) poden exportar diferentes ficheiros TMX en diferentes versións. OmegaT é compatible con todas as versións actuais de TMX, pero ten máis posibilidades de ofrecer mellores resultados de coincidencias se a versión do ficheiro TMX é a 1.4b. 

Nun principio, as ferramentas que soportan diferentes niveis de TMX son compatibles entre si. A información de formato que conteñen os niveis máis altos carecerá de sentido para as \xABoutras\xBB ferramentas, pero seguirá sendo posible ver a información textual, as coincidencias parciais, etc.

OmegaT emprega o estándar internacional TMX como o seu formato de memoria de tradución nativo. Algunhas ferramentas de tradución asistida inda empregan formatos de memoria de tradución dedicados, pero practicamente todas permiten a importación e exportación de ficheiros TMX. Isto permite que, na práctica, as persoas que traducen poidan entregar memorias de tradución aos clientes e viceversa, e que a persoa que reciba estes ficheiros poida empregalos como material de referencia inmediato ou futuro. Porén, se o ficheiro vai ser empregado no proceso de tradución, presentaranse as limitacións descritas anteriormente.

Puntos adicionais que ter en conta en relación cos ficheiros TMX:

O estándar TMX contén definicións de que caracteres están permitidos. Non todas as ferramentas de tradución asistida son igual de estritas á hora de aplicar estas restricións. Desta forma, algunhas ferramentas de tradución asistida son incapaces de abrir ficheiros TMX creados por outras ferramentas de tradución asistida directamente. Por norma xeral, OmegaT ten en conta as condicións e é tolerante coa incapacidade doutras plataformas de observalas. Porén, se aparecen problemas neste aspecto, polo xeral poden ser resoltos con bastante facilidade usando a opción Buscar e substituír nun editor de texto dos caracteres ilegais no ficheiro TMX.

Os ficheiros TMX están codificados en Unicode, pero poden ser UTF-8 ou UTF-16. Os ficheiros TMX creados en sistemas Windows poden comezar cunha marca de orde de bytes (BOM). Polo xeral, estas diferenzas non causan problemas de compatibilidade.

Os problemas de compatibilidade poden estar causados polas diferenzas nos códigos de idioma empregados. OmegaT é compatible con códigos de idioma no formato \xABxx\xBB, \xABXX\xBB, \xABxx-YY\xBB e \xABXX-YY\xBB, nos que xx ou XX é o idioma e yy ou YY é a rexión. Nun sentido estrito, o estándar ISO para os códigos de idioma require \xABxx-YY\xBB (por exemplo: \xABen-GB\xBB para o inglés británico), inda que esta variante é compatible con OmegaT, a convención por defecto que ofrece OmegaT é \xABXX-YY\xBB, é dicir, \xABEN-GB\xBB. OmegaT é tolerante á hora de ler ficheiros TMX: aceptará os ficheiros con en-GB, en-US, en, EN, etc. Non todas as ferramentas de tradución asistidas son tan tolerantes e, polo tanto, é posible que algunhas non mostren as coincidencias que se esperan se os códigos de idioma non son os adecuados. É posible resolver esta incompatibilidade buscando e substituíndo os códigos de idioma pertinentes no ficheiro TMX cun editor de texto adecuado. Outra posible causa de incompatibilidade son os códigos de idioma de tres díxitos, que non son compatibles con OmegaT. (Isto débese a unha limitación de Java, non do propio OmegaT.)

Puntos que ter en conta en relación cos ficheiros de memoria de tradución propietarios:

O formato de ficheiro de memoria de tradución tradicional de Wordfast é especialmente interesante debido á súa simplicidade: consiste nun ficheiro de texto plano cunha unidade de tradución (segmento) en cada liña na cal o texto de orixe e a tradución están separados por unha táboa. É posible converter este formato moi facilmente a TMX con ferramentas de terceiros como Wf2TMX. Tamén é posible usar Anaphraseus para esta tarefa.

Ficheiros de glosario

Os ficheiros de glosario de OmegaT son ficheiros de texto plano co formato:

termo de orixe    <tab>    termo traducido    <tab>    información adicional

Algunhas ferramentas de tradución asistida son capaces de importar e exportar ficheiros de glosario con este formato, ou nun formato de texto plano similar que pode ser creado de forma moi fácil (por exemplo, empregando a función buscar e substituír de Microsoft Word).

OmegaT tamén pode ler glosarios en formato TBX, o estándar da industria para os ficheiros de glosario.

OmegaT non pode importar ou ler ficheiros de glosario en formatos propietarios binarios, tales como Trados Multiterm.

Formatos bilingües de ferramentas de tradución asistida

Moitas ferramentas de tradución asistida empregan un formato de ficheiro intermedio bilingüe, é dicir, un ficheiro que contén os segmentos do idioma de orixe e do idioma da tradución e, nalgúns casos, tamén a estrutura do ficheiro orixinal. Nun principio estes ficheiros bilingües puideron ser un subproduto da arquitectura da ferramenta. Porén, transformáronse nun fenómeno importante nos procesos nos que se empregan ferramentas de tradución asistida e, polo xeral, representan o maior obstáculo na compatibilidade entre OmegaT e outras ferramentas (ou entre as ferramentas de tradución asistida en xeral).

Existen cando menos tres motivos polos que un cliente pode solicitar o envío dunha tradución nun formato de ficheiro bilingüe concreto (en lugar do envío do ficheiro traducido e quizais tamén a memoria de tradución):

1. Algunhas ferramentas de tradución asistida, en especial TRADOS, poden importar unha gran variedade de formatos, entre os que se inclúen formatos de creación de publicacións, e preparalos para a tradución na ferramenta. Normalmente, o formato \xABpreparado\xBB e o formato de ficheiro bilingüe da ferramenta. Sen preparalos desta forma, o ficheiro orixinal pode ser accesible para a persoa que traduce.

2. A tradución só é unha parte do proceso de traballo do cliente. A tradución pode ser enviada a un persoa para que a revise, por exemplo. Se é preciso incluír os cambios da persoa que realiza a revisión nun repositorio de memorias de tradución mantido polo cliente, os cambios teñen que ser realizados antes de crear o ficheiro final. Iso pode realizarse dentro da ferramenta de tradución asistida ou, nalgúns casos, nun formato de ficheiro bilingüe externo que a ferramenta pode ler.

3. O cliente desexa recibir unha memoria de tradución para empregala no futuro con outros textos, é dicir, para \xABpretraducir\xBB outros textos empregando unha memoria de tradución que xa existe. Para volver este proceso tan automático como sexa posible é necesario que se cumpran dúas condicións en concreto: en primeiro lugar, a memoria de tradución debe conter información de formato (algo do que falamos nos parágrafos anteriores) e, en segundo lugar, as regras de segmentación aplicadas ao texto deben ser as mesmas que aquelas que se aplicaron cando a memoria de tradución (ou unha parte dela) foi creada. A forma máis fácil de que os clientes poidan asegurarse de que se cumpran estas condicións é que pretraduzan eles mesmos os textos antes de enviarllos á persoa que fará a tradución (e polo tanto establecer como se segmenta) e crear a memoria de tradución na ferramenta de tradución asistida que escolleron despois de recibir o ficheiro de formato bilingüe intermedio da persoa que traduciu, asegurándose desta forma de que a información de formato que contén a memoria de tradución será compatible con futuros proxectos.

OmegaT pode traballar con varios formatos de ficheiro bilingües sen esforzo significativo. Porén, é importante entender o proceso necesario para conseguir isto. A continuación describimos os formatos de ficheiro bilingüe.

XLIFF

XLIFF é o formato de ficheiro bilingüe estándar da industria. É compatible con varias ferramentas de tradución asistida, de feito, algunhas ferramentas están \xABdeseñadas arredor\xBB do estándar XLIFF. Heartsome e Swordfish son dous exemplos. Como é un estándar, XLIFF ten a vantaxe de que os filtros de ficheiro ofrecidos por un fornecedor de ferramentas de tradución asistida para conversións dun formato concreto a XLIFF (e viceversa) poden en teoría empregarse para preparar os ficheiros para a súa tradución en calquera ferramenta de tradución asistida compatible con XLIFF. Na práctica, por norma xeral traballar con XLIFF require o uso de ferramentas que non son fáciles de usar.

OmegaT ten compatibilidade rudimentaria con XLIFF. Pode atopar o proceso para usar XLIFF e OmegaT conxuntamente coas ferramentas Rainbow aquí. Os filtros dispoñibles están destinados na súa maioría a formatos de ficheiros propios da industria das TI máis que a ficheiros empregados polos usuarios finais.

\xABUncleaned RTF\xBB de Trados

O formato de ficheiro \xABuncleaned RTF\xBB (\xABRTF sen limpar\xBB) de Trados, normalmente denominado como \xABficheiros sen limpar\xBB, leva moitos anos sendo o formato de ficheiros bilingües máis usado nos procesos de tradución. A súa orixe está no uso de MS Word como interface da ferramenta de tradución asistida Trados. Hai outras ferramentas aparte de Trados compatibles co formato \xABuncleaned RTF\xBB, entre as que destaca Wordfast Classic.

Este formato consiste basicamente nun ficheiro RTF no que se alternan os segmentos de orixe e de destino. Estes segmentos están marcados e delimitados por caracteres especiais e estilos de formato de MS Word.

En 2008 creouse un script (só dispoñible para Windows) e un proceso para permitirlle aos usuarios de OmegaT crear ficheiros de RTF sen limpar de Trados para a súa entrega no proceso final da tradución. Poderá atopar máis detalles na guía para exportar de OmegaT ao formato \xABuncleaned RTF\xBB de Trados.

Trados TTX

O formato Trados TTX é a equivalente do formato \xABuncleaned RTF\xBB para o editor de etiquetas de Trados (Trados Tag Editor) que, a diferenza de Trados Workbench, non traballa en combinación directa con MS Word. O formato TTX está baseado en XML. Hai un complemento de OmegaT dispoñible que permite traballar con este formato en OmegaT.

Wordfast TXML

Wordfast TXML é un formato interno nativo da nova versión de Wordfast Wordfast Proffesional (tamén coñecida como Wordfast 6.0). Tal como suxire o seu nome, é un formato baseado en XML. É compatible con OmegaT.

\xABExternal View\xBB de Déjà Vu

Unha característica interesante de Déjà Vu DVX é o seu formato de ficheiro \xABExternal View\xBB. Este formato de ficheiro permite ás persoas que usan OmegaT entregar ficheiros bilingües a persoas que usan Déjà Vu DVX para que poidan editalas ou incorporalas a procesos automáticos. Atopará máis detalles na guía de \xABExternal View\xBB de Déjà Vu.

Copyright Marc Prior 2009-2014