Compatibility

OmegaT, l'eina de memòria de traducció lliure

Manual de compatibilitat de l'OmegaT

En aquest manual es descriu la compatibilitat de l'OmegaT amb altres programes informàtics.

Comentaris generals

Com que normalment els traductors professionals reben i lliuren els textos en format digital, és natural que els usuaris de l'OmegaT estiguin interessats en la compatibilitat amb altres programes informàtics. L'objectiu d'aquest manual és oferir informació al respecte.

Una observació important: la «compatibilitat» no sol ser un assumpte tan senzill com dir «sí» o «no». Quan el venedor d'un producte informàtic afirma que el seu producte és compatible amb un altre programa informàtic, aquesta compatibilitat no sol ser del 100 %. A la inversa, quan és evident que determinats productes no són directament compatibles, sovint es poden trobar procediments per aconseguir que funcionin junts. La qüestió és si aquests procediments són acceptables quant al resultat i l'esforç que comporten, i la resposta dependrà segurament de cada usuari. En altres paraules, la «compatibilitat» no es refereix només als productes, sinó també als cicles de treball.

Sistemes operatius

L'OmegaT funciona en qualsevol sistema operatiu on es pugui executar una versió adient del Java Runtime Environment (JRE). En aquests moments, això inclou totes les versions del Microsoft Windows a partir del Windows 98, el Mac OS X i la major part de les distribucions del Linux.

Textos de partida (fitxers per traduir)

Consulteu el manual de l'usuari de l'OmegaT per trobar una llista completa i actualitzada dels formats de fitxer compatibles. La llista següent no és una llista exhaustiva dels formats de fitxer admesos per l'OmegaT, sinó que es limita a aquells que tenen un interès particular per als usuaris habituals.

Memòries de traducció

Hi ha un estàndard internacional per a les memòries de traducció: TMX o Translation Memory eXchange. Aquest estàndard ha tingut una gran acceptació i l'admeten gairebé totes les eines TAO actuals.

L'estàndard TMX té diverses versions i també diferents nivells, una distinció important pel que fa a la compatibilitat. L'estàndard encara s'està desenvolupant; a això fan referència les diverses versions. Els nivells fan referència a la informació de format que conté el fitxer TMX:

Algunes eines TAO (com ara el TRADOS) permeten exportar els diversos fitxers TMX a diferents versions. L'OmegaT admet totes les versions de TMX actuals, però segurament oferirà uns millors resultats de coincidències si la versió del fitxer TMX és la 1.4b. 

En principi, les eines que admeten diferents nivells de fitxers TMX són encara compatibles les unes amb les altres. Encara que la informació de format continguda en els nivells superiors no tingui cap sentit per a l'«altra» eina, es podrà veure la informació textual, es trobaran les coincidències parcials, etc.

L'OmegaT utilitza l'estàndard internacional TMX com a format de memòria de traducció natiu. Algunes eines TAO encara utilitzen formats de memòria de traducció específics de propietari, però gairebé totes permeten importar i exportar fitxers TMX. En la pràctica, per tant, els traductors poden lliurar memòries de traducció als clients i viceversa, i els receptors poden utilitzar aquests fitxers com a referència al moment o més endavant; si, per contra, els fitxers s'han d'utilitzar en un cicle de treball automatitzat, caldrà tenir en compte les limitacions descrites anteriorment.

Altres aspectes destacats dels fitxers TMX:

L'estàndard TMX conté definicions sobre quins caràcters es permeten. No totes les eines TAO s'ajusten de manera estricta a aquestes definicions i, per tant, algunes eines TAO no poden obrir directament els fitxers TMX produïts per determinades eines TAO. L'OmegaT generalment respecta les condicions i és tolerant si altres eines no les respecten; si es produeixen problemes en aquest sentit, però, normalment es poden solucionar de manera bastant senzilla fent una cerca i substitució, en un editor de text, del caràcter no permès que apareix al fitxer TMX.

Els fitxers TMX tenen la codificació Unicode, però poden ser UTF-8 o UTF-16. Els fitxers TMX produïts als sistemes Windows poden començar amb una marca d'ordre de bytes (BOM, de Byte Order Mark). Aquestes diferències no solen provocar problemes de compatibilitat.

Els problemes de compatibilitat poden ocórrer per diferències en els codis lingüístics utilitzats. L'OmegaT admet els codis lingüístics amb el format «xx», «XX», «xx-YY» i «XX-YY», on xx o XX correspon a l'idioma i yy o YY a la regió. Per a ser exactes, l'estàndard ISO per als codis lingüístics indica que han de tenir el format «xx-YY» (per exemple: «en-GB» per a l'anglès britànic); tot i que l'OmegaT admet aquesta variant, el valor que ofereix el programa de manera predeterminada és «XX-YY», és a dir, «EN-GB». L'OmegaT és flexible quan llegeix fitxers TMX: accepta fitxers amb els formats en-GB, en-US, en, EN, etc. No totes les eines TAO tenen la mateixa flexibilitat i algunes podrien no mostrar les coincidències esperades si els codis lingüístics no s'ajusten prou als estàndards. Aquesta incompatibilitat es pot resoldre fent una cerca dels codis lingüístics al fitxer TMX i reemplaçant-los pels codis corresponents amb un editor de text adient. Una altra possible causa d'incompatibilitat són els codis lingüístics de tres dígits, que són totalment incompatibles amb l'OmegaT. (De fet, es tracta d'una limitació del Java, no de l'OmegaT).

Comentaris quant als fitxers de memòria de traducció de propietari:

El format de fitxer de memòria de traducció tradicional del Wordfast té un interès particular per la seva senzillesa: es tracta d'un fitxer de text net amb una unitat de traducció (segment) a cada línia on el text de partida i el text traduït se separen amb una tabulació. Aquest format es pot convertir fàcilment al format TMX mitjançant utilitats d'altres proveïdors, com ara Wf2TMX. També es pot utilitzar Anaphraseus amb aquest propòsit.

Fitxers de glossari

Els fitxers de glossari de l'OmegaT són fitxers de text net amb aquest format:

terme de partida    <tabulació>    terme traduït    <tabulació>    informació addicional

Algunes eines TAO permeten importar i exportar els fitxers de glossari amb aquest format o amb un format de text net semblant, que es pot produir de manera molt senzilla a partir d'aquest (per exemple, amb una operació de cerca i substitució al Microsoft Word).

L'OmegaT també pot llegir glossaris amb el format TBX, el format estàndard del sector per als fitxers de glossari.

L'OmegaT no pot importar ni llegir fitxers de glossari en formats binaris de propietat, com ara Trados Multiterm.

Formats bilingües d'eines TAO

Moltes eines TAO utilitzen un format de fitxer intermedi bilingüe, és a dir, un fitxer que conté tant els segments de la llengua de partida com els de la llengua a la qual es tradueix i, en alguns casos, també l'estructura del fitxer original. En un principi, aquests formats de fitxer bilingües eren una conseqüència de l'arquitectura de l'eina. Això no obstant, s'han convertit en un fenomen important en els fluxos de treball de traducció en què intervenen eines TAO i, sovint, suposen el principal obstacle per a la compatibilitat entre l'OmegaT i altres eines TAO (o més aviat, entre les eines TAO en general).

Hi ha almenys tres raons per les quals un client pot demanar que el lliurament d'una traducció es faci en un determinat format bilingüe (en comptes de lliurar simplement el fitxer traduït i, possiblement, també la memòria de traducció):

1. Algunes eines TAO, en particular el TRADOS, poden importar una gran varietat de formats de fitxer, fins i tot formats d'autoedició, i preparar-los per a la traducció amb l'eina corresponent. La forma «preparada» sol ser el format de fitxer bilingüe de l'eina. Sense aquesta preparació, el traductor podria potser accedir al format de fitxer original.

2. La fase de traducció només és una part del flux de treball del client. Pot ser que, per exemple, s'enviï la traducció a un revisor perquè la corregeixi. Si els canvis del revisor han d'incloure's a la compilació de memòries de traducció del client, caldrà fer els canvis abans de crear els documents finals. Això es pot fer a través de l'eina TAO que s'estigui utilitzat o, en alguns casos, amb un format de fitxer bilingüe extern que l'eina pugui llegir.

3. El client vol rebre una memòria de traducció per aplicar-la als textos en el futur; és a dir, per «pretraduir» els futurs textos amb una memòria de traducció ja creada. Per automatitzar al màxim aquest procés, cal complir dues condicions particulars: en primer lloc, la memòria de traducció ha de contenir la informació de format (vegeu més amunt) i, en segon lloc, les regles de segmentació aplicades al text han de ser les mateixes que es van aplicar quan es va crear la memòria de traducció (o part d'aquesta). Per als clients, la manera més senzilla d'assegurar-se que es reuneixen ambdues condicions és pretraduir el text ells mateixos abans d'enviar-lo al traductor (amb la qual cosa poden comprovar com s'ha segmentat) i crear la memòria de traducció en l'eina TAO escollida quan el traductor els torni el fitxer bilingüe intermedi traduït (amb la qual cosa s'asseguren que la informació de format inclosa a la memòria de traducció serà compatible amb els futurs projectes).

L'OmegaT admet diversos formats de fitxer bilingües i no necessàriament amb un gran esforç. Això no obstant, és important comprendre els processos implicats. Tot seguit es descriuen els diferents formats de fitxer bilingüe.

XLIFF

XLIFF és el format de fitxer bilingüe estàndard del sector de la traducció. És compatible amb diverses eines TAO i, de fet, algunes eines TAO s'han dissenyat seguint l'estàndard XLIFF: per exemple, Heartsome i Swordfish. Com que es tracta d'un estàndard, l'avantatge de l'XLIFF és que els filtres de fitxer que proporciona el fabricant d'una eina TAO per a la conversió entre un determinat format i l'XLIFF (i, una vegada completat el procés de traducció, tornar-lo a convertir) es poden utilitzar en teoria per preparar els fitxers en el format necessari per traduir-los en qualsevol eina TAO que sigui compatible amb l'XLIFF. En la pràctica, per treballar amb el procés de treball d'XLIFF sovint fan falta eines que no són molt senzilles d'utilitzar.

L'OmegaT té una compatibilitat rudimentària amb el format XLIFF i aquí trobareu un procediment per utilitzar XLIFF en OmegaT juntament amb les eines de Rainbow. Els filtres disponibles són sobretot per als formats de fitxer propis de la indústria de les tecnologies de la informació, més que per als fitxers d'usuari final.

«RTF brut» del Trados

El format de fitxer RTF «brut» del Trados, al qual es fa sovint referència com «fitxers bruts», ha estat durant molts anys el format de fitxer bilingüe més habitual en els processos de traducció. Els seus orígens es remunten a la utilització de l'MS Word com a interfície de l'eina TAO Trados. A més del Trados, però, moltes altres eines TAO són compatibles amb el format RTF «brut», en particular el Wordfast Classic.

Aquest format consisteix bàsicament en un fitxer RTF al qual s'alternen els segments del text de partida i del text traduït. Aquests segments es marquen i delimiten amb caràcters especials i els estils de formatació de l'MS Word.

En 2008 es van desenvolupar un script (només per al Windows) i un procediment que permeten als usuaris produir els fitxers RTF bruts del Trados per lliurar-los en finalitzar la fase de traducció. En trobareu tota la informació al manual «Exportació de l'OmegaT a un RTF brut».

Trados TTX

El format Trados TTX és l'equivalent del format «RTF brut» del Trados Tag Editor que, a diferència del Trados Workbench, no treballa combinat directament amb l'MS Word. El TTX és un format basat en XML. Hi ha un connector de l'OmegaT disponible que permet utilitzar aquest format amb l'OmegaT.

Wordfast TXML

El Wordfast TXML és el format natiu intern del nou Wordfast Professional (també conegut com Wordfast 6.0) de Wordfast. Com ho suggereix el nom, és un format basat en XML. És compatible amb l'OmegaT.

«External View» del Déjà Vu

El format de fitxer «External View» és una característica interessant del Déjà Vu DVX. Aquest format de fitxer permet als usuaris de l'OmegaT lliurar fitxers bilingües als usuaris del Déjà Vu DVX, els quals podran continuar editant-los o incorporar-los a fluxos de treball automatitzats. En trobareu més informació al manual «External View» del Déjà Vu.

Copyright Marc Prior 2009-2014