Compatibility

Guida di OmegaT: compatibilità

Questa guida descrive la compatibilità di OmegaT con altri prodotti software.

Commenti generali

Dal momento che è procedura standard per i traduttori professionisti ricevere e consegnare testi in formato digitale, gli utenti di OmegaT naturalmente sono interessati alla sua compatibilità con altri prodotti software. Questa guida mira a fornire informazioni in questo settore.

Un'osservazione generale: la "compatibilità" è raramente un problema in bianco e nero, "sì" o "no". Quando il fornitore di un prodotto software afferma che esso è compatibile con un altro software, tale compatibilità è raramente al 100%. Al contrario, laddove i prodotti siano chiaramente non direttamente compatibili, è spesso possibile trovare procedure che possono consentire di lavorare assieme. La domanda a cui si deve rispondere è se queste procedure sono accettabili in termini di risultato e aggravio di lavoro, e questa risposta molto probabilmente varia da un utente all'altro. In altre parole, la "compatibilità" è non solo dei prodotti, ma anche dei flussi di lavoro.

Sistemi operativi

OmegaT funziona su qualsiasi sistema operativo in cui è possibile eseguire una versione adatta di Java Runtime Environment (JRE). Attualmente, questo include tutte le versioni di Microsoft Windows, da Windows 98 in poi, la maggior parte delle distribuzioni Linux e Mac OS X.

Testi di origine (file da tradurre)

Per un elenco aggiornato di tutti i formati di file supportati, consultare il manuale utente di OmegaT. L'elenco riportato sotto non è un elenco esaustivo di tutti i formati di file supportati da OmegaT, ma si limita a quelli di particolare interesse per gli utenti tipici.

Memorie di traduzione

Esiste uno standard internazionale per le memorie di traduzione: TMX (Translation Memory eXchange). Esso è stato diffusamente adottato ed è supportato da quasi tutti gli attuali strumenti CAT.

Lo standard TMX esiste sia in diverse versioni, sia in diversi livelli. La distinzione è importante per questioni di compatibilità. Lo standard è ancora in fase di sviluppo; questo è ciò cui le varie versioni si riferiscono. I livelli si riferiscono alle informazioni di formattazione contenute nel file TMX:

Certi altri strumenti CAT (come TRADOS) sono in grado di esportare file TMX diversi in diverse versioni. OmegaT supporta tutte le versioni correnti di TMX, ma è probabile che fornisca risultati di concordanza migliori se il file TMX è nella versione 1.4b. 

Gli strumenti che supportano i livelli differenti di file TMX sono in linea di principio ancora compatibili a vicenda. Le informazioni di formattazione contenute nei livelli più alti saranno prive di significato per lo strumento di "altri", ma le informazioni testuali possono ancora essere visualizzate, le corrispondenze parziali trovate, e via discorrendo.

OmegaT utilizza lo standard TMX internazionale come suo formato di memoria di traduzione nativo. Alcuni strumenti CAT ancora utilizzano formati di memoria di traduzione proprietari dedicati, ma praticamente tutti supportano l'importazione e l'esportazione di file TMX. In pratica, è quindi possibile per i traduttori consegnare memorie di traduzione ai clienti e viceversa, e per il destinatario usare questi file per riferimento immediato o futuro; se i file devono essere utilizzati all'interno di un flusso di lavoro automatizzato, tuttavia, si applica il vincolo sopra descritto.

Ulteriori punti da notare per quanto riguarda i file TMX:

Lo standard TMX contiene le definizioni di quali caratteri sono ammessi. Non tutti gli strumenti CAT sono altrettanto rigorosi nella loro osservanza di queste definizioni; di conseguenza, alcuni strumenti CAT sono in grado di aprire file TMX prodotti direttamente da alcuni altri strumenti CAT. OmegaT è generalmente attento delle condizioni e tollerante delle inosservanze di altri strumenti; dovessero insorgere problemi qui, tuttavia, si può, di solito, risolverli abbastanza facilmente tramite una ricerca e sostituzione, all'interno di un editor di testo, del carattere illegale contenuto nel file TMX.

I file TMX sono codificati Unicode, ma possono essere anche UTF-8 o UTF-16. I file TMX prodotti su sistemi Windows possono iniziare con un "Byte-Order Mark" (BOM). Questa differenze non creano in genere problemi di compatibilità.

I problemi di compatibilità possono essere causati da differenze nei codici di lingua impiegati. OmegaT supporta i codici di lingua nel formato "xx", "XX", "xx-YY" e "XX-YY", dove xx o XX è la lingua, yy o YY il paese. Strettamente parlando, lo standard ISO per i codici di lingua richiede "xx-YY" (ad esempio: "en-GB" per l'inglese britannico); anche se questa variante è supportata da OmegaT, la convenzione predefinita offerta da OmegaT è "XX-YY", ad esempio "EN-GB". OmegaT è tollerante quando si leggono i file TMX: accetterà file con en-GB, en-US, it, EN, ecc. Non tutti gli strumenti CAT presentano la stessa tolleranza e alcuni potrebbero, quindi, non visualizzare le concordanze previste, se i codici di lingua non sono sufficientemente conformi. Questa incompatibilità può essere risolta attraverso la ricerca e sostituzione dei codici di lingua pertinenti nel file TMX con un editor di testo adatto. Un'altra possibile fonte d'incompatibilità sono codici di lingua a tre cifre, che non sono per niente supportati da OmegaT (per inciso, questa è una limitazione di Java, non di OmegaT).

Punti relativi ai file di memoria di traduzione proprietari:

Il tradizionale formato di file memoria di traduzione Wordfast è di particolare interesse a causa della sua semplicità: si compone di un file di testo con un'unità di traduzione (segmento) su ogni riga in cui l'origine e la destinazione sono separati da una tabulazione. Questo formato può essere convertito facilmente in formato TMX da programmi di terze parti come Wf2TMX. Anche Anaphraseus può essere utilizzato per questo scopo.

File di glossario

I file di glossario di OmegaT sono file di solo testo nel formato:

termine di origine <tabulazione> termine di destinazione <tabulazione> informazioni aggiuntive

Alcuni altri strumenti CAT sono in grado di importare ed esportare file glossario in questo formato, o in un formato di testo simile, che può essere prodotto da esso molto facilmente (ad esempio, da un'operazione di ricerca e sostituzione in Microsoft Word).

OmegaT è anche in grado di leggere i glossari in TBX, il formato standard di settore per i file di glossario.

OmegaT non può importare o leggere i file di glossario in formati binari proprietari, quali Trados Multiterm.

Formati di strumenti CAT bilingui

Molti strumenti CAT fanno uso di un formato di file intermedio bilingue, cioè un file che contiene segmenti sia della lingua di partenza, sia di destinazione e in alcuni casi anche la struttura del file originale. Originariamente, questi formati di file bilingui potrebbero essere stati un sottoprodotto dell'architettura dello strumento. Tuttavia, essi sono diventati un fenomeno importante nei flussi di lavoro della traduzione che coinvolgono strumenti CAT, e spesso rappresentano il più grande ostacolo alla compatibilità tra OmegaT e altri strumenti CAT (o, se è per quello, tra strumenti CAT in generale).

Ci sono almeno tre ragioni perché un cliente possa richiedere la consegna di una traduzione in un particolare formato bilingue (piuttosto che semplicemente la consegna del file tradotto e possibilmente anche la memoria di traduzione):

1. Alcune applicazioni CAT, Trados in particolare, sono in grado di importare una vasta gamma di formati di file, inclusi quelli di desktop publishing, e di prepararli per la traduzione nello strumento in questione. La forma "preparata" è in genere il formato di file bilingue dell'applicazione. Senza questo tipo di preparazione, il formato di file originale potrebbe essere accessibile al traduttore.

2. La fase di traduzione è solo una parte del flusso di lavoro del cliente. La traduzione può essere passata, ad esempio, a un revisore per la correzione. Se le correzioni del revisore si dovranno conservare in un deposito per memorie di traduzione mantenuto dal cliente, esse devono essere fatte prima di creare i documenti finali. Questo si può fare o all'interno dell'applicazione CAT in questione, o in alcuni casi in un formato di file esterno bilingue che l'applicazione è in grado di gestire.

3. Il cliente desidera ricevere una memoria di traduzione per trattare in futuro altri testi: in altre parole, come "pre-traduzione" di futuri testi con riferimento alla memoria di traduzione esistente. Affinché questo processo possa essere automatizzato al meglio devono essere soddisfatte due condizioni, in particolare: in primo luogo, la memoria di traduzione deve contenere informazioni di formattazione (vedere sopra); in secondo luogo, le regole di segmentazione applicate al testo devono essere identiche a quelle applicate quando la memoria di traduzione (o parte di essa) è stata prodotta. Il modo più semplice per un cliente di garantire che queste due condizioni siano soddisfatte è di pre-tradurre da sé il testo prima di passarlo al traduttore (definendo pertanto la sua segmentazione), e di creare la memoria di traduzione nel formato dello strumento CAT di propria scelta dopo aver ricevuto dal traduttore il file bilingue intermedio tradotto (garantendo così che le informazioni di formattazione contenute all'interno della memoria di traduzione siano compatibili con i progetti futuri).

Molti dei formati di file bilingue possono essere gestiti da OmegaT e senza grande sforzo. La comprensione dei processi coinvolti è comunque importante. I singoli formati di file bilingue sono descritti di seguito.

XLIFF

XLIFF è il formato di file bilingue standard di settore. È supportato da diverse applicazioni CAT, e di fatto alcune applicazioni sono "progettate attorno" allo standard XLIFF: Heartsome e Swordfish sono esempi. Poiché è uno standard, un vantaggio di XLIFF è che i filtri dei file forniti da il venditore di uno strumento CAT per la conversione tra un determinato formato e XLIFF (e, dopo aver completato il processo di traduzione, viceversa), in teoria possono essere utilizzati per preparare i file nel formato di cui trattasi per la traduzione in qualsiasi applicazione CAT in grado di supportare XLIFF. In pratica, lavorare col sistema di lavoro XLIFF richiede spesso l'uso di strumenti che non sono molto semplici da usare.

OmegaT ha un supporto rudimentale per XLIFF, e qui è possibile trovare una procedura per il suo utilizzo in OmegaT, grazie alle applicazioni di Rainbow. I filtri disponibili sono principalmente per formati di file peculiari a quelli dell'industria IT piuttosto che quelli dell'utente finale.

Trados "RTF non ripulito"

Il formato di file Trados "RTF non ripulito", spesso indicato semplicemente come "file non puliti", è stato per molti anni il formato file bilingue più comune utilizzato nei flussi di lavoro di traduzione. Deve le sue origini all'utilizzo di MS Word come interfaccia per l'applicazione CAT Trados. Oltre a Trados, tuttavia, diverse altre applicazioni CAT supportano anche il formato "RTF non ripulito", in particolare Wordfast Classic.

Essenzialmente, questo formato è costituito da un file RTF in cui si alternano i segmenti di origine e di destinazione. Questi segmenti sono contrassegnati e delimitati da caratteri speciali e stili di formattazione MS Word.

Uno script (solo per Windows) e una procedura sono stati recentemente (2008) sviluppati, permettendo agli utenti di OmegaT di produrre i file in formato Trados RTF non ripulito per la consegna, al termine del loro lavoro di traduzione. Per ulteriori informazioni, vedere la GUIDA "Esportazione da OmegaT a RTF non ripulito".

Trados TTX

Il formato Trados TTX è la controparte del formato "RTF non ripulito" per Trados Tag Editor, che a differenza di Trados Workbench, non funziona in combinazione diretta con MS Word. TTX è un formato basato su XML. Ora è disponibile un plugin di OmegaT per gestire questo formato in OmegaT.

Wordfast TXML

Wordfast TXML è il formato nativo interno del nuovo Wordfast Professional della Wordfast (noto anche come Wordfast 6.0). Come suggerisce il nome, è un formato basato su XML. Al momento non è supportato da OmegaT e, secondo i rappresentanti di Wordfast, nel medio periodo rischia di essere superato dal formato XLIFF.

Déjà Vu "Vista esterna"

Una caratteristica interessante di Déjà Vu DVX è formato di file "Vista esterna". Questo formato di file consente agli utenti di OmegaT di consegnare i file bilingui agli utenti di DVX Déjà Vu, che sono quindi in grado di modificarli ulteriormente o d'incorporarli in flussi di lavoro automatizzati. Per ulteriori informazioni, vedere la GUIDA Déjà Vu "Vista esterna".

Copyright Marc Prior 2009-2011