Compatibility

OmegaT

HOWTO: OmegaT kompatibilitet

Denna HOWTO beskriver OmegaT:s kompatibilitet med andra mjukvaruprodukter.

Allmänna anmärkningar

Eftersom det är rätt vanligt för professionella översättare att ta emot och skicka text i olika format är OmegaT-användare naturligtvis intresserade av dess kompatibilitet med annan mjukvara. Denna HOWTO försöker ge information om detta.

En allmän iakttagelse är att "kompatibilitet" sällan är svart på vitt "ja" eller "nej", När en försäljare av ett program hävdar att produkten är kompatibel med ett annan program, är kompatibiliteten sällan 100%. Däremot är det ofta möjligt att hitta tillvägagångssätt för att få program att fungera när de inte kan arbeta tillsammans direkt. Frågan är om dessa procedurer är acceptabla vad gäller resultat och ansträngning som krävs. Detta varierar från fall till fall och mellan olika användare. Med andra ord handlar "kompatibilitet" inte bara om program, men också om arbetsflöden.

Operativsystem

OmegaT kan köras på vilket system som helst, förutsatt att JRE (Java Runtime Environment) kan köras. För närvarande innefattar detta alla versioner av Microsoft Windows från Windows 98 och framåt, Mac OS X, och de flesta distributioner av Linux.

Källtexter (filer som ska översättas)

Se Användarmanualen för OmegaT för en uppdaterad lista av alla filformat som stöds, Listan nedan är inte en fullständig lista av alla filformat som stöds av OmegaT, utan är begränsad till dem som är av extra intresse för den typiske användaren.

Översättningsminnen

Det finns en internationell standard för översättningsminnen: TMX, eller Translation Memory eXchange. Den är allmänt vedertagen och stöds av nästan alla översättningsverktyg.

TMX finns både i olika versioner och i olika nivåer. Den åtskillnaden är viktig i kompatibilitetssyfte. Standarden är fortfarande under utveckling; detta är vad de olika versionerna refererar till. Nivån refererar till formateringsinformationen som finns i TMX-filen:

Verktyg som stöder olika nivåer på TMX-filer är i princip fortfarande kompatibla med varandra. Formateringsinformationen i de högre nivåerna blir meningslösa för det "andra" verktyget, men textinformationen kan fortfarande ses, luddiga träffar hittas, etc.

OmegaT använder den internationella TMX-standarden som inhemskt format för översättningsminnen. Vissa översättningsverktyg använder fortfarande patentskyddade format för översättningsminnen, men de allra flesta stöder ändå import och export av TMX-filer. I praktiken är det alltså möjligt för översättare att leverera översättningsminnen till kunder och vice versa, och för mottagaren att använda de filerna för direkt eller senare referens. Om filerna ska användas inom ett automatiserat arbetsflöde, finns dock begränsningarna som beskrivits ovan.

Ytterligare anmärkningar om TMX-filer:

Standarden för TMX innehåller definitioner om vilka tecken som är tillåtna. Inte alla översättningsverktyg är lika strikta i att efterfölja dessa omständigheter; detta leder till att vissa översättningsverktyg inte kan öppna TMX-filer skapade av vissa andra översättningsverktyg. OmegaT efterlever generellt omständigheterna och är tolerant mot andra verktygs försummelse att efterleva dem. Om problem uppstår, kan de vanligtvis lösas genom att använda funktionen "Sök och ersätt" i en textredigerare för att ta bort olovliga tecken i TMX-filen.

TMX-filer kodas i Unicode, men kan både vara antingen UTF-8 eller UTF-16. TMX-filer som skapats i Windows kan börja med en byte-ordningsmarkering (BOM). Detta skapar vanligtvis inga kompatibilitetsproblem.

Kompatibilitetsproblem kan orsakas av skillnader i språkkoderna. OmegaT stöder språkkoder i formatet "xx", "XX", "xx-YY" och "XX-YY", där xx eller XX är språket, yy eller YY regionen. Strikt sett är ISO-standarden för språkkoder "xx-YY" (t.ex.: "en-GB" för brittisk engelska); även om OmegaT stöder denna variant, är den normala varianten i OmegaT "XX-YY", t.ex. "EN-GB". OmegaT är tolerant när det läser TMX-filer: det kommer acceptera filer med en-GB, en-US, en, EN, etc. Alla översättningsverktyg uppvisar inte samma tolerans, och några kommer alltså inte visa de förväntade träffarna om språkkoderna inte är stämmer överens tillräckligt. Denna inkompatibilitet kan lösas genom att söka och ersätta språkkoderna i TMX-filen i en textredigerare. En annan möjlig orsak till inkompatibilitet är tresiffriga språkkoder, som inte stöds av OmegaT. (Detta är för övrigt en begränsning i Java, inte OmegaT i sig.)

Anmärkningar om patentskyddade filer för översättningsminnen:

Det traditionella formatet för översättningsminnen i Wordfast är speciellt av intresse, på grund av sin enkelhet: det består av en vanlig textfil en översättningsenhet (ett segment) på varje rad, där källa och mål är separerade med ett tabbslag. Detta format kan enkelt konverteras till TMX med extern mjukvara som Wf2TMX.

Ordlistor

OmegaT:s ordlistefiler är vanliga textfiler i formatet:

källterm    <tab>    målterm    <tab>    ytterligare information

Vissa andra översättningsverktyg kan importera och exportera ordlistor i detta format, eller i ett liknande textfilformat som lätt kan skapas (t.ex. med funktionen "Sök och ersätt" i Microsoft Word).

OmegaT kan inte importera eller läsa ordlistefiler i patentskyddade binära format som Trados Multiterm.

Tvåspråkiga format för översättningsverktyg

Många översättningsverktyg använder sig av en mellanliggande tvåspråkig fil, alltså en fil som innehåller både käll- och målsegment, och ibland även strukturen i källfilen. Ursprungligen var dessa tvåspråkiga filer restprodukter av verktygets arkitektur. De har däremot blivit viktiga inom arbetsflöden för översättning med översättningsverktyg, och har kommit att bli det största hindret för kompatibilitet mellan OmegaT och andra översättningsverktyg (eller mellan översättningsverktyg i allmänhet).

Det finns åtminstone tre anledningar för en kund att be om leverans i ett speciellt tvåspråkigt format (snarare än att få den översatta filen och möjligtvis översättningsminnet):

1. Vissa översättningsverktyg, speciellt TRADOS, kan importera en mängd olika filformat, inklusive DTP-format (datorstödd trycksaksproduktion) och kan förbereda dem för översättning i verktyget. Den "förberedda" formen är vanligtvis verktygets tvåspråkiga filformat. Utan förberedning, kan filen vara tillgänglig för översättaren. 2. Översättningsarbetet är enbart en del av kundens arbetsflöde. Översättningen måste kanske kontrolleras innan redigering. Om korrekturens ändringar ska inkluderas i översättningsminnet som kunden har, så måste ändringarna göras innan de färdiga dokumenten skapas. Detta kan antingen göras med det aktuella verktyget, eller i vissa fall en extern tvåspråkig fil som verktyget kan läsa.
3. Kunden önskar att få ett översättningsminne, som texter kan köras mot i framtiden: med andra ord för att kunna "föröversätta" framtida texter mot ett existerande översättningsminne. För att detta ska vara en så automatiserad process som möjligt måste två villkor uppfyllas: först och främst måste översättningsminnet innehålla formateringsinformation (se ovan); och för det andra måste segmenteringsreglerna vara desamma som när översättningsminnet (eller delar av det) skapades. Det lättaste sättet för kunder att försäkra sig om att dessa två villkor uppfyllts är att föröversätta texten själva, innan de skickar den vidare till översättaren (och därför bestämma segmenteringen), och att skapa översättningsminnet i ett översättningsverktyg efter att ha mottagit den översatta tvåspråkiga filen från översättaren (och därigenom försäkra sig om att formateringsinformationen i översättningsminnet kommer vara kompatibel med framtida projekt).

Flera av de tvåspråkiga filerna kan hanteras i OmegaT, inte nödvändigtvis med större ansträngning. Det är dock viktigt att förstå de involverade processerna. De olika tvåspråkiga filformaten beskrivs nedan.

XLIFF

XLIFF är standardformatet för tvåspråkiga filer. Det stöds av flera översättningsverktyg, och faktum är att flera faktiskt är uppbyggda kring XLIFF-standarden: t.ex. Heartsome och Swordfish. Eftersom det är en standard, är en fördel med XLIFF att filfiltren som erbjuds av ett översättningsverktyg för konvertering av ett visst format till XLIFF (och, efter översättning, tillbaka igen) kan i teorin användas för att förbereda filer i det formatet för översättning i vilket översättningsverktyg som helst som stöder XLIFF. I praktiken kräver arbete med XLIFF verktyg som inte är speciellt användarvänliga. 

OmegaT har rudimentär support för XLIFF, och ett tillvägagångssätt för att använda XLIFF i OmegaT tillsammans med verktyg från Rainbow finns här. Filtren som finns är mest för filformat speciella för IT-industrin, snarare än användarformat.

Trados "uncleaned RTF"

Tradosformatet "uncleaned RTF", ofta bara kallade "uncleaned files", har länge varit det vanligaste tvåspråkiga filformatet som används för arbetsflöden med översättning. Det kommer sig av att översättningsverktyget Trados använder sig av MS Word som gränssnitt. Utöver Trados stöder flera andra formatet "uncleaned RTF", bl.a. Wordfast Classic.
I princip består detta format av en RTF-fil där käll- och målsegment alternerar. Segmenten markeras och avgränsas med specialtecken och MS Word-formatering.
Ett skript (endast för Windows) och procedur utvecklades nyligen (2008) som möjliggör användare av OmegaT att skapa Trados "uncleaned RTF"-filer för att leverera till slutkund. För ytterligare detaljer, se "Exporting from OmegaT to uncleaned RTF" HOWTO.

Trados TTX

Trados TTX är motsvarigheten till "uncleaned RTF"-formatet för Trados Tag Editor, som till skillnad från Trados Workbench inte arbetar direkt i kombination med MS Word. TTX är ett XML-baserat format. En kombination av ett skript ("Toxic", för Trados-OmegaT-eXchange) och ett filter som gör det möjligt att översätta TTX-filer i OmegaT finns här. Observera: denna funktion är fortfarande i ett tidigt utvecklingsstadium.

Wordfast TXML

Wordfast TXML är det inhemska filformatet för Wordfasts nya Wordfast Professional (också känd som Wordfast 6.0). Som namnet antyder, är det ett XML-baserat format. Det stöds inte av OmegaT för närvarande, och enligt representanter från Wordfast kommer det troligtvis ersättas av XLIFF i sinom tid.

Déjà Vu "External View"

En intressant funktion i Déjà Vu DVX är dess "External View"-filformat. Detta filformat möjliggör användare av OmegaT att leverera tvåspråkiga filer till användare av Déjà Vu DVX, som sedan kan redigera dem ytterligare, eller inkorporera dem i automatiserade arbetsflöden. För ytterligare detaljer, se Déjà Vu "External View" HOWTO.



Tillbaka till Dokumentation
© Marc Prior, 2009