Compatibility

Οδηγός συμβατότητας του OmegaT

Αυτός ο οδηγός περιγράφει την συμβατότητα του OmegaT με άλλα προϊόντα λογισμικού.

Γενικά σχόλια

Αφού οι επαγγελματίες μεταφραστές συνήθως παραλαμβάνουν και παραδίδουν κείμενα σε ψηφιακή μορφή, είναι φυσικό να ενδιαφέρει τους χρήστες τού OmegaT η συμβατότητά του με άλλα προϊόντα λογισμικού. Σκοπός αυτού του οδηγού είναι να σας πληροφορήσει σχετικά.

Γενικά, σπάνια υπάρχει πλήρης ή μηδαμινή συμβατότητα. Όταν ο κατασκευαστής ενός προϊόντος λογισμικού διατείνεται ότι το προϊόν είναι συμβατό με ένα άλλο προϊόν, σπάνια πρόκειται για 100% συμβατότητα. Από την άλλη, όταν δύο προϊόντα δεν είναι ευθέως συμβατά, συχνά μπορούν να βρεθούν διαδικασίες για να συνεργαστούν. Το ερώτημα είναι πόσο αποδεκτές είναι αυτές οι διαδικασίες βάσει του ισοζυγίου κόπου-αποτελέσματος που ενέχουν, ερώτημα του οποίου η απάντηση ενδέχεται να διαφέρει από χρήστη σε χρήστη. Με άλλα λόγια, η "συμβατότητα" δεν αφορά μόνο σε προϊόντα αλλά και σε μεθόδους εργασίας.

Λειτουργικά συστήματα

Το OmegaT τρέχει σε οποιοδήποτε λειτουργικό σύστημα μπορεί να τρέξει κατάλληλη έκδοση του Java Runtime Environment (JRE). Προς το παρόν, τέτοια συστήματα είναι όλες τις εκδόσεις των Windows (από Windows 98 και εξής), το Mac OS X και τις περισσότερες διανομές τού Linux.

Κείμενα αφετηρίας (αρχεία προς μετάφραση)

Ανατρέξτε στο εγχειρίδιο χρήσης τού OmegaT για μια ενημερωμένη λίστα των υποστηριζόμενων μορφών αρχείου. Η παρακάτω λίστα δεν αναφέρει όλες τις μορφές αρχείου που υποστηρίζει το OmegaT, αλλά περιορίζεται σε όσες ενδιαφέρουν κυρίως τον μέσο χρήστη.

Μεταφραστικές μνήμες

Για τις μεταφραστικές μνήμες υπάρχει ένα διεθνές πρότυπο: το TMX, ήτοι Translation Memory eXchange. Τυγχάνει ευρείας αποδοχής και το υποστηρίζουν σχεδόν όλα τα εργαλεία CAT.

Το πρότυπο TMX υπάρχει σε διαφορετικές εκδόσεις και διαφορετικά επίπεδα. Η διάκριση έχει σημασία για την συμβατότητα. Το πρότυπο τελεί ακόμη υπό ανάπτυξη, εξού και οι διαφορετικές εκδόσεις. Τα διαφορετικά επίπεδα αφορούν στις πληροφορίες που περιέχει ένα αρχείο TMX:

Ορισμένα εργαλεία CAT (όπως το Trados) μπορούν να εξάγουν διαφορετικά αρχεία TMX σε διαφορετικές εκδόσεις. Το OmegaT υποστηρίζει όλες τις τρέχουσες εκδόσεις τού TMX, αλλά συνήθως οι καλύτερες ταυτίσεις προέρχονται από TMX έκδοσης 1.4b.

Ακόμη κι αν δυο εργαλεία υποστηρίζουν αρχεία TMX διαφορετικών επιπέδων, παραμένουν κατ’ αρχήν συμβατά το ένα με το άλλο. Οι πληροφορίες μορφοποίησης του υψηλότερου επιπέδου δεν σημαίνουν τίποτε στο άλλο εργαλείο, μα το κείμενο παραμένει χρήσιμο για προβολή, ταύτιση κτλ..

Οι εγγενείς μεταφραστικές μνήμες τού OmegaT βασίζονται στο διεθνές πρότυπο TMX. Ορισμένα εργαλεία CAT χρησιμοποιούν δικές τους, ιδιόκτητες μορφές μεταφραστικής μνήμης, αλλά σχεδόν όλα μπορούν να εισαγάγουν και να εξαγάγουν αρχεία TMX. Άρα, στην πράξη, οι μεταφραστές μπορούν να παραδίδουν μεταφραστικές μνήμες στους πελάτες —κι αντιστρόφως— και οι παραλήπτες τους να τις χρησιμοποιούν ως υλικό αναφοράς· αν, όμως, τα αρχεία προορίζονται για χρήση σε αυτοματοποιημένη ροή εργασιών, ισχύει ο ανωτέρω περιορισμός.

Άλλες αξιοσημείωτες πληροφορίες για τα αρχεία TMX:

Το πρότυπο TMX ορίζει ποιοι χαρακτήρες επιτρέπονται. Αυτοί οι ορισμοί δεν τηρούνται εξίσου αυστηρά από όλα τα εργαλεία CAT· επομένως, ορισμένα εργαλεία CAT δεν μπορούν να ανοίξουν απευθείας αρχεία TMX που έχουν δημιουργηθεί από ορισμένα άλλα εργαλεία CAT. Το OmegaT γενικά τηρεί τους ορισμούς και ανέχεται την μη τήρησή τους από άλλα εργαλεία· αν, παρά ταύτα, ανακύψουν προβλήματα, μπορείτε να τα επιλύσετε σχετικά εύκολα: ανοίγετε το αρχείο TMX σε έναν επεξεργαστή κειμένου, αναζητάτε τον/τους ανεπίτρεπτους χαρακτήρες και τους αντικαθιστάτε.

Τα αρχεία TMX είναι εγκωδικευμένα ως Unicode (UTF-8 ή UTF-16). Αρχεία TMX που έχουν δημιουργηθεί σε συστήματα Windows ίσως ξεκινούν με σημάδι σειράς byte (Byte-Order Mark —BOM). Αυτές οι διαφορές συνήθως δεν προκαλούν ασυμβατότητα.

Προβλήματα συμβατότητας ενδέχεται να ανακύψουν από διαφορές στους κωδικούς γλωσσών. Το OmegaT υποστηρίζει κωδικούς γλωσσών τής μορφής "xx", "XX", "xx-YY" ή "XX-YY", όπου xx ή XX είναι η γλώσσα και yy ή YY η περιοχή. Το πρότυπο ISO για τους κωδικούς γλωσσών απαιτεί την χρήση τής μορφής "xx-YY" (π.χ.: "el-GR" για την Ελληνική τής Ελλάδας)· το OmegaT υποστηρίζει αυτήν την μορφή, αλλά από προεπιλογή χρησιμοποιεί την "ΧΧ-YY" (π.χ. "EL-GR"). Το OmegaT είναι ανεκτικό όταν διαβάζει αρχεία TMX: αποδέχεται αρχεία με κωδικό en-GB, en-US, en, EN κτλ.. Δεν είναι όλα τα εργαλεία CAT τόσο ανεκτικά, ώστε ορισμένα ίσως να μην εμφανίζουν τις αναμενόμενες ταυτίσεις αν οι κωδικοί γλωσσών δεν συμμορφώνονται με το πρότυπο. Αυτή η ασυμβατότητα μπορεί να επιλυθεί αν ανοίξετε το αρχείο TMX σε έναν κατάλληλο επεξεργαστή κειμένου, αναζητήσετε τους ακατάλληλους κωδικούς γλωσσών και τους αντικαταστήσετε. Άλλη πιθανή πηγή ασυμβατότητας είναι οι τριψήφιοι κωδικοί γλωσσών, τους οποίους δεν υποστηρίζει το OmegaT καθόλου. (Παρεμπιπτόντως, αυτό οφείλεται σε ανεπάρκεια της Java, όχι του OmegaT.)

Σημειώσεις για τα ιδιόκτητα αρχεία μεταφραστικής μνήμης:

Η μορφή αρχείου μεταφραστικής μνήμης τού Wordfast είναι αξιοσημείωτης απλότητας: είναι ένα αρχείο απλού κειμένου με μία μεταφραστική μονάδα σε κάθε σειρά, της οποίας τα τεμάχια αφετηρίας και αφίξεως χωρίζονται με διάστημα στηλοθέτη (Tab). Αυτή η μορφή μπορεί εύκολα να μετατραπεί σε TMX με βοηθήματα τρίτων, όπως το Wf2TMX. Το ίδιο μπορεί να επιτευχθεί και με το Anaphraseus.

Αρχεία γλωσσαρίου

Τα αρχεία γλωσσαρίου τού OmegaT είναι αρχεία απλού κειμένου τής μορφής:

όρος αφετηρίας <tab> όρος αφίξεως <tab> πρόσθετες πληροφορίες

Ορισμένα άλλα εργαλεία CAT μπορούν να εισαγάγουν και να εξαγάγουν αρχεία γλωσσαρίου σε αυτήν την μορφή ή σε παρόμοιο αρχείο απλού κειμένου, το οποίο μπορεί να προκύψει πολύ εύκολα από αυτήν (π.χ. με αναζήτηση-αντικατάσταση στο Microsoft Word).

Το OmegaT μπορεί επίσης να διαβάσει γλωσσάρια μορφής TBX, που είναι η πρότυπη μορφή για αρχεία γλωσσαρίου.

Το OmegaT δεν μπορεί να εισαγάγει ή να διαβάσει αρχεία γλωσσαρίου σε ιδιόκτητες δυαδικές μορφές, όπως αρχεία τού Trados Multiterm.

Δίγλωσσα αρχεία εργαλείων CAT

Πολλά εργαλεία CAT χρησιμοποιούν ενδιάμεσες δίγλωσσες μορφές αρχείου, δηλαδή αρχεία με τα τεμάχια αφετηρίας και αφίξεως —και την δομή τού πρωτότυπου αρχείου, σε ορισμένες περιπτώσεις. Αρχικά, αυτές οι δίγλωσσες μορφές αρχείου ήταν απόρροια της αρχιτεκτονικής τού εκάστοτε εργαλείου. Ωστόσο, έχουν γίνει συνήθη σε ροές μεταφραστικών εργασιών με χρήση εργαλείων CAT και συχνά αποτελούν το μεγαλύτερο εμπόδιο στην συμβατότητα μεταξύ του OmegaT και άλλων εργαλείων CAT (ή μεταξύ δύο οποιωνδήποτε εργαλείων CAT).

Υπάρχουν τουλάχιστον τρεις λόγοι για τους οποίους ένας πελάτης ίσως ζητήσει να παραδοθεί μια μετάφραση σε ορισμένη δίγλωσση μορφή αρχείου (αντί να παραδοθούν το μετάφρασμα και η μεταφραστική μνήμη):

1. Ορισμένα εργαλεία CAT (με πλέον γνωστό παράδειγμα το Trados) μπορούν να εισαγάγουν διάφορες μορφές αρχείου, όπως μορφές εφαρμογών επιτραπέζιας τυπογραφίας, και να τις προετοιμάζουν για μετάφραση σε αυτά. Αυτή η "προετοιμασμένη" μορφή είναι συνήθως η δίγλωσση μορφή αρχείου τού εργαλείου. Χωρίς αυτήν την προετοιμασία ο μεταφραστής ίσως μπορεί να προσπελάσει την αρχική μορφή αρχείου.

2. Η μετάφραση είναι ένα μόνο στάδιο στην ροή εργασιών τού πελάτη. Για παράδειγμα, η μετάφραση ενδέχεται να σταλεί αλλού για έλεγχο και επιμέλεια. Αν οι αλλαγές τού επιμελητή πρόκειται να περιληφθούν σε αποθετήριο μεταφραστικών μνημών τού πελάτη, οι αλλαγές πρέπει να γίνουν πριν δημιουργηθούν τα τελικά έγγραφα. Αυτό γίνεται είτε εντός τού οικείου εργαλείου CAT είτε, καμιά φορά, μέσω εξωτερικής δίγλωσσης μορφής αρχείου την οποία μπορεί να αναγνώσει το εργαλείο.

3. Ο πελάτης επιθυμεί να παραλάβει μια μεταφραστική μνήμη για χρήση σε μελλοντικές μεταφράσεις κειμένων: για "προμετάφρασή" τους βάσει υπάρχουσας μεταφραστικής μνήμης. Για να γίνει αυτό με την μικρότερη δυνατή παρέμβαση του χρήστη, πρέπει να ικανοποιούνται δύο συνθήκες: πρώτον, η μεταφραστική μνήμη να περιέχει πληροφορίες μορφοποίησης (βλ. παραπάνω)· δεύτερον, οι κανόνες τεμαχισμού τού κειμένου να είναι ίδιοι με εκείνους που χρησιμοποιήθηκαν κατά την δημιουργία τής μεταφραστικής μνήμης (ή μέρους αυτής). Ο ευκολότερος τρόπος με τον οποίο ο πελάτης μπορεί να διασφαλίσει την ικανοποίηση αυτών των δύο συνθηκών είναι να προμεταφράσει —άρα και να τεμαχίσει— το κείμενο ο ίδιος πριν το επιδώσει στον μεταφραστή και να δημιουργήσει την μεταφραστική μνήμη στο εργαλείο CAT τής επιλογής του αφού λάβει το μεταφρασμένο ενδιάμεσο δίγλωσσο αρχείο από τον μεταφραστή (διασφαλίζοντας, έτσι, την καταλληλότητα των πληροφοριών μορφοποίησης της μεταφραστικής μνήμης για χρήση σε μελλοντικά έργα).

Το OmegaT μπορεί να χειριστεί πολλές δίγλωσσες μορφές αρχείου, τις περισσότερες εξ αυτών χωρίς πολύ κόπο. Ωστόσο, είναι σημαντικό να κατανοήσετε τις απαιτούμενες διαδικασίες. Παρακάτω περιγράφεται καθεμιά δίγλωσση μορφή αρχείου.

XLIFF

Η μορφή XLIFF είναι η πλέον διαδεδομένη δίγλωσση μορφή αρχείου. Την υποστηρίζουν πολλά εργαλεία CAT, ενώ ορισμένα έχουν σχεδιαστεί "βάσει" τού προτύπου XLIFF —όπως το Heartsome και το Swordfish. Επειδή είναι πρότυπο, το XLIFF έχει το πλεονέκτημα ότι τα φίλτρα ενός εργαλείου CAT για την μετατροπή από μια μορφή αρχείου σε XLIFF (και αντίστροφα, αφού ολοκληρωθεί η ροή μεταφραστικών εργασιών) μπορούν θεωρητικά να χρησιμοποιηθούν για την προετοιμασία αρχείων προς μετάφραση σε οποιοδήποτε εργαλείο CAT υποστηρίζει XLIFF. Στην πράξη, μια ροή εργασιών με XLIFF συχνά απαιτεί την χρήση εργαλείων που δεν είναι ιδιαίτερα φιλικά προς τον χρήστη.

Το OmegaT παρέχει βασική υποστήριξη για XLIFF, ενώ υπάρχει ειδική διαδικασία για χρήση XLIFF στο OmegaT με την βοήθεια του Rainbow. Τα διαθέσιμα φίλτρα είναι κυρίως για ειδικές μορφές αρχείου τού τομέα τής πληροφορικής παρά για αρχεία τελικών χρηστών.

"Ακαθάριστο RTF" τού Trados

Τα "ακαθάριστα RTF" τού Trados (συχνά καλούνται απλώς "ακαθάριστα αρχεία") ήταν για χρόνια η πιο κοινή δίγλωσση μορφή αρχείου για μεταφραστικές ροές εργασίας. Εμφανίστηκαν όταν το Trados ήταν μια μακροεντολή τού Microsoft Word. Ωστόσο, κι άλλα εργαλεία CAT υποστηρίζουν την μορφή "ακαθάριστο RTF", με γνωστότερο παράδειγμα το Wordfast Classic.

Στην ουσία, αυτή η μορφή αποτελείται από ένα αρχείο RTF στο οποίο εναλλάσσονται τα τεμάχια αφετηρίας και αφίξεως. Αυτά τα τεμάχια σημειώνονται και κατατέμνονται με ειδικούς χαρακτήρες και στιλ μορφοποίησης του Microsoft Word.

Σχετικά πρόσφατα (2008) κυκλοφόρησαν μια δέσμη ενεργειών (μόνο για Windows) και μια διαδικασία με τις οποίες οι χρήστες τού OmegaT μπορούν να δημιουργούν ακαθάριστα RTF τού Trados και να παραδίδουν αυτά. Για λεπτομέρειες ανατρέξτε στονοδηγό "Εξαγωγή ακαθάριστου RTF από το OmegaT.

Trados TTX

Η μορφή Trados TTX είναι η μορφή τού Trados Tag Editor που αντιστοιχεί στο "ακαθάριστο RTF" τού Trados Workbench, μόνο που αυτή η εφαρμογή δεν λειτουργεί εντός του Microsoft Word. Η μορφή TTX βασίζεται στην XML. Πλέον διατίθεται βυσματούμενο πρόγραμμα (plugin) τού OmegaT, που επιτρέπει την εργασία με αρχεία αυτής της μορφής.

Wordfast TXML

Η μορφή TXML είναι η εγγενής μορφή τού Wordfast Professional. Όπως δηλώνει το όνομά της, είναι μορφή βασισμένη στην XML. Προς το παρόν δεν υποστηρίζεται από το OmegaT, ενώ σύμφωνα με τους αντιπροσώπους τού Wordfast πρόκειται να αντικατασταθεί από την μορφή XLIFF στο μέλλον.

"External View" τού Déjà Vu

Ένα ενδιαφέρον γνώρισμα του Déjà Vu DVX είναι η μορφή αρχείου "External View". Αυτή η μορφή αρχείου επιτρέπει στους χρήστες τού OmegaT να παραδίδουν δίγλωσσα αρχεία σε χρήστες τού Déjà Vu DVX κι εκείνοι να τα επεξεργάζονται περαιτέρω ή να τα ενσωματώνουν σε αυτοματοποιημένες ροές εργασιών. Για λεπτομέρειες ανατρέξτε στον οδηγό για το "External View" τού Déjà Vu.

Copyright Marc Prior 2009-2011