Howto - Translating Word 2007 files in OmegaT

Οδηγός τού OmegaT:
Μετάφραση αρχείων τού Word 2007 (Office Open XML, .docx) στο OmegaT

Αυτός ο οδηγός δίνει συμβουλές για την μετάφραση αρχείων των Microsoft Office 2007 (και μεταγενέστερων) στο OmegaT.

Προκαταρκτικά

Με την έλευση τού Microsoft Office 2007, τα Microsoft Word, Excel και Powerpoint απέκτησαν νέες προεπιλεγμένες μορφές αρχείου. Αυτές οι μορφές είναι γνωστές ως "Office Open XML" και έχουν τις επεκτάσεις .docx, .xlsx και .pptx, αντιστοίχως. Τις ίδιες μορφές χρησιμοποιεί και το Microsoft Office 2010. Χάριν απλότητας, θα τις καλούμε "μορφές αρχείου τού Microsoft Office 2007".

Από την έκδοση 1.7.1 και ύστερα το OmegaT χειρίζεται τα αρχεία τού Microsoft Office 2007 απευθείας, χωρίς μετατροπή. Με την έκδοση 2.1.8 τού OmegaT ο χειρισμός αυτής της μορφής αρχείου στο OmegaT έγινε και πολύ φιλικότερος προς τον χρήστη.

Πλεονεκτήματα της χρήσης τής μορφής .docx με το OmegaT

Καθώς οι πελάτες/συντάκτες αναβαθμίζουν σε νεότερες εκδόσεις τού Microsoft Office/Word, οι μεταφραστές λαμβάνουν ολοένα περισσότερα αρχεία στην νέα μορφή. Σε αντιδιαστολή με τις μορφές .doc, .xls και .ppt, αυτά τα αρχεία μπορεί να τα χειριστεί απευθείας το OmegaT, χωρίς απώλεια πληροφοριών μορφοποίησης εξαιτίας μετατροπών από μια μορφή σε άλλη.

Η νέα μορφή μπορεί να διευκολύνει και τον χειρισμό αρχείων μορφής .doc, .xls και .ppt, αφού μπορούν να μετατραπούν στις αντίστοιχες μορφές τού Microsoft Office 2007, να μεταφραστούν στο OmegaT και ύστερα να μετατραπούν ξανά στην αρχική τους μορφή. Αυτή η διαδικασία προσφέρει μια εναλλακτική λύση σε όσους μεταφραστές προτιμούν να μην χρησιμοποιήσουν το OpenOffice.org για τον ίδιο σκοπό.

Μετατροπή σε μορφή τού Microsoft Office 2007

Μπορείτε να μετατρέψετε αρχεία των Microsoft Office 1997/2000/2003/XP σε μορφή τού Microsoft Office 2007 ανοίγοντάς τα στο Microsoft Office 2007 και αποθηκεύοντάς τα στην νέα μορφή με την εντολή "Αποθήκευση ως". (Αφού αυτές είναι πια οι συνήθης μορφές, καλούνται απλώς "μορφή Word", "μορφή Excel" και "μορφή PowerPoint" στο Microsoft Office 2007.)

Για όσους χρήστες δεν έχουν το Microsoft Office 2007 ή 2010 και δεν επιθυμούν να το αγοράσουν, η Microsoft παρέχει ένα πακέτο συμβατότητας για προγενέστερες εκδόσεις.

Χρήστες Linux: Χρήστες Linux: το Microsoft Office 2007 όσο και το πακέτο συμβατότητας της Microsoft μπορούν να εκτελεστούν σε Crossover Linux.

Σημεία που απαιτούν προσοχή κατά την χρήση των μορφών .docx, .xlsx και .pptx στο OmegaT

Σε εκδόσεις τού OmegaT πριν την 2.1.8 κάθε αλλαγή στη μορφοποίηση ενός αρχείου τού Microsoft Office 2007 δημιουργούσε πολλές ετικέτες, δυσχεραίνοντας σημαντικά τον χειρισμό αυτής της μορφής αρχείου. Από την έκδοση 2.1.8 η προεπιλεγμένη συμπεριφορά είναι αυτές οι ετικέτες να συμπυκνώνονται σε μία. Επομένως, όσοι χρήστες επιθυμούν να μεταφράσουν αρχεία τού Microsoft Office 2007 καλό είναι να αναβαθμίσουν το OmegaT στην έκδοση 2.1.8 ή μεταγενέστερη.

(Ο ευκολότερος χειρισμός των ετικετών των αρχείων .docx, όμως, συνοδεύεται από μικρή απώλεια στο έλεγχο της μορφοποίησης. Για παράδειγμα, χωρίς τις συνδυασμένες ετικέτες, αν μια λέξη ήταν με έντονα και πλάγια στοιχεία, ο μεταφραστής μπορούσε να κρατήσει μόνο την έντονη ή την πλάγια μορφοποίηση. Όταν χρησιμοποιούνται συνδυασμένες ετικέτες, αυτό δεν είναι δυνατό. Οι περισσότεροι χρήστες μάλλον θα προτιμήσουν τις συνδυασμένες ετικέτες παρά το μειονέκτημα αυτό.)

Η μορφή .docx έχει επίσης το μειονέκτημα της εισαγωγής "ενοχλητικών" κωδικών μορφοποίησης, οι οποίοι εμφανίζονται ως αχρείαστες ετικέτες στην περιοχή μετάφρασης του OmegaT. Αφού αυτές οι ετικέτες εμποδίζουν κατά την μετάφραση, καλό είναι να τις αφαιρέσετε πριν αρχίσετε να μεταφράζετε στο OmegaT. Αυτό το πρόβλημα επηρεάζει και το OmegaT και άλλα εργαλεία CAT και όλα το επιλύουν με τον ίδιο ή παραπλήσιο τρόπο.

Πώς αφαιρείτε ανεπιθύμητους κωδικούς μορφοποίησης από αρχεία .docx

Σημειώστε ότι, ακόμη και αφού αλλάξετε τις ρυθμίσεις τού Word ώστε να μην εισάγει "ενοχλητικούς" κωδικούς (π.χ. για αυτόματο συλλαβισμό), ενδέχεται να παραμείνουν τέτοιοι κωδικοί στο αρχείο, που να μην επηρεάζονται από την αλλαγή στις ρυθμίσεις. Αυτοί οι κωδικοί μπορούν να αφαιρεθούν όπως περιγράφεται παρακάτω. Προτού ακολουθήσετε τις οδηγίες για την αφαίρεση των ενοχλητικών κωδικών, όμως, πρέπει να έχετε αλλάξει τις ρυθμίσεις τού Word, αλλιώς το πρόγραμμα θα εισαγάγει εκ νέου ενοχλητικούς κωδικούς μόλις ανοίξετε το επόμενο αρχείο.

Μακροεντολή CodeZapper

Όπως έχει αναφερθεί ήδη, το πρόβλημα με το Microsoft Office 2007 δεν πλήττει μόνο το OmegaT. Ο μεταφραστής David Turner έχει γράψει μια μακροεντολή τού MS Word που αντιμετωπίζει το πρόβλημα —και την οποία συνιστούμε μετ’ επιτάσεως!

Εξομάλυνση μορφοποίησης χαρακτήρων

Αντί να εκτελέσετε την μακροεντολή CodeZapper, θα μπορούσατε να "εξομαλύνετε" την μορφοποίηση. "Εξομάλυνση" της μορφοποίησης σημαίνει ότι εφαρμόζετε την μορφοποίηση του πρώτου χαρακτήρα μιας επιλεγμένης έκτασης κειμένου (π.χ. μιας παραγράφου) σε όσους χαρακτήρες ακολουθούν. Αυτό δεν ισοδυναμεί με "διαγραφή" μορφοποίησης, περίπτωση στην οποία οι χαρακτήρες θα μορφοποιούνταν σύμφωνα με την προεπιλογή τού εγγράφου.

Για να εξομαλύνετε την μορφοποίηση μιας παραγράφου, την αντιγράφετε στο MS Word και την επικολλάτε στον εαυτό της, ώστε όλοι οι χαρακτήρες της να μορφοποιηθούν όπως ο πρώτος της.

Μη αυτόματη εξομάλυνση μορφοποίησης χαρακτήρων

Βήμα 1: Εμφανίστε τα σημάδια παραγράφου. Κάνετε κλικ σε μια παράγραφο ώσπου να επιλεχθεί ολόκληρη (δύο κλικ αν αποτελείται από μία λέξη, τρία κλικ αν αποτελείται από περισσότερες). Εξαιρέστε το σημάδι τής παραγράφου από την επιλογή.

Βήμα 2: Αντιγράψτε το επιλεγμένο κείμενο (Ctrl+C). Μετά, κάντε "Ειδική επικόλληση" (Word 2003) ή κάντε κλικ στο βελάκι στο κάτω μέρος τού κουμπιού "Εισαγωγή" (Word 2007), για να εμφανιστούν περισσότερες επιλογές επικόλλησης. Τέλος, εισαγάγετε το κείμενο με την επιλογή "Μη μορφοποιημένο κείμενο Unicode".

Αν μια παράγραφος περιέχει μερικές λέξεις με έντονα ή πλάγια στοιχεία, υπερσυνδέσμους κ.ά., μπορείτε να κάνετε ένα από τα παρακάτω:

- Εξομαλύνετε την μορφοποίηση όπως περιγράφηκε παραπάνω και μορφοποιείτε εξαρχής όσες λέξεις επιθυμείτε ή

- Επιλέγετε το κείμενο πριν την λέξη με την ειδική μορφοποίηση, το αντιγράφετε, το επικολλάτε και συνεχίζετε με το κείμενο μετά την λέξη με την ειδική μορφοποίηση.

Δημιουργία μακροεντολής για την εξομάλυνση της μορφοποίησης των χαρακτήρων μιας παραγράφου

Η παραπάνω διαδικασία μπορεί αν αυτοματοποιηθεί με την δημιουργία μιας μακροεντολής. Ακολουθούν σύντομες οδηγίες για το πώς να δημιουργήσετε την μακροεντολή (στο Microsoft Office 2007). (Για λεπτομερέστερες οδηγίες ανατρέξτε στο εγχειρίδιο οδηγιών ή εδώ, εδώ κι εδώ.)

Αν δεν το έχετε κάνει ήδη, προσθέστε την καρτέλα "Προγραμματιστής" στην κορδέλα, ως εξής: Πιέσετε το κουμπί τού Office. Μεταβείτε στις "Επιλογές τού Word". Κάντε κλικ στο κουμπί Δημοφιλείς. Επιλέξτε "Εμφάνιση της καρτέλας "Προγραμματιστής" στη Κορδέλα" και πιέστε ΟΚ. Κλείστε το Word.

Εκκινήστε το Word ξανά, δημιουργήστε ένα νέο αρχείο τού Word και προσθέστε μια παράγραφο τουλάχιστον τριών σειρών, όπως:

Αυτή είναι μία παράγραφος. Αυτή είναι μία παράγραφος. Αυτή είναι μία παράγραφος. Αυτή είναι μία παράγραφος. Αυτή είναι μία παράγραφος. Αυτή είναι μία παράγραφος. Αυτή είναι μία παράγραφος. Αυτή είναι μία παράγραφος. Αυτή είναι μία παράγραφος. Αυτή είναι μία παράγραφος. Αυτή είναι μία παράγραφος. Αυτή είναι μία παράγραφος. Αυτή είναι μία παράγραφος. Αυτή είναι μία παράγραφος. Αυτή είναι μία παράγραφος. Αυτή είναι μία παράγραφος. Αυτή είναι μία παράγραφος. Αυτή είναι μία παράγραφος. Αυτή είναι μία παράγραφος. Αυτή είναι μία παράγραφος. Αυτή είναι μία παράγραφος. Αυτή είναι μία παράγραφος.

Πιέστε το κουμπί με το σημάδι παραγράφου, για να εμφανιστούν τα κρυφά τυπογραφικά σημάδια.

Εισαγάγετε τον δρομέα σε μια παράγραφο πλην της πρώτης και της τελευταίας.

Δημιουργήστε την μακροεντολή:

Στην καρτέλα "Προγραμματιστής" πιέστε "Καταγραφή μακροεντολής".

Στο πλαίσιο "Όνομα μακροεντολής" πληκτρολογήστε ένα όνομα, όπως "levelformat". Για να είναι η μακροεντολή διαθέσιμη σε όλα τα έγγραφα, επιλέξτε το Normal.dotm στο "Αποθήκευση μακροεντολής σε". Αν έχετε τροποποιήσει το Normal.dotm, καλό είναι να έχετε δημιουργήσει αντίγραφο ασφαλείας του πριν συνεχίσετε.

Πιέστε το κουμπί "Πληκτρολόγιο". Βάλτε τον δρομέα στο πλαίσιο "Πίεση νέου πλήκτρου συντόμευσης" και δοκιμάστε διάφορους συνδυασμούς πλήκτρων, ώσπου να πετύχετε έναν που δεν έχει δεσμευτεί. Αν ένας συνδυασμός είναι δεσμευμένος, εμφανίζεται μήνυμα που σας το λέει, οπότε διαγράφετε τον συνδυασμό και δοκιμάζετε άλλον. Σε μία ατροποποίητη εγκατάσταση του Word, ο συνδυασμός Ctrl+Shift+9 είναι ελεύθερος, οπότε μπορείτε να χρησιμοποιήσετε αυτόν.

Πιέστε το "Εκχώρηση", για να ανατεθεί η συντόμευση στην μακροεντολή που πρόκειται να καταγράψετε. Ό,τι κάνετε στην συνέχεια θα περιληφθεί στην μακροεντολή, οπότε κάντε τα παρακάτω με προσοχή:

Ctrl+Πάνω (για να μεταβείτε στην αρχή τής παραγράφου)

Ctrl+Shift+Κάτω (για να επιλέξετε την παράγραφο και το σημάδι παραγράφου)

Shift+Αριστερά (για να μειωθεί επιλογή κατά έναν χαρακτήρα, ώστε να μην είναι επιλεγμένο το σημάδι παραγράφου)

Ctrl+C (για να αντιγραφεί η παράγραφος)

Ctrl+V (για να επικολληθεί το κείμενο της παραγράφου στο ίδιο σημείο)

Αφού εκτελέσετε αυτές τις εντολές, πιέστε "Διακοπή καταγραφής".

Πιέστε "Μακροεντολές", επιλέξτε την "levelformat" (ή όπως αλλιώς την ονομάσατε) και πιέστε "Επεξεργασία". Εμφανίζεται ο κώδικας της μακροεντολής σας (και άλλων μακροεντολών, αν υπάρχουν). Ο κώδικας για την μακροεντολή σας πρέπει να είναι ως εξής:

___________________
Sub levelformat()
'
' levelformat macro
'
'
Selection.MoveUp Unit:=wdParagraph, Count:=1
Selection.MoveDown Unit:=wdParagraph, Count:=1, Extend:=wdExtend
Selection.MoveLeft Unit:=wdWord, Count:=1, Extend:=wdExtend
Selection.Copy
Selection.PasteAndFormat (wdPasteDefault)
End Sub
___________________

Αλλάξτε την σειρά:

Selection.PasteAndFormat (wdPasteDefault)

σε:

Selection.PasteSpecial DataType:=wdPasteText

Αποθηκεύστε την με Ctrl+S και κλείστε το παράθυρο επεξεργασίας μακροεντολών.

Αν όλα έγιναν σωστά, η μακροεντολή πρέπει να λειτουργεί. Για να την δοκιμάσετε, μορφοποιήστε τμήμα τού κειμένου σας στο Word —κάντε μια λέξη έντονη, για παράδειγμα. Κατόπιν, βάλτε τον δρομέα οπουδήποτε εντός τής παραγράφου και πιέστε Ctrl+Shift+9 (ή όποιον συνδυασμό πλήκτρων ορίσατε): η μορφοποίηση πρέπει να εξαφανιστεί.

Μπορείτε να αλλάξετε τον συνδυασμό πλήκτρων οποτεδήποτε. Για να το κάνετε, πιέστε το κουμπί τού Office και μεταβείτε στις "Επιλογές" τού Word.

Επιλέξτε "Προσαρμογή > Επιλογή εντολών". Επιλέξτε "Μακροεντολές" από την πτυσσόμενη λίστα. Επιλέξτε την "levelformat" (ή όπως αλλιώς την ονομάσατε).

Στο κάτω μέρος τού παραθύρου διαλόγου, δεξιά από τις "Συντομεύσεις πληκτρολογίου", κάντε κλικ στο κουμπί "Προσαρμογή".

Στο πλαίσιο "Κατηγορίες", κυλίστε μέχρι να εμφανιστεί η επιλογή "Μακροεντολές" και επιλέξτε την. Στα δεξιά, στο πλαίσιο "Μακροεντολές", επιλέξτε την "levelformat" (ή όπως αλλιώς ονομάσατε την μακροεντολή σας). Η υπάρχουσα συντόμευση θα εμφανιστεί στο σχετικό πλαίσιο. Μπορείτε να την διαγράψετε, αν την επιλέξετε και πιέσετε Delete. Μπορείτε να εισαγάγετε νέα συντόμευση και να την εκχωρήσετε με το κουμπί "Αντιστοίχιση", όπως κάνατε προηγουμένως. Πατήστε "Κλείσιμο" ή "ΟΚ" σε όλα τα παράθυρα διαλόγου.

Με παρόμοιο τρόπο μπορείτε να δημιουργήσετε ένα κουμπί για την μακροεντολή σας:

Ξανά, πιέστε το κουμπί τού Office και μεταβείτε στις "Επιλογές" τού Word.

Επιλέξτε "Προσαρμογή > Επιλογή εντολών". Επιλέξτε "Μακροεντολές" από την πτυσσόμενη λίστα. Επιλέξτε την μακροεντολή σας.

Πιέστε "Προσθήκη". Η μακροεντολή θα πρέπει να εμφανιστεί στην δεξιά στήλη. Πιέστε "Τροποποίηση".

Επιλέξτε ένα σύμβολο και πιέστε "OK" και πάλι "OK". Το σύμβολο της μακροεντολής θα πρέπει να εμφανιστεί στην γραμμή εργαλείων.

Αυτή η μακροεντολή είναι χρήσιμη για να εξομαλύνετε την μορφοποίηση ολόκληρων παραγράφων που δεν έχουν εμφανή μορφοποίηση. Αν μια παράγραφος έχει μορφοποίηση την οποία θέλετε να διατηρήσετε, πρέπει να την αναδημιουργήσετε μετά την εξομάλυνση. Αν μια παράγραφος έχει περίπλοκη μορφοποίηση, αυτή η αναδημιουργία ίσως αποδειχθεί κοπιαστική. Αν έχετε πολλές τέτοιες παραγράφους, εξετάστε αυτές τις εναλλακτικές:

Copyright Marc Prior 2009-2011