HowTo - Word 2007-Dateien in OmegaT übersetzen

Dieses HowTo liefert Tipps zur Übersetzung von Dateien von MS Office 2007 und neuer (Office Open XML, .docx) in OmegaT.

Hintergrund

Mit dem Aufkommen von Microsoft Office 2007 haben Microsoft Word, Excel und PowerPoint neue Standarddateiformate. Diese Formate werden offiziell als "Office Open XML" bezeichnet und haben die Endungen .docx, beziehungsweise .xlsx und .pptx. Diese Formate werden auch in MS Office 2010 verwendet. Der Einfachheit halber werden sie nachstehend als "MS Office 2007-Dateiformate" bezeichnet.

Ab Version 1.7.1 konnte OmegaT Microsoft Office 2007-Dateien direkt und ohne Konvertierung verarbeiten. Mit dem Erscheinen von OmegaT Version 2.1.8 wurde auch die Handhabung dieses Dateiformats in OmegaT wesentlich benutzerfreundlicher.

Die Vorteile der Verwendung des .docx-Formats in Verbindung mit OmegaT

Wenn Kunden / Autoren Microsoft Office / Word auf neuere Versionen aktualisieren, können Übersetzer erwarten, diese Dateien zunehmend im neuen Format zu erhalten. Im Gegensatz zu den älteren Formaten .doc, .xls und .ppt können diese Dateien direkt in OmegaT verarbeitet werden, ohne dass die Formatierung durch Konvertierung in andere Formate verloren geht.

Das neue Format kann auch als nützlicher Weg zur Bearbeitung der älteren Formate .doc, .xls und .ppt dienen, da sie in ihre Pendants in MS Office 2007 konvertiert, in OmegaT übersetzt und wieder zurückkonvertiert werden können. Dieses Verfahren ist daher eine Alternative für Übersetzer, die OpenOffice.org zu diesem Zweck nicht verwenden möchten.

Konvertierung in das MS Office 2007-Format

Sie können MS Office 1997/2000/2003/XP-Dateien in das MS Office 2007-Format konvertieren, indem Sie sie in MS Office 2007 öffnen und mit "Speichern unter" im neuen Format speichern. (Da dies jetzt das Standardformat ist, wird es in MS Office 2007 einfach als Word, Excel oder Powerpoint bezeichnet).

Linux-Benutzer: Sowohl MS Office 2007 als auch das Microsoft-Kompatibilitäts-Plugin werden unter Crossover Linux ausgeführt.

Zu beachtende Punkte bei Verwendung der Formate .docx, .xlsx und .pptx in OmegaT

In OmegaT-Versionen vor 2.1.8 führte jede Formatierungsänderung in einer MS Office 2007-Datei zu einer langen Reihe von mehreren Tags, was die Handhabung dieses Dateiformats oft unpraktisch machte. Ab Version 2.1.8 werden diese vielen Tags standardmäßig zu einem einzigen Tag aggregiert (verdichtet). Benutzer, die MS Office 2007-Dateien übersetzen möchten, sollten daher auf OmegaT Version 2.1.8 oder höher aktualisieren.

(Die leichtere Handhabung von Tags mit DOCX-Dateien geht mit einem leichten Verlust der Kontrolle über die Formatierung einher. Zum Beispiel ohne die Funktion "aggregate tags", bei der ein Wort im Quelltext fett und kursiv dargestellt wird, kann der Übersetzer für die Ausgabe nur fett oder nur kursiv wählen. Wenn die Funktion "aggregate tags" aktiviert ist, ist dies nicht möglich. Die meisten Benutzer werden wahrscheinlich feststellen, dass die größere Benutzerfreundlichkeit diesen Nachteil überwiegt.)

Das .docx-Format ist auch anfällig für die Einführung von "lästigem" Formatierungscode, der dazu führt, dass unerwünschte und unnötige Tags im Editorbereich von OmegaT erscheinen. Da diese während der Übersetzung unbequem sind, lohnt es sich, diese lästigen Tags zu entfernen, bevor mit der Übersetzung in OmegaT begonnen wird. OmegaT teilt dieses Problem mit anderen CAT-Tools, die das DOCX-Format verarbeiten, und die Lösungen sind ähnlich oder gleich.

Wie Sie unerwünschten Formatierungscode aus DOCX-Dateien entfernen

Beachten Sie, dass selbst nach dem Ändern der Word-Einstellungen, so dass keine "störenden" Codes eingefügt werden, z. B. für die automatische Silbentrennung, solche Codes immer noch in der Datei vorhanden sein können und nicht durch die Konfigurationsänderung entfernt wurden. Die Entfernung dieser Codes wird nachstehend beschrieben. Bevor Sie die folgenden Anweisungen zum Entfernen der störenden Codes befolgen, denken Sie daran, die Konfigurationsänderungen zuerst in Word vorzunehmen oder Word fügt möglicherweise einfach wieder Störcode ein, wenn die Datei das nächste Mal geöffnet wird.

Drittanbieterwerkzeuge

Wie bereits erwähnt, ist dieses Problem mit MS Word nicht einzigartig für OmegaT. Drittanbieterwerkzeuge wurden produziert, um mit dem Problem umzugehen. Zwei von ihnen sind:

CodeZapper (preiswert)

Document Cleaner (kostenlos)

Zeichenformat übertragen

Eine Alternative zum Ausführen des CodeZapper-Makros in Ihrem Text ist "Format übertragen". "Format übertragen" bedeutet, dass das Format des ersten Zeichens in einer Textauswahl (z. B. ein ganzer Absatz) auf alle nachfolgenden Zeichen angewendet wird. Beachten Sie, dass dies nicht das gleiche ist wie "Löschen" der Formatierung, wodurch die Zeichenformatierung auf die Standardeinstellungen des Dokuments zurückgesetzt wird.

Sie können die Formatierung von Absätzen im Wesentlichen dadurch verbessern, dass Sie ganze Absätze in MS Word kopieren und über sich selbst einfügen, so dass der gesamte Absatz die Formatierung des ersten Zeichens annimmt.

Manuelles Anpassen der Zeichenformatierung eines Absatzes

Schritt 1: Blenden Sie die Absatzmarke ein. Markieren Sie jeden Absatz durch mehrmaliges Klicken, bis der gesamte Absatz markiert ist. Verschieben Sie dann das Ende der Hervorhebung um ein Zeichen nach links, so dass sie die Absatzmarke nicht enthält.

Schritt 2: Kopieren Sie den markierten Text (Strg + C). Wählen Sie dann "Einfügen spezial" (Word 2003) oder klicken Sie auf den Pfeil am unteren Rand der Schaltfläche "Einfügen" (Word 2007), um die erweiterten Einfügeoptionen zu erhalten. Fügen Sie den Inhalt schließlich mit der Option "Unformatierter Unicode-Text" ein.

Wenn Absätze Inline-Formatierung enthalten (fett, kursiv, Hyperlinks usw.), können Sie entweder:

- die Formatierung aus diesen Absätzen mit dem oben beschriebenen Makro anpassen; Fügen Sie dann die Formatierung erneut ein oder

- nur den Text bis zum Anfang des formatierten Teils markieren; Kopieren Sie diesen Text und fügen Sie ihn wieder über sich selbst ein, wiederholen Sie dann den Vorgang im Text nach dem formatierten Teil.

Erstellen eines Makros zum Anpassen der Zeichenformatierung eines Absatzes

Sie können den obigen Vorgang etwas automatisieren, indem Sie ein Makro erstellen. Kurze Anweisungen zum Erstellen des Makros (in MS Office 2007). (For more detailed instructions, refer to your instruction manual or click here or here.)

Wenn Sie dies noch nicht getan haben, fügen Sie die Registerkarte Entwickler wie folgt in das Menüband ein: Klicken Sie auf die Schaltfläche Office. Wählen Sie Word-Optionen. Klicken Sie im Dialogfeld Word-Optionen auf Beliebt. In der Multifunktionsleiste aktivieren Sie die Registerkarte Entwickler anzeigen und bestätigen Sie mit OK. Schließen Sie Word.

Starten Sie Word erneut, erstellen Sie eine neue Word-Datei und fügen Sie einen Absatz mit mindestens drei Zeilen Beispieltext hinzu, z. B.:

Das ist ein Absatz. Das ist ein Absatz. Das ist ein Absatz. Das ist ein Absatz. Das ist ein Absatz. Das ist ein Absatz. Das ist ein Absatz. Das ist ein Absatz. Das ist ein Absatz. Das ist ein Absatz. Das ist ein Absatz. Das ist ein Absatz. Das ist ein Absatz. Das ist ein Absatz. Das ist ein Absatz. Das ist ein Absatz. Das ist ein Absatz. Das ist ein Absatz. Das ist ein Absatz. Das ist ein Absatz. Das ist ein Absatz. Das ist ein Absatz.

Klicken Sie auf die Absatzmarkierungsschaltfläche, um Absatzmarken sichtbar zu machen.

Platzieren Sie den Cursor in Ihrem Textabsatz (nicht in der ersten oder letzten Zeile).

Erstellen Sie das Makro:

Klicken Sie auf der Registerkarte Entwickler auf Makro aufzeichnen.

Geben Sie in das Feld Makroname einen Namen für das Makro ein, z. B. "FormatUebertragen". Wählen Sie Normal.dotm in dem Feld "Makro speichern in" aus, um das Makro in allen Dokumenten verfügbar zu machen. Wenn Sie Änderungen an Ihrer Normal.dotm vorgenommen haben, möchten Sie diese möglicherweise zuerst sichern.

Klicken Sie auf die Schaltfläche Tastatur. Klicken Sie in das Feld für eine neue Tastaturkombination und experimentieren Sie anschließend mit den Tastaturkombinationen, um eine nicht zugewiesene zu finden. Wenn eine Kombination, die Sie versuchen, bereits vergeben ist, wird im Dialogfeld eine entsprechende Meldung angezeigt und Sie können die Kombination löschen und eine andere versuchen. Strg + Umschalt + 9 wird in der grundlegenden Word-Installation keiner anderen Funktion zugewiesen, aber Sie können jede andere Kombination verwenden, die noch nicht zugewiesen wurde.

Klicken Sie auf Zuweisen, um die Verknüpfung dem Makro zuzuordnen, das Sie aufnehmen möchten. Alles, was Sie jetzt tun, wird im Makro aufgezeichnet. Befolgen Sie diese Vorgehensweise sorgfältig:

Strg + Pfeil nach oben (dies bringt den Cursor an den Anfang des Absatzes)

Strg + Umschalt + Pfeil nach unten (wählt den Absatz inklusive der Absatzmarke aus)

Umschalt + Pfeil nach links (dadurch wird das Ende der Auswahl um ein Zeichen nach links verschoben, sodass es die Absatzmarke nicht mehr enthält)

Strg + C (dies kopiert den Absatz)

Strg + V (fügt den Text des Absatzes wieder über dem Absatz ein)

Klicken Sie nach Eingabe dieser Befehle auf Aufzeichnung beenden.

Klicken Sie auf Makros und wählen Sie FormatUebertragen (oder den Namen, den Sie Ihrem Makro gegeben haben), dann Bearbeiten. Der Code Ihres / Ihrer Makros wird angezeigt. Für FormatUebertragen sollte dies sein:

___________________
Sub FormatUebertragen()
'
' FormatUebertragen Makro
'
'
Selection.MoveUp Unit:=wdParagraph, Count:=1
Selection.MoveDown Unit:=wdParagraph, Count:=1, Extend:=wdExtend
Selection.MoveLeft Unit:=wdWord, Count:=1, Extend:=wdExtend
Selection.Copy
Selection.PasteAndFormat (wdPasteDefault)
End Sub
___________________

Ändern Sie die Zeile:

Selection.PasteAndFormat (wdPasteDefault)

zu:

Selection.PasteSpecial DataType:=wdPasteText

Speichern Sie mit Strg + S und schließen Sie das Fenster zum Bearbeiten von Makros.

Wenn alles nach Plan verlaufen ist, sollte Ihr Makro jetzt funktionieren. Um es zu testen, fügen Sie Ihrem Word-Dokument einige Formatierungen hinzu, indem Sie beispielsweise ein Wort fett formatieren. Platzieren Sie den Cursor einfach irgendwo im Absatz und drücken Sie Strg + Umschalt + 9 (oder welche andere Tastenkombination Sie ausgewählt haben) und Sie sollten sehen, dass die Formatierung verschwindet.

Sie können die Tastenkombination jederzeit ändern. Klicken Sie dazu auf die Hauptschaltfläche "Office" und dann auf Word-Optionen (unten rechts im Dialogfeld).

Klicken Sie auf Anpassen > Befehle auswählen. Wählen Sie Makros aus der Dropdown-Liste. Wählen Sie "FormatUebertragen" (oder wie immer Sie es genannt haben).

Klicken Sie unten im Dialogfeld neben Tastaturbefehle auf Anpassen.

Scrollen Sie im Feld Kategorien nach unten zu Makros und wählen Sie es aus. Wählen Sie rechts unter Makros FormatUebertragen (oder wie auch immer Sie Ihr Makro genannt haben). Das aktuelle Kürzel wird in der entsprechenden Box angezeigt. Sie können es löschen, indem Sie es auswählen und Löschen drücken. Sie können dann ein neues Kürzel eingeben und es mit "Zuweisen" wie zuvor zuweisen. Schließen / bestätigen Sie die Dialoge.

Sie können ein ähnliches Verfahren verwenden, um ein Symbol für Ihr Makro zu erstellen:

Klicken Sie erneut auf die Schaltfläche "Office" und dann auf Word-Optionen.

Klicken Sie auf Anpassen > Befehle auswählen. Wählen Sie Makros aus der Dropdown-Liste. Wählen Sie Ihr Makro.

Klicken Sie auf Hinzufügen. Sie sollten sehen, dass der Makrobefehl in der rechten Spalte erscheint. Klicken Sie auf Bearbeiten.

Wählen Sie ein Symbol und dann OK > OK. Das Symbol für Ihr Makro sollte in der Symbolleiste angezeigt werden.

Dieses Makro eignet sich zum Übertragen der Formatierung eines ganzen Absatzes, der keine sichtbare Formatierung enthält. Wenn ein Absatz eine gewünschte Formatierung enthält, müssen Sie die gelöschte Formatierung wiederherstellen, nachdem Sie den Absatz angepasst haben. In Absätzen, die viele Formatierungen enthalten, kann das Wiederherstellen der gelöschten Formatierung viel Arbeit sein. Erwägen Sie für solche Absätze die folgenden Alternativen:

Copyright Marc Prior 2009-2011