Howto - Translating Word 2007 files in OmegaT

Tento návod poskytuje tipy k překladu Word 2007 a novější verze (Office Open XML, .docx) v OmegaT.

Pozadí

S příchodem Microsoft Office 2007, mají programy Microsoft Word, Excel a PowerPoint nový výchozí souborové formáty. Tyto soubory jsou formálně známy jako „Office Open XML“ a používají tyto koncovky (dle pořadí jmenovaných programů) .docx, .xlsx a .pptx. Tyto formáty jsou také použity v MS Office 2010. Pro přehlednost, když se bude na tyto formáty odkazovat níže, bude užito označení „souborové formáty MS Office 2007“.

OmegaT od verze 1.7.1 a novější, již umí pracovat s formáty Microsoft Office 2007 přímo, bez konverze. Po vydání OmegaT verze 2.1.8 je práce s těmito souborovými formáty v rámci OmegaT je pro uživatele ještě přehlednější.

Výhody používání formátu .docx ve spojení s OmegaT

Podle toho, jak zákazníci/autoři aktualizují Microsoft Office/Word na novější verze, tak překladatelé mohou očekávat stále častější dodávání zakázek v novém formátu. Oproti starším formátům .doc, .xls a .ppt, je možno tyto soubory zpracovat v OmegaT přímo, bez ztráty formátování jakožto důsledek konverze do a z jiných formátů.

Nový formát může také posloužit jako praktický způsob zpracování starších formátů .doc, .xls a .ppt, protože tyto lze převádět na své protějšky ve verzi MS Office 2007, překládat s OmegaT a v případě potřeby uložit opět v původním formátu. Tento postup představuje alternativu pro překladatele, kteří k tomuto účelu nechtějí používat OpenOffice.org.

Převod na formát MS Office 2007

Můžete převádět soubory MS Office 1997/2000/2003/XP na formát MS Office 2007 tak, že je otevřete v MS Office 2007 a uložíte je do nového formátu přes volbu „Uložit jako“. (Protože toto je nyní standardní formát, je v MS Office 207 popsán jako Word, Excel nebo Powerpoint.)

Pro uživatele, kteří nemají MS Office 2007 nebo 2010 a nechtějí si tento balík kupovat, poskytuje Microsoft doplněk kompatibility pro starší verze.

Uživatelé linuxu: jak MS Office 2007, tak doplněk kompatibility Microsoft poběží přes Crossover Linux.

Na co je třeba dbát, když používáte formáty .docx, .xlsx a .pptx v OmegaT

Ve verzích OmegaT starších než 2.1.8 se každá změna formátování v dokumentu MS Office 2007 projeví jako dlouhé řetězce vícenásobných tagů, které ve výsledku téměř znemožnili použití tohoto formátu. Od verze 2.1.8 jsou tyto vícenásobné tagy již ve výchozím stavu seskupeny (kondenzovány) do jednoho tagu. Uživatelé, kteří mají zájem překládat soubory MS Office 2007 by tudíž měli aktualizovat OmegaT na verzi 2.1.8 nebo novější.

(Ještě jednodušší práce s tagy v rámci dokumentů .docx je možná, ale už to bude stát ztrátu kontroly nad formátováním. Například, bez funkce „seskupení tagů“, kde u slova, které je ve zdrojovém textu tučně a kurzívou, si překladatel může vybrat že jej převede jen jako tučné nebo jen kurzívu. Když je aktivní funkce „seskupení tagů“ tak taková situace nemůže nastat. Většina uživatelů bude pravděpodobně téhož názoru, že zjednodušení práce na překladu má větší váhu než si ji ztěžovat složitým formátováním.)

Formát .docx je náchylný k produkování „nadbytečného“ formátovacího kódu, což má za následek množství nechtěných a nepotřebných tagů, které se pak zobrazjí v okně Editoru v OmegaT. Protože takové tagy jsou během překladu na obtíž, má jistě cenu zkusit odstranit tyto nadbytečné tagy před začátkem překladu pomocí OmegaT. Kromě OmegaT se s podobným problémem potýkají i jiné CAT nástroje, které pracují s formátem .docx a řešení situace jsou podobná nebo stejná.

Jak odstranit nechtěné části kódu formátování ze souborů .docx

Dokonce i po změnách nastavení Wordu, takže již nevkládá „nadbytečný“ kód, například automatické dělení slov, tak podobné části kódu se mohou v souboru stále vyskytovat a nelze je odstranit změnou nastavení. Odstranění těchto částí kódu je popsáno níže. Ještě dříve, než budete provádět níže uvedené instrukce k odstranění nadbytečného kódu, zkuste nejprve provést změny nastavení Wordu, nebo Word možná také vloží nadbytečný kód při novém otevření souboru.

Nástroje třetích stran

Jak již bylo zmíněno, tento problém s MS Word se nevyskytuje výhradně u OmegaT. Existují nástroje třetích stran aby si s tímto problémem poradily. Dva z nich jsou:

CodeZapper (nenákladný)

Document Cleaner (zdrama)

Srovnání formátování znaků

Alternativou ke spuštění makra CodeZapper na vašem textu představuje „srovnání“ formátování. „Srovnání“ formátování znamená aplikování formátu prvního znaku ve výběru textu (např. jako celý odstavec) na všechny následující znaky. Toto ale není to samé jak „odstranění“ formátování, což by znamenalo změnu formátování na výchozí hodnotu dokumentu.

Můžete upravit formátování odstavce jen pomocí zkopírování celého odstavce v MS Word a vložením jej zpět přes sebe sama, takže celý odstavec převezme formátování prvního znaku.

Manuální srovnání formátování znaků v odstavci

Krok 1: Zobrazte si značky odstavce. Označte každý odstavec opakovaným kliknutím na něj, dokud není celý odstavec zvýrazněn. Pak přesuňte konec zvýraznění o jeden znak vlevo, a to tak, že nezahrnuje značku odstavce.

Krok 2: Zkopírujte zvýrazněný text (Ctr.+C)- Pak vyberte „Vložit jinak“ (Word 2003) nebo klikněte na šipku ve spodní části tlačítka „Vložit“ (Word 2007) pro zobrazení rozšířených možností funkce Vložit. Nakonec vložte obsah prostřednictvím položky „Neformátovaný text“.

Když odstavec obsahuje formátování v textu (tučné, kurzíva, odkazy, atd.), můžete buď:

- srovnat formátování těchto odstavců užitím makra jak je to popsáno výše, pak znovu vložit formátování; nebo

- označte jen text od začátku formátované části, zkopírujte tento text a vložte je znovu na stejnou pozici, doslova přes něj, pak opakujte tento krok na každé části textu obsahující formátování.

Vytvoření makra pro srovnání formátování znaků daného odstavce

Výše uvedené postupy můžete do jisté míry zautomatizovat vytvořením makra. Krátký úvod k vytváření makra (v MS Office 2007) najdete níže. (Detailnější popis najdete ve své příručce nebo klikněte zde, zde nebo zde.)

Pokud jste dosud neučinili, pak si přidejte záložku vývojáře na pás karet: klikněte na tlačítko Office (nebo Soubor). Vyberte Možnosti. V zobrazeném okně klikněte na Oblíbené (Popular). Na pásu karet zaznačte Ukázat vývojářské funkce (Show Develper tab) a potvrďte OK. Zavřete Word.

Spusťte Word znovu, vytvořte nový wordovský dokument a přidejte odstavec zkušebního textu, minimálně tři řádky, např.:

Toto je odstavec. Toto je odstavec. Toto je odstavec. Toto je odstavec. Toto je odstavec. Toto je odstavec. Toto je odstavec. Toto je odstavec. Toto je odstavec. Toto je odstavec. Toto je odstavec. Toto je odstavec. Toto je odstavec. Toto je odstavec. Toto je odstavec. Toto je odstavec. Toto je odstavec. Toto je odstavec. Toto je odstavec. Toto je odstavec. Toto je odstavec. Toto je odstavec.

Nahoře ve Wordu klikněte na tlačítku se symbolem odstavce a nechejte si zobrazit netisknutelné znaky.

Umístěte kurzor ve vašem odstavci textu (ne do první nebo poslední řádky).

Vytvořte makro:

Na kartě Vývojář, klikněte na Záznam makra.

V poli pro Název makra zapište název makra, např. „srovnatformat“. Aby bylo makro dostupné ve všech dokumentech, vyberte Normal.dotm v poli „Uložit makro v“. Než provedete změny v souboru Normal.dotm určitě si jej zálohujte v nezměněné podobě.

Klikněte na tlačítko Klávesnice. Klikněte na políčko pro novou klávesovou zkratku, pak zkuste najít takovou kombinaci kláves, která je ještě volná. Pokud je kombinace vaší volby již zadaná, zobrazí se odpovídající hlášení, pak takovou kombinaci smažte a zkuste najít další. Zdá se, že Ctrl+Shift+9 není přiřazeno k žádné jiné funkci v rámci základní instalace Wordu, ale sami si vyberte pro vás vhodnou klávesovou zkratku, která je ještě volná.

Klikněte na Přiřadit, a tím přiřadíte klávesou zkratku makru, které se chystáte zaznamenat. Kroky postupu následujte opravdu pečlivě, protože vše, co teď učiníte bude zaznamenáno do makra::

Ctrl+Šipka nahoru (toto posune kurzor na začátek odstavce)

Ctrl+Shift+Šipka dolů (toto vybere odstavec, včetně značky odstavce)

Shift+Šipka vlevo (toto posune konec výběru jeden znak vlevo, takže už nebude obsahovat samotnou značku odstavce)

Ctrl+C (toto zkopíruje odstavec)

Ctrl+V (toto vloží text odstavce zpět přes stávající odstavec)

Po zadání těchto příkazů klikněte na Konec záznamu.

Klikněte na Makra a vyberte srovnatformat (nebo jaké jste svému makru zadali jméno), a pak Upravit. Zobrazí se kód vašeho makra. Pro srovnatformat by to mělo vypadat takto:

___________________
Sub srovnatformat()
'
' srovnatformat macro
'
'
Selection.MoveUp Unit:=wdParagraph, Count:=1
Selection.MoveDown Unit:=wdParagraph, Count:=1, Extend:=wdExtend
Selection.MoveLeft Unit:=wdWord, Count:=1, Extend:=wdExtend
Selection.Copy
Selection.PasteAndFormat (wdPasteDefault)
End Sub
___________________

Změňte řádek:

Selection.PasteAndFormat (wdPasteDefault)

na:

Selection.PasteSpecial DataType:=wdPasteText

Uložte s Ctrl+S a zavřete okno editoru maker.

Pokud vše proběhlo dle plánu, vaše makro by teď mělo fungovat. Můžete jej otestovat, např. tak, že přidáte formátování jednomu slovu dokumentu, např. jedno slovo zadejte jako tučné. Teď prostě umístěte kurzor někam v odstavci a stiskněte Ctrl+Shift+9 (nebo kombinaci kláves, kterou jste pro makro vybrali) a měli byste vidět, že formátování zmilo.

Klávesovou zkratku můžete kdykoliv změnit. To uděláte tak, že kliknete na hlavní tlačítko „Office“, pak Možnosti (tlačítko vpravo od dialogu)

Klikněte na Upravit > Vybrat příkazy. V zobrazeném seznamu vyberte Makra. Vyberte „srovnatformat“ (nebo jak jste si to nazvali).

V dolní části dialogového okna, vedle Klávesové zkratky, klikněte na Upravit.

V políčku Kategorie srolujte na položku Makra a vyberte ji. Pak na pravé straně, pod Makra, vyberte srovnatformat (nebo jak jste své makro nazvali). Současná zkratka se zobrazí v příslušném políčku. Můžete jej promazat tím, že jej vyberete a stisknete Delete. Můžete pak vložit novou klávesovou zkratku a přidat novou přes Přidat stejně, jako jste to učinili na začátku. Zavřete / potvrďte obsah dialogového okna.

Můžete použít podobné kroky k vytvoření tlačítka pro své makro:

Opět, klikněte na hlavní tlačítko „Office“, pak Možnosti.

Klikněte na Upravit > Vybrat příkazy. V zobrazeném seznamu vyberte Makra. Vyberte své makro.

Klikněte na Přidat. Měli byste teď vidět, že příkaz makra ze zobrazí v pravém sloupci. Klikněte na Upravit.

Vyberte si symbol, pak OK > OK. Symbol pro vaše makro by se měl zobrazit na liště nástrojů.

Toto makro je užitečné pro srovnání formátování celého odstavce, který obsahuje neviditelné formátování. Tam, kde odstavec obsahuje žádané formátování, musíte smazané formátování po srovnání formátování v odstavci opět obnovit. V odstavcích obsahujících spoustu formátování, může obnovení smazaného formátování představovat pořádnou práci navíc. Pro takovéto odstavce zvažte následující alternativy:

Copyright Marc Prior 2009-2011