Howto - Using the OmegaT text export function (scripting interface)

Návod OmegaT:
Použití funkce OmegaT pro export textu (skriptovací prostředí).

Od verze 2.0.1 má OmegaT přidanou funkci pro export textu. Tento návod popisuje tuto funkci a její možné využití. Navíc balíček te-scripts.zip obsahuje některé velmi jednoduché tcl/tk skripty, které jsou určeny k ilustraci použití těchto funkcí.

Účel

Funkce pro export textu exportuje data z aktuálního projektu OmegaT do souborů s prostým textem bez formátování. V současnosti vypadá export následovně:

- obsah segmentu zdrojového textu, když je segment otevřený
- obsah segmentu cílového textu, když je segment otevřený
- zvýrazněný text v cílovém textu, když stisknete odpovídající klávesovou zkratku

Programátoři a tvůrci skriptů mohou použít tyto soubory obsahující text k přidávání dalších funkcí do OmegaT. Potřebují pak znalost Javy; místo toho lze použít většinu, když ne všechny, programovací jazyky a dosáhnout tak na užitečné funkce, i přes to, že mají jen poměrně omezené programovací dovednosti.

Použití funkce pro export textu

Aby šlo použít funkci pro export textu, musí být tato nejdříve aktivována uvnitř samotné OmegaT:

Možnosti > Nastavení editace

Pak označte políčko „Exportovat segment do textového souboru“

Tento soubor bude uložen v podadresáři /script v uživatelském adresáři OmegaT a obsahuje:
(pro více informací k umístění adresáře uživatelských souborů OmegaT na svém operačním systému, vizte Uživatelská příručka (F1 v aplikaci OmegaT) > Soubory a adresáře > Soubory uživatele):

source.txt - obsahuje text zdroje daného segmentu
target.txt - obsahuje cílový text daného segmentu
selection.txt - obsahuje text, který uživatel zvýraznil, a to tehdy, když stisknete kombinaci kláves Ctrl-Shift-C nebo vyberete volbu Upravit > Exportovat výběr.

Obsah souboru bude přepsán buď když otevřete nový segment (source.txt a target.txt) nebo když je exportován nový výběr (selection.txt). Soubory jsou pak ve formě textových souborů s neformátovaným textem.

Použití vzorových skriptů

Tcl/tk se musí instalovat, pokud tedy dosud není. Tcl/tk můžete získat z celé řady zdrojů; tcl.activestate.com je jeden z oblíbených zdrojů. Uživatelé Mac OSX by měli instalovat tcl/tk z vlastního system media a uživatelé Linuxu by měli pohledat v repozitářích své distribuce, za předpokladu, že to již není nainstalováno ve výchozím nastavení. (Poznámka pro uživatele Ubuntu: implementace fontu je ve výchozí instalace tcl/tk v Ubuntu v současnosti (verze 9.10) hrozná, ale může být napravena.)

Aby se zachovala přehlednost práce skriptů, každý skript zásadně vykonává jen jednu funkci. Pokud by bylo v praxi nutno použít více funkcí ve stejný čas, bude výkonnější kombinovat je do jednoho skriptového souboru.

Skripty v příkladech, které jsou poskytovány zde všechny spouštějí okno, ale skripty, které je možno sestrojit i skripty, které provádějí dané funkce na pozadí.

Jak spustit skript:

Zkopírujte skript do adresáře „script“ v programu OmegaT, tj. adresář obsahující soubor source.txt atd. (Skripty lze prakticky umisťovat všude, ale musí být pak navíc upravena cesta k souborům skriptů.)

V závislosti na konfiguraci systému, může být možno spustit skripty jednoduše jejich nakliknutím myší. Alternativní postup:

Otevřete okno s příkazovým řádkem (DOS prompt, terminál, konsole)

Změňte složku (adresář) na složku obsahující skripty, např. (pod systémem Windows XP):

cd C:\Dokumenty a Nastavení\Jméno Uživatele\Data aplikací\OmegaT\script

Spusťte skript příkazem „wish“ následovaný jménem skriptu, např.:

wish te-basic-source.tcl

Popis jednotlivých skriptů:

te-basic-source

Tento skript zobrazí zdrojový text v samostatném okně. Skript sám o sobě neudělá nic nového, co by již neprovedlo okno Editoru OmegaT; jeho účel je zobrazit to, jak lze vyextrahovat text ze souboru a zpřístupnit jej pro další skripty. Obsah okna skriptu lze upravovat a může být kopírován a vkládán zpět do okna Editoru OmegaT.

te-basic-target

Oproti te-basic-source platí tento skript pro cílový text.

te-warning

Vedle zobrazení zdrojového textu, poskytuje tento skript políčko pro vkládání textu uživatelem (např. slovo). Když je otevřený segment OmegaT, který obsahuje tento řetězec, skript zobrazí upozornění. Upozornění je pak v podobě textu ve skriptovém okně, a je zobrazeno žlutě. Navíc, pokud to podporuje hardware a operační systém (to neplatí vždy), zazní zvukový signál.

Příklad použití této funkce je ilustrován v následujícím textu. Překladatel má text obsahující frázi „abc“, a má hotový první hrubý překlad, překládá „abc“ jako „abc“. Pak zjistí, že „abc“ mělo být přeloženo jako „def“. Místo hledání všech výskytů „abc“ a jejich opravování před dalším postupem (což je možné, ale má jisté nevýhody), měl by se jednoduše rozhodnout pro opravu těchto míst během dalšího kola překladu. V tomto případě je pak v každém odpovídajícím segmentu nápomocná jakási „upomínka“.

te-notags

Jak již napovídá jeho název, tento skript automaticky odstraní tagy z (cílového) segmentu OmegaT. Toto je důležité když kontrolujete segmenty zobrazující na monitoru spousty tagů, a pak je jednoduché přehlédnout např. chybějící nebo přebývající mezeru.

te-tags

Tento skript zobrazí cílový segment se zvláštním fontem (pevně zapsaný ve skriptu, ale lze upravit) místo výchozího fontu. Tagy zobrazené jiným fontem pak působí méně rušivě. Oproti te-notags, je možné, aby překladatel pracoval v tomto okně, pak zkopíroval a vložil obsah v jeho plném rozsahu do okna Editoru OmegaT.

te-gloss-highlight

Tento skript čte obsah ze souboru glosáře a zvýrazní jakýkoliv pojem nalezený v aktuálním (zdrojovém) segmentu. Soubor glosáře smí obsahovat jen dva sloupce, mít jméno GLOSS.utf8, a být dostupný v adresáři /script.

te-gloss-subst

Funguje podobně jako te-gloss-highlight, ale nahradí zdrojové termíny v glosáři termíny cílovými.

te-gloss-subst-highlight

Kombinuje funkce nahrazení a zvýraznění skriptů te-gloss-subst a te-gloss-highlight.

Programování v tcl/tk

Tcl/tk jako skriptovací jazyk má řadu výhod :

- Je snadné se jej naučit
- Je zdarma
- Je hojně používán, takže na internetu najdete pomoc
- Komponenta Tk ulehčuje vytvoření grafického uživatelského prostředí
- Existuje spousta dobrých publikací a jiných zdrojů zabývajících se touto problematikou (minimálně v angličtině určitě)
- Je zaměřen na zpracování řetězců znaků, obzvláště vhodný pro aplikace zpracovávající text.

Pro začátečníky je tu dostupných několik tutoriálů online, např.:

www.dci.clrc.ac.uk/Publications/Cookbook/index.html
www.tcl.tk/man/tcl8.5/tutorial/tcltutorial.html
www.tcl.tk/man/tcl8.5/tutorial/tcltutorial.html

Pokud byste měli vážný zájem a chtěli naučit tcl/tk, tak lze doporučit knihu „Practical Programming in Tck and Tk“ od autora Brent Welch, ISBN: 0-13-038560-3. Je to přeci jen trošku techničtější pro úplné začátečníky v programování, ale po propracování jednoho z online tutoriálů může být tato kniha velmi nápomocná.

Copyright Marc Prior 2009-2011