Guida - Usar le tokenizer de OmegaT

Le plug-in tokenizer era integrate in OmegaT in le version 3.0.0. Le sequente information es pro isto applicabile sol si tu usa un version de OmegaT precedente quam 3.0.0.
Si tu usava le plug-in tokenizer con un precedente version de OmegaT e tu ha promovite al version 3.0.0 o subsequente de OmegaT, dele le plug-in tokenizer in le files ex tu plica plug-in.

Le tokenizer de OmegaT es un plugin pro OmegaT. Illo provide melior concordantias partial o del glossario, con le computation del radices ("cerca del stirpe") del parolas original. Per exemplo, illo recognoscera le parolas declinate in textos e monstrara le correspondente entrata del glossario, etsi le entrata del glossario contine sol le forma non declinate de un parola.

Preparation

Ante que tu usa le tokenizer con OmegaT, tu debe in prime loco assecurar te que tu version de OmegaT es convenibile e preparate pro le uso con illo.

Version Webstart de OmegaT: le tokenizer non es compatibile con le version Webstart de OmegaT. Si tu vole usar le tokenizer, installa le version standard de OmegaT (le ultime version beta) pro tu systema.

OmegaT version 2.1.0 e precedente: le actual tokenizer non es compatibile con iste versiones. (Le tokenizer pote esser usate con le versiones 2.0.x e 2.1.0, ma isto necessita ambe un differente version del tokenizer, e un differente procedura de installation.) Le usatores es consiliate de promover al ultime version beta de OmegaT.

Versiones Windows de OmegaT: pro usar OmegaT (omne version) con le tokenizer, illo debe esser lanceate ab un file script de lanceamento. Un file script de lanceamento non es supplite con le versiones de OmegaT pro Windows. Si tu usa le version Windows con JRE, discarga le file OmegaT_with_JRE.bat; si tu usa le version Windows sin JRE, discarga le file OmegaT_without_JRE.bat. Depost le discargamento, pone le file in le plica principal de OmegaT (le plica continente le file OmegaT.jar).

Le version Platteforma neutre (sur Windows): loca tu file script de lanceamento de OmegaT (OmegaT.bat).

Versiones/systemas Linux: loca tu file script de lanceamento de OmegaT (OmegaT o OmegaT.sh).

Controla que OmegaT es lanceate quando tu exeque le file script de lanceamento:
- Sur Linux, sur le linea de commando
- sur Windows, cliccante sur le file script de lanceamento

Installar le tokenizer

Post le preparation al installation (vide supra), installa le tokenizer como seque:

1. Discarga le pacchetto tokenizer zip (pro OmegaT version 2.1.1 e subsequente).

2. Expande le files ab le pacchetto zip de tokenizer.

3. In le plica principal del programma OmegaT (id es le plica continente le file OmegaT.jar), crea un sub plica nominate "plugins", si un sub plica con iste nomine non existe ja. Copia le files que tu ha expandite ex le pacchetto tokenizer directemente in iste sub plica.

4. Aperi tu file script de lanceamento in un editor de texto. Usatores de Windows (in particular): non cliccar simplemente sur iste file. In vice, lancea un editor de texto (assi como Notepad o Wordpad), postea aperi le file script de lanceamento con File > Aperi. Tu pote alsi cliccar con le dextero con le mouse sur le file, pois seliger un editor de texto in le qual aperir lo

5. Le file script de lanceamento contine le commando de lanceamento de OmegaT. Le forma basic de iste commando is:

java -jar OmegaT.jar

Dependente de tu configuration del systema, le commando de lanceamento pote esser levemente differente.

6. Selige un tokenizer ex le lista sequente, secundo tu lingua fonte:

org.omegat.plugins.tokenizer.LuceneArabicTokenizer
org.omegat.plugins.tokenizer.LuceneBrazilianTokenizer
org.omegat.plugins.tokenizer.LuceneChineseTokenizer
org.omegat.plugins.tokenizer.LuceneCJKTokenizer
org.omegat.plugins.tokenizer.LuceneCzechTokenizer
org.omegat.plugins.tokenizer.LuceneDutchTokenizer
org.omegat.plugins.tokenizer.LuceneFrenchTokenizer
org.omegat.plugins.tokenizer.LuceneGermanTokenizer
org.omegat.plugins.tokenizer.LuceneGreekTokenizer
org.omegat.plugins.tokenizer.LucenePersianTokenizer
org.omegat.plugins.tokenizer.LuceneSmartChineseTokenizer
org.omegat.plugins.tokenizer.LuceneRussianTokenizer
org.omegat.plugins.tokenizer.LuceneThaiTokenizer
org.omegat.plugins.tokenizer.SnowballDanishTokenizer
org.omegat.plugins.tokenizer.SnowballDutchTokenizer
org.omegat.plugins.tokenizer.SnowballEnglishTokenizer
org.omegat.plugins.tokenizer.SnowballFinnishTokenizer
org.omegat.plugins.tokenizer.SnowballFrenchTokenizer
org.omegat.plugins.tokenizer.SnowballGerman2Tokenizer
org.omegat.plugins.tokenizer.SnowballGermanTokenizer
org.omegat.plugins.tokenizer.SnowballHungarianTokenizer
org.omegat.plugins.tokenizer.SnowballItalianTokenizer
org.omegat.plugins.tokenizer.SnowballNorwegianTokenizer
org.omegat.plugins.tokenizer.SnowballPorterTokenizer
org.omegat.plugins.tokenizer.SnowballPortugueseTokenizer
org.omegat.plugins.tokenizer.SnowballRomanianTokenizer
org.omegat.plugins.tokenizer.SnowballRussianTokenizer
org.omegat.plugins.tokenizer.SnowballSpanishTokenizer
org.omegat.plugins.tokenizer.SnowballSwedishTokenizer
org.omegat.plugins.tokenizer.SnowballTurkishTokenizer

Adde le argumento --ITokenizer= sequite per le nomine complete de iste tokenizer (copiante le linea integre, insere un spatio) al fin del commando de lanceamento in tu file script de lanceamento de OmegaT .

Per exemplo, pro usar le tokenizer anglese (quando on rende a partir del anglese), tu commando de lanceamento pote ora esser:

java -jar OmegaT.jar %* --ITokenizer=org.omegat.plugins.tokenizer.SnowballEnglishTokenizer

O si tu rende ab turco, il pote ora esser:

java -jar OmegaT.jar %* --ITokenizer=org.omegat.plugins.tokenizer.SnowballTurkishTokenizer

Importante: iste commando integre debe apparer sur un linea (mesmo si illo appare trovar se sur duo lineas in le apparentia in le qual tu es legente lo).

7. Exeque iste file, e OmegaT deberea ora lancear con le function tokenizer. Pro essayar, controla si entratas glossario es monstrate mesmo ubi le segmento OmegaT actual contine un termino in un forma declinate ex illo in le glossario.

8. Si tu vole usar tokenizers differente perque tu rende ex plus que un lingua, crea un file script de lanceamento de OmegaT separate pro cata tokenizer que tu desidera usar. Denomina appropriatemente le files script de lanceamento, per exemplo "OmegaT-EN.bat" pro le file script de lanceamento continente le commando con le tokenizer anglese e "OmegaT-TR.bat" pro le file script de lanceamento continente le commando con le tokenizer turco.

9. In alicun casos, tu pote trovar que le tokenizer del lingua de origine interfere con le tokenizer del corrector orthographic. Tu pote eliminar iste problema specificante (ubi disponibile) un tokenizer pro le lingua de destination, con le argumento --ITokenizerTarget=.

Per exemplo, si tu rende ex le chinese al nederlandese, proba:

java -jar OmegaT.jar %* --ITokenizer=org.omegat.plugins.tokenizer.LuceneChineseTokenizer --ITokenizerTarget=org.omegat.plugins.tokenizer.LuceneDutchTokenizer

10. Depost create un script de lanceamento como supra describite, tu pote configurar tu systema de maniera que OmegaT es lanceate plus convenibilemente, per exemplo creante un via breve. Pro crear un via breve in Windows:

Clicca con le dextero sur le script de lanceamento (OmegaT.bat), pois tenente le button dextre del mouse pressate, trahe le script a un position commode, assi como tu scriptorio. Quando tu relaxa le button dextre, un fenestra de dialogo se displica con plure optiones. Seliger "Crear hic vias breve".

Alternativemente, clicca con le dextere sur le file script de lanceamento Selige: "Invia a", pois elige "Scriptorio (crea via breve)".

Post haber create e probate le via breve, tu pote lo adder al menu Start trahente lo illac.

Copyright Marc Prior 2010-2011