Guida - Usare il tokenizer per OmegaT

Il plugin dei tokenizer sono stati integrati dalla versione 3.0.0 di OmegaT. Questa informazione è dunque valida solo se si sta utilizzando una versione di OmegaT precedente alla 3.0.0.
Se si è utilizzato il plugin dei tokenizer con una versione precedente di OmegaT e si è aggiornato OmegaT alla versione 3.0.0 o successiva, eliminare i file del plugin dei tokenizer dalla propria cartella «plugins».

Omegat Tokenizer è un plugin per OmegaT. Esso fornisce migliori concordanze parziali e del glossario in OmegaT, basandosi sulla elaborazione delle radici ("stemming") delle parole da tradurre. Ad esempio, riconoscerà parole flesse nei testi e visualizzerà la corrispondente voce di glossario, anche se la voce di glossario contiene solo la forma non flessa di una parola.

Preparazione

Prima di utilizzare il tokenizer con OmegaT, è necessario assicurarsi che la versione di OmegaT sia adatta e pronta per l'uso di tale plugin.

Versione WebStart di OmegaT: il tokenizer non è compatibile con la versione Webstart di OmegaT. Se si desidera utilizzare il tokenizer, installare la versione standard di OmegaT (ultima versione beta) per il proprio sistema.

OmegaT versione 2.1.0 e precedenti: l'attuale tokenizer non è più compatibile con queste versioni (il tokenizer può essere utilizzato con le versioni 2.0. x e 2.1.0, ma richiede una versione diversa del tokenizer, così come una procedura di installazione diversa). Consigliamo agli utenti di aggiornare all'ultima versione beta di OmegaT.

Versioni per Windows di OmegaT: per usare il tokenizer con OmegaT (qualsiasi versione) occorre un apposito file script di avvio. Tale file script di avvio non viene fornito con le versioni di OmegaT per Windows. Se si utilizza la versione di Windows con JRE, scaricare il file OmegaT_with_JRE.bat; per la versione di Windows senza JRE, scaricare invece il file OmegaT_without_JRE.bat. Dopo lo scaricamento, inserire il file nella cartella principale di OmegaT (la cartella contenente il file OmegaT.jar, per esempio C:\Programmi\OmegaT).

Versione di OmegaT multi-piattaforma (su Windows): individuare il file script di avvio di OmegaT (OmegaT.bat).

Versioni/sistemi Linux: individuare il file script del lancio di OmegaT (OmegaT o OmegaT.sh).

Controllare che OmegaT si avvii regolarmente quando si esegue il file script di avvio:
- Su Linux, sulla riga di comando
- Su Windows, facendo clic sul file script di avvio

Installare Tokenizer

Dopo la preparazione per l'installazione (vedere sopra), installare il tokenizer come segue:

1. Scaricare il pacchetto compresso zip del tokenizer (per la versione 2.1.1 di OmegaT o successive).

2. Decomprimere i file dal pacchetto zip del tokenizer.

3. Creare nella cartella principale del programma OmegaT (cioè quella contenente il file OmegaT.jar), una sottocartella chiamata "plugins", se già non ne esiste una con tale nome. Copiare i file del pacchetto tokenizer decompresso direttamente in questa sottocartella.

4. Aprire il file script di avvio (per esempio OmegaT_without_JRE.bat) in un editor di testo. Per gli utenti di Windows (in particolare): non basta fare clic su questo file. Avviare invece un editor di testo (tipo Notepad o Wordpad), quindi, con File > Apri, aprire il file di script di avvio. Si può anche fare clic sul file col pulsante destro del mouse, quindi 'Apri con' e selezionare un editor di testo per aprirlo.

5. Il file script di avvio contiene il comando di avvio di OmegaT. La forma base del comando è:

java -jar OmegaT.jar

A seconda della configurazione del sistema, il comando di avvio potrebbe essere leggermente diverso.

6. Scegliere un tokenizer dal seguente elenco, in base alla lingua di origine:

org.omegat.plugins.tokenizer.LuceneArabicTokenizer
org.omegat.plugins.tokenizer.LuceneBrazilianTokenizer
org.omegat.plugins.tokenizer.LuceneChineseTokenizer
org.omegat.plugins.tokenizer.LuceneCJKTokenizer
org.omegat.plugins.tokenizer.LuceneCzechTokenizer
org.omegat.plugins.tokenizer.LuceneDutchTokenizer
org.omegat.plugins.tokenizer.LuceneFrenchTokenizer
org.omegat.plugins.tokenizer.LuceneGermanTokenizer
org.omegat.plugins.tokenizer.LuceneGreekTokenizer
org.omegat.plugins.tokenizer.LucenePersianTokenizer
org.omegat.plugins.tokenizer.LuceneSmartChineseTokenizer
org.omegat.plugins.tokenizer.LuceneRussianTokenizer
org.omegat.plugins.tokenizer.LuceneThaiTokenizer
org.omegat.plugins.tokenizer.SnowballDanishTokenizer
org.omegat.plugins.tokenizer.SnowballDutchTokenizer
org.omegat.plugins.tokenizer.SnowballEnglishTokenizer
org.omegat.plugins.tokenizer.SnowballFinnishTokenizer
org.omegat.plugins.tokenizer.SnowballFrenchTokenizer
org.omegat.plugins.tokenizer.SnowballGerman2Tokenizer
org.omegat.plugins.tokenizer.SnowballGermanTokenizer
org.omegat.plugins.tokenizer.SnowballHungarianTokenizer
org.omegat.plugins.tokenizer.SnowballItalianTokenizer
org.omegat.plugins.tokenizer.SnowballNorwegianTokenizer
org.omegat.plugins.tokenizer.SnowballPorterTokenizer
org.omegat.plugins.tokenizer.SnowballPortugueseTokenizer
org.omegat.plugins.tokenizer.SnowballRomanianTokenizer
org.omegat.plugins.tokenizer.SnowballRussianTokenizer
org.omegat.plugins.tokenizer.SnowballSpanishTokenizer
org.omegat.plugins.tokenizer.SnowballSwedishTokenizer
org.omegat.plugins.tokenizer.SnowballTurkishTokenizer

Aggiungere l'argomento --ITokenizer = seguito dal nome completo di questo tokenizer (copiando l'intera riga, inserendo uno spazio) alla fine del comando di avvio all'interno del proprio file di script di avvio di OmegaT.

Ad esempio, per utilizzare il tokenizer inglese (quando si traduce dall'inglese), il comando di avvio potrebbe dunque essere:

java -jar OmegaT.jar %* --ITokenizer=org.omegat.plugins.tokenizer.SnowballEnglishTokenizer

O se si sta traducendo dal turco, potrebbe essere:

java -jar OmegaT.jar %* --ITokenizer=org.omegat.plugins.tokenizer.SnowballTurkishTokenizer

Importante: questo comando tutto deve stare su una sola riga (anche se appare su due righe nello schermo in cui stai leggendo queste frasi).

7. Eseguire questo file: OmegaT ora dovrebbe avviarsi con la funzione tokenizer. Per verificare, controllare se le voci di glossario vengono visualizzate anche quando il segmento di OmegaT corrente contiene un termine in una forma flessa del termine contenuto nel glossario.

8. Se si desidera utilizzare diversi tokenizer perché si traduce da più lingue, creare un file di script di avvio di OmegaT specifico per ogni tokenizer che si desidera utilizzare. Denominare i file script di avvio in modo appropriato, ad esempio "OmegaT-EN.bat" per il file di script di avvio che contiene il comando con il tokenizer inglese e "OmegaT-TR.bat" per il file di script di avvio che contiene il comando con il tokenizer turco.

9. In alcuni casi, può succedere che il tokenizer per la lingua di origine interferisca con il correttore ortografico della lingua di destinazione. È possibile eliminare questo problema specificando un tokenizer anche per la lingua di destinazione (dove disponibile), con l'argomento --ITokenizerTarget=.

Ad esempio, se si sta traducendo dal cinese all'olandese, provare:

java -jar OmegaT.jar %* --ITokenizer=org.omegat.plugins.tokenizer.LuceneChineseTokenizer --ITokenizerTarget=org.omegat.plugins.tokenizer.LuceneDutchTokenizer

10. Dopo aver creato uno script di avvio come descritto sopra, è possibile configurare il sistema affinché OmegaT sia avviato in modo più comodo, per esempio mediante la creazione di un collegamento. Per creare un collegamento in Windows:

Fare clic col pulsante destro del mouse sullo script di avvio (OmegaT.bat), poi, mentre lo si tiene premuto, trascinare lo script nella posizione desiderata, ad esempio sul desktop. Quando si rilascia il pulsante destro si apre una finestra di dialogo con varie opzioni. Scegliere "Crea collegamenti qui".

In alternativa, fare clic col destro sullo script di avvio. Selezionare: "Invia a" poi "Desktop (Crea collegamento)".

Dopo la creazione e il controllo del collegamento, lo si può aggiungere al menu Start trascinandovelo sopra.

Copyright Marc Prior 2010-2011