Howto - Using the OmegaT text export function (scripting interface)

OmegaT, l'eina de memòria de traducció lliure

Manual de l'OmegaT:
Com s'utilitza la funció d'exportació de text de l'OmegaT (interfície de scripts)

A partir de la versió 2.0.1, l'OmegaT inclou una funció d'exportació de text. En aquest manual es descriu la funció i les possibles aplicacions que pot tenir. A més a més, el paquet te-scripts.zip conté alguns scripts en tcl/tk molt senzills que serveixen per il·lustrar com s'utilitza aquesta funció.

Finalitat

La funció d'exportació de text exporta les dades del projecte de l'OmegaT actiu a fitxers de text net. En aquest moment, les dades que s'exporten són:

- El contingut del segment del text de partida, quan el segment està obert.
- El contingut del segment del text traduït, quan el segment està obert.
- El text realçat al text traduït, si es prem la drecera corresponent.

Els programadors i els creadors de scripts poden utilitzar els fitxers que contenen aquest text per afegir més funcions a l'OmegaT. No cal que tinguin coneixements del Java, ja que es poden utilitzar la majoria dels llenguatges de programació, si no tots, i es poden crear funcions ben útils fins i tot sense tenir uns amplis coneixements de programació.

Com s'utilitza la funció d'exportació de text

Perquè es pugui utilitzar la funció d'exportació de text, abans heu d'activar-la a l'OmegaT:

Opcions > Comportament de l'edició

Tot seguit, seleccioneu la casella «Exporta el segment a fitxers de text».

Els fitxers apareixen a la subcarpeta /script de la carpeta de fitxers de l'usuari de l'OmegaT (per trobar la ubicació de la carpeta de fitxers de l'usuari de l'OmegaT al sistema operatiu, consulteu el Manual d'usuari (F1 quan sou a l'OmegaT) > Fitxers i directoris > Fitxers de l'usuari):

source.txt: conté el text de partida del segment
target.txt: conté el text traduït del segment
selection.txt: conté el text realçat per l'usuari quan es prem Ctrl+Shift+C o se selecciona Edita > Exporta la selecció

El contingut dels fitxers se sobreescriu en obrir un segment nou (source.txt i target.txt) o bé quan s'exporta una nova selecció (selection.txt). Els fitxers són fitxers de text net sense format.

Utilització dels scripts de mostra

Cal instal·lar el Tcl/tk, si no s'ha instal·lat encara. El Tcl/tk es pot aconseguir de diversos llocs; un dels més coneguts és tcl.activestate.com. Els usuaris del Mac OSX hauran d'instal·lar el tcl/tk dels suports del sistema i els usuaris del Linux el trobaran als repositoris de les seves distribucions, si no el tenen ja instal·lat per defecte. (Nota per als usuaris de l'Ubuntu: la implementació del tipus de font de la instal·lació per defecte del tcl/tk és pèssima en aquests moments [versió 9.10], però es pot rectificar).

Perquè el funcionament del codi de script sigui més clar, cada script fa en principi una sola funció. Si, en la pràctica, es necessita més d'una funció, seria més eficaç combinar-les en un únic fitxer script.

Tots els scripts d'exemple proporcionats aquí inicien una finestra, però els scripts que fan funcions en segon pla són bastant senzills de concebre.

Per iniciar un script:

Copieu l'script a la carpeta «script» de l'OmegaT, és a dir, la carpeta que conté, entre d'altres, el fitxer source.txt (en principi, els scripts es poden col·locar en qualsevol lloc, però caldria editar-los per afegir el camí corresponent als fitxers script).

En funció de la configuració del sistema, hi hauria la possibilitat d'iniciar els scripts tot just fent-hi clic amb el ratolí. Com a alternativa:

Obriu una finestra de línia d'ordres (consola, finestra DOS).

Canvieu de carpeta (directori) a la carpeta dels scripts, p. ex. (als sistemes Windows XP):

cd C:\Documents and Settings\Nom d'usuari\Application Data\OmegaT\script

Inicieu l'script amb «wish», seguit pel nom del fitxer script, p. ex.:

wish te-basic-source.tcl

Descripcions de cada script

te-basic-source

Aquest script mostra el text de partida en una finestra independent. Per tant, no fa res que no faci ja la subfinestra de l'editor de l'OmegaT; l'objectiu és mostrar com s'extreu el text d'un fitxer script perquè estigui disponible per crear altres scripts. El contingut de la finestra de l'script és editable i es pot copiar i tornar a enganxar a la subfinestra de l'editor de l'OmegaT.

te-basic-target

Fa el mateix que te-basic-source, però per al text traduït.

te-warning

A més de mostrar el text de partida, aquest script ofereix un quadre d'entrada de text al qual l'usuari pot escriure una cadena (p. ex., una paraula). Quan s'obri un segment de l'OmegaT que contingui aquesta cadena, l'script llençarà un avís. L'avís consistirà a realçar en groc el text de la finestra de l'script. A més a més, si ho permeten el maquinari i el sistema operatiu (no sempre és així), s'emetrà un so.

A continuació es mostra un exemple de com s'utilitza aquesta funció. Imaginem que una traductora té un text amb la frase «abc» i ja ha completat el primer esborrany de la traducció, on ha traduït «abc» com «abc». En aquest moment, descobreix que «abc» s'ha de traduir com «def». En comptes de cercar totes les aparicions d'«abc» i corregir-les abans de continuar (la qual cosa és possible, però té alguns inconvenients), pot decidir corregir-les mentre treballa en l'esborrany següent. En aquest cas, li vindria bé rebre un «recordatori» en cada segment.

te-notags

Com ho indica el nom («no tags», sense etiquetes), aquest script elimina automàticament totes les etiquetes d'un segment (traduït) de l'OmegaT. És una funció útil quan es revisen segments plens d'etiquetes a la pantalla, ja que és molt fàcil passar per alt, per exemple, si hi ha espais dobles o si en falten.

te-tags

Aquest script mostra el segment traduït amb un tipus de lletra particular (incrustat a l'script, però es pot editar), en comptes del tipus de lletra per defecte. Les etiquetes es mostren amb un tipus de lletra diferent perquè destaquin menys. Al contrari que amb te-notags, el traductor pot treballar en aquesta finestra i, a continuació, copiar i enganxar tot el contingut a la subfinestra de l'editor de l'OmegaT.

te-gloss-highlight

Aquest script llegeix el contingut d'un fitxer de glossari i realça els termes que apareixen al segment actual (text de partida). El fitxer del glossari ha de tenir només dues columnes, anomenar-se GLOSS.utf8 i estar ubicat a la carpeta /script.

te-gloss-subst

Fa el mateix que te-gloss-highlight, però substitueix els termes de partida del glossari pels termes traduïts.

te-gloss-subst-highlight

Combina les funcions de realçat i substitució de te-gloss-highlight i te-gloss-subst.

Programació amb el tcl/tk

El tcl/tk és un llenguatge script que presenta diversos avantatges:

- És ben senzill d'aprendre.
- És gratuït.
- S'utilitza molt i, per tant, es pot trobar ajuda en Internet.
- El component Tk facilita la creació d'interfícies gràfiques d'usuari.
- Hi ha diversos llibres i altres recursos de qualitat per a aquest llenguatge (almenys en anglès).
- Se centra en les cadenes, de manera que s'adiu especialment a les aplicacions que treballen amb text.

Per als principiants, hi ha diversos programes d'aprenentatge en línia, com ara:

www.dci.clrc.ac.uk/Publications/Cookbook/index.html
www.tcl.tk/man/tcl8.5/tutorial/tcltutorial.html
www.tutorialspoint.com/tcl-tk/

Si realment voleu aprendre el llenguatge tcl/tk, us recomanem especialment la lectura de «Practical Programming in Tcl and Tk» de Brent Welch, ISBN: 0-13-038560-3. Probablement sigui un poc massa tècnic per als principiants en programació, però segurament els resultarà útil després de completar un dels programes d'aprenentatge en línia.

Copyright Marc Prior 2009-2011