Howto - Translating Word 2007 files in OmegaT

Manual de l'OmegaT:
Traducció de fitxers del Word 2007 (Office Open XML, .docx) a l'OmegaT

Aquest manual ofereix consells per traduir fitxers de l'MS Office 2007 (i posteriors) a l'OmegaT.

Descripció del context

Amb l'arribada del Microsoft Office 2007, els programes Microsoft Word, Excel i Powerpoint tenen un nou format de fitxer per defecte. Aquests formats es coneixen oficialment com «Office Open XML» i tenen les extensions .docx, .xlsx i .pptx, respectivament. També s'utilitzen aquests formats a l'MS Office 2010. Per comoditat, d'ara endavant ens hi referirem com a «formats de fitxer de l'MS Office 2007».

A partir de la versió 1.7.1, l'OmegaT admet els fitxers del Microsoft Office 2007 directament, sense necessitat de convertir-los. Amb la presentació de la versió 2.1.8 de l'OmegaT, la utilització d'aquests formats de fitxer a l'OmegaT també es va tornar molt més senzilla.

Avantatges d'utilitzar el format .docx amb l'OmegaT

A mesura que els clients/autors actualitzen a les versions més recents del Microsoft Office/Word, els traductors reben més fitxers amb el nou format. A diferència dels formats anteriors, .doc, .xls i .ppt, aquests fitxers es poden utilitzar directament amb l'OmegaT, de manera que s'evita la pèrdua de format que pot provocar la conversió entre formats.

El nou format pot ser també una manera útil de gestionar els antics formats .doc, .xls i .ppt, ja que es poden convertir als equivalents de l'MS Office 2007, traduir-los amb l'OmegaT i tornar-los convertir al format original. Aquest procediment és, per tant, una alternativa per als traductors que prefereixin no utilitzar l'OpenOffice.org amb aquesta finalitat.

Conversió al format de l'MS Office 2007

Per convertir els fitxers de l'MS Office 1997/2000/2003/XP al format de l'MS Office 2007, cal obrir-los amb l'MS Office 2007 i desar-los amb «Anomena i desa» amb el format nou. (Atès que aquest és ara el format estàndard, a l'MS Office 2007 se'ls anomena directament Word, Excel o PowerPoint).

Per als usuaris que no tenen l'MS Office 2007 ni 2010 i no volen comprar-lo, Microsoft ofereix un connector de compatibilitat per a les versions anteriors.

Usuaris del Linux: tant l'MS Office 2007 com el connector de compatibilitat de Microsoft es poden executar amb el CrossOver Linux.

Recomanacions per utilitzar els formats .docx, .xlsx i .pptx a l'OmegaT

A les versions de l'OmegaT anteriors a la 2.1.8, cada canvi de format d'un fitxer de l'MS Office 2007 creava un gran nombre d'etiquetes múltiples que sovint dificultaven la gestió d'aquest format del fitxer. A partir de la versió 2.1.8, aquestes etiquetes múltiples s'agrupen (condensen) en una única etiqueta. Per tant, els usuaris que vulguin traduir fitxers de l'MS Office 2007 hauran d'actualitzar a la versió 2.1.8 de l'OmegaT o una posterior.

(A canvi d'aquesta millora en la facilitat d'ús de les etiquetes amb els fitxers .docx, es perd una mica de control sobre el format. Per exemple, sense la funció d'«etiquetes agrupades», quan una paraula del text de partida era en negreta i en cursiva, el traductor podia decidir representar-la només en negreta o només en cursiva. Amb la funció d'«etiquetes agrupades» activada no es pot fer això. Per a la majoria dels usuaris, la millora de la facilitat d'ús tindrà més pes que aquest inconvenient).

El format.docx també és propens a introduir codi de formatació molest que fa que apareguin etiquetes supèrflues i innecessàries a la subfinestra d'edició de l'OmegaT. Com que aquestes etiquetes són un inconvenient durant la traducció, val la pena intentar eliminar-les abans de començar a traduir amb l'OmegaT. L'OmegaT comparteix aquest problema amb altres eines TAO que treballen amb el format .docx i aquestes proposen solucions semblants o la mateixa.

Com eliminar el codi de formatació innecessari dels fitxers .docx

Tingueu en compte que, fins i tot després de canviar la configuració del Word perquè no introdueixi codis «molestos», per exemple, per a la partició de mots, pot ocórrer que encara n'apareguin molts al fitxer que no s'hagin eliminat amb el canvi de configuració. Més endavant s'explica com eliminar aquests codis. Això no obstant, abans de seguir les instruccions següents per eliminar els codis molestos, no oblideu fer els canvis de configuració al Word, perquè, si no els feu, el Word podria tornar a inserir els codis molestos en tornar a obrir el fitxer.

Macro CodeZapper

Com ja s'ha dit abans, aquest problema de l'MS Office 2007 no és exclusiu de l'OmegaT. El traductor David Turner ha escrit una macro de l'MS Word (molt recomanable!) per resoldre aquest problema.

Anivellament del format dels caràcters

Una alternativa a executar la macro CodeZapper al text és «anivellar» el format. «Anivellar» el format vol dir aplicar el format del primer caràcter d'una selecció de text (com ara, un paràgraf complet) a tots els caràcters que el segueixin. Fixeu-vos que no és el mateix que «eliminar» el format, la qual cosa faria que el format del caràcter tornès a ser el predeterminat del document.

Per anivellar el format dels paràgrafs podeu copiar els paràgrafs sencers a l'MS Word i tornar-los a enganxar sobre el mateix paràgraf perquè tot el paràgraf adopti el format del primer caràcter.

Anivellament manual del format dels caràcters d'un paràgraf

Primer pas. Mostreu la marca de paràgraf. Marqueu cada paràgraf fent-hi clic diverses vegades fins que se seleccioni tot el paràgraf. Llavors desplaceu el final de la selecció un caràcter cap a l'esquerra de manera que no inclogui la marca de paràgraf.

Segon pas. Copieu el text realçat (Ctrl+C). Tot seguit, seleccioneu l'opció d'enganxada amb opcions (Word 2003) o feu clic a la fletxa sota el botó «Insereix» (Word 2007) per veure més opcions d'enganxada. Finalment, inseriu el contingut amb l'opció «Text Unicode sense format».

Si els paràgrafs tenen format inserit (negreta, cursiva, enllaços, etc.), podeu triar entre:

- anivellar el format d'aquests paràgrafs amb la macro descrita més amunt i, posteriorment, tornar a inserir el format; o bé

- realçar només el text fins al començament de la part formatada, copiar-lo i tornar-lo a enganxar a sobre i, tot seguit, repetir el procés amb el text que segueix la part realçada.

Creació d'una macro per anivellar el format dels caràcters d'un paràgraf

Podeu crear una macro per fer els processos anteriors d'una manera més automàtica. Més avall trobareu unes instruccions breus per crear la macro (a l'MS Office 2007). (Si necessiteu instruccions més detallades, consulteu el vostre manual d'instruccions o feu clic aquí, aquí o aquí).

Si encara no ho heu fet, afegiu la pestanya Desenvolupador a la franja com segueix: feu clic al botó Office. Seleccioneu Opcions del Word Feu clic a Opcions habituals al quadre de diàleg Opcions del Word. A la franja, seleccioneu Mostra la pestanya Desenvolupador i confirmeu amb D'acord. Tanqueu el Word.

Torneu a iniciar el Word, creeu un nou fitxer del Word i afegiu un paràgraf de text de mostra que tingui almenys tres línies, com ara:

Això és un paràgraf. Això és un paràgraf. Això és un paràgraf. Això és un paràgraf. Això és un paràgraf. Això és un paràgraf. Això és un paràgraf. Això és un paràgraf. Això és un paràgraf. Això és un paràgraf. Això és un paràgraf. Això és un paràgraf. Això és un paràgraf. Això és un paràgraf. Això és un paràgraf. Això és un paràgraf. Això és un paràgraf. Això és un paràgraf. Això és un paràgraf. Això és un paràgraf. Això és un paràgraf. Això és un paràgraf.

Feu clic al botó de marca de paràgraf per mostrar les marques de paràgraf.

Col·loqueu el cursor al paràgraf de text (tret de la primera o l'última línia).

Creeu la macro:

A la pestanya Desenvolupador, feu clic a Enregistrament de la macro.

Al quadre de nom de la macro, escriviu un nom per a la macro, com ara «formatanivellat». Perquè la macro estigui disponible per a tots els documents, seleccioneu Normal.dotm al quadre «Emmagatzema la macro a». Si heu fet canvis al document Normal.dotm, és recomanable fer-ne primer una còpia de seguretat.

Feu clic al botó Teclat. Feu clic al quadre de text per introduir una combinació de tecles nova i seguidament proveu diverses combinacions de tecles fins que en trobeu una que no estigui assignada. Si la combinació que proveu ja està assignada, es mostrarà un missatge al quadre de diàleg per indicar-ho, i podreu esborrar la combinació i provar amb una altra. Sembla que Ctrl+Maj+9 no està assignada a cap altra funció en la instal·lació bàsica del Word, però podeu utilitzar qualsevol altra combinació que encara no estigui assignada.

Feu clic a Assigna per assignar la drecera a la macro que enregistrareu. Qualsevol cosa que feu ara s'enregistrarà a la macro, de manera que heu de seguir el procés amb molta atenció:

Ctrl+fletxa cap amunt (fa que el cursor se situï a l'inici del paràgraf)

Ctrol+Maj+fletxa cap avall (se selecciona el paràgraf i també la marca de paràgraf)

Maj+fletxa a l'esquerra (es desplaça el final de la selecció un caràcter cap a l'esquerra per excloure la marca de paràgraf)

Ctrl+C (per copiar el paràgraf)

Ctrl+V (per tornar a enganxar el text del paràgraf sobre el paràgraf)

Un cop enregistrades aquestes ordres, feu clic a Atura l'enregistrament.

Feu clic a Macros, seleccioneu formatanivellat (o el nom que hàgiu donat a la vostra macro) i feu clic a Edita. Es mostrarà el codi de la vostra macro. Per a formatanivellat, hauria de ser:

___________________
Sub formatanivellat()
'
' formatanivellat macro
'
'
Selection.MoveUp Unit:=wdParagraph, Count:=1
Selection.MoveDown Unit:=wdParagraph, Count:=1, Extend:=wdExtend
Selection.MoveLeft Unit:=wdWord, Count:=1, Extend:=wdExtend
Selection.Copy
Selection.PasteAndFormat (wdPasteDefault)
End Sub
___________________

Canvieu la línia:

Selection.PasteAndFormat (wdPasteDefault)

per:

Selection.PasteSpecial DataType:=wdPasteText

Deseu amb Ctrl+S i tanqueu la finestra d'edició de la macro.

Si tot ha anat bé, la macro hauria de funcionar. Per comprovar-ho, afegiu format al document Word; per exemple, poseu una paraula en negreta. A continuació, només cal que col·loqueu el cursor en qualsevol lloc del paràgraf i feu clic a Ctrl+Maj+9 (o la drecera de teclat que hàgiu seleccionat); el format hauria de desaparèixer.

Podeu canviar la drecera de teclat en qualsevol moment. Per canviar-la, aneu al botó principal «Office» i a les opcions del Word (a la part inferior dreta del quadre de diàleg).

Feu clic a Personalitza > Tria les ordres de. Escolliu Macros al menú desplegable. Seleccioneu «formatanivellat» (o el nom que hàgiu triat).

Sota el quadre de diàleg, al costat de Dreceres de teclat, feu clic a Personalitza.

Al quadre Categories, desplaceu-vos fins a Macros i seleccioneu aquesta opció. Tot seguit, a mà dreta, sota Macros, seleccioneu formatanivellat (o el nom que hàgiu posat a la macro). La drecera actual es mostrarà al quadre corresponent. Per esborrar-la, seleccioneu-la i feu clic a Suprimeix. A continuació, hi podeu introduir una nova drecera i assignar-la amb Assigna, com féreu abans. Tanqueu/confirmeu els quadres de diàleg.

Podeu utilitzar un procediment semblant per crear un botó per a la vostra macro:

De nou, feu clic al botó principal «Office» i a les opcions del Word.

Feu clic a Personalitza > Tria les ordres de. Escolliu Macros al menú desplegable. Seleccioneu la vostra macro.

Feu clic a Afegeix. L'ordre de la macro hauria d'aparèixer a la columna de la dreta. Feu clic a Modifica.

Trieu un símbol i feu clic a D'acord > D'acord. El símbol de la vostra macro hauria d'aparèixer a la barra d'eines.

Aquesta macro és útil per anivellar el format d'un paràgraf complet que no contingui format visible. Si un paràgraf inclou format que cal respectar, hi haureu de restaurar el format eliminat després d'anivellar el paràgraf. Als paràgrafs amb molt de contingut formatat, la restauració del format eliminat pot comportar molta feina. Per a aquests paràgrafs, un recomanem les alternatives següents:

Copyright Marc Prior 2009-2011