Howto - Translating Word 2007 files in OmegaT

Guía de OmegaT:
Traducir ficheiros de Word 2007 (Office Open XML, .docx) en OmegaT

Esta guía dálle consellos para traducir ficheiros de Word 2007 (e versións posteriores) en OmegaT.

Situación

Dende o lanzamento de Microsoft Office 2007, Microsoft Word, Excel e PowerPoint teñen novos formatos de ficheiro por defecto. Estes formatos son coñecidos como \xABOffice Open XML\xBB e teñen as extensións .docx, .xlsx e .pptx respectivamente. MS Office 2010, 2013 e 2016 tamén usan este formato. Para simplificar falaremos deles como \xABformatos de ficheiro MS Office 2007\xBB.

OmegaT pode traballar con ficheiros de MS Office 2007 sen necesidade de convertelos dende a versión 1.7.1. Ademais, coa aparición da versión 2.1.8 de OmegaT traballar con este formato de ficheiros volveuse máis fácil.

Vantaxes de usar o formato .docx con OmegaT

A medida que os clientes/autores actualizan Microsoft Office/Word a versións máis recentes, as persoas que se dedican á tradución recibirán cada vez máis ficheiros no novo formato. A diferenza do que ocorría cos antigos formatos .doc, .xls e .ppt, é posible traballar con estes ficheiros en OmegaT sen perdas de formato como resultado da conversión a ou dende outros formatos.

O novo formato pode ser unha forma moi útil de traballar cos antigos formatos .doc, .xls e .ppt, xa que é posible convertelos aos seus equivalentes de MS Office 2007, traducilos en OmegaT e convertelos de novo. Este proceso é unha alternativa para as persoas que traducen que non queren empregar OpenOffice.org para este propósito.

Converter ao formato MS Office 2007

Pode converter ficheiros de MS Office 1997/2000/2003/XP ao formato MS Office 2007 abríndoos en MS Office 2007 (ou unha versión posterior) e gardándoos con \xABGardar como\xBB no novo formato. (Ao ser o novo formato estándar está descrito como Word, Excel ou PowerPoint en MS Office 2007 e posteriores).

Microsoft ofrece un complemento de compatibilidade para que o empreguen en versións anteriores aqueles usuarios que non teñen a versión de MS Office 2007 (ou unha posterior) e non desexen mercala.

Usuarios de Linux: é posible executar MS Office 2007 e o complemento de compatibilidade de Microsoft en Crossover Linux.

Puntos que ter en conta cando usa os formatos .docx, .xlsx e .pptx en OmegaT

Nas versións de OmegaT anteriores á 2.1.8 cada cambio no formato dun ficheiro de MS Office 2007 resultaba nunha longa serie de múltiples etiquetas, o cal facía que na maioría dos casos traballar con este formato fose pouco práctico. Por defecto, a partir da versión 2.1.8, non se agregan as etiquetas múltiples a unha etiqueta única. Por tanto, as persoas que queiran traducir ficheiros de MS Office 2007 deberían actualizar á versión 2.1.8 ou unha superior.

(A mellora na xestión das etiquetas nos ficheiros .docx ten como contrapartida unha pequena perda no control sobre o formato. Por exemplo, sen a opción \xABEtiquetas de agregado\xBB, cando unha palabra no texto fonte está en negra e cursiva a persoa que traduce pode optar por deixala só en negra ou só en cursiva no texto traducido, algo que non é posible facer se a opción \xABEtiquetas de agregado\xBB está activada. Para a maioría da xente a maior facilidade de uso compensa esta desvantaxe.)

O formato .docx ten a tendencia de introducir código de formato \xABsen sentido\xBB, o cal leva a que aparezan etiquetas inútiles e innecesarias no panel de edición de OmegaT. É boa idea intentar eliminalas antes de comezar a traducir en OmegaT, xa que estas etiquetas resultan incómodas durante o proceso de tradución. OmegaT comparte este problema á hora de traballar co formato .docx con outras ferramentas de tradución asistida, e as solucións que empregan son similares ou iguais.

Como eliminar código de formato non desexado en ficheiros .docx

Teña en conta que incluso despois de cambiar a configuración de Word para que non introduza etiquetas sen sentido, como pode ser o caso da guionización automática, é posible que non sexan eliminadas polo cambio na configuración e sigan estando presentes no ficheiro. A continuación describimos o método para eliminar estas etiquetas. Teña en conta que deberá cambiar a configuración de Word antes de seguir as instrucións que atopará a continuación, ou Word volverá a introducir etiquetas sen sentido cando se abra de novo o ficheiro.

Ferramentas de terceiros

Como xa mencionamos, este problema con MS Word non só se dá en OmegaT. Por ese motivo se crearon ferramentas para solucionar este problema: Dúas destas ferramentas son:

CodeZapper (barata)

Document Cleaner (gratuíta)

Nivelar o formato dos caracteres

Unha alternativa a usar a macro de CodeZapper no seu texto é \xABnivelar\xBB o formato. \xABNivelar\xBB o formato consiste en aplicar o formato do primeiro carácter nunha selección de texto (un parágrafo completo, por exemplo) a todos os caracteres subsecuentes. Teña en conta que isto non é o mesmo que \xABeliminar\xBB o formato, o cal podería causar que o formato dos caracteres volvese a ser o que emprega o documento por defecto.

Pode nivelar o formato dos parágrafos copiando parágrafos enteiros en MS Word e pegándoos de novo sobre eles mesmos para que o parágrafo asuma o formato do primeiro carácter.

Nivelar o formato dun parágrafo de forma manual

Paso 1: Mostre a marca do parágrafo. Marque cada parágrafo facendo clic nel repetidas veces ata que o parágrafo completo quede destacado. Despois desprace o final do espazo destacando un carácter á esquerda para que non inclúa a marca do parágrafo.

Paso 2: - nivelar o formato destes parágrafos usando a macro que describimos antes e reinserir o formato, ou Seleccione \xABpegado especial\xBB (Word 2003) ou faga clic na frecha da parte inferior do botón \xABinserir\xBB (Word 2007) para obter as opcións de pegado estendidas. Por último, insira o contido empregando a opción \xABTexto Unicode sen formato\xBB.

Nos parágrafos que conteñan formato entre liñas, como grosa, cursiva, hiperligazóns, etc, pode optar por:

- nivelar o formato destes parágrafos usando a macro que describimos antes, e reinserir o formato; ou

- marcar só o texto que está ao comezo da parte con formato, copiar ese texto e pegalo sobre si mesmo e repetir o proceso despois da parte con formato.

Crear unha macro para nivelar o formato dos caracteres dun parágrafo

Pode actualizar o proceso que describimos anteriormente creando unha macro. A continuación describimos de forma breve o proceso para crear unha macro (en MS Office 2007). (Pode atopar instrucións máis detalladas no seu manual de instrucións ou facendo clic aquí, aquí ou aquí.)

Se inda non o fixo, engada a pestana do Programador á fita seguindo este proceso: faga clic no botón de Office. Seleccione Opcións de Word. Fai clic na opción Popular da caixa de diálogo de Opcións de Word. Na fita, faga clic en Mostrar xanela do programador e confirme con Aceptar. Peche Word.

Volva a executar Word, cree un novo ficheiro de Word e engada un parágrafo dun texto de exemplo, que teña polo menos tres liñas de lonxitude, por exemplo:

Isto é un parágrafo. Isto é un parágrafo. Isto é un parágrafo. Isto é un parágrafo. Isto é un parágrafo. Isto é un parágrafo. Isto é un parágrafo. Isto é un parágrafo. Isto é un parágrafo. Isto é un parágrafo. Isto é un parágrafo. Isto é un parágrafo. Isto é un parágrafo. Isto é un parágrafo. Isto é un parágrafo. Isto é un parágrafo. Isto é un parágrafo. Isto é un parágrafo. Isto é un parágrafo. Isto é un parágrafo. Isto é un parágrafo. Isto é un parágrafo.

Faga clic no botón da marca do parágrafo para volver as marcas de parágrafo visibles.

Coloque o cursor no seu parágrafo de texto (non na primeira ou na última liña).

Cree a macro:

Na xanela do Programador, faga clic en Gravar macro.

Escriba un nome na caixa Nome da macro, por exemplo \xABnivelarformato\xBB. Seleccione Normal.dotm na caixa “Gardar macro en” para poñer a macro á disposición de todos os ficheiros. Se fixo cambios no seu Normal.dotm, é posible que queira facer unha copia de seguranza deste.

Faga clic no botón Teclado. Faga clic na caixa para crear unha nova combinación de teclado e probe as distintas combinacións para atopar unha que non estea atribuída. Unha mensaxe aparecerá na caixa de diálogo se proba unha combinación que xa está atribuída e poderá eliminar a combinación e probar con outra. Parece que a combinación Ctrl+Maiús+9 non está atribuída a ningunha función nas instalacións básicas de Word, pero pode empregar calquera combinación que non estea atribuída.

Faga clic en Atribuír para establecer o atallo da macro que está a punto de gravar. Todo o que faga a partir de agora será gravado na macro, polo que debe seguir este proceso coidadosamente:

Ctrl+Cursor arriba (para levar o cursor ao comezo do parágrafo)

Ctrl+Maiús+Cursor abaixo (para seleccionar o parágrafo, incluíndo a marca de parágrafo)

Maiús+Cursor esquerda (para mover o final da selección un carácter á esquerda para que non inclúa a marca do parágrafo)

Ctrl+C (para copiar o parágrafo)

Ctrl+V (para pegar o texto do parágrafo sobre o propio parágrafo)

Despois de introducir estes comandos, faga clic en Parar gravación.

Faga clic en Macros e seleccione nivelarformato (ou o nome que lle dese á súa macro), despois en Editar: Mostrarase o código da súa macro. En nivelarformato debería ter este aspecto:

___________________
Sub nivelarformato()

‘ nivelarformato macro


Selection.MoveUp Unit:=wdParagraph, Count:=1
Selection.MoveDown Unit:=wdParagraph, Count:=1, Extend:=wdExtend
Selection.MoveLeft Unit:=wdWord, Count:=1, Extend:=wdExtend
Selection.Copy
Selection.PasteAndFormat (wdPasteDefault)
End Sub
___________________

Cambie a liña:

Selection.PasteAndFormat (wdPasteDefault)

a:

Selection.PasteSpecial DataType:=wdPasteText

Garde con Ctrl+G e peche a ventá de edición de macros.

Se todo saíu como debería, agora a súa macro debería funcionar. Para probala, engada algo de formato ao seu documento de Word, como por exemplo, poñer unha palabra en grosa. Despois poña o cursor nalgún lugar do parágrafo e prema Ctrl+Maiús+9 (ou o atallo que escollese) e debería ver como o formato desaparece.

Pode cambiar o atallo en calquera momento. Para facelo, faga clic no botón \xABOffice\xBB e despois en Opcións de Word (botón dereito da caixa de diálogo).

Faga clic en Personalizar > Escoller comandos. Escolla Macros na lista despregable. Escolla \xABnivelarformato\xBB (ou o nome que lle puxese).

Na parte inferior da caixa de diálogo a carón dos atallos faga clic en Personalizar.

Na caixa de diálogo Categorías, desprácese cara abaixo ata e escolla Macros. Na dereita, baixo Macros, escolla nivelarformato (ou o nome que lle puxese). O atallo actual aparecerá na caixa de diálogo. Pode limpalo facendo clic no botón Eliminar, despois pode introducir un novo atallo con Atribuír. Peche/confirme as caixas de diálogo.

Pode seguir un proceso similar para crear un botón para a súa macro:

Faga clic de novo no botón \xABOffice\xBB e despois en Opcións de Word.

Faga clic en Personalizar > Escoller comandos. Escolla Macros na lista despregable. Escolla a súa macro.

Faga clic en Engadir. Debería aparecer o comando do macro na columna da dereita. Faga clic en Modificar.

Escolla un símbolo, despois faga clic en Vale > Vale. O símbolo da súa macro debería aparecer na barra de ferramentas.

Esta macro é útil para nivelar o formato dun parágrafo completo que non conteña formato visible. Cando un parágrafo conteña formato que queira conservar, deberá restaurar o formato eliminado despois de nivelar o parágrafo. Restaurar o formato eliminado pode levar moito traballo naqueles parágrafos que conteñan moito formato. Nestes casos debe considerar as seguintes alternativas:

Copyright Marc Prior 2009-2011