Guida - Traduction files de Microsoft Word 2007 in OmegaT

Iste Guida provide suggestiones re le traduction in OmegaT de files MS Office 2007 (e plus tarde).

Scenario de fundo

Con le advenimento de Microsoft Office 2007, Microsoft Word, Excel e Powerpoint ha nove formatos de file. Iste formatos es formalmente note como "Office Open XML", e ha respectivemente le extensiones .docx, .xlsx e .pptx. Le formatos es anque usate in MS Office 2010. Pro convenientia, illos essera referite in sequito como "Formatos de file MS Office 2007".

A partir del Version 1.7.1 in avante, OmegaT poteva tractar directemente files Microsoft Office 2007, sin conversion. Con le apparentia de OmegaT Version 2.1.8, le tractamento de iste formato de file in OmegaT deveni mesmo multo plus facile.

Le avantages de usar le formato .docx con OmegaT

Pois que le clientes e le autores promove Microsoft Office/Word al versiones plus recente, le traductores pote se expectar de reciper le files progressivemente in le nove formato. Differentemente de vetule formatos .doc, .xls e .ppt, iste files pote esser tractate directemente in OmegaT, con nulle perdita de formato in consequentia del conversiones verso e a partir del altere formatos.

Le nove formato pote alsi servir como un utile maniera de tractar le vetule formatos .doc, .xls e .ppt, post que illos pote esser convertite a lor pendantes de MS Office 2007, traducite in OmegaT, e reconvertite de novo in le vetule formato. Iste procedura es in consequentia un alternativa pro le traductores qui prefererea non usar OpenOffice.org pro iste proposito.

Converter in formato MS Office 2007

On pote converter le files MS Office 1997/2000/2003/XP al formato MS Office 2007 per los aperir in MS Office 2007 e los salvar con "Salva Como" in le formato nove. (Pois que isto es ora le formato standard, illo es simplemente describite como Word, Excel o Powerpoint in MS Office 2007).

Pro usatores qui non ha MS Office 2007 o 2010 e non desidera comprar los, Microsoft provide un plugin de compatibilitate pro le versiones anterior.

Usatores de Linux: ambe MS Office 2007 e le plugin de compatibilitate Microsoft opera sur Linux Crossover.

Punctos a notar quando on usa le formatos .docx, .xlsx e .pptx con OmegaT

In le versiones de OmegaT precedente le 2.1.8, cata cambiamento de formato in un fila de MS Office 2007 resultava in un longe serie de plure tags, que sovente rende le gestion de iste formato de file impractic. Depost le version 2.1.8, per per predefinition, iste tags multiple non es aggregate (condensate) in un sol tag. Le usatores que desidera render le files MS Office 2007 deberea dunque promover al version 2.1.8 o plus tarde de OmegaT.

(Le major facilitate de tractar le tag con le files .docx veni a costo de un leve perdita in controlo re le formato. E.g. sin le function "aggrega le tags", ubi un parola in le texto original es in nigrato e italico, le traductor poterea seliger de render lo in nigrato solmente, o sol in italico. Con le function "aggrega le tags" habilitate, isto non es possibile. Le major parte del usatores probabilemente trovara que le major facilitate de uso supera iste disavantage.)

Le formato .docx es alsi pron al introduction de codice de formato "enoiose" que resulta in un apparition de tags importun e inutile in le quadro del modifica (editor) de OmegaT. Pois que isto es incommode durante traduction, vale le pena de probar a remover iste tags enoiose ante le initio del traduction in OmegaT. OmegaT comparti iste problema con altere applicationes CAT que tracta le formato .docx, e le solutiones es simile o identic.

Como remover le codice de formato importun del files .docx

Nota que mesmo post que le configurationes de Word esseva cambiate de maniera que illos non insereva codices "enoiose", per exemplo pro le auto syllabation, tal codices pote ancora esser presente in le file e non removite per le cambio in le configuration. Le remotion de iste codices es describite in sequito. Ante que tu seque le instructiones in sequito pro le remotion del codices enoiose, comocunque, rememorar se facer le cambios de configuration in Word in prime loco, o Word pote simplemente re-inserer codices enoiose un altere vice quando le file es aperte novemente

Utensiles de tertie parte

Como ja mentionate, iste problema con MS Word non es sol pro OmegaT. Applicationes de tertie parte esseva producite pro tractar le problema. Ecce duo de illos:

CodeZapper (non costose)

Document Cleaner (gratuite)

Nivellar le formato del character

Un alternativa a facer fluer le macro CodeZapper sur tu texto, es "nivellar" le formato. "Nivellar" le formato significa applicar le formato del prime character in un selection de texto (assi como un integre paragrapho) a omne characteres subsequente. Nota que isto non es le identic a "cancellar" le formato, le qual causarea le retorno al formato base del character del documento.

Tu pote nivellar le formato de paragrapho essentialmente per copiar le paragraphos integre in MS Word e los collar retro super se ipse a fin que le integre paragrapho assume le formato del prime character.

Nivellar le formato del character de un paragrapho manualmente

Grado 1: discoperi le marca del paragrapho. Marca cata paragrapho cliccante sur illo repetitemente usque le paragrapho integre es marcate. Pois move le fin del marca un character al sinistra de sorta que on non include le marca del paragrapho.

Grado 2: copia iste texto marcate (Ctrl+C). Pois selige "Colla Special" (Word 2003) o clicca sur le flecha al base del button "Inserer" (Word 2007) pro obtener le optiones extendite de Collar. Finalmente, insere le contento usante le option "Texto Unicode non formattate ".

Ubi le paragraphos contine formato integrate (nigrato, italico, ligamines, etc.), tu pote o:

- nivellar le formato ab iste paragraphos usante le macro como describite supra e pois re inserer le formato; o

- marcar sol le texto usque al initio del parte formattate, copiar iste texto e collar lo retro, super se ipse, pois iterar le processo sur le texto post le parte formattate.

Crear un macro pro nivellar le formato del character de un paragrapho

Tu pote automatisar alquanto le procedura precedente per le creation de un macro. Breve instructiones pro crear le macro (in MS Office 2007) es fornite in sequito. (Pro instructiones plus detaliate, refere te a tu manual de instruction o clicca ci, ci o ci.)

Si tu non ha ja facite assi, adde le scheda Disveloppator al banda como seque: clicca sur le button Office. Selige le Optiones de Word Clicca Popular in le fenestras de dialogo Optiones de Word. Sur le "banda", pulsa le linguetta "Monstra disveloppator" e confirma lo con OK. Claude Word.

Lancea de nove Word, crea un file Word nove e adde un paragrapho de texto exemplo, longe al minus tres lineas, e.g.:

Isto es un paragrapho. Isto es un paragrapho. Isto es un paragrapho. Isto es un paragrapho. Isto es un paragrapho. Isto es un paragrapho. Isto es un paragrapho. Isto es un paragrapho. Isto es un paragrapho. Isto es un paragrapho. Isto es un paragrapho. Isto es un paragrapho. Isto es un paragrapho. Isto es un paragrapho. Isto es un paragrapho. Isto es un paragrapho. Isto es un paragrapho. Isto es un paragrapho. Isto es un paragrapho. Isto es un paragrapho. Isto es un paragrapho. Isto es un paragrapho.

Clicca sur le button Marcar paragrapho pro render le marcas del paragrapho visibile.

Placia le cursor in tu paragrapho de texto (non in le prime o ultime lineas).

Crear le macro:

Sur le scheda Disveloppator, clicca sur Registrar macro.

In le cassa Nomine del macro, scribe un nomine pro le macro, assi como "NivellarFormato". Pro render le macro utilisabile in omne documentos, elige in le cassa "Salva macro in": Normal.dotm. Si tu ha modificate tu Normal.dotm, tu pote voler in prime loco lo salvar.

Clicca sur le button Claviero. Clicca in le cassa pro un nove combination de claviero, pois experimenta con le combinationes de claviero pro trovar uno que non es assignate. Si un combination que tu tenta es jam assignate, es monstrate un message pro iste effecto in the dialogo, e tu pote deler le combination e experir un altere. Ctrl+Shift+9 sembla non sia assignate a ulle altere function in le installation ordinari de Word, ma tu pote usar omne altere combination que non esseva jam assignate.

Clicca sur Assigna pro assignar le via breve al macro que tu va registrar. Toto lo que tu ora face sera registrate in le macro, assi seque exactemente iste procedura:

Ctrl+Cursor In alto (isto porta le cursor al initio del paragrapho)

Ctrl+Shift+Cursor a basso (isto selige le paragrapho, includente le marca de paragrapho)

Shift+Cursor a sinistra (isto move le fin del selection un character al sinistra, de maniera que illo non include plus le marca del paragrapho)

Ctrl+C (isto copia le paragrapho)

Ctrl+V (isto colla le texto del paragrapho de novo sur le paragrapho mesme)

Post inserite iste commandos, clicca Cessa le registration.

Clicca sur Macros e selige "NivellarFormato" (o qualcunque tu lo ha nominate), pois Modificar. Le codice de tu macro essera monstrate. Pro NivellarFormato, isto deberea esser:

___________________
Sub NivellarFormato()
'
' NivellarFormato macro
'
'
Selection.MoveUp Unit:=wdParagraph, Count:=1
Selection.MoveDown Unit:=wdParagraph, Count:=1, Extend:=wdExtend
Selection.MoveLeft Unit:=wdWord, Count:=1, Extend:=wdExtend
Selection.Copy
Selection.PasteAndFormat (wdPasteDefault)
End Sub
___________________

Cambia le linea:

Selection.PasteAndFormat (wdPasteDefault)

in:

Selection.PasteSpecial DataType:=wdPasteText

Salva con Ctrl+S, e claude le fenestra de modifica del macro.

Si toto esseva facite secun le plano, tu macro deberea ora functionar. Pro probar lo, adde alicun formatos a tu documento Word, per exemplo rendente un parola nigrate. Ora simplemente mitte le cursor alicubi in le paragrapho e pulsa Ctrl+Shift+9 (o qualcunque altere via breve de claviero que tu ha seligite), e tu deberea vider le formato disparer.

Tu pote cambiar alquando le via breve de claviero. Pro facer isto, clicca le button principal de "Office", pois Optiones de Word (in fundo al dextera del fenestra de dialogo).

Clicca Personalisa > Selige le commandos. Elige Macros ab le lista a cadita. Selige "NivellarFormato" (o qualcunque tu lo ha nominate).

Al base del fenestra de dialogo juxta a Vias breve de claviero, clicca sur Personalisar.

In le cassa Categorias, rola in basso a Macros e selige lo. Pois al dextra, sub Macros, selige "NivellarFormato" (o qualcunque tu ha nominate tu macro). Le via breve currente essera monstrate in le cassa apposite. Tu pote deler lo: selige lo e pulsa Dele. Tu pote dunque scriber un via breve nove e assignar lo con Assigna como tu ha facite anteriormente. Claude/confirma le fenestras de dialogo.

Tu pote usar un procedura simile pro crear un button pro tu macro:

De novo, clicca le button principal de "Office", dunque Optiones de Word.

Clicca Personalisa > Selige le commandos. Elige Macros ab le lista a cadita. Selige tu macro.

Clicca sur Adde. Tu deberea vider apparer in le columna dextere le commando macro. Clicca sur Modifica.

Elige un symbolo, pois OK > OK. Le symbolo pro tu macro deberea apparer in le barra del instrumentos.

Iste macro es utile pro nivellar le formato de un integre paragrapho que non contine formato visibile. Ubi un paragrapho contine formato desiderate, tu debe restaurar le formato delite post le nivellamento del paragrapho. In le paragraphos continente multe formatos, le restauration del formatos delite pote resultar in un grande quantitate de labor. Pro tal paragraphos, considera le sequente alternativas:

Copyright Marc 2009-2011