Howto - Translating Word 2007 files in OmegaT

Guida di OmegaT:
Traduzione di file di Word 2007 (Office Open XML, con estensione .docx) in OmegaT

Questa guida fornisce suggerimenti sulla traduzione di file MS Office 2007 (e successivi) con OmegaT.

Premesse

Con l'avvento di Microsoft Office 2007, Microsoft Word, Excel e Powerpoint hanno nuovi formati di file predefiniti. Questi formati sono formalmente conosciuti come "Office Open XML" e hanno rispettivamente le estensioni .docx, .xlsx e .pptx. I formati sono utilizzati anche in MS Office 2010. Per motivi di convenienza, si farà riferimento a tali formati con la locuzione "formati file MS Office 2007".

Dalla versione 1.7.1, OmegaT è in grado di gestire direttamente i file di Microsoft Office 2007, senza conversione. Con la comparsa di OmegaT versione 2.1.8, il trattamento di questo formato di file nel programma è diventato molto più facile da usare.

I vantaggi di usare il formato .docx insieme con OmegaT

Con l'aggiornamento, da parte dei clienti/autori, alle versioni più recenti di Microsoft Office/Word, i traduttori devono attendersi sempre più file nel nuovo formato. A differenza dei precedenti formati. doc,. xls e. ppt, questi file possono essere gestiti direttamente in OmegaT, senza perdite di formattazione dovute alla conversione da altri formati.

Il nuovo formato può anche essere utile per gestire i vecchi formati .doc, .xls e .ppt, dato che possono essere convertiti nei loro corrispettivi di MS Office 2007, tradotti in OmegaT e riconvertiti nel vecchio formato. Questa procedura è quindi alternativa per i traduttori che preferiscono non utilizzare LibreOffice/OpenOffice.org per questo scopo.

Conversione nel formato MS Office 2007

È possibile convertire file di MS Office 1997/2000/2003/XP nel formato MS Office 2007, aprendoli con MS Office 2007 e salvandoli con "Salva con nome" nel nuovo formato (poiché ora è questo il formato standard, esso è semplicemente definito come formato Word, Excel o Powerpoint in MS Office 2007).

Per gli utenti che non dispongono di MS Office 2007 o 2010 e non hanno intenzione di comprarlo, Microsoft fornisce anche un plug-in di compatibilità gratuito per le versioni precedenti.

Utenti di Linux: sia MS Office 2007, sia i plug-in di compatibilità con Microsoft funzionano in Linux Crossover.

Punti da tenere presente nell'uso dei formati .docx, .xlsx e .pptx in OmegaT

Nelle versioni di OmegaT precedenti alla 2.1.8, ogni cambiamento di formattazione in un file di MS Office 2007 provocava una lunga serie di tag multipli, che rendevano spesso impraticabile la gestione di questo formato di file. Dalla versione 2.1.8, per impostazione predefinita, questi tag multipli sono ora aggregati (condensati) in un unico tag. Gli utenti che desiderano tradurre i file di MS Office 2007 dovrebbero quindi aggiornare OmegaT alla versione 2.1.8 o successiva

(la maggiore facilità di gestione dei tag con i file .docx è data al costo di una leggera perdita del controllo sulla formattazione. Per esempio, senza la funzione di "aggregazione tag", in cui una parola nel testo di origine è in grassetto e corsivo, il traduttore potrebbe scegliere di renderla solo in grassetto o solo in corsivo. Con la funzione di "aggregazione tag" attivata, questo non è possibile. La maggioranza degli utenti probabilmente troverà che l'aumentata facilità di utilizzo è superiore a questo inconveniente).

Il formato .docx è anche soggetto all'introduzione di codice di formattazione, per così dire, "fastidioso", che si traduce in tag indesiderati e inutili visibili nel riquadro dell'editor di OmegaT. Dato che sono scomodi durante la traduzione, vale la pena tentare di rimuovere questi disturbi prima di iniziare a tradurre. OmegaT condivide questo problema con altri strumenti CAT che gestiscono il formato .docx e le loro soluzioni sono simili o uguali.

Come rimuovere il codice di formattazione indesiderato dai file. docx

Si noti che anche dopo che le impostazioni di Word sono state modificate in modo che esso non inserisca più codici di "disturbo", ad esempio per la sillabazione automatica, tali codici potrebbero non essere stati rimossi dalla modifica della configurazione ed essere ancora presenti nel file. La rimozione di questi codici è descritta di seguito. Prima di seguire le seguenti istruzioni per la rimozione dei codici fastidiosi, tuttavia, si rammenti di apportare le modifiche di configurazione in Word, altrimenti Word potrà semplicemente reinserire tali codici appena il file viene riaperto.

Macro CodeZapper

Come già accennato, questo problema con MS Office 2007 non è limitato solo a OmegaT. Il traduttore David Turner ha scritto una macro di MS Word (vivamente consigliata!) per affrontare il problema.

Livellamento della formattazione dei caratteri

Un'alternativa all'esecuzione della macro CodeZapper sul vostro testo è quella di "livellare" la formattazione. "Livellare" la formattazione significa applicare il formato del primo carattere a tutti i caratteri successivi, in una selezione di testo (ad esempio un paragrafo intero). Si noti che questo non è lo stesso che "eliminare" la formattazione, che causerebbe alla formattazione dei caratteri di tornare all'impostazione predefinita del documento.

È possibile livellare la formattazione dei paragrafi essenzialmente copiando interi paragrafi in MS Word e incollandoli di nuovo su se stessi, in modo che l'intero paragrafo prenda la formattazione del primo carattere.

Livellamento manuale della formattazione di un paragrafo

Passo 1: scoprire il segno di paragrafo. Selezionare ogni paragrafo facendovi sopra clic ripetutamente finché non viene evidenziato l'intero paragrafo. Quindi spostare la fine della selezione un carattere a sinistra, in modo che il segno di paragrafo sia escluso.

Passo 2: copiare il testo evidenziato (Ctrl+C). Selezionare poi "Incolla speciale" (Word 2003) o fare clic sulla freccia nella parte inferiore del pulsante "Inserisci" (Word 2007) per ottenere le opzioni estese per l'incollaggio. Infine, inserire il contenuto usando l'opzione "Testo Unicode non formattato".

Dove i paragrafi contengono formattazione incorporata (grassetto, corsivo, collegamenti ipertestuali, ecc.) è possibile:

- livellare la formattazione da questi paragrafi utilizzando la macro come descritto sopra, quindi reinserire la formattazione; o

- evidenziare solo il testo fino all'inizio della parte formattata, copiarlo e incollarlo su se stesso, quindi ripetere il processo sul testo dopo la parte formattata.

Creazione di una macro per livellare la formattazione del carattere di un paragrafo

È in qualche modo possibile automatizzare la procedura descritta sopra con la creazione di una macro. Brevi istruzioni per la creazione della macro (in MS Office 2007) sono fornite di seguito (per maggiori informazioni, consultare il manuale di istruzioni o fare clic qui, qui o qui).

Se non l'avete già fatto, aggiungere la scheda di sviluppo alla barra multifunzione come segue: fare clic sul pulsante Office. Selezionare opzioni di Word. Fare clic su 'Popolare' nella finestra di dialogo Opzioni di Word. Sulla barra multifunzione, spuntare la scheda 'Visualizza sviluppo' e confermare con OK. Chiudere Word.

Riavviare Word, creare un nuovo file Word e aggiungere un paragrafo di testo campione, lungo almeno tre righe, ad esempio:

Questo è un paragrafo. Questo è un paragrafo. Questo è un paragrafo. Questo è un paragrafo. Questo è un paragrafo. Questo è un paragrafo. Questo è un paragrafo. Questo è un paragrafo. Questo è un paragrafo. Questo è un paragrafo. Questo è un paragrafo. Questo è un paragrafo. Questo è un paragrafo. Questo è un paragrafo. Questo è un paragrafo. Questo è un paragrafo. Questo è un paragrafo. Questo è un paragrafo. Questo è un paragrafo. Questo è un paragrafo. Questo è un paragrafo. Questo è un paragrafo.

Premere il pulsante 'evidenzia paragrafo' per rendere visibili i caratteri nascosti.

Posizionare il cursore nel paragrafo di testo (non nelle prime righe o nelle ultime).

Creare la macro:

Nella scheda Sviluppatore, fare clic su Registra Macro.

Nella casella Nome Macro digitare un nome per la macro, ad esempio "levelformat". Per rendere la macro disponibile in tutti i documenti, selezionare Normal.dotm nella casella "Memorizza macro in". Se sono state apportate modifiche al proprio Normal.dotm, potrebbe convenire prima farne una copia di sicurezza.

Fare clic sul pulsante Tastiera. Fare clic nella casella per una nuova combinazione di tasti, poi sperimentare con le combinazioni di tasti per trovarne una non assegnata. Se una combinazione che si prova è già assegnata, verrà visualizzato un messaggio relativo al comando nella finestra di dialogo, ed è possibile eliminare la combinazione e provarne un'altra. Ctrl+Maiusc+9 sembra non essere assegnata nell'installazione base di Word, ma è possibile utilizzare qualsiasi altra combinazione non ancora assegnata.

Fare clic su Assegna per assegnare la scorciatoia alla macro che si sta per registrare. Qualsiasi cosa si fa ora sarà registrata nella macro, quindi seguire questa procedura con attenzione:

Ctrl+cursore su (questo sposta il cursore all'inizio del paragrafo)

Ctrl+Maiusc+cursore giù (seleziona il paragrafo, incluso il segno di paragrafo)

Maiusc+cursore sinistra (sposta la fine della selezione a sinistra di un carattere, in modo da escludere il segno di paragrafo)

Ctrl+C (copia il paragrafo)

Ctrl+V (viene incollato il testo del paragrafo di nuovo sopra il paragrafo)

Dopo aver inserito questi comandi, fare clic su Ferma Registrazione.

Fare clic su Macro e selezionare levelformat (o qualunque sia il nome dato alla macro), quindi Modifica. Verrà visualizzato il codice della, o delle, macro. Per levelformat, questo dovrebbe essere:

___________________
Sub levelformat()
'
' levelformat macro
'
'
Selection.MoveUp Unit:=wdParagraph, Count:=1
Selection.MoveDown Unit:=wdParagraph, Count:=1, Extend:=wdExtend
Selection.MoveLeft Unit:=wdWord, Count:=1, Extend:=wdExtend
Selection.Copy
Selection.PasteAndFormat (wdPasteDefault)
End Sub
___________________

Modificare la riga:

Selection.PasteAndFormat (wdPasteDefault)

in:

Selection.PasteSpecial DataType:=wdPasteText

Salvare con Ctrl+S e chiudere la finestra di modifica macro.

Se tutto è andato secondo i piani, la macro ora dovrebbe funzionare. Per provarlo, aggiungere alcuni elementi di formattazione a un documento di Word, ad esempio convertendo una parola in grassetto. Ora basta posizionare il cursore in un punto qualsiasi del paragrafo e premere Ctrl+Maiusc+9 (o qualunque altro tasto di scelta rapida che era stato scelto): la formattazione dovrebbe scomparire.

È possibile modificare la scelta rapida da tastiera in qualsiasi momento. Per fare questo, premere il pulsante "Office" principale, poi opzioni di Word (in basso a destra della finestra di dialogo).

Fare clic su Personalizza > Scegli comandi. Scegliere Macro dall'elenco a discesa. Selezionare "levelformat" (o qualsiasi sia il suo nome).

Nella parte inferiore della finestra di dialogo accanto alle scelte rapide da tastiera, fare clic su Personalizza.

Nella casella Categorie, scorrere giù le macro e selezionarle. Poi a destra, sotto le macro, selezionare levelformat (o qualsiasi sia il suo nome). La scelta rapida corrente verrà visualizzata nella casella pertinente. È possibile cancellarla selezionandola e premendo CANC. È possibile poi inserire una nuova scorciatoia da tastiera e assegnarla con il comando Assegna, come fatto in precedenza. Chiudere/confermare le finestre di dialogo.

È possibile utilizzare una procedura simile per creare un pulsante per la macro:

Ancora una volta, fare clic su pulsante "Office" principale, poi opzioni di Word.

Fare clic su Personalizza > Scegli comandi. Scegliere Macro dall'elenco a discesa. Selezionare la macro.

Fare clic su Aggiungi. Si dovrebbe vedere il comando macro apparire nella colonna di destra. Fare clic su Modifica.

Scegliere un simbolo, quindi OK > OK. Il simbolo per la macro dovrebbe apparire nella barra degli strumenti.

Questa macro è utile per la formattazione di un paragrafo intero che non contiene alcuna formattazione visibile di livellamento. Laddove un paragrafo contiene la formattazione desiderata, è necessario ripristinare la formattazione eliminata dopo il paragrafo di livellamento. Nei paragrafi che contengono molta formattazione, il ripristino della formattazione eliminata può richiedere molto lavoro. Per tali paragrafi, considerare le seguenti alternative:

Copyright Marc Prior 2009-2011