Un approccio ibrido alla traduzione automatica

La ricerca accademica ha prestato una notevole attenzione alla traduzione automatica (MT) basata su statistica, ma nella pratica continuano a dominare le architetture di traduzione automatica basata su regole (RBMT). Tale situazione è dovuta a una serie di motivi e limiti che caratterizzano i due sistemi.

Per affrontare la questione, il progetto HYGHTRA (A hybrid high quality translation system) ha proposto un’architettura ibrida, in cui vengono combinati i punti di forza di entrambi gli approcci e si riducono al minimo le debolezze, per giungere a una MT di alta qualità. Il lavoro ha assunto la forma di progetto in collaborazione tra un centro di studi di traduzione universitario e una società di ingegneria linguistica, entrambi tedeschi.

I componenti del progetto hanno inventato una metodologia e predisposto una serie di strumenti e risorse computazionali che integrano rapidamente nuove lingue e istruzioni di traduzione in un sistema MT basato su regole che utilizza tecniche della TM statistica.

Il lavoro ha anche portato a un’infrastruttura di sviluppo modulare. In tal modo si è dischiusa la possibilità di una nuova gamma di prodotti e servizi, che da allora i partner industriali hanno proposto a nuovi mercati diversi dai consueti utilizzatori di MT. Vi rientrano moduli per una ricca analisi e generazione linguistica, l’estrazione di terminologia e il supporto del processo di traduzione in collaborazione.

Il team ha anche esplorato nuovi impieghi della tecnologia MT in campi come l’apprendimento delle lingue e la formazione dei traduttori. Ha proposto un metodo fondato su basi pedagogiche e scenari per l’uso della MT nel caso di studenti avanzati di lingue, per contribuire al processo.

Le nuove metodologie sono rilevanti per indurre dizionari e grammatiche abbondantemente annotati, tratti da ampie raccolte di testi; l’estrazione di database di equivalenti di traduzioni; dizionari e grammatiche elettronici di bootstrapping per lingue nuove strettamente correlate; la disambiguazione statistica di applicazioni concorrenti di regole di analisi sintattica. Scenari fondati su motivazioni pedagogiche, per l’impiego di MT al fine di generare prove linguistiche negative per l’apprendimento avanzato delle lingue e la formazione di traduttori, sono stati testati nell’insegnamento di un modulo “Inglese per traduttori” di livello universitario.

Altre attività del progetto hanno riguardato una serie di laboratori di studio, tenuti in occasione di conferenze internazionali sulla linguistica computazionale. Vi è confluita una comunità composta di ricercatori nel campo della MT e sviluppatori di MT a livello industriale, interessati agli approcci ibridi alla MT.

Il più importante contributo scientifico di HYGHTRA consiste nello sviluppo di un nuovo modo di costruire sistemi MT ibridi, aggiungendo tecniche statistiche a un RBMT esistente ad ampia copertura. L’architettura del sistema di fondo resta basata su regole, ma i metodi statistici sostengono il rapido sviluppo di grammatiche e dizionari per nuove indicazioni di traduzione. Tale risultato contribuisce a conservare la precisione dell’analisi linguistica, con una minore impronta computazionale.

pubblicato: 2015-11-13
Commenti


Privacy Policy