Per affrontare la questione, il progetto
HYGHTRA
(A hybrid high quality translation system) ha proposto un’architettura
ibrida, in cui vengono combinati i punti di forza di entrambi gli
approcci e si riducono al minimo le debolezze, per giungere a una MT di
alta qualità. Il lavoro ha assunto la forma di progetto in
collaborazione tra un centro di studi di traduzione universitario e una
società di ingegneria linguistica, entrambi tedeschi.
I componenti del progetto hanno inventato una metodologia e predisposto una serie di strumenti e risorse computazionali che integrano rapidamente nuove lingue e istruzioni di traduzione in un sistema MT basato su regole che utilizza tecniche della TM statistica.
Il lavoro ha anche portato a un’infrastruttura di sviluppo modulare. In tal modo si è dischiusa la possibilità di una nuova gamma di prodotti e servizi, che da allora i partner industriali hanno proposto a nuovi mercati diversi dai consueti utilizzatori di MT. Vi rientrano moduli per una ricca analisi e generazione linguistica, l’estrazione di terminologia e il supporto del processo di traduzione in collaborazione.
Il team ha anche esplorato nuovi impieghi della tecnologia MT in campi come l’apprendimento delle lingue e la formazione dei traduttori. Ha proposto un metodo fondato su basi pedagogiche e scenari per l’uso della MT nel caso di studenti avanzati di lingue, per contribuire al processo.
Le nuove metodologie sono rilevanti per indurre dizionari e grammatiche abbondantemente annotati, tratti da ampie raccolte di testi; l’estrazione di database di equivalenti di traduzioni; dizionari e grammatiche elettronici di bootstrapping per lingue nuove strettamente correlate; la disambiguazione statistica di applicazioni concorrenti di regole di analisi sintattica. Scenari fondati su motivazioni pedagogiche, per l’impiego di MT al fine di generare prove linguistiche negative per l’apprendimento avanzato delle lingue e la formazione di traduttori, sono stati testati nell’insegnamento di un modulo “Inglese per traduttori” di livello universitario.
Altre attività del progetto hanno riguardato una serie di laboratori di studio, tenuti in occasione di conferenze internazionali sulla linguistica computazionale. Vi è confluita una comunità composta di ricercatori nel campo della MT e sviluppatori di MT a livello industriale, interessati agli approcci ibridi alla MT.
Il più importante contributo scientifico di HYGHTRA consiste nello sviluppo di un nuovo modo di costruire sistemi MT ibridi, aggiungendo tecniche statistiche a un RBMT esistente ad ampia copertura. L’architettura del sistema di fondo resta basata su regole, ma i metodi statistici sostengono il rapido sviluppo di grammatiche e dizionari per nuove indicazioni di traduzione. Tale risultato contribuisce a conservare la precisione dell’analisi linguistica, con una minore impronta computazionale.