La ricerca europea ha promosso lo studio della traduzione automatica (machine translation - MT), promettendo un forte impatto sociale e industriale. Il progetto ha prodotto un sistema con un'architettura MT rafforzata, fornendo uno strumento potente per i ricercatori, i relatori e gli studenti di elaborazione del linguaggio naturale.
Il progetto ENEUS (“Testing the portability of techniques to handle
dissimilar source and target languages in MT”) ha combinato l'esperienza
dei campi della linguistica, l'informatica e la traduzione. Il lavoro è
importante per gli utilizzatori MT nonché per lo studio delle
interazioni tra computer e linguaggio umano.
ENEUS ha misurato la capacità dell'architettura di traduzione
automatica Matxin da impiegare per diverse combinazioni linguistiche. Ha
anche verificato il sistema in termini di avere una lingua analitica
(ad es. inglese) dalla quale partire, per arrivare a una lingua
agglutinante (ad es. basco). Matxin si è dimostrata adatta per la
traduzione tra lingue dissimili in quanto capace di gestire l'analisi
profonda, con particolare attenzione alla morfosintassi.
È stato costruito un prototipo di traduzione automatica basata su
regole (rule-based machine translation - RBMT) sulla base del lavoro di
trasferimento del sistema esistente spagnolo-basco nella direzione
inglese-basco. Il prototipo copre 35 000 voci. Può gestire semplici
frasi affermative, negative e interrogative all'indicativo per tutti i
paradigmi oggetto-soggetto, nonché per la voce attiva e passiva e
l'imperativo.
ENEUS ha studiato le caratteristiche agglutinative e i profili
dell'ordine delle parole nell'inglese, basco, finlandese e ungherese. Le
ultime tre sono lingue agglutinative
Il lavoro del progetto ha dimostrato chiaramente che i sistemi SMT
non sono in grado di trattare allo stesso modo tutte le lingue
agglutinative e che un approccio più orientato alla lingua potrebbe
risultare più efficace. La ricerca sull'allineamento delle combinazioni
inglese-finlandese, inglese-ungherese e inglese-basco hanno permesso di
creare sistemi SMT ENEUS per tutte le combinazioni.
Oltre 500 utilizzatori hanno contribuito a una campagna di
valutazione umana come parte del programma i sensibilizzazione ENEUS.
Essi hanno confrontato il sistema MT inglese-basco sviluppato dal
progetto nonché il traduttore d'avanguardia Google. I risultati hanno
dimostrato che il sistema SMT morfologicamente sensibile era alla pari
del traduttore Google. I due sistemi hanno mostrato prestazioni migliori
rispetto a tutti gli altri.
Il sistema migliore di ENEUS è stato integrato nel Bologna
Translation Service, presso Elhuyar, e gli utilizzatori potranno
accedere ai prototipi ENEUS attraverso il sito web Matxin (gestito da
Elhuyar). Il sistema RBMT è il primo sistema MT open source inglese-basco. È disponibile per gli sviluppatori tramite
sourceforge
e offre la possibilità di creare e cercare usando l'inglese e lo
spagnolo come lingue di partenza da tradurre in qualsiasi altra lingua.