Potenziare la traduzione automatica

La ricerca europea ha promosso lo studio della traduzione automatica (machine translation - MT), promettendo un forte impatto sociale e industriale. Il progetto ha prodotto un sistema con un'architettura MT rafforzata, fornendo uno strumento potente per i ricercatori, i relatori e gli studenti di elaborazione del linguaggio naturale.

Il progetto ENEUS (“Testing the portability of techniques to handle dissimilar source and target languages in MT”) ha combinato l'esperienza dei campi della linguistica, l'informatica e la traduzione. Il lavoro è importante per gli utilizzatori MT nonché per lo studio delle interazioni tra computer e linguaggio umano.

ENEUS ha misurato la capacità dell'architettura di traduzione automatica Matxin da impiegare per diverse combinazioni linguistiche. Ha anche verificato il sistema in termini di avere una lingua analitica (ad es. inglese) dalla quale partire, per arrivare a una lingua agglutinante (ad es. basco). Matxin si è dimostrata adatta per la traduzione tra lingue dissimili in quanto capace di gestire l'analisi profonda, con particolare attenzione alla morfosintassi.

È stato costruito un prototipo di traduzione automatica basata su regole (rule-based machine translation - RBMT) sulla base del lavoro di trasferimento del sistema esistente spagnolo-basco nella direzione inglese-basco. Il prototipo copre 35 000 voci. Può gestire semplici frasi affermative, negative e interrogative all'indicativo per tutti i paradigmi oggetto-soggetto, nonché per la voce attiva e passiva e l'imperativo.

ENEUS ha studiato le caratteristiche agglutinative e i profili dell'ordine delle parole nell'inglese, basco, finlandese e ungherese. Le ultime tre sono lingue agglutinative

Il lavoro del progetto ha dimostrato chiaramente che i sistemi SMT non sono in grado di trattare allo stesso modo tutte le lingue agglutinative e che un approccio più orientato alla lingua potrebbe risultare più efficace. La ricerca sull'allineamento delle combinazioni inglese-finlandese, inglese-ungherese e inglese-basco hanno permesso di creare sistemi SMT ENEUS per tutte le combinazioni.

Oltre 500 utilizzatori hanno contribuito a una campagna di valutazione umana come parte del programma i sensibilizzazione ENEUS. Essi hanno confrontato il sistema MT inglese-basco sviluppato dal progetto nonché il traduttore d'avanguardia Google. I risultati hanno dimostrato che il sistema SMT morfologicamente sensibile era alla pari del traduttore Google. I due sistemi hanno mostrato prestazioni migliori rispetto a tutti gli altri.

Il sistema migliore di ENEUS è stato integrato nel Bologna Translation Service, presso Elhuyar, e gli utilizzatori potranno accedere ai prototipi ENEUS attraverso il sito web Matxin (gestito da Elhuyar). Il sistema RBMT è il primo sistema MT open source inglese-basco. È disponibile per gli sviluppatori tramite sourceforge e offre la possibilità di creare e cercare usando l'inglese e lo spagnolo come lingue di partenza da tradurre in qualsiasi altra lingua.

pubblicato: 2015-02-26
Commenti


Privacy Policy