Un’interfaccia vocale basata su dati reali
Un gruppo finanziato dall’UE ha contribuito al potenziamento delle tecniche di riconoscimento del linguaggio umano da parte delle macchine, attraverso l’inserimento di enormi quantità di materiali di partenza in un formato prestrutturato unitamente a nuovi algoritmi per la strutturazione automatica delle informazioni.
Ciononostante, i computer continuano a presentare grossi limiti per quel
che concerne l’interpretazione della comunicazione umana naturale. Uno
dei motivi alla base di questa condizione consiste nel fatto che il
metodo solitamente utilizzato per impartire istruzioni alle macchine,
che prende il nome di “annotazione esperta”, rappresenta di per sé un
sistema lento, costoso e poco flessibile.
Il progetto HELENLP (Heterogeneous learning for natural language processing), finanziato dall’UE, è stato concepito allo scopo di sviluppare sistemi in grado di interagire in modo più efficace con gli esseri umani, attraverso un potenziamento delle prestazioni reso possibile grazie all’aggiunta di un’ampia gamma di nuove fonti digitali e di vari livelli di annotazione. Gli algoritmi previsti consentono ai computer di interpretare automaticamente le fonti disponibili attraverso un sistema di interrogazione applicato a un annotatore. Il gruppo di lavoro si è prefissato l’obiettivo di sviluppare algoritmi di annotazione aggiuntivi nel tentativo di migliorare la comprensione del linguaggio naturale e dei testi da parte delle macchine.
I lavori sono stati incentrati su nuovi metodi computazionali e statistici in grado di garantire l’integrazione e l’analisi delle fonti digitali. I ricercatori hanno quindi sviluppato metodi passivi di annotazione di dati parzialmente annotati senza il ricorso ad alcun annotatore, unitamente a metodi attivi basati sull’utilizzo di questa tecnologia. Grazie alla combinazione di varie fonti di dati annotati, i nuovi algoritmi hanno anche consentito ai ricercatori di gestire il fenomeno dell’apprendimento simultaneo, attraverso metodi di categorizzazione dei testi, nonché di segmentazione e di riconoscimento dei fonemi.
I lavori hanno condotto alla reintegrazione di un solido gruppo di ricerca, nonché alla disponibilità di nuovi finanziamenti e di pubblicazioni specializzate.
I nuovi algoritmi sviluppati nell’ambito dell’iniziativa HELENLP contribuiranno al potenziamento delle tecniche di elaborazione computerizzata della comunicazione umana naturale.
pubblicato: 2016-03-15