Corola link direct Institutul de Cercetări pentru Inteligența Artificială (ICIA) și Institutul de Informatică Teoretică – Iași (IIT) (ambele din subordinea Academiei Române) au în derulare, ca temă de plan în cadrul programelor de cercetare prioritară ale Academiei Române, realizarea unui corpus computațional de referință pentru limba română contemporană: o colecție de texte (scrise și orale) de dimensiuni foarte mari (sute de milioane de cuvinte), adnotate cu metainformații (dată, autor etc.) și cu date lingvistice (părți de vorbire, categorii gramaticale, dependențe sintactice etc.). Prin naturaleţea textelor și prin adnotările pe care le va conţine, corpusul va fi util lingviștilor (pentru descrierea diverselor aspecte ale limbii), lexicografilor (pentru crearea dicţionarelor generale sau speciale de limbă), dezvoltatorilor de aplicaţii pe baza limbii naturale (corpusurile oferă material de antrenare, de învăţare, de testare), celor care învață limba română ca limbă străină (un corpus oferă exemple concrete de contexte posibile pentru cuvinte, de relaţii pe care acestea le stabilesc cu alte cuvinte etc.), profesorilor care predau limba română în şcoala românească (un corpus poate fi un instrument util de predare şi evaluare a elevilor).

Parteneri

rador Editura Economica sigla-am-web
DC NEWS Muzica Polirom
humanitas romlit  

Colaboratori

ASLS