You are here:   Home
Register   |  Login

Pentru limba română, restaurarea automată a diacriticelor este o adevărată provocare, atât datorită frecvenţei lor, cât şi contribuţiei semnificative pe care acestea o au la dezambiguizarea morfo-lexicală şi semantică a cuvintelor. În limba română, cel puţin o treime din cuvinte conţin semne diacritice iar dintre acestea doar o mică parte sunt ne-ambigue (între 12% şi 18%).

Diac+ este un plugin pentru programul Microsoft Word 2007 sau 2010 cu ajutorul căruia pot fi introduse caracterele diacritice într-un text din care acestea lipsesc (total sau parțial). Cele mai utilizate strategii de recuperare a caracterelor diacritice folosesc dicţionare de forme valide de cuvinte ale limbii române. Astfel de strategii nu pot funcţiona atunci când există mai multe forme valide pentru acelaşi cuvânt (de exmplu, "sa" şi "să", "ca" şi "că", "casa" şi "casă" etc.). În plus față de rezolvarea cazurilor triviale cu ajutorul unui dicționar de aproximativ un milion de cuvinte, programul Diac+ poate rezolva și cazurile ambigue în care contextul cuvântului ajută la recuperarea caracterele diacritice.

Programul DIAC+ este disponibil gratuit pentru folosirea în scopuri necomerciale şi pentru uzul academic. Dacă îl folosiţi vă rugăm să citaţi una din lucrările menţionate la secţiunea DOCS.

 

Anunţuri

Aplicaţie independentă pentru introducerea diacriticelor în texte cu grafie cu î din i - 6 octombrie 2010

 Aplicaţia, realizată în urma unui experiment, foloseşte doar un model de limbă pentru înlocuirea caracterelor diacritice. Aplicaţia este independentă (NU este un plug-in pt. MSWord) şi rulează sub Windows. Are însă nevoie de .Net Framework 3.5.

 read more ...
Diac+ disponibil pentru download - 19 octombrie 2009

Prima versiune a programului Diac+ ca plugin pentru Microsoft Word 2007 sau 2010.

 read more ...