Academia lucrează la varianta electronică a Marelui Dicţionar tezaur al Limbii Române

Nu ai găsit subiectul dorit?
Foloseşte căutarea ...

Academia lucrează la varianta electronică a Marelui Dicţionar tezaur al Limbii Române

Cultură 11 Septembrie 2007 / 00:00 816 accesări

Academia Română doreşte ca, pînă la sfîrşitul anului, să finalizeze proiectul Marelui Dicţionar tezaur al Limbii Române, apoi să-l lanseze şi în format digital, astfel încît documentul să poată fi actualizat în funcţie de schimbările limbii. Marele Dicţionar tezaur al Limbii Române este un proiect ce reuneşte Dicţionarul Academiei şi Dicţionarul Limbii Române. Lucrul la proiect a debutat la începutul secolului trecut, iar Academia urmăreşte finalizarea lucrării care cuprinde 33 de volume, peste 15.000 de pagini, aproximativ 175.000 de cuvinte şi mai mult de trei milioane de exemple, pînă la sfîrşitul anului.

Potrivit Academiei Române, varianta electronică a acestui proiect, ce va purta numele de Dicţionar Tezaur al Limbii Române (eDTLR), va deveni unul dintre principalele instrumente în cercetarea lingvistică şi va fi unul dintre cele mai mari dicţionare în format digital din lume. La proiectul eDTLR colaborează Institutul de Informatică Teoretică al Academiei Române, Facultatea de Informatică a Universităţii „A.I. Cuza” din Iaşi şi Institutul de Cercetări pentru Inteligenţă Artificială din cadrul Academiei. Pentru realizarea dicţionarului în format electronic, informaticienii trebuie să scaneze şi să digitalizeze documentele fizice, să le indexeze şi să realizeze o interfaţă web cu ajutorul căreia să corecteze cuvintele indexate.

Un alt proiect susţinut de Academia Română este RoWordNet, o bază de date lexicale, realizată de Institutul de Cercetări pentru Inteligenţă Artificială al Academiei Române. Directorul Institutului de Cercetări pentru Inteligenţă Artificială, Dan Tufiş, a spus că proiectul a beneficiat de fonduri în valoare de 300.000 de euro în cadrul proiectului european BalkaNet între 2001 şi 2004. După încheierea proiectului, RoWordNet avea 16.000 de unităţi lingvistice în baza de date, iar acum, după ce a fost susţinut de Academia Română între 2004 şi 2007, are 44.000 de unităţi lingvistice. Tufiş a spus că proiectul este, însă, în dezvoltare, dar că o parte din serviciile RoWordNet sînt accesibile pe internet, gratuit, iar programul poate fi achiziţionat, la cerere, în stadiul în care se află în acest moment. De asemenea, Institutul de Cercetări pentru Inteligenţă Artificială are în proiect şi un program care inserează diacriticele în texte în limba română. Programul numit Diac este valabil în două forme: utilizatorul îşi poate edita textul pe internet cu DIAC, în baza unui username şi a unei parole sau îşi poate instala aplicaţia în cadrul pachetului Microsoft Office.

Taguri articol


12