octombrie 6, 2024

Obiectiv Jurnalul de Tulcea – Citeste ce vrei sa afli

Informații despre România. Selectați subiectele despre care doriți să aflați mai multe

România lansează primul său model open source LLM

România lansează primul său model open source LLM

În scurt

  • Cu sprijinul BRD Groupe Société Générale, primul LLM din România condus de Universitatea din București și Institutul de Logică și Știința Datelor, Politenica București a fost lansat astăzi.
  • Modelul este open source și poate fi folosit pentru dezvoltarea de instrumente și platforme AI.
  • Împreună cu LLM, a fost lansată și comunitatea OpenLLM-Ro cu scopul de a promova implementarea AI în România.

Obțineți detalii

Din a doua jumătate a anului 2023, o echipă de cercetători de la Politeneca București, Universitatea din București și Institutul de Logică și Știința Datelor a lucrat la dezvoltarea și formarea LLM românească. Potrivit Startup.ro, cercetătorii care au contribuit au implementat un proiect pro-bono. De asemenea, Politehnica București a oferit puterea de calcul necesară antrenării modelului.

BRD Groupe Société Générale, care susține inovația și tehnologiile viitoare în România, este principalul partener al proiectului.

Eforturile de dezvoltare a unui model bazat pe limbă sunt adesea inițiate de comunitățile academice. În luna martie a acestui an, Institutul Bulgar pentru Știința Calculatoarelor, Inteligență Artificială și Tehnologie (INSAIT) a lansat primul LLM deschis, pregătit gratuit în Bulgaria, BgGPT. Mai târziu în aceeași lună, Grecia și-a introdus propriul LLM, Meltemi. În toată Europa, există și alte exemple, cum ar fi germanul LeoLM și spaniolul Aguila.

Obiectivul principal al dezvoltării LLM-ului românesc este de a aborda limitările LLM-urilor deschise actuale, care sunt instruite în principal pe seturi de date monolingve în limba engleză. Noul model a fost expus la câteva milioane de documente în limba română, au spus cercetătorii.

În propriile lor cuvinte

„Credem că lansarea acestui model este începutul unui efort pe termen lung care va avea ca rezultat mai bune LLM-uri pentru limba română. Am găsit deja o metodă pe care dorim să o folosim pentru alte modele lansate recent (Lama-3 și Mistral), care sunt în general mai bune decât cele cu care am început (Lama-2), au explicat Polydenica București și conf. univ. Traian Repetia, unul dintre coordonatorii tehnici ai inițiativei OpenLLM-Ro, cercetătorul principal NVIDIA.

READ  Costurile de participare la Eurovision 2022 publicate de TVR - escYOUnited

„Sperăm ca organizațiile private și publice să înțeleagă importanța dezvoltării de modele lingvistice și multimodale (text-imagine) la scară largă pentru limba română. Salutăm tuturor să ni se alăture inițiativei OpenLLM-Ro și proiectelor de cercetare care o susțin, ” el a spus.

„Prin angajarea într-un peisaj inovator, cele mai noi tehnologii pot contribui la un impact pozitiv asupra societății românești, în același ritm cu care a progresat la nivel internațional”, a declarat Horia Velicu, șeful Laboratorului de inovare al BRD Groupe Société. General.