octombrie 7, 2024

Obiectiv Jurnalul de Tulcea – Citeste ce vrei sa afli

Informații despre România. Selectați subiectele despre care doriți să aflați mai multe

Ce este în noul model ChatGPT AI generativ și cum funcționează?

OpenAI a crescut antetul în lumea extrem de competitivă a AI generativă prin introducerea unui nou model care speră că va atrage mai mulți utilizatori către platforma sa și va respinge toți concurenții.

GPT-4o este o versiune actualizată a tehnologiei care stau la baza modelului de limbă mare care alimentează ChatGPT. S-a zvonit săptămâna trecută că va fi lansat ca motor de căutare pentru a provoca Google, dar Reuters a raportat că OpenAI l-a amânat.

Sam Altman, CEO al OpenAI, a negat orice lansare – doar pentru a posta pe X că compania „lucrează din greu la niște lucruri noi care credem că le vor plăcea oamenilor”.

„O” din nume înseamnă „omni”, iar compania din California promovează GPT-4o ca fiind ceva pentru toată lumea, ceea ce are sens pentru că „omni” înseamnă „totul” sau „totul” – dorește OpenAI să fie în Peste tot în viața noastră?

Ce este GPT-4o?

Răspunsul scurt: GPT-4o, conform OpenAI, este „noua paradigmă majoră care poate raționa prin sunet, viziune și text în timp real”.

Răspuns scurt: este cel mai rapid model AI din OpenAI.

Numele „omni” se referă la „un pas către o interacțiune mai naturală om-calculator”, a spus OpenAI într-o postare pe blog luni.

De asemenea, este multimodal nativ, ceea ce înseamnă că poate accepta orice combinație de text, audio și imagine ca intrare, precum și poate genera orice combinație de text, audio și imagine.

Cât de rapid este GPT-4o?

OpenAI susține că GPT-4o poate răspunde la intrarea vocală în doar 232 de milisecunde, cu o medie de 320 de milisecunde, ceea ce este similar cu timpul de răspuns uman în conversație, potrivit mai multor studii.

Astfel, GPT-4o necesită utilizarea a mai puține jetoane de limbă, care este unitatea de bază a AI care calculează lungimea textului și poate include semne de punctuație și spații. Numărul de jetoane variază de la o limbă la alta.

Printre limbile evidențiate de OpenAI care folosesc mai puține jetoane cu GPT-4o sunt arabă (53 până la 26), gujarati (145 până la 33), hindi (90 până la 31), coreeană (45 până la 27) și chineza (34 până la 31). 24). .

Pentru perspectivă, putem face câteva comparații cu un studiu din 1968 al lui Robert Miller – Timp de răspuns în tranzacțiile de conversație om-calculator – Care detaliază cele trei măsuri ale răspunsului mainframe-ului.

READ  Kingdom Hearts IV a fost anunțat

Cercetarea a arătat că un timp de răspuns de 100 de milisecunde este perceput ca fiind instantaneu, în timp ce o secundă sau mai puțin este considerată suficient de rapidă pentru ca utilizatorii să simtă că interacționează liber cu informațiile. Un timp de răspuns mai mare de 10 secunde va face utilizatorul să piardă complet atenția.

Cum funcționează GPT-4o?

Cel mai simplu răspuns este că OpenAI a simplificat procesul de conversie a intrărilor în ieșiri.

În modelele anterioare OpenAI AI, modul voce a fost folosit pentru a vorbi cu ChatGPT cu o latență de 2,8 secunde (GPT-3,5) și 5,4 secunde (GPT-4) în medie. Modul Voce folosește trei modele separate: un model simplu convertește sunetul în text, GPT-3.5 sau GPT-4 primește textul și îl emite, iar o a treia versiune simplă convertește textul înapoi în audio.

„Acest proces înseamnă că principala sursă de inteligență, GPT-4, pierde o mulțime de informații – nu poate observa direct tonul, mai multe difuzoare sau zgomotul de fundal și nu poate scoate râsete, cântări sau exprimarea emoțiilor”, a spus OpenAI. .

Dar cu GPT-4o, OpenAI a reușit să consolideze toate aceste funcționalități într-un singur model, cu capabilități cuprinzătoare pentru text, viziune și voce, reducând dramatic timpul petrecut cu procesarea informațiilor.

„Toate intrările și ieșirile sunt procesate de aceeași rețea neuronală”, a spus OpenAI. O rețea neuronală este o tehnologie de inteligență artificială care învață computerele cum să proceseze date în mod similar cu creierul uman.

Cu toate acestea, OpenAI a spus că „încă zgârie suprafața” capabilităților și limitărilor GPT-4o, deoarece este primul său model care integrează toate aceste metode.

Ce poate GPT-4o Nu Do?

Vorbind despre limitări, OpenAI a recunoscut că au fost „multe” dintre ele în modelul GPT-4o, inclusiv inconsecvențe în răspunsurile care au apărut în bara de erori. A arătat chiar cât de inteligent poate fi GPT-4o la batjocură.

În plus, OpenAI a spus că continuă să îmbunătățească comportamentul modelului prin post-training – care este esențial în abordarea problemelor de siguranță, un punct major de blocare în IA modernă.

READ  Bungie a câștigat un proces împotriva producătorului de trișoare Aimjunkies

Compania a spus că a creat noi sisteme de securitate pentru a acționa ca bariere în calea ieșirii audio, precum și a testat modelul cu peste 70 de experți în domeniile psihologiei sociale, părtinire, corectitudine și dezinformare pentru a identifica orice riscuri care ar putea trece.

„Vom continua să atenuăm noile riscuri pe măsură ce acestea sunt descoperite. Recunoaștem că metodele acustice ale lui GPT-4o prezintă o varietate de noi riscuri”, a spus OpenAI.

Cât costă GPT-4o?

Vești bune – este gratuit pentru toți utilizatorii, utilizatorii plătiți beneficiind de limitele de capacitate de până la cinci ori mai mari decât colegii lor gratuiti, a declarat Mira Moratti, director de tehnologie la OpenAI, în prezentarea de dezvăluire.

Cu toate acestea, dacă nu sunteți un utilizator OpenAI plătitor, vă va costa 5 USD și, respectiv, 15 USD pentru 1 milion de jetoane de intrare și, respectiv, de ieșire.

Permiterea utilizării gratuite a GPT-4o ar trebui să servească bine OpenAI, care ar completa și celelalte oferte plătite ale companiei.

În august, OpenAI a lansat planul său lunar ChatGPT Enterprise, al cărui preț variază în funcție de cerințele utilizatorului. Este al treilea nivel după serviciul gratuit de bază și planul Plus de 20 USD pe lună.

În ianuarie, compania a lansat magazinul online ChatGPT, care oferă utilizatorilor acces la peste trei milioane de versiuni personalizate de GPT, dezvoltate de partenerii OpenAI și comunitatea sa.

OpenAI speră să atragă mai mulți utilizatori pe măsură ce concurența se încinge în lumea AI generativă – și îi așteaptă multe.

Cum concurează OpenAI cu cei mai mari concurenți ai săi în acest moment?

Mișcarea OpenAI de a oferi un model de limbă mare nou, gratuit și rapid este o indicație a cât de ocupat este cu concurența sa în IA generativă.

Google, probabil cel mai mare competitor al său în acest domeniu, are Gemini, care a fost primul model AI care a depășit experții umani în înțelegerea limbajului multitasking, una dintre metodele utilizate pe scară largă pentru a testa cunoștințele și abilitățile de rezolvare a problemelor AI.

Gemini poate fi accesat cu planul Google One AI Premium pentru 19,99 USD pe lună, care include 2 TB de spațiu de stocare, 10% cashback la achizițiile efectuate pe Google Store și mai multe funcții în Gmail, Google Docs, Google Slides și Google Meet.

READ  Bill Hader nu este tipicul tău magnat tehnologic în The Adams Family 2

În februarie, a lansat Gemma, care își propune să ajute dezvoltatorii și cercetătorii „să construiască AI în mod responsabil” și este destinată mai mult sarcinilor modeste, cum ar fi chatbot-uri de bază sau funcții de rezumat.

Între timp, Anthropic a lansat în martie Cloud 3, o provocare directă pentru pionierul AI OpenAI.

Compania, susținută de Google și Amazon, are trei niveluri – Haiku, Sonnet și Opus – fiecare oferind capabilități crescânde pentru a se potrivi nevoilor utilizatorilor.

Haiku costă 0,25 USD per milion de jetoane (MTok) pentru intrare și 1,25 USD pentru ieșire, în timp ce Sonnet costă 3 USD și 15 USD. Opusul este cel mai scump la 15 USD și 75 USD.

Pentru comparație, GPT-4 Turbo de la OpenAI vine la 10 USD pentru intrare și 30 USD pentru ieșire, de asemenea, cu o fereastră de context mai mică de 128.000 MTok.

Microsoft, cel mai mare susținător al OpenAI, percepe 20 de dolari pe lună pentru serviciul Copilot pro, care garantează o performanță mai rapidă și „tot ce” oferă serviciul. Dacă nu sunteți dispus să plătiți, există un nivel Copilot gratuit, care, evident, are o funcționalitate limitată.

Și apoi este Grok de la xAI, de la prietenul OpenAI devenit inamic, Elon Musk.

Versiunea actuală de Grok, Grok-1.5, este disponibilă numai pentru abonații la nivelul Premium+ al lui X, care începe de la 16 USD pe lună sau 168 USD pe an.

Entitățile regionale vizează și lideri: Luni, Institutul de Inovare Tehnologică din Abu Dhabi a prezentat cea de-a doua versiune a modelului său lingvistic mare, Falcon 2, pentru a concura cu modelele dezvoltate de Meta, Google și OpenAI.

Tot luni, Core42, o unitate a companiei de IA și cloud G42 din Abu Dhabi, a lansat un chatbot bilingv arabă-engleză dezvoltat în Emiratele Arabe Unite, Jais Chat. Poate fi descărcat și folosit gratuit pe iPhone-urile Apple.

Actualizat: 15 mai 2024 la 10:34