ianuarie 10, 2025

Obiectiv Jurnalul de Tulcea – Citeste ce vrei sa afli

Informații despre România. Selectați subiectele despre care doriți să aflați mai multe

Se pare că OpenAI și Google au folosit copii ale videoclipurilor YouTube pentru a-și antrena modelele AI

Se pare că OpenAI și Google au folosit copii ale videoclipurilor YouTube pentru a-și antrena modelele AI

OpenAI și Google și-au instruit modelele AI cu privire la textul transcris din videoclipurile YouTube, încălcând potențial drepturile de autor ale creatorilor de conținut, potrivit New York times. Raportul, care descrie eforturile companiilor OpenAI, Google și Meta de a maximiza cantitatea de date pe care o pot furniza sistemelor lor AI, citează mai multe persoane care cunosc practicile companiilor. Acest lucru vine la doar câteva zile după ce CEO-ul YouTube, Neil Mohan, a spus într-un interviu cu… Originile Bloomberg presupusa utilizare de către OpenAI a videoclipurilor YouTube pentru a antrena noul său generator de text în video, Sora, Va fi împotriva politicilor platformei.

In conformitate cu The New York TimesOpenAI a folosit instrumentul de recunoaștere a vorbirii Whisper pentru a transcrie mai mult de un milion de ore de videoclipuri YouTube, care a fost apoi folosit pentru a antrena GPT-4. informatia Am raportat anterior că OpenAI a folosit videoclipuri și podcasturi YouTube pentru a-și antrena sistemele AI. Se pare că șeful OpenAI, Greg Brockman, a fost printre oamenii din acea echipă. Matt Bryant, un purtător de cuvânt al Google, a declarat că, conform regulilor Google, „decuparea sau descărcarea neautorizată a conținutului YouTube” nu este permisă. The New York TimesSpunând, de asemenea, că compania nu cunoștea o astfel de utilizare de către OpenAI.

Cu toate acestea, raportul susține că au existat oameni la Google care știau, dar nu au luat nicio măsură împotriva OpenAI, deoarece Google folosea videoclipuri YouTube pentru a-și antrena modelele AI. a spus Google The New York Times Face acest lucru doar cu videoclipurile de la creatori de conținut care au fost de acord cu aceasta. Engadget a contactat Google și OpenAI pentru comentarii.

READ  Video: Analiza tehnică a limitelor acustice de turnătorie digitală pe transformator

cel The New York Times Raportul mai susține că Google a cerut unei echipe să își modifice politica de confidențialitate în iunie 2023 pentru a acoperi utilizarea conținutului mai larg disponibil public, inclusiv Google Docs și Google Sheets, pentru a-și instrui modelele și produsele AI. Modificările, despre care Google spune că au fost făcute pentru claritate, au fost publicate în iulie. spuse Bryant The New York Times Acest tip de date este folosit doar cu permisiunea utilizatorilor care s-au înscris pentru testele de caracteristici beta ale Google, iar compania „nu a început instruirea cu privire la tipuri suplimentare de date pe baza acestei schimbări de limbă”. Modificarea a adăugat Bard ca exemplu pentru ce pot fi folosite aceste date.

Corecție, 6 aprilie 2024, 15:45 ET: Această poveste a raportat inițial că Google și-a actualizat politica de confidențialitate în iunie 2022. Actualizarea politicii a fost de fapt făcută în 2023. Ne cerem scuze pentru eroare.