NYT pritlačili na OpenAI. Firma bude musieť vydať obrovský balík dát, ktorý môže pre ňu znamenať poriadne bolesti hlavy.

NYT pritvrdzuje: Chce kompletné logy z tréningu a používania ChatGPT

Spor medzi New York Times a OpenAI naberá nové obrátky. Americký sudca nariadil OpenAI, aby odovzdala viac než 20 miliónov logov, ktoré ukážu, ako bol model ChatGPT trénovaný, ako fungoval pri konkrétnych dotazoch a či v odpovediach neopakoval autorsky chránené texty NYT.

New York Times tvrdí, že ChatGPT „regeneruje celé pasáže“ ich článkov bez povolenia a tým porušuje copyright. OpenAI to popiera, ale súd teraz prikázal, aby firma vydala dáta, ktoré môžu všetko výrazne objasniť – alebo ešte viac skomplikovať.

OpenAI argumentovala, že požiadavka je prehnaná, ale sudca to videl inak. Logy vraj môžu byť kľúčové k tomu, aby sa zistilo, čo vlastne model obsahuje a odkiaľ to má.

OpenAI sa bráni: „Chcú od nás nemožné“

Firma tvrdí, že požiadavka NYT je technicky extrémne náročná, lebo logy sú roztrúsené v rôznych systémoch a nemuseli sa vôbec archivovať v podobe, v akej ich chce súd.

Ďalším problémom je bezpečnosť:

  • – logy môžu obsahovať citlivé údaje používateľov,
  • – môžu odhaliť interné fungovanie modelov,
  • – a mohli by byť zneužité konkurenciou.

Napriek tomu sudca argumentuje, že ide o „primeranú“ požiadavku vzhľadom na závažnosť obvinení.

Precedens, ktorý zmení AI biznis?

Toto rozhodnutie môže ovplyvniť celý AI priemysel. Ak budú musieť firmy poskytovať detailné logy o tréningu či výstupoch modelov, môže to otvoriť dvere ďalším žalobám a sprísniť pravidlá pri práci s obsahom médií.

Zároveň to ukazuje, že veľké vydavateľstvá sa už nechystajú trpieť v tichosti – AI platformy budú musieť viac dokazovať, čo presne robia s cudzím obsahom.

Čo bude ďalej?

OpenAI musí logy poskytnúť, NYT z nich vytiahne, čo potrebuje, a spor bude pokračovať. Či to skončí veľkou pokutou, dohodou alebo prelomovým rozsudkom, sa ešte uvidí. Isté však je, že ide o jeden z najdôležitejších AI súdnych sporov súčasnosti.