NYT pritlačili na OpenAI. Firma bude musieť vydať obrovský balík dát, ktorý môže pre ňu znamenať poriadne bolesti hlavy.
NYT pritvrdzuje: Chce kompletné logy z tréningu a používania ChatGPT
Spor medzi New York Times a OpenAI naberá nové obrátky. Americký sudca nariadil OpenAI, aby odovzdala viac než 20 miliónov logov, ktoré ukážu, ako bol model ChatGPT trénovaný, ako fungoval pri konkrétnych dotazoch a či v odpovediach neopakoval autorsky chránené texty NYT.
New York Times tvrdí, že ChatGPT „regeneruje celé pasáže“ ich článkov bez povolenia a tým porušuje copyright. OpenAI to popiera, ale súd teraz prikázal, aby firma vydala dáta, ktoré môžu všetko výrazne objasniť – alebo ešte viac skomplikovať.
OpenAI argumentovala, že požiadavka je prehnaná, ale sudca to videl inak. Logy vraj môžu byť kľúčové k tomu, aby sa zistilo, čo vlastne model obsahuje a odkiaľ to má.
OpenAI sa bráni: „Chcú od nás nemožné“
Firma tvrdí, že požiadavka NYT je technicky extrémne náročná, lebo logy sú roztrúsené v rôznych systémoch a nemuseli sa vôbec archivovať v podobe, v akej ich chce súd.
Ďalším problémom je bezpečnosť:
- – logy môžu obsahovať citlivé údaje používateľov,
- – môžu odhaliť interné fungovanie modelov,
- – a mohli by byť zneužité konkurenciou.
Napriek tomu sudca argumentuje, že ide o „primeranú“ požiadavku vzhľadom na závažnosť obvinení.
Precedens, ktorý zmení AI biznis?
Toto rozhodnutie môže ovplyvniť celý AI priemysel. Ak budú musieť firmy poskytovať detailné logy o tréningu či výstupoch modelov, môže to otvoriť dvere ďalším žalobám a sprísniť pravidlá pri práci s obsahom médií.
Zároveň to ukazuje, že veľké vydavateľstvá sa už nechystajú trpieť v tichosti – AI platformy budú musieť viac dokazovať, čo presne robia s cudzím obsahom.
Čo bude ďalej?
OpenAI musí logy poskytnúť, NYT z nich vytiahne, čo potrebuje, a spor bude pokračovať. Či to skončí veľkou pokutou, dohodou alebo prelomovým rozsudkom, sa ešte uvidí. Isté však je, že ide o jeden z najdôležitejších AI súdnych sporov súčasnosti.




















