OpenAIho změna postoje: Neprobíhá trénink GPT-4 na základě dat z API zákazníků

openai-privacy-changes-6457d3fd3d25f-sej-760x400.png

Významně se odchylujíc od svých dosavadních postupů oznámilo OpenAI, že již nebude využívat data zákazníků, která jsou zasílána prostřednictvím jejich API, pro trénování svých rozsáhlých jazykových modelů, jako je GPT-4.

Změnu potvrdil Sam Altman, výkonný ředitel společnosti OpenAI, v nedávném rozhovoru s CNBC.

OpenAI’s nový přístup k uživatelským datům

OpenAI změnila svou politiku dne 1. března 2023, kdy společnost tiše aktualizovala své služební podmínky, aby odrážela tento nový závazek k ochraně soukromí uživatelů.

Altman objasnil, "Zákazníci jasně chtějí, abychom je neošetřovali jejich daty, takže jsme změnili naše plány: To nebudeme dělat."

API, neboli rozhraní pro programování aplikací, jsou technologické rámce, které umožňují zákazníkům připojit se přímo k softwaru společnosti OpenAI.

Altman uvedl, že OpenAI nepoužívá data API pro trénování modelu "už nějakou dobu", což naznačuje, že tato oficiální oznámení formalizuje existující postup.

Důsledky pro obchodní zákazníky

Posun OpenAI má dalekosáhlé dopady, zejména pro své obchodní zákazníky, kteří zahrnují giganty jako Microsoft, Salesforce a Snapchat.

Tyto společnosti mají větší pravděpodobnost využívání možností OpenAI API pro své operace, takže přechod na ochranu soukromí a ochranu dat je pro ně zvláště relevantní.

Nová opatření pro ochranu osobních údajů se však vztahují pouze na zákazníky využívající služby API společnosti. Aktualizované podmínky služby společnosti OpenAI upozorňují: „Můžeme používat obsah z jiných služeb než je naše API.“

Jako takové mohou být i jiné formy vstupních dat, například text zadaný do populárního chatbota ChatGPT, stále využívány společností OpenAI, pokud je data nejsou sdílena prostřednictvím API.

Širší dopad na průmysl

OpenAIho změna politiky přichází v době, kdy se odvětví vypořádávají s potenciálními dopady velkých jazykových modelů, jako je OpenAIho ChatGPT, které nahrazují materiál, který tradičně tvořili lidé.

Například Writers Guild of America nedávno začalo stávku poté, co došlo k selhání vyjednávání mezi Guildou a filmovými studii. Guilda hájila omezení používání OpenAI ChatGPT pro generování nebo přepisování scénářů.

Rozhodnutí OpenAI nepoužívat data zákazníků pro trénink představuje zlomový okamžik v probíhající diskusi o ochraně dat a umělé inteligenci. Jak společnosti nadále zkoumají a posouvají hranice technologie AI, zajištění soukromí uživatele a udržení důvěry pravděpodobně zůstanou středem těchto diskusí.

Vývoj ChatGPT: GPT-3 na GPT-4

Je důležité poznamenat, že závazek OpenAI nepoužívat zákaznická data pro trénink platí pro jejich nejnovější jazykový model GPT-4, který byl uveden na trh 14. března 2023.

GPT-4 přinesl několik vylepšení oproti svému předchůdci, GPT-3, včetně významného navýšení maximálního počtu slov (25 000 oproti omezení 3 000 slov u ChatGPT), větší velikosti okna kontextu a zlepšených schopností v uvažování a porozumění.

Další pozoruhodnou vlastností GPT-4 je její multi-modalita, nebo schopnost porozumět a inferovat informace z obrázků kromě textu. Tento nejnovější model generuje texty, které jsou více podobné lidskému stylu, používá emoji pro osobnější pocit.

Nicméně přesná velikost a architektura GPT-4 zůstávají utajeny, což vede k spekulacím ohledně detailů modelu.

Přestože se tyto zvěsti objevují, generální ředitel OpenAI popírá konkrétní tvrzení o velikosti modelu.

Pokud jde o výkon, GPT-4 prokázal určité přednosti v generování textu, ale také některá omezení. Například dosáhl skóre ve 54. percentilu v testu Graduate Record Examination (GRE) Writing a v rozmezí 43. – 59. percentilu v testu AP Calculus BC.

Kromě toho se osvědčil u jednoduchých úloh kódu na Leetcode, ale jeho výkon se snižoval s nárůstem obtížnosti úkolů.

Zatímco konkrétní informace o trénovacím procesu u GPT-4 nejsou oficiálně zdokumentované, je známo, že GPT modely obecně zahrnují široké měřítko strojového učení s různorodým spektrem internetového textu.

Sledujte s očekáváním

V důsledku změn OpenAI politiky využití dat se data použitá pro trénování jeho jazykových modelů nezahrnují informace sdílené prostřednictvím API, pokud uživatelé výslovně nesouhlasí s jejich přispíváním pro tento účel.

Zatímco se tato technologie zlepšuje a hraje stále významnější roli v našich životech, je zajímavé, jak se společnosti přizpůsobují a reagují na obavy ohledně uchovávání dat v soukromí a získávání důvěry lidí.

Příbuzné články

Zobrazit víc >>

Odemkněte sílu AI s HIX.AI!