ChatGPT od společnosti OpenAI selhává při odpovídání

Už je to téměř 6 měsíců, co je zde [ OpenAI’s ChatGPT](/blog/what-is-chatgpt). Ve skutečnosti firma nedávno spustila ChatGPT 4. Tato technologie teď posunula svět na zcela novou úroveň.

ChatGPT je jazykový model napájený umělou inteligencí, který byl vyškolen v řadě činností, včetně překladu jazyků, shrnutí informací a odpovídání na otázky. Vynikající schopnosti tohoto modelu získaly značnou pozornost a jako výsledek se mnoho lidí začíná ptát na své zaměstnanecké vyhlídky.

Model GPT-4 pro zpracování jazyka lze použít k analýze obrovského množství dat, po které může vytvářet obsah na základě zjištění analýzy. Nová technologie je také schopná analyzovat velké množství textu za účelem poskytnutí spotřebitelům informace týkající se konkrétního datového bodu.

Není pochyb, že technologie zůstane na dlouho. Samozřejmě pomáhá uživatelům na mnoha frontách. Již na tisíce příležitostí dokázala, že je schopna vykonat cokoli od psaní scénářů až po řešení nejtěžších testových otázek. Není nic, co ChatGPT nedokáže dokončit. Přesto existují věci, které jsou pro ChatGPT náročnější.

1. ChatGPT, napájený umělou inteligencí, utrpěl neúspěch, když nedokázal obstát v ceněném společném vstupním zkoušení (JEE) v Indii. Společné vstupní zkoušení je pro svou obtížnost proslulé a každoročně přitahuje tisíce studentů, kteří se zajímají o studium na nejprestižnějších technických školách v Indii. Jedná se o jednu z nejtěžších kvantitativních zkoušek, které zahrnují složité diagramy a čísla.

Studenti, kteří mají zájem o studium na prestižních vzdělávacích institucích jako IIT a NIT, musí nejprve složit společný přijímací test. Podle zpráv se ChatGPT na zkoušce JEE Advanced nedařilo dobře.

Výsledky výkonu ChatGPT v testu byly méně než uspokojivé, protože dokázal vyřešit pouze 11 z celkového počtu otázek v papíru.

2. V minulosti byl ChatGPT úspěšný v řadě dalších testů, které jsou jakýmsi zářezem a obtížnými. Ojediněle se ChatGPT pokusil a úspěšně odpověděl na všech 200 otázek národní kvalifikační a přijímací zkoušky pro lékařské fakulty (NEET), přičemž kandidáti musí odpovědět na 180 otázek z celkového počtu 200.

Přesto ChatGPT se pokusil zodpovědět všech 200 otázek a výsledek jeho výkonu byl 359 bodů z 800. Konkrétně se ChatGPT v oblasti biologie při testu NEET výjimečně osvědčil a prokázal lepší přesnost odpovědí na otázky z této sekce. Výkon ChatGPT při testu NEET naznačuje, že má schopnost vyniknout i v jiných oblastech, přestože neuspěl u zkoušky JEE Advanced.

Porážka, kterou ChatGPT zažil při testu JEE Advanced, ukazuje omezení, která existují i u nejlepších AI modelů. Ačkoli umělá inteligence má potenciál výrazně ovlivnit mnoho různých odvětví, má stále ještě dlouhou cestu před sebou, než bude schopna konkurovat lidské inteligenci v obtížných úkolech.

Chatbot ChatGPT od společnosti OpenAI neuspěl v další soutěžní zkoušce.

3. ChatGPT absolvoval(a) zkoušku Union Public Service Commission (UPSC) na žádost Analytics India Magazine (AIM). Zkouška UPSC je považována za jednu z nejtěžších soutěžních zkoušek na světě. Každý rok se na zkoušku UPSC přihlásí přes 10 lakh aspirantů, ale pouze 5 % z nich uspěje.

AIM poskytl ChatGPTovi 100 otázek z UPSC Prelims 2022.

Chatbot neuspěl v předběžném přijímacím zkoušky UPSC 2022, získal pouhých 54 bodů ze 100 na Otázku 1 (Sada A), přičemž požadovaný skóre bylo 87,54 bodu. To naznačuje, že ChatGPT neuspěl v zkoušce UPSC.

Otázky byly založeny na tématech indické všeobecné vědy, historie, geografie, ekonomie, ekologie a současné události. Chatbot si vede dobře s otázkami týkajícími se lokalit a ekonomie, ale čelně selhal, když byl požádán o historické události, které se odehrály před rokem 2021.

Skutečnost, že datová sada ChatGPT sahá pouze do roku 2021, je pravděpodobně rozhodujícím faktorem pro neschopnost AI robota správně odpovědět na všechny otázky zkoušky.

4. Kromě toho byly výsledky zkoušky CLAT pro ChatGPT také nadprůměrné. Během zkoušky CLAT UG byl tento nástroj umělé inteligence úspěšný v přesném řešení pouze 50,83 procent otázek. ChatGPT nebyl úspěšný v kategoriích logiky a kvantitativních otázek. Nicméně si vedl mimořádně dobře v kategoriích angličtiny a aktuálních událostí. Pokud jde o otázky založené na konceptech, s tímto nástrojem se velmi potýkal.

Vydaný v listopadu 2022 se ChatGPT v Spojených státech daří poměrně dobře. Tato technologie umělé inteligence byla úspěšná při absolvování zkoušky pro získání americké lékařské licence (USMLE) a různých MBA zkoušek ve Spojených státech. Kromě toho byla úspěšná i při skládání Google Coding Interviews pro inženýry úrovně 3.

Veterinární odborníci byli nedávno překvapeni, když ChatGPT byl schopen správně diagnostikovat stav psa a zachránit život zvířete.

Mnoho zemí však nyní má protichůdné názory na ChatGPT a jsou připraveny podniknout rozhodná opatření proti této nové inovaci. Nedávno byla technologie zakázána ve dvou hlavních zemích, včetně Německa a Itálie. Tyto země tvrdí, že ChatGPT od OpenAI postrádá opatření, která by zabránily nezletilým vystavení se urážlivému materiálu, jako je systém ověřování věku.

Ulrich Kelber, německý komisař pro ochranu dat, vydal varování, že Chat-GPT by mohl být v Německu potenciálně zakázán z důvodů obav o bezpečnost dat uživatelů, podobně jako se stalo v Itálii.

Nu, uvidíme, jak se bude v budoucnosti chovat technologie poháněná umělou inteligencí.

Děkuji za přečtení! Sledujte nás pro další takové informativní články!

ChatGPT společnosti OpenAI selhává při odpovídání na otázky.

Příbuzné články