![screenshot-2023-03-14-v-1-hod-13-min-41-s-web.jpg](https://static-lib.s3.amazonaws.com/cms/screenshot_2023_03_14_at_1_13_41_pm_da5958b43b.jpg)
Pokročilé schopnosti ChatGPT, jako například ladění kódu, psaní esejů nebo hádání vtipů, její vedly k obrovské popularitě. Přestože má své schopnosti, její asistence byla dosud omezena na text – ale to se brzy změní.
V úterý OpenAI odhalil GPT-4, velký multimodální model, který přijímá jak vstupy textu, tak obrázky, a vrací text.
Také: Jak zajistit, aby ChatGPT poskytoval zdroje a citace
Rozdíl mezi GPT-3.5 a GPT-4 bude "jemný" v neformálním rozhovoru. Nicméně, nový model bude podstatně schopnější z hlediska spolehlivosti, kreativity a dokonce i inteligence.
Podle OpenAI dosáhla GPT-4 v simulovaném průměrném testu na úrovni nejlepších 10 %, zatímco GPT-3.5 dosáhla naopak v dolních 10 %. GPT-4 také předčila GPT-3.5 v sérii srovnávacích testů, jak je vidět na následujícím grafu.
![snímek-obrazovky-2023-03-14-v-13-40-32.png](https://static-lib.s3.amazonaws.com/cms/screenshot_2023_03_14_at_1_40_32_pm_c7577ae6e4.jpg)
Pro kontext, ChatGPT běží na jazykovém modelu, který byl doladěn z modelu ze série 3.5, což omezuje chatbota na textový výstup.
Oznámení GPT-4 od OpenAI následovalo po projevu Andrease Brauna, technického ředitele Microsoftu v Německu, minulý týden, ve kterém uvedl, že GPT-4 brzy přijde a umožní možnost generování textu do videa.
Také: Jak funguje ChatGPT?
"Příští týden představíme GPT-4; tam budeme mít multimodální modely, které nabídnou zcela odlišné možnosti - například videa," uvedl Braun podle zpravodaje Heise, německého zpravodajského webu, na akci.
Přestože GPT-4 je multimodální, tvrzení o generátoru textu-na-video nebyla zcela přesná. Model ještě nedokáže plně produkovat video, ale umí přijímat vizuální vstupy, což je hlavní změna oproti předchozímu modelu.
Jedním ze příkladů, který OpenAI poskytl k předvedení této funkce, je ukázka ChatGPT, který skenuje obrázek v pokusu zjistit, co na fotografii bylo vtipné, podle uživatelova vstupu.
![screenshot-2023-03-14-v-1-36-02-odpoledne.jpg](https://static-lib.s3.amazonaws.com/cms/screenshot_2023_03_14_at_1_36_02_pm_af3a113b01.jpg)
Dalšími příklady bylo nahrání obrázku grafu a požádání GPT-4 o provedení výpočtů, nebo nahrání pracovního listu a požádání ho o vyřešení otázek.
Také: 5 způsobů, jak vám může ChatGPT pomoci psát esej
OpenAI říká, že uvolní schopnost zadávání textu do ChatGPT a jeho API prostřednictvím čekacího seznamu. Na funkci zadávání obrázků však budete muset chvíli počkat, protože OpenAI spolupracuje s jediným partnerem, aby toto zavedení spustili.
Pokud jste zklamaní, že nemáte generátor textu na video, nebojte, není to zcela nový koncept. Technologické giganty jako Meta a Google již mají modely ve vývoji. Meta má Make-A-Video a Google má Imagen Video, které oba využívají umělou inteligenci k vytváření videa z uživatelského vstupu.