Sobota 27. července 2024, svátek má Věroslav
  • Premium

    Získejte všechny články
    jen za 49  Kč / 1. měsíc

  • schránka
  • Přihlásit Můj účet

Nová umělá inteligence vás vidí a slyší. S modelem GPT-4o si můžete zcela zdarma popovídat

Společnost OpenAI představila nový revoluční model GPT-4o, který dokáže vidět a slyšet. Lidé si s ním tak mohou popovídat o čemkoliv, a to dokonce zcela zdarma. Americká společnost poskytne model s omezeným užíváním všem svým uživatelům.
  15:49

Umělá inteligence je na vzestupu. Americká společnost OpenAI přichází s novými modely neuvěřitelnou rychlostí. Nedávno představila model Sora, který dokáže z jedné věty vytvořit fascinující video, které je často těžko rozeznatelné od reality. Nyní na tiskové konferenci představila GPT-4o. Tento model dokáže uživateli naslouchat a následně mu odpovědět, dokonce i v češtině. Zajímavé je, že umí pracovat s emocemi, například při vyprávění pohádky. Model může být nápomocný například pro nevidomé.

GPT-4o patří bezpochyby mezi nejpokročilejší jazykové modely dostupné veřejnosti. Jeho klíčovým prvkem je rychlost odpovědí, kdy podle společnosti dokáže zareagovat na uživatele za průměrně tři sta dvacet milisekund. Co všechno nový model umí? Dokáže zpracovat text, obraz, video i zvuk. Uživatel mu tak může říct, co od něj požaduje, a model mu hlasem odpoví. Informace vyhledává převážně na internetu, což znamená, že má opravdu široké znalosti.

Zajímavé také je, jak umí pracovat s intonací hlasu. Nejde tedy jen o všemi známý robotický hlas, který mluví čistě bez emocí. GPT-4o dokáže vyprávět například pohádku, jakkoliv si uživatel zamane. „Bylo nebylo, ve světě ne tak odlišném tomu našemu byl robot, který se jmenoval Bite,“ vypráví na tiskové konferenci OpenAI model pohádku o robotech a lásce. Na požadavky prezentujících následně do vyprávění pohádky přidal více emocí, či ji vyprávěl robotickým hlasem. S intonací dokáže pracovat natolik dobře, že pohádku zakončil zpěvem.

Funkcí má model mnoho. Jedna z těch nejzajímavějších je, že dokáže zpracovat video. To společnost ukázala na scénce, ve které nevidomý muž chodí po ulicích Londýna a ptá se modelu, co se kolem něj nachází. Ten dokázal například z kamery poznat, že je Král Karel III. v Buckinghamském paláci jen podle toho, že je na něm vyvěšená královská vlajka. V další scénce muž postává na okraji ulice a čeká na taxi. Když si GPT-4o všimne, že se jedno blíží, informuje ho. „Ano, zrovna teď jsem jednoho zpozoroval. Blíží se k tobě po levé straně ulice. Připrav se na něj mávnout,“ informuje model muže.

Co by mnoho fanoušků umělé inteligence mohlo zajímat, je také to, že velká část modelu bude v aplikaci zcela zdarma. Umět bude až padesát jazyků, včetně češtiny. Spekuluje se také o tom, že by se ChatGPT měl v brzké době zakomponovat i do systémů iOS od společnosti Apple. Doposud majitelé iPhonů znají jen omezenější Siri ve srovnání s umělou inteligencí od OpenAI. Co kdyby ji však nahradil právě například propracovaný model GPT-4o? Zda k něčemu takovému skutečně dojde, zatím není jisté. Společnost by společnou spolupráci mohla oznámit na své každoroční konferenci WWDC (pozn. red.: Apple Worldwide Developer Conference je každoroční konference firmy Apple pro vývojáře).

GPT-4o dokáže skutečně mnoho věcí. Díky jeho rozvinutým jazykovým schopnostem se dá využít například k učení jazyků. Jednoduše dokáže přepínat z jednoho jazyka na druhý. Využít se tak dá nejen k učení, ale také ke komunikaci.