Az OpenAI hétfőn jelentette be legújabb mesterséges intelligencia nyelvi modelljét, amely állítása szerint intelligensebbé és könnyebben használhatóvá teszi a ChatGPT-t.
A vállalat hétfői bemutatója alapján a GPT-4o gyakorlatilag egy digitális személyi asszisztenssé alakítja a ChatGPT-t, amely valós idejű, beszélt beszélgetésekbe képes bekapcsolódni. Emellett képes lesz szöveges és „látási” interakcióra is, vagyis képes lesz a felhasználók által feltöltött képernyőképeket, fényképeket, dokumentumokat vagy grafikonokat megtekinteni, és azokról beszélgetést folytatni.
Mira Murati, az OpenAI technológiai igazgatója elmondta, hogy a ChatGPT frissített változata már memóriafunkciókkal is rendelkezik majd, vagyis képes lesz tanulni a felhasználókkal folytatott korábbi beszélgetésekből, és képes lesz valós idejű fordításra is.
„Ez az első alkalom, hogy valóban hatalmas lépést teszünk előre a könnyű használat terén” – mondta Murati a vállalat San Franciscó-i székhelyéről tartott élő bemutató során.
Az új kiadással az OpenAI igyekszik a mesterséges intelligencia terén kialakult növekvő verseny élén maradni. A riválisok, köztük a Google és a Meta egyre nagyobb teljesítményű nagy nyelvi modellek létrehozásán dolgoznak, amelyek a chatbotokat működtetik, és amelyek segítségével a mesterséges intelligencia technológiát különböző más termékekbe is be lehet építeni.
Az OpenAI eseménye egy nappal a Google éves I/O fejlesztői konferenciája előtt volt. Az új GPT-4o-hoz hasonlóan a Google Gemini is multimodális, azaz képes értelmezni és generálni szöveget, képet és hangot. Az OpenAI frissítése megelőzi az Apple jövő hónapban megrendezésre kerülő Worldwide Developers Conference-en várható AI-bejelentéseket is, amelyek között szerepelhetnek az AI következő iPhone- vagy iOS-kiadásokba való beépítésének új módjai.
Eközben a legújabb GPT-kiadás a Microsoft számára is áldás lehet, amely több milliárd dollárt fektetett be az OpenAI-ba, hogy AI-technológiáját beágyazza a Microsoft saját termékeibe.
Az OpenAI vezetői bemutattak egy ChatGPT-vel folytatott beszélgetést, amelynek során valós idejű utasításokat kaptak egy matematikai feladat megoldásához, egy esti mese elmeséléséhez és kódolási tanácsadáshoz. A ChatGPT képes volt természetes, emberi hangon és robothangon is beszélni – sőt, az egyik válasz egy részét még el is énekelte. Az eszköz képes volt egy táblázat képét is megnézni és megvitatni.
Azt is megmutatták, hogy a modell érzékeli a felhasználók érzelmeit; egy esetben figyelte a használó légzését, és nyugalomra ösztönözte őt. A ChatGPT több nyelven is képes volt beszélgetést folytatni azáltal, hogy automatikusan fordított és válaszolt. Az OpenAI szerint az eszköz már több mint 50 nyelvet támogat.
„Az új hang (és videó) mód a legjobb számítógépes felület, amit valaha használtam” – mondta Sam Altman, az OpenAI vezérigazgatója a bejelentést követő blogbejegyzésben.
„Olyan érzés, mintha a filmekből ismert AI lenne; és még mindig meglepő számomra, hogy ez valódi. Az emberi szintű válaszidő és kifejezőkészség elérése nagy változásnak bizonyul”.
Murati elmondta, hogy az OpenAI egy ChatGPT asztali alkalmazást fog indítani a GPT-4o képességeivel, így a felhasználóknak egy újabb platformot biztosítva a vállalat technológiájával való interakcióra. A GPT-4o elérhető lesz a fejlesztők számára is, akik saját, egyedi chatbotokat szeretnének készíteni az OpenAI GPT áruházából, amely funkció mostantól a nem fizető felhasználók számára is elérhető lesz.
A frissített technológia és funkciók a következő hónapokban kerülnek bevezetésre a ChatGPT-be. Az ingyenes ChatGPT felhasználók korlátozott számú interakciót végezhetnek az új GPT-4o modellel, mielőtt az eszköz automatikusan visszatér a régi GPT-3.5 modellre; a fizetős felhasználók a legújabb modellel nagyobb számú üzenethez férhetnek hozzá.
További információért látogasson el az OpenAI hivatalos oldalára!