A multimodális AI asszisztens képes ruhákat javasolni, szöveget fordítani, képeket feliratozni és leírni a tárgyakat, amelyekre a szemüveget irányítod. A Ray-Ban Meta okosszemüveg komoly frissítést kap, köszönhetően annak, hogy a Meta mesterséges intelligenciája végre megtanul látni és hallani.
A korábban Facebook néven ismert Meta bejelentette a Meta Ray-Ban okosszemüvegének néhány izgalmas új funkcióját, amelyek még hasznosabbá és interaktívabbá teszik azt. A vállalat egy új „multimodális” AI asszisztenst tesztel, amely a szemüveg kameráján és mikrofonjain keresztül látottak és hallottak alapján tud válaszolni a kérdéseinkre.
Multimodális AI a játékban
A multimodális AI asszisztens képes ruhákat javasolni, szöveget fordítani, képeket feliratozni és leírni a tárgyakat, amelyekre a szemüveget irányítod. A Meta vezérigazgatója, Mark Zuckerberg egy Instagram-felvételen mutatott be néhányat ezekből a képességekből, amikor megkérte a szemüveget, hogy ajánljon egy nadrágot, amely jól illene egy inghez, amelyet éppen a kezében tartott. Az asszisztens két lehetőséget adott neki, és leírta az ing színét és mintáját.
Felhasználási esetek
Képzelje el a következőt: Egy elegáns butikban jársz, kezedben egy lenyűgöző smaragdzöld blúzzal, de nem tudod, milyen nadrághoz passzoljon a tökéletes párosítás. Nincs szükség arra, hogy előkapja a telefonját, és végtelen Pinterest táblákat lapozgasson. Csak súgd meg: „Hé, Meta, milyen nadrág illik ehhez a ruhához?”. Bumm, a szemüveged letapogatja a blúzt, elemzi a színét és a stílusát, és BAM! Azonnali divattanácsot kapsz, mintha egy személyes stylist súgna titkokat a füledbe.
Azt hiszed, ez csak a ruhákról szól? Gondold újra! Ez a szemüveg az Ön szeme és füle a világhoz, amelyet a Meta mesterséges intelligencia agya hajt. Nehezen értesz meg egy idegen nyelvű menüt? Kérd meg a szemüvegedet, hogy fordítsa le. Eltévedtél egy múzeumban? Elmondja neked, milyen kiállítási tárgyakat nézel. Még az a funky falfestmény is a barátod lakásán? Csak mutasson rá, és kérdezze meg: „Mi lehet az?”. A szemüveg, mint egy apró orákulum, megfejti a művészi rejtélyt. De várj, van még más is! Emlékszel azokra a menő képaláírásokra, amiket az Instagram-ra írsz? Ezek a szemüvegek segítenek menet közben elkészíteni őket, elemzik a fotóidat, és szellemes egysorosokat javasolnak.
Persze ez a mesterséges intelligencia szuperképesség csak egyeseknek szól. A Meta egy korai hozzáférési tesztet tart, amely az Egyesült Államokban csak a technológia iránt érdeklődők egy kiválasztott csoportjára korlátozódik. De hidd el, a funkcióról szóló suttogások máris futótűzként terjednek. Képzelj el egy olyan világot, ahol a szemüveged a házmestereddé, stílusguruddá, nyelvi tolmácsoddá és útközbeni információs központoddá válik. Olyan, mintha Siri, Alexa és a Google egy személyben lenne az orrodon.
A multimodális mesterséges intelligencia asszisztens még fejlesztés alatt áll, és vannak bizonyos korlátai. Csak úgy tudja felismerni, hogy mit látsz, ha fényképet készítesz, amit aztán a felhőben elemez. A hangos kérés után néhány másodpercet várnia kell, hogy meghallgassa a választ. A fotókészítés és a lekérdezés elindításához is meghatározott hangparancsokat kell használnia. Például azt kell mondania, hogy „Hé, Meta, nézd meg ezt és…”, majd a kérdését.
A fényképek és a válaszok a telefonodon lévő Meta View alkalmazásban tárolódnak, amelyhez később hozzáférhetsz. Ez hasznos lehet, ha feljegyzést vezetsz arról, hogy mit tanultál vagy láttál a szemüvegen keresztül. A multimodális AI asszisztens praktikus eszköz lehet a világ felfedezéséhez, vásárláshoz, tanuláshoz vagy szórakozáshoz a Meta Ray-Ban okosszemüveggel.