Digitália

2023.06.01. 06:00

Ez gamerforradalom: a játékos saját hangján szólal meg a videójátékban

A virtuális karakterek váratlanul életre kelnek: az NVIDIA ACE for Games bedobta a játékosoknak a generatív mesterséges intelligencia erejét. Vegyük úgy – némi túlzással –, mintha egy ChatGPT-t ötvöznének a videójátékba.

MW

Forrás: Nvidia

A tajpeji Computex 2023 kiállításon az Nvidia vezérigazgatója, Jensen Huang meghökkentette a világot azzal, hogy bemutatta egy játékuk demójával, milyen az, mikor a csúcstechnikával készült videó összekarol a mesterséges intelligenciával. Látszólag apróságról van szó. A videójáték ezen részében a gamer besétál egy lélegzetelállítóan részletes képi világú cyberpunk ramen boltba, ahol pár szót beszélget a tulajdonossal.

De a lényeg: ahelyett, hogy a játékos a gépen különböző opciókra kattintgatna, vagy lenyomna egy-két gombot az előre definiált reakció lefuttatására,

a saját hangján szólal meg, és a videójáték virtuális szereplője konkrét, jelen idejű választ ad a kérdéseire!

Ahányszor csak „találkoznak” a játékban, valós időben másról beszélgethet az emberi játékos és a virtuális szereplő.

Az alábbi demóban úgy 1:06-nál indul a különben nem túl épületes, de mégis játéktörténelmi jelentőségű társalgás, amelyben egy virtuális karakter a játékos természetes emberi beszédére reagál.

Íme a beszélgetés, amely úgy 1:06 körül indul a videón:

Játékos: Szia Jin, hogy vagy?

Jin: Sajnos, nem igazán jól.

Hogy-hogy?

Aggódom az itteni bűnözés miatt. Mostanában elvadult. A ramen boltom kereszttűzbe került.

Segíthetek?

Ha tenni akarsz valamit ez ellen, hallottam olyan pletykákat, hogy Kumon Aoki, a nagyhatalmú bűnöző okozza a káoszt a városban. Lehet, hogy ő az erőszak gyökere.

Beszélek vele. Hol találom?

Azt hallottam, hogy a város keleti oldalán lévő underground harci klubokban lóg. Próbáld ott.

Rendben, megyek.

Vigyázz, Kai.

 

Eddig a beszélgetés, ami sokféleképpen lejátszódhat, kérdezhetünk, mondhatunk mást, okosabbat, egyszerűbbet is – akárhogy, a játékos élőben belevonódik a történetbe.

Az NVIDIA ACE for Games úttörő fejlesztésként olyan valós idejű interakciókat vezet be, amelyekben a nem játszható karakterek (NPC-k) menet közben reagálnak az emberi beszédre. (Az NPC, Non-player character a videójátékokban a nem játszható karaktert jelenti.)

A mesterséges intelligencia felhasználásával az NPC-k valós idejű párbeszédet generálnak, dinamikus beszélgetéseket hoznak létre a játékosokkal. Ez új lehetőségeket nyit meg a gamerek és a virtuális karakterek közötti élethű és előre megírt forgatókönyv nélküli interakciókban, és olyan játékélményt nyújt, amit eddig csak sci-fi filmeken láthattunk.

A demóban az NPC-vel való beszélgetéshez az „NVIDIA NeMo”-t, egy nagyszabású nyelvi modellt használták, amely képes megtanulni az NPC hátterét, történetét stb. A modell a hangalapú beszélgetést automatikus beszédfelismerésre és szövegfelolvasásra alapozza. Ezt egy köztes szoftvercsomag teszi lehetővé, amely tartalmazza az NVIDIA Riva-t a hangok lejátszásához, és az NVIDIA Omniverse Audio2Facet, amely lehetővé teszi a karakterek arckifejezésének természetes változtatását a beszédükhöz és az adott helyzethez alkalmazkodva.

Az NVIDIA szerint az NVIDIA ACE egyszerre több karakterre is alkalmazható, így lehetséges lesz, hogy az NPC-k majd teljesen autonóm módon beszélgethessenek nem csak a játékosokkal, hanem egymással is.

Az Nvidia az AI fellendülésének köszönhetően 1 billió dolláros cég lett

Az Nvidia kedd reggel átmenetileg az 1 billió dolláros vállalatok elit klubjának tagja lett az Apple, a Microsoft, a Meta, az Amazon, a Google és társai mellett.

Tőzsdei záráskor a részvény árfolyama a 419 dolláros csúcs után 401,11 dollárra esett vissza. Ezzel az Nvidia részvényeinek értéke „mindössze” 992 milliárd dollár, ami egyelőre még kivette az 1 billiós klubból.

A cég legutóbbi negyedéves eredményjelentése három hónap alatt több mint 2 milliárd dollár nyereséget mutatott ki. Az Nvidia üzlete a világjárvány korai szakaszában lendült fel igazán a GPU-hiány miatt, ráadásul szintén akkoriban megugrott a kereslet a PC-s játékok és a kriptovaluta bányászata iránt. Ezek a piacok 2022-re visszaestek: mostani pazar növekedése elsősorban annak köszönhető, hogy a kép- és a szöveggeneráló mesterséges intelligencia-rendszerek mind Nvidia videókártyákon futnak, más gyártók csak botladoznak az új piacon.

A vezető játékfejlesztők és startupok már kihasználják az Nvidia generatív mesterséges intelligencia technológiáit. A GSC Game World például az Audio2Face-t alkalmazza a várva várt STALKER 2 Heart of Chernobyl játékban, a Fallen Leaf pedig karakterarc-animációhoz a Fort Solis című sci-fi thrillerében. A Charisma.ai szintén az Audio2Face-et dobja be az animáció vezérlésére a beszélgetési motorjában, lehetővé téve a virtuális karakterek használatát mesterséges intelligenciával.

Hírlevél feliratkozás
Ne maradjon le a baon.hu legfontosabb híreiről! Adja meg a nevét és az e-mail-címét, és mi naponta elküldjük Önnek a legfontosabb híreinket!