Doom на движке из нейросетки
Aug. 29th, 2024 11:38 pmПарни из лабораторий «Google DeepMind» в сотрудничестве с университетом Тель-Авива представили кое-что весьма забавное и интересное: «игровой движок» GameNGen, полностью построенный на виртуальной нейросети. И запустили на нем старый добрый «Doom» на 20 FPS.
Самое же интересное здесь то, что на самом деле никакой игры тут нет. Обученная на визуальном ряде «Doom» нейросеть реагирует на нажатия клавиш игроком, генерируя кадры, которые, как она считает, наилучшим образом соответствуют вводимому действию. Например, если игрок нажимает «вперед» — нейросеть сверяется со своей базой данных о том, какие изменения происходят на экране от этого действия, и генерирует соответствующие кадры. Если игрок нажимает «огонь», нейросеть, соответственно, начинает генерировать кадры стрельбы из оружия, поражения монстров и т.д.
Сделано это было следующим образом:

* Для начала, команда исследователей создала базу исходных данных. Поскольку требуемое количество часов игры было невозможно набрать «естественным» путем, они создали небольшого виртуального агента (по принципу обучения с подкреплением), который накручивал необходимые сотни и тысячи часов игрового времени.
* На следующем этапе, исследователи взяли небольшую нейросеть Stable Diffusion v1.4, и на ее основе создали диффузионную модель. Которая, обучаясь на предоставленной базе данных, училась сопоставлять нажатия клавиш игроком с изменением картинки на экране. Еще раз подчеркиваю; программа не имела ни малейшего представления, что имеет дело с игрой. Она обучалась только и исключительно последовательно генерировать кадры в зависимости от того, как действия (нажатия клавиш) меняют происходящее на экране.
* Обученную нейросеть доработали для максимальной точности воспроизведения игровых кадров, дополнительно обучив ее на сопоставлении сгенерированных ею кадров с игровыми. В результате, показатель пикового отношения сигнал/шум при прогнозировании каждого следующего кадра достигал 29,4 (авторы проекта использовали аналогию «как если бы кадр Doom сжимали в формат JPEG с соответствующей потерей качества»).

И в результате получился «движок», который при полном отсутствии самой игры, чрезвычайно достоверно ее симулирует. Эксперименты показали, что люди практически не способны отличить «реальный» Doom от симуляции. Десять испытуемых, которым предложили короткие (1,5-3 секунды) ролики «реальной» игры и симуляции GameNGen, в среднем могли угадать какой «реальный» а какой нет, лишь немногим более чем в половине случаев (58-60%, что близко к случайному распределению).
Разумеется, пока что возможности GameNGen сильно ограничены. Запаса «памяти» искусственного интеллекта хватает лишь на несколько секунд интерактивного процесса — то есть если игрок решит пойти в обратном направлении, программа уже «забудет» как выглядели посещенные им комнаты, и сгенерирует совершенно новые. И чем дольше идет игра, тем больше накапливается артефактов и «дрейфа». Да и качество генераций оставляет подчас желать лучшего:

И тем не менее — это один из первых шагов в очень интересном направлении. Многие аналитики считают, что уже в обозримом будущем настанет время, когда игровые модели и игровой процесс будут не столько программироваться, сколько генерироваться, используя текстовые промты и визуальные образцы (фотографии, 3D модели, видео) как основу для дальнейшей работы искусственных интеллектов. Что может привести к настоящей революции в отрасли, сделав графические решения и процессы на уровне игр ААА-класса доступными и дешевыми в производстве.
Интригует, не так ли?

no subject
Date: 2024-08-29 08:45 pm (UTC)Было в «Гиперионе» Дэна Симмонса. Там у земных ВКС был тактический симулятор, построенный на таком принципе
no subject
Date: 2024-08-29 09:02 pm (UTC)no subject
Date: 2024-08-29 09:18 pm (UTC)> Интригует, не так ли?
Нет, конечно. Видеомагнитофон на технологиях 21 века.
no subject
Date: 2024-08-30 03:44 am (UTC)(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2024-08-29 09:20 pm (UTC)no subject
Date: 2024-08-30 04:41 am (UTC)Практически никак не будет и не оправдано.
no subject
Date: 2024-08-29 09:38 pm (UTC)Нужно еще отметить, что это чисто исследовательская работа, использующая устаревшие версии нейросетей и ограниченные вычислительные ресурсы. Если бы им дали те ресурсы и технологии, которые сейчас использует OpenAI для тренировки Sora и GPT-5, то результат уже сегодня отличался бы в разы по качеству.
no subject
Date: 2024-08-29 09:45 pm (UTC)Интригует, но не так вам думается
"Это что же, и в магазине можно вот так стенку приподнять?"(с)
Чувствуете как теперь можно освоить бюджет какого-нибудь еще вчера простого тренажера или симулятора?
no subject
Date: 2024-08-29 09:46 pm (UTC)Кругом измена, трусость и обман
no subject
Date: 2024-08-29 10:55 pm (UTC)Не взлетит, только как вспомогательный элемент только.
Не хватает мощностей для симуляции разума.
Так что ждем квантовых компьютеров.
-----------------
P.S. а про искусственный интеллект с 70-х истории рассказывают, что вот вот, буквально через год, но не выходит каменный цветок.
no subject
Date: 2024-08-30 01:47 am (UTC)на ютубе много лонгплэев, которые делает тренированный ИИ, собственно "не иметь представления о том, что это игра" получается давно и стабильно :-) в том и проблема, что алгоритму по барабану, что генерировать на основе базы знаний.
(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2024-08-29 11:11 pm (UTC)Будьте вы прокляты за рекламу длиннее ролика.
no subject
Date: 2024-08-30 04:42 am (UTC)Так отключите рекламу.
no subject
Date: 2024-08-30 12:46 am (UTC)которым предложили короткие (1,5-3 секунды) ролики «реальной» игры и симуляции
А если ролик сократить до 0.5 секунды!...
no subject
Date: 2024-08-30 01:49 am (UTC)Интриги интригуют, Но забавная часть весьма интересна )
no subject
Date: 2024-08-30 01:56 am (UTC)no subject
Date: 2024-08-30 02:12 am (UTC)И такое есть уже. Закидываешь в ИИ формулу-пример, на выходе получаешь некий расчет и результат. Правильность — не знаю. Таблицу умножения знает, всякие логарифмы проверять влом.
(no subject)
From:no subject
Date: 2024-08-30 02:15 am (UTC)"Запаса «памяти» искусственного интеллекта хватает лишь на несколько секунд интерактивного процесса — то есть если игрок решит пойти в обратном направлении, программа уже «забудет» как выглядели посещенные им комнаты, и сгенерирует совершенно новые."
Сказать что это не баг, а фича. Персонаж попадает в адский пластично-изменяющийся мир, где нет ничего постоянного. Помните, в "Обмене разумов" было понятие искаженного мира?
no subject
Date: 2024-08-30 06:11 am (UTC)Так что это баг, а искаженный мир — психоз.
Впрочем возможности ИИ на современном уровне для построения игры дальше этих нескольких секунд уже исчерпаны.
(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2024-08-30 03:23 am (UTC)no subject
Date: 2024-08-30 04:27 am (UTC)Дык прогресс на месте не стоит!
(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2024-08-30 05:36 am (UTC)2) Что же касается сетевых решений, то они давным давно существуют. Где игра запускается на мощном железе и транслируется на более слабые машины. Потому и это не является решением. Ибо дешевле установить нормальную игру, нежели засрать дисковое пространство этим иезуитством.
И последнее: в любом случае сама игра должна существовать в нормальном виде.
3) Как эксперимент достойно внимания. Но перспектив у идеи — никаких.
Что же касается "ИИ" и моего к нему отношения, то "ИИ" это миф. Его не существует. То есть: обычный электронный калькулятор это такой-же "ИИ" как и все остальные. Просто в калькуляторе заложено меньше условий и информации. Если кто-то пытался "генерировать" изображения с помощью "ИИ", то наверное замечал, что он их просто крадёт с каких-то ресурсов. А иначе: откуда размазанные глаза и руки рядом с "нарисованным" "ИИ" портретом?
4) Кроме того: сама компьютерная игра — это ИИ. И в игре присутствует ИИ, причём так и называется. )))
no subject
Date: 2024-08-30 03:54 pm (UTC)Если кто-то пытался "генерировать" изображения с помощью "ИИ", то наверное замечал, что он их просто крадёт с каких-то ресурсов.
Мягко говоря — бред)
(no subject)
From:no subject
Date: 2024-08-30 06:55 am (UTC)А теперь давайте такое же, но с порнухой)
no subject
Date: 2024-08-30 07:10 am (UTC)(no subject)
From:no subject
Date: 2024-08-30 07:20 am (UTC)no subject
Date: 2024-08-30 08:06 am (UTC)no subject
Date: 2024-08-30 01:13 pm (UTC)Дум более классический)
(no subject)
From:no subject
Date: 2024-08-30 09:00 am (UTC)Норм.
Нейрогеймконструктор давно просится в реал.
Захотел поиграть, просто наговорил в микрофон стиль игры, название движка, придумал персонажей, размерность и количество пространств и т.д. и т.п. и вперед.
За этим будущее. (ТМ)
no subject
Date: 2024-08-30 09:10 am (UTC)— Ваш ИИ вместо достоверных данных постоянно выдаёт какие-то галлюцинации!
— Зато посмотрите, какие это прикольные галлюцинации, в них даже играть можно :)
no subject
Date: 2024-08-30 09:27 am (UTC)То же самое происходит с человеком во сне.
no subject
Date: 2024-08-30 01:13 pm (UTC)А кстати выше озвучили интересную идею — выдать баг за фичу)
no subject
Date: 2024-08-30 11:00 am (UTC)""Многие аналитики считают..."
Многие аналитики только за последние 5 лет наговорили столько бреда, от всеобщего блокчейна до всеобщего ИИ, что воспринимать их всерьёз как-то уже не получается.
А если оглянуться в аналитику игровой индустрии лет на 10-15 назад, то там вообще факап на факапе.
no subject
Date: 2024-08-31 01:40 pm (UTC)no subject
Date: 2024-08-31 06:47 pm (UTC)Индивидуализация контента посредством генерации ИИ — это мое предсказание.
no subject
Date: 2024-09-03 04:42 pm (UTC)