قدم فريق من الباحثين في شركة جوجل محرك ألعاب جديد يعرف باسم “GameNGen”، والذي يمكنه توليد تجربة لعبة Doom بشكل تفاعلي وإطارًا بإطار في الوقت الحقيقي. يتم تنفيذ ذلك من خلال تحليل الضغوطات على لوحات المفاتيح وتوليد المحتوى بطريقة مستندة إلى شبكة عصبية متطورة.
وقد تم تدريب النظام على اللعب في لعبة Doom، حيث ساعد ذلك في جمع البيانات اللازمة التي تم استخدامها لتطوير مجموعة بيانات رئيسية لنموذج الذكاء الاصطناعي. وأوضح الباحثون أن استخدام البشر لجمع البيانات كان سيستغرق وقتًا أطول بكثير، لذا كانت هذه الطريقة أكثر فعالية.
بالاستفادة من البيانات المجمعة، تم تدريب نموذج Stable Diffusion 1.4 ليكون قادرًا على توليد الإطار التالي في اللعبة بناءً على الإطار الحالي وإجراءات اللاعب. كما قام المطورون بتحسين استقرار الإطارات الناتجة، مما يضمن الحفاظ على مواضع الكائنات ومظهر الشخصيات.
نتيجة لذلك، نجح محرك GameNGen في توفير تجربة لعبة Doom تفاعلية بمعدل يزيد عن 20 إطارًا في الثانية عند التشغيل على شريحة معالجة Tensor من جوجل.
لتقييم جودة التوليد، شارك عشرة خبراء في تجربة تم فيها عرض 130 مقطع فيديو، حيث كانت المحاكاة تعمل بالتوازي مع اللعبة. وقد أظهر تقييمهم أن نسبة الإجابات الصحيحة وصلت إلى 58% لمقاطع الفيديو التي استمرت 1.6 ثانية و60% للمقاطع التي استغرقت 3.2 ثانية، وهو ما يعد أفضل قليلاً من صرف الاختيار العشوائي.
الجدير بالذكر أن الأمثلة العملية لمحرك GameNGen والنص الكامل للدراسة متاحة للجمهور على موقع المشروع.