เมื่อ AI ไม่ใช่แค่ตอบคำถาม แต่สามารถสร้าง “โลก” ให้คุณเดินเข้าไปสำรวจได้จริง นั่นคือสิ่งที่ Google DeepMind กำลังทำกับ Project Genie ต้นแบบการวิจัยที่พาเราก้าวข้ามขีดจำกัดของ Generative AI ไปสู่การสร้างประสบการณ์เชิงโต้ตอบที่ไม่มีที่สิ้นสุด
Project Genie คือต้นแบบแอปพลิเคชันบนเว็บที่ขับเคลื่อนด้วย Genie 3 โมเดลโลกอเนกประสงค์ (General-Purpose World Model) ที่พัฒนาโดย Google DeepMind ร่วมกับ Gemini และ Imagen 3 Pro สิ่งที่ทำให้มันแตกต่างจาก AI สร้างภาพทั่วไปคือ มันไม่ได้สร้างแค่ภาพนิ่ง แต่จำลองสภาพแวดล้อมที่มีฟิสิกส์ เคลื่อนไหว และตอบสนองต่อการกระทำของผู้ใช้ได้แบบเรียลไทม์
ฟีเจอร์หลักแบ่งออกเป็น 3 ส่วน ได้แก่ World Sketching (สร้างโลกจากข้อความหรือภาพ พร้อมกำหนดมุมกล้องและตัวละคร), World Exploration (เดินสำรวจโลกที่สร้างขึ้น โดย AI จะสร้างเส้นทางข้างหน้าแบบ Real-Time ตามการเคลื่อนไหวของผู้ใช้) และ World Remixing (นำโลกที่มีอยู่มาดัดแปลงหรือต่อยอดสร้างเป็นเวอร์ชันใหม่ และดาวน์โหลดวิดีโอได้) นอกจากนี้ ยังมีแกลเลอรีโลกสำเร็จรูปให้เลือกสำรวจหรือนำมารีมิกซ์ต่อได้อีกด้วย
ปัจจุบัน Project Genie เปิดให้สมาชิก Google AI Ultra ในสหรัฐอเมริกา (อายุ 18 ปีขึ้นไป) ได้ทดลองใช้แล้ว โดยมีแผนขยายไปยังประเทศอื่น ๆ ในอนาคต
ข้อควรรู้
Project Genie ยังเป็นต้นแบบที่อยู่ระหว่างพัฒนา โลกที่สร้างขึ้นอาจยังไม่สมจริง 100% การควบคุมตัวละครอาจมีความล่าช้า และการสร้างโลกจำกัดที่ 60 วินาทีต่อครั้ง
ดังนั้น Project Genie คือ ก้าวสำคัญที่แสดงให้เห็นว่า AI กำลังก้าวข้ามการเป็นเพียงเครื่องมือสร้างเนื้อหา ไปสู่การเป็น “เครื่องจำลองโลก” ที่ผู้ใช้งานสามารถโต้ตอบได้จริง แม้จะยังอยู่ในขั้นทดลอง แต่ศักยภาพของมันครอบคลุมตั้งแต่การสร้างเกม แอนิเมชัน หุ่นยนต์ ไปจนถึงการจำลองฉากประวัติศาสตร์ ซึ่งน่าจับตามองอย่างยิ่งสำหรับวงการเทคโนโลยีและครีเอทีฟ
อ้างอิงจาก : Blog Google, Techsauce