ปฏิวัติการแก้ไขภาพด้วย AI! “Nano Banana” คว้าแชมป์โลก LMArena ด้วยเทคโนโลยีรักษาความสอดคล้องตัวละคร และการปรับแต่งแบบต่อเนื่อง พร้อมฟีเจอร์ผสมผสานสไตล์ และระบบความปลอดภัย SynthID ท้าทายคู่แข่งในสงครามตลาด AI สร้างภาพที่ทวีความดุเดือด
Google ได้เปิดตัวการอัพเกรดครั้งสำคัญของ Gemini AI ในด้านการสร้างภาพ ด้วยโมเดล Gemini 2.5 Flash ที่มีชื่อเล่นว่า “Nano Banana” ซึ่งได้รับการยกย่องให้เป็นเครื่องมือแก้ไขภาพอันดับหนึ่งของโลกบน LMArena Leaderboard และได้รับคำชมจากผู้ใช้งาน โมเดลนี้ได้รับการออกแบบมาเพื่อแก้ไขปัญหาใหญ่ที่สุดของ AI ในการสร้างภาพ นั่นคือความสอดคล้อง Google มุ่งหวังที่จะสร้างปรากฏการณ์ทางวัฒนธรรมของตัวเองเช่นเดียวกับที่ ChatGPT เคยทำได้ด้วยภาพสไตล์ Studio Ghibli
ความสามารถเด่นของ Nano Banana คือ การแก้ไขภาพโดยรักษาความสอดคล้องของตัวละครหรือวัตถุหลัก ซึ่งเป็นปัญหาที่ผู้ใช้งาน AI สร้างภาพอื่น ๆ เช่น ChatGPT หรือ Grok มักพบ เมื่อต้องการปรับแต่งรายละเอียดเล็กๆ น้อยๆ แต่ภาพทั้งหมดกลับเปลี่ยนไปอย่างสิ้นเชิง ผู้ใช้สามารถอัพโหลดภาพบุคคลและลองเปลี่ยนเสื้อผ้า ทรงผม หรือย้ายไปยังยุคสมัยอื่นได้ โดยไม่ทำให้ตัวละครเพี้ยนแปลกประหลาด นอกจากนี้ยังสามารถวางตัวละครเดียวกันในสภาพแวดล้อมที่ต่างกัน แสดงผลิตภัณฑ์จากหลากหลายมุมมองในสถานที่ใหม่ หรือสร้างสื่อแบรนด์ที่สอดคล้องกันได้
ฟีเจอร์การแก้ไขแบบหลายรอบ (Multi-turn editing) ช่วยให้ผู้ใช้สามารถปรับแต่งภาพอย่างต่อเนื่องได้ Google แนะนำการเพิ่มเฟอร์นิเจอร์และของตกแต่งในภาพห้องเพื่อสร้างแรงบันดาลใจ ส่วนการผสมผสานดีไซน์ (Mixing designs) ช่วยให้สามารถนำสไตล์จากภาพหนึ่งไปใช้กับวัตถุในอีกภาพหนึ่งได้ เช่น เปลี่ยนการออกแบบชุดเดรสให้เป็นลายปีกผีเสื้อ ความสามารถเหล่านี้ทำให้ Nano Banana กลายเป็นเครื่องมือที่ทรงพลังสำหรับงานสร้างสรรค์และการตลาด ผู้ใช้สามารถเข้าถึงผ่าน Gemini app และนักพัฒนาสามารถใช้ผ่าน Gemini API, Google AI Studio และแพลตฟอร์ม Vertex AI
เรื่องความปลอดภัย Google ได้ใส่ลายน้ำ AI ที่มุมภาพและ SynthID ที่มองไม่เห็นเพื่อระบุว่าเป็นภาพสร้างจาก AI แม้จะถูกตัดต่อแล้วก็ตรวจได้ ขณะนี้การสร้างภาพด้วย AI กลายเป็นสนามแข่งขันใหญ่ระหว่างแอป AI ชั้นนำ โดยที่ Elon Musk ผลักดัน Grok ด้วยโหมด “Spicy” ที่สร้างภาพสำหรับผู้ใหญ่ได้ ในขณะที่ ChatGPT โด่งดังจากภาพสไตล์ Studio Ghibli จนมีผู้ใช้เกือบพันล้านคน ส่วน Meta ก็ให้ลิขสิทธิ์ AI สร้างภาพกับ Midjourney ซึ่งแสดงให้เห็นว่าตลาดนี้แข่งกันดุเดือดจริง ๆ
อ้างอิงจาก : Techspot