Tencent เปิดตัว Hunyuan TTencent เปิดตัวโมเดล AI ใหม่ อ้าง เร็วกว่า DeepSeek-R1

ยอดเยี่ยมกว่าเดิม: โมเดล AI ใหม่จากจีนที่รวมความเร็วเข้ากับความแม่นยำ ท้าชนคู่แข่งระดับโลกด้วยเทคโนโลยีล้ำสมัย
Tencent-เปิดตัวโมเดล-AI-ใหม่-อ้างว่าเร็วกว่า-DeepSeek-R1

ยอดเยี่ยมกว่าเดิม: โมเดล AI ใหม่จากจีนที่รวมความเร็วเข้ากับความแม่นยำ ท้าชนคู่แข่งระดับโลกด้วยเทคโนโลยีล้ำสมัย

ยักษ์ใหญ่ด้านเทคโนโลยีของจีน เทนเซ็นต์ โฮลดิ้งส์ ได้เปิดตัวโมเดล AI ใหม่ชื่อ Hunyuan Turbo S ที่ออกแบบมาให้เป็น “โมเดลคิดเร็ว” เพื่อแข่งขันกับ “โมเดลคิดช้า” อย่าง DeepSeek-R1 โดยสามารถตอบสนองได้แทบจะทันทีภายในหนึ่งวินาที ด้วยการเพิ่มความเร็วในการแสดงผลเป็นสองเท่าและลดความล่าช้าของคำแรกลงเกือบ 44% ความโดดเด่นของ Turbo S คือความสามารถในการเริ่มตอบคำถามได้ทันทีโดยใช้การคิดแบบลูกโซ่สั้นๆ ที่คล้ายกับสัญชาตญาณของมนุษย์ ผสมผสานกับการคิดแบบลูกโซ่ยาวที่มีความสามารถในการให้เหตุผลสำหรับคำตอบด้านวิทยาศาสตร์ คณิตศาสตร์ และการให้เหตุผลที่มีเหตุผล

บริษัทเผยว่า Hunyuan Turbo S แสดงประสิทธิภาพที่เทียบเท่ากับโมเดลชั้นนำในตลาดอย่าง DeepSeek-V3, GPT-4o ของ OpenAI และ Claude ของ Anthropic PBC ในการทดสอบเกณฑ์มาตรฐานด้านคณิตศาสตร์ การใช้เหตุผล และความรู้ ความสำเร็จอย่างโดดเด่นของโมเดล AI ของ DeepSeek จากประเทศจีน เช่น R1 และ V3 ได้สร้างข่าวพาดหัวมากมายในช่วงหลายเดือนที่ผ่านมา ทำให้ผู้พัฒนาโมเดล AI หลายรายต้องเร่งผลิตโมเดลคู่แข่งออกมาอย่างรวดเร็ว การแข่งขันเป็นไปอย่างดุเดือดจากบริษัทต่างๆ เช่น อาลีบาบา กรุ๊ป จากจีนที่มีโมเดล Qwen 2.5-Max ซึ่งอ้างว่ามีประสิทธิภาพเหนือกว่า V3

ในการสร้างโมเดลนี้ เทนเซ็นต์ได้ใช้การผสมผสาน Hybrid-Mamba-Transformer เพื่อลดความซับซ้อนของการคำนวณและ KV-Cache ของสถาปัตยกรรม Transformer ของโมเดล ผลลัพธ์คือโมเดลแบบไฮบริดที่สามารถใช้สถาปัตยกรรมการเรียนรู้เชิงลึกแบบ Mamba ซึ่งเชี่ยวชาญในการจัดการลำดับที่ยาว ในขณะที่ยังคงความสามารถของ Transformer ในการเข้าใจบริบทเบื้องหลังแนวคิดและข้อความที่ซับซ้อนในข้อมูล เทนเซ็นต์ระบุในการประกาศว่า “นี่เป็นครั้งแรกที่อุตสาหกรรมประสบความสำเร็จในการประยุกต์ใช้สถาปัตยกรรม Mamba กับโมเดล Mixture of Experts ขนาดใหญ่พิเศษโดยไม่เกิดความเสียหาย”

บริษัทยังกล่าวอีกว่าสถาปัตยกรรมใหม่นี้ช่วยลดต้นทุนในการฝึกฝนและการใช้งานอย่างมาก ด้วยการที่บริษัทคู่แข่งอย่าง DeepSeek ปล่อยโมเดลที่แข่งขันได้ในราคาถูก ทำให้เทนเซ็นต์และบริษัทอื่นๆ ต้องลดราคาบริการและวิจัยวิธีการฝึกฝน AI และการอนุมานที่มีประสิทธิภาพมากขึ้น เทนเซ็นต์เพิ่มเติมว่าในฐานะโมเดลเรือธง Turbo S จะกลายเป็นแกนหลักสำหรับโมเดลพื้นฐานในอนาคตสำหรับการอนุมาน การสร้างข้อความและโค้ด


อ้างอิงจาก : Siliconangle, Prompt-Expert

Previous Article

"Foxconn เปิดตัว FoxBrain" LLM แห่งแรกจากไต้หวัน

Next Article

Baidu เปิดตัว ERNIE X1 ท้าชน DeepSeek ในราคาที่ถูกกว่า!

View Comments (1)

Leave a Comment

Your email address will not be published. Required fields are marked *