เปิดตัว Typhoon OCR : พลิกโฉมการอ่านเอกสารด้วย AI ภาษาไทย-อังกฤษ

Typhoon OCR คือโมเดลโอเพ่นซอร์สใหม่ที่ใช้เทคโนโลยี Vision-Language ช่วยดึงข้อมูลจากไฟล์เอกสารและรูปภาพ รองรับทั้งภาษาไทยและอังกฤษ
เปิดตัว-Typhoon-OCR--พลิกโฉมการอ่านเอกสารด้วย-AI-ภาษาไทย-อังกฤษ
โมเดล OCR อัจฉริยะ รองรับภาษาไทยและอังกฤษ

Typhoon OCR คือโมเดลโอเพ่นซอร์สใหม่ที่ใช้เทคโนโลยี Vision-Language ช่วยดึงข้อมูลจากไฟล์เอกสารและรูปภาพ รองรับทั้งภาษาไทยและอังกฤษ เหมาะสำหรับการสรุปเนื้อหา วิเคราะห์ และต่อยอดข้อมูลจากเอกสารต่างๆ  

ข้อจำกัดของระบบ OCR แบบดั้งเดิม

ระบบ OCR แบบดั้งเดิมมักใช้ CNNs และ RNNs หรือ Transformers ในการแปลงภาพเป็นข้อความ แต่ยังมีข้อจำกัดเมื่อใช้งานกับเอกสารจริงที่มีรูปแบบซับซ้อนหรือคุณภาพไม่สม่ำเสมอ เช่น ขาดความเข้าใจโครงสร้างเอกสาร ไม่สามารถตีความรูปภาพได้ และสูญเสีย metadata สำคัญเมื่อแปลง PDF เป็นภาพ  

Typhoon OCR ทลายข้อจำกัดและนำเสนอความสามารถที่ใช้งานได้จริง

Typhoon OCR ใช้เทคโนโลยี Vision-Language Models (VLMs) ผสมผสานการรับรู้ภาพเข้ากับความเข้าใจภาษาธรรมชาติ สามารถตีความโครงสร้างเอกสาร เข้าใจเนื้อหา และเจตนาของเอกสาร โดยไม่ต้องพึ่งพากระบวนการแบบฮาร์ดโค้ดที่ซับซ้อน รองรับเอกสารภาษาไทยและอังกฤษที่ใช้งานจริงในชีวิตประจำวันและการทำงาน  

รองรับเอกสารที่ใช้งานจริงในชีวิตประจำวัน

Typhoon OCR รองรับเอกสารหลากหลายรูปแบบ ทั้ง PDF และไฟล์ภาพ เช่น JPEG, PNG โดยสามารถรักษาโครงสร้างและความหมายของเอกสารได้อย่างครบถ้วน ไม่ว่าจะเป็นเอกสารทางการหรือเนื้อหาที่ไม่เป็นทางการ  

สามารถทดลองใช้งาน Typhoon OCR ได้ที่ https://vision.opentyphoon.ai


อ้างอิงจาก : opentyphoon.ai

Previous Article

ChatGPT สามารถใช้งานโมเดล GPT-4.1 และ GPT-4.1mini ได้แล้ว

Next Article

ChatGPT Deep Research เชื่อมต่อ GitHub ได้แล้ว

Write a Comment

Leave a Comment

Your email address will not be published. Required fields are marked *