โมเดล OCR อัจฉริยะ รองรับภาษาไทยและอังกฤษ
Typhoon OCR คือโมเดลโอเพ่นซอร์สใหม่ที่ใช้เทคโนโลยี Vision-Language ช่วยดึงข้อมูลจากไฟล์เอกสารและรูปภาพ รองรับทั้งภาษาไทยและอังกฤษ เหมาะสำหรับการสรุปเนื้อหา วิเคราะห์ และต่อยอดข้อมูลจากเอกสารต่างๆ
ข้อจำกัดของระบบ OCR แบบดั้งเดิม
ระบบ OCR แบบดั้งเดิมมักใช้ CNNs และ RNNs หรือ Transformers ในการแปลงภาพเป็นข้อความ แต่ยังมีข้อจำกัดเมื่อใช้งานกับเอกสารจริงที่มีรูปแบบซับซ้อนหรือคุณภาพไม่สม่ำเสมอ เช่น ขาดความเข้าใจโครงสร้างเอกสาร ไม่สามารถตีความรูปภาพได้ และสูญเสีย metadata สำคัญเมื่อแปลง PDF เป็นภาพ
Typhoon OCR ทลายข้อจำกัดและนำเสนอความสามารถที่ใช้งานได้จริง
Typhoon OCR ใช้เทคโนโลยี Vision-Language Models (VLMs) ผสมผสานการรับรู้ภาพเข้ากับความเข้าใจภาษาธรรมชาติ สามารถตีความโครงสร้างเอกสาร เข้าใจเนื้อหา และเจตนาของเอกสาร โดยไม่ต้องพึ่งพากระบวนการแบบฮาร์ดโค้ดที่ซับซ้อน รองรับเอกสารภาษาไทยและอังกฤษที่ใช้งานจริงในชีวิตประจำวันและการทำงาน
รองรับเอกสารที่ใช้งานจริงในชีวิตประจำวัน
Typhoon OCR รองรับเอกสารหลากหลายรูปแบบ ทั้ง PDF และไฟล์ภาพ เช่น JPEG, PNG โดยสามารถรักษาโครงสร้างและความหมายของเอกสารได้อย่างครบถ้วน ไม่ว่าจะเป็นเอกสารทางการหรือเนื้อหาที่ไม่เป็นทางการ
สามารถทดลองใช้งาน Typhoon OCR ได้ที่ https://vision.opentyphoon.ai
อ้างอิงจาก : opentyphoon.ai