News / How-to / รวมค่าย
รวมค่าย · How-to

Typhoon Isan — AI ที่ฟังภาษาอีสานรู้เรื่องจริง ไม่ใช่แค่เดา

Mac
ภีศเดช เพชรน้อย
26 ธ.ค. 2025 · อ่าน 3 นาที
Typhoon Isan — AI ที่ฟังภาษาอีสานรู้เรื่องจริง ไม่ใช่แค่เดา

มันคือ โมเดลถอดเสียงภาษาอีสานแบบจริงจัง มีทั้งข้อมูล มาตรฐานการเขียน และโมเดล ASR ใช้งานได้จริง ไม่ใช่งานโชว์เดโม

เรื่องมันเริ่มจากปัญหาง่ายๆ แต่แก้ยากมาก คือ AI เสียงส่วนใหญ่เข้าใจแต่ไทยกลาง พอเป็นอีสานคือเพี้ยนหนัก เพราะอีสานเป็นภาษาพูด ไม่มีมาตรฐานการเขียนชัด แถมข้อมูลก็แทบไม่มี ทีม Typhoon เลยตัดสินใจทำยาว ทำลึก ทำครบ ตั้งแต่รากภาษา ไม่ได้แค่เอาเสียงไปยัดเทรนโมเดล

สิ่งที่น่าสนใจคือเขาไม่ได้ทำแค่โมเดล แต่สร้าง “โครงสร้างภาษา” ขึ้นมาด้วย มีทั้งชุดข้อมูลเสียงจากคนอีสานหลายจังหวัด การกำหนดวิธีสะกดคำอีสานด้วยอักษรไทย แนวทางถอดเสียงแบบเป็นระบบ พจนานุกรมคำอ่าน ไปจนถึงการจัดกลุ่มสำเนียงอีสาน อันนี้แหละที่ทำให้โมเดลมันฟังรู้เรื่อง ไม่ใช่แค่เดาๆ จากเสียงคล้ายไทยกลาง

ฝั่งโมเดลมี 2 ตัวให้เลือกใช้งาน

ตัวแรกเป็น Real-time เน้นเร็ว หน่วงต่ำ รันบนเครื่องธรรมดาได้ เหมาะกับแคปชันสด ประชุม หรือ voice agent

อีกตัวเป็นสาย Whisper เน้นความแม่น เหมาะกับถอดไฟล์เสียงจริงจัง งานสัมภาษณ์ พอดแคสต์ หรือสื่อ

ผลทดสอบก็ไม่ธรรมดา ค่า error ต่ำพอๆ หรือดีกว่าโมเดลเชิงพาณิชย์ใหญ่ๆ อย่าง Gemini ด้วยซ้ำ อันนี้ผมว่ามันสะท้อนชัดมากว่า ถ้าข้อมูลดี มาตรฐานชัด โมเดลโอเพนซอร์สก็สู้ของใหญ่ได้ โดยเฉพาะภาษาท้องถิ่นที่คนทำเข้าใจบริบทจริง

ภาพที่ผมชอบคือ มันไม่ใช่แค่เรื่องเทคโนโลยี แต่เป็นเรื่องความเท่าเทียมทางภาษา คนอีสานพูดอีสาน แล้ว AI ฟังออก ต่อยอดได้ทั้งงานรัฐ ธุรกิจท้องถิ่น สื่อ การศึกษา หรือแม้แต่ smart city มันคือการบอกว่า ภาษาถิ่นไม่ควรถูกทิ้งไว้ข้างหลังในโลก AI

ลองคิดภาพง่ายๆ เปิด YouTube ฟังพอดแคสต์อีสาน หรือรายการคำต้องเชื่อม พาร์ทเสียงอีกสาน แล้วถอดซับได้ตรง ฟังรู้เรื่องจริง คนอีสานลองเทสดู ผมว่ามีประโยชน์อีกเยอะมาก นี่แค่จุดเริ่มต้นเอง

ชอบการตีโจทย์ของ SCB 10X มาก ขอครบทุกภาษาถิ่นเลย

อยากใช้ AI กับงานจริงเป็นระบบ?

เรียน Claude Method — วิธีคิดและลงมือใช้ Claude/AI กับงานจริง ตั้งแต่วันแรก

ดูคอร์ส →

📍 โพสต้นฉบับบน Facebook: AI กับ Peesamac