ของดีมากกกกก คนที่อยากได้ AI ถอดเสียงไทย เพิ่งรู้นะเนี่ย
เรื่องที่ 1 — Microsoft ปล่อยโมเดลถอดเสียงไทย ฟรี แม่นเท่า Gemini
VibeVoice-ASR คือโมเดลถอดเสียงตัวใหม่จาก Microsoft Research ที่ปล่อยออกมาต้นปี 2026 และสิ่งที่น่าสนใจมากคือมันรองรับภาษาไทยเต็มตัว พูดไทย ก็ transcribe ออกมาเป็นตัวอักษรไทยได้เลย ไม่ต้องตั้งค่าภาษา
ความแม่นของมันอยู่ที่ประมาณ 8.34% WER ซึ่งใกล้เคียงมากกับ Gemini 2.5 Pro ที่ทำได้ 8.15% แต่ข้อดีคือ Gemini เป็น cloud ต้องส่งเสียงไปให้ Google ส่วน VibeVoice รันบนเครื่องตัวเองได้ เสียงไม่ออกไปไหนเลย แถมฟรีด้วย MIT license ดาวน์โหลด weights ได้จาก Hugging Face
เรื่องที่ 2 — Vibing แอปเล็กๆ จาก community ที่เอาโมเดลนี้มาทำให้ใช้งานได้จริง
Vibing คือแอป dictation open-source ที่ build บน VibeVoice-ASR ปล่อยเวอร์ชันแรก v0.1.0 เมื่อวันที่ 28 มี.ค. ที่ผ่านมา สร้างโดยนักพัฒนาคนเดียวโดยใช้ GitHub Copilot ช่วยเขียนโค้ด
วิธีใช้ง่ายมาก กด Right Option (Mac) หรือ Ctrl+Win (Windows) แล้วพูด เสร็จแล้วมันถอดเสียงให้อัตโนมัติแล้ว copy ไปยัง clipboard รอ Paste ได้เลย ใช้ได้กับทุกแอป ไม่ว่าจะ VS Code, Word, หรือ chat
Microsoft เองยังเข้ามา endorse โปรเจกต์นี้ใน repo ทางการของ VibeVoice ซึ่งหายากมากที่ Big Tech จะโปรโมทงาน community ขนาดนี้
โหลดได้ที่ → https://vibingjustspeakit.github.io/Vibing/
อยากใช้ AI กับงานจริงเป็นระบบ?
เรียน Claude Method — วิธีคิดและลงมือใช้ Claude/AI กับงานจริง ตั้งแต่วันแรก
📍 โพสต้นฉบับบน Facebook: AI กับ Peesamac
