Microsoft MAI-Voice-2 — AI เสียงพูด มีเสียงไทยให้ลองฟรี
Microsoft ออก AI เสียงพูดตัวใหม่ "MAI-Voice-2" แล้ว และคราวนี้มีเสียงไทยให้ลองฟรีด้วยนะทุกคน
เล่าให้ฟังก่อน MAI-Voice-2 คือโมเดล Text-to-Speech (พิมพ์ข้อความแล้วให้ AI อ่านออกมาเป็นเสียงพูด) ตัวล่าสุดจากทีม Microsoft AI ที่นำโดย Mustafa Suleyman เป็นรุ่นต่อจาก MAI-Voice-1 จุดที่ผมว่าน่าสนใจคือมันทำเสียงได้ธรรมชาติขึ้นเยอะ จนในการเทสแบบฟังเทียบกันสองรุ่น (2,500 ครั้ง) คนเลือก MAI-Voice-2 ถึง 72% เลย
ที่เด็ดสำหรับคนไทยคือ มันรองรับ 15 ภาษา รวมภาษาไทยด้วย แถมสลับไทย-อังกฤษกลางประโยคได้ (พวกคำทับศัพท์ที่เราพูดปนกันตลอด) เลยน่าจะ relate กับคอนเทนต์บ้านเรามากกว่าโมเดลฝรั่งหลายตัว
ฟีเจอร์อื่นที่มี
- คุมอารมณ์เสียงได้ ใส่ tag เช่น excited, whispered, sad หรือสไตล์แบบโค้ชสร้างแรงบันดาลใจ นักพากย์กีฬา ก็ได้
- โคลนเสียงได้จากตัวอย่างแค่ 5-60 วินาที (มีระบบขอความยินยอมกันเอาเสียงคนอื่นไปใช้มั่ว)
- รักษาเสียงคนพูดให้เหมือนเดิมตลอดคลิปยาว เหมาะทำ audiobook หรือ podcast
- กำลังจะมีรุ่น Flash ที่เร็วและถูกกว่าตามมา
ลองได้ที่ไหน เข้า MAI Playground (playground.microsoft.ai) ลองพิมพ์ให้มันอ่านได้ฟรีแบบไม่ต้องเขียนโค้ด ส่วนสาย dev ก็ต่อผ่าน Microsoft Foundry ได้เลย
พูดตามตรง ผมว่าข้อดีคือเสียงธรรมชาติและมีไทยให้เล่นจริง แต่ก็มีคนรีวิวว่าบางทีเพลงพื้นหลังดังกลบเสียงพูด และบางสำนัก (อย่าง PCMag) ก็ว่ายังฟังออกว่าเป็นหุ่นยนต์อยู่นิดหน่อย เทียบกับเจ้าอย่าง ElevenLabs ในบางมุม เลยอยากให้ลองฟังเสียงไทยเองก่อนตัดสินใจเอาไปใช้งานจริงครับ
อยากใช้ AI กับงานจริงเป็นระบบ?
เรียน Claude Method — วิธีคิดและลงมือใช้ Claude/AI กับงานจริง ตั้งแต่วันแรก
📍 โพสต้นฉบับบน Facebook: AI กับ Peesamac
