GPT-Realtime-2 ของ OpenAI เพิ่งเปิดตัว ผมเพิ่งได้ดูคลิปเดโมเสร็จ…
มันคือ voice model ตัวแรกของ OpenAI ที่มี reasoning ระดับ GPT-5 ฟังคิดพูดทำงานพร้อมกันได้แบบ realtime ไม่ใช่ระบบเก่าที่แยกขั้นตอน ฟังเสียง แปลงเป็นข้อความ ส่ง LLM แล้วแปลงกลับเป็นเสียงอีกที แต่เป็น loop เดียวต่อเนื่อง ขัดจังหวะได้ แก้คำพูดกลางทางได้ เรียก tool หลายตัวพร้อมกันได้
ที่ผมว่าเด็ดสุดคือ preambles คือมันพูดสั้นๆ ระหว่างคิดเช่น เดี๋ยวเช็คให้ก่อนนะ หรือ กำลังอัพเดทข้อมูลให้ เพื่อซ่อน latency ฟังแล้วเป็นธรรมชาติเหมือนคุยกับคนจริงๆ ไม่ใช่หุ่นยนต์ที่เงียบไปเฉยๆ ตอนกำลังประมวลผล
ในเดโมผู้บรรยายพูดฝรั่งเศสแล้วสลับเยอรมันกลางทาง agent แปลเป็นอังกฤษได้ลื่นไหลมาก แล้วก็สั่งให้เช็คปฏิทินก่อนประชุม Sablecrest Robotics อีก 12 นาที สั่งอัพเดท CRM ด้วยสรุปการประชุม มันทำได้หมดและอธิบายขั้นตอนให้ฟังด้วย เหมือนผู้ช่วยที่ฟังตลอดเวลาแต่ไม่ขัดจังหวะจนกว่าจะเรียก
OpenAI ยังเปิดตัว GPT-Realtime-Translate แปลเสียง 70+ ภาษา input 13 ภาษา output แบบ realtime กับ GPT-Realtime-Whisper ถอดเสียง low-latency มาด้วยพร้อมกัน รวมแล้ว 3 ตัวคุมตั้งแต่ฟัง คิด แปล ตอบ ครบ pipeline
มี case ที่ผมว่าน่าสนคือ Zillow บอกว่าใช้ตัวนี้แล้ว success rate ในงานจริงขึ้นจาก 69% เป็น 95% บวก 26 จุด นี่คือเลขที่บอกว่ามันไม่ใช่ demo เท่ๆ แล้ว แต่ production ready จริง
ราคา API อยู่ที่ $32 ต่อ 1M audio input tokens และ $64 ต่อ output Translate $0.034 ต่อนาที Whisper $0.017 ต่อนาที ติดอย่างเดียวคือยังเป็น API only ใน ChatGPT ยังไม่มี
ผมว่า impact อันแรกที่จะเห็นคือ call center กับงานล่ามแปลภาษา เพราะ solopreneur คนเดียวก็ build voice agent ที่ฉลาด พูดได้หลายภาษา เรียก tool ได้ ขึ้นมาเองได้แล้ว ราคาต่อนาทีไม่ใช่ต่อ agent ต่อเดือน
แต่ที่ผมตื่นเต้นมากกว่านั้นคือภาพที่ใหญ่กว่า voice เริ่มฉลาดพอจะเป็นอินเตอร์เฟซหลักของ software จริงๆ ไม่ต้องพิมพ์ ไม่ต้องคลิก พูดอย่างเดียว แล้วมันคิดและทำให้ได้ ถ้า trend นี้แรงต่อ อีก 2-3 ปี วิธีที่เราใช้คอมอาจจะเปลี่ยนหน้าตาไปเลย
อ่านเต็มๆ ที่ openai.com/index/advancing-voice-intelligence-with-new-models-in-the-api/
อยากใช้ AI กับงานจริงเป็นระบบ?
เรียน Claude Method — วิธีคิดและลงมือใช้ Claude/AI กับงานจริง ตั้งแต่วันแรก
📍 โพสต้นฉบับบน Facebook: AI กับ Peesamac
