Microsoft เพิ่งปล่อยสองฟีเจอร์ใหม่พร้อมกันใน Copilot Researcher…
ก่อนหน้านี้พวก deep research tool ทั้งหลาย ไม่ว่าจะ Perplexity, ChatGPT หรือ Claude ต่างใช้โมเดลเดียวทำทุกอย่างตั้งแต่ค้นหา วิเคราะห์ จนถึงเขียนรายงาน แต่ Critique ทำต่างออกไปโดยแบ่งงานเป็น 2 ช่วง ช่วงแรกโมเดลจาก OpenAI ดึงข้อมูลและร่างรายงานมาก่อน พอได้ draft แล้วส่งให้ Claude จาก Anthropic มาทำหน้าที่ reviewer คนที่สอง ตรวจว่าข้อมูลน่าเชื่อถือไหม ครบถ้วนไหม ทุก claim มี citation รองรับไหม แล้วค่อยออก final report
ส่วน Council คือแนวคิดอีกแบบหนึ่ง แทนที่จะให้โมเดลทำงานต่อกันแบบ Critique Council รัน Claude กับ GPT พร้อมกันเลย แล้วแสดงผลแบบ side-by-side ให้เห็นว่าแต่ละตัวคิดอะไร ตรงไหนเห็นด้วยกัน ตรงไหนมุมมองต่างกัน มี judge model คอยสรุปว่า insight ที่ต่างกันนั้นคืออะไร เหมาะกับงานที่ต้องการมุมมองหลายด้านก่อนตัดสินใจ
ผลที่ได้จาก benchmark DRACO ที่ทดสอบ 100 งานวิจัยซับซ้อน Critique ทำคะแนนได้ 57.4 เทียบกับ Perplexity ที่ดีที่สุดในตลาดได้แค่ 50.4 นำอยู่ 14% ซึ่งห่างกันพอสมควร
จุดที่ทำให้มันน่าสนใจสำหรับองค์กรคือมันดึงข้อมูลจากภายในบริษัทได้ด้วย ทั้ง email ไฟล์ meeting notes ผ่าน M365 แบบ secure ซึ่งตัวอื่นทำแบบนี้ไม่ได้
ข้อระวังคือมันใช้เวลานานกว่าเดิม เพราะต้องรัน 2 โมเดล และยังต้อง human review อยู่ดี ราคาต้องมี Microsoft 365 Copilot license ที่ $30 ต่อคนต่อเดือน แต่ถ้ามี license อยู่แล้ว Frontier program เปิดให้ใช้ฟรีโดยไม่มีค่าเพิ่ม
ผมมองว่านี่คือ signal ชัดมากว่าทิศทาง AI enterprise กำลังเดินไปสู่ระบบ multi-agent จริงๆ ไม่ใช่แค่ดูว่าโมเดลไหนฉลาดกว่า แต่คือจะออกแบบให้โมเดลหลายตัวทำงานร่วมกันยังไงให้ผลออกมาดีที่สุด
อยากใช้ AI กับงานจริงเป็นระบบ?
เรียน Claude Method — วิธีคิดและลงมือใช้ Claude/AI กับงานจริง ตั้งแต่วันแรก
📍 โพสต้นฉบับบน Facebook: AI กับ Peesamac


