SkillOpt คือของใหม่จาก Microsoft Research ที่เพิ่งเปิด…
เล่าให้เข้าใจง่ายๆ ก่อนนะครับ ปกติเวลาเราจะให้ AI ทำงานเก่งขึ้นมี 2 ทาง ทางแรกคือ fine-tune โมเดล ซึ่งแพงมากและต้องมี GPU ทางที่สองคือเขียน prompt หรือ skill file ดีๆ ให้มัน เช่นบอกว่า "ถ้าเจอเคสนี้ให้ทำแบบนี้นะ" "อย่าลืมเช็คอันนี้ก่อน" ปัญหาคือเราต้องนั่งลองเขียน ลองแก้ ลองรันเอง วันแล้ววันเล่า ใครทำ agent คงเข้าใจว่าเสาร์อาทิตย์หมดไปกับการ tune prompt แบบนี้
SkillOpt บอกว่าไม่ต้องนั่งทำเองแล้ว ให้มันทำแทนแบบเป็นระบบเลย วิธีคิดคือ มองไฟล์คู่มือ (skill.md) เป็นเหมือน "พารามิเตอร์" ใน neural network แล้วใช้กระบวนการเทรนแบบเดียวกัน
ขั้นตอนคือ หนึ่ง เอา agent ไปลองทำงานจริงเช่น answer คำถาม แก้ Excel หรือใช้ tool ต่างๆ แล้วเก็บผลว่าทำได้กี่ข้อ ผิดที่ไหน สอง เอาผลนั้นป้อนให้ AI อีกตัว (เรียกว่า optimizer) อ่านแล้วเสนอว่า "เออ น่าจะแก้ประโยคนี้ในคู่มือเป็นแบบนี้" สาม ก่อนจะรับการแก้นั้น มันจะเอาไปทดสอบกับข้อสอบชุดสำรองก่อนว่าดีขึ้นจริงไหม ถ้าดีขึ้นเก็บไว้ ถ้าไม่ดีโยนทิ้ง แล้วจำไว้ว่าทางนี้ไม่เวิร์ก ทำซ้ำไปเรื่อยๆ เป็นรอบๆ เหมือน epoch ในการเทรนโมเดล
ผลที่ได้คือไฟล์ skill.md หนึ่งไฟล์ที่อ่านเข้าใจได้เป็นภาษาคน ขนาดแค่ 300 ถึง 2000 tokens เอาไปแปะใส่ agent ก็ใช้งานได้เลย ไม่ต้องเทรนโมเดลใหม่ ไม่ต้องจ่ายค่า inference เพิ่ม
ที่ทำให้ผมว้าวคือผลทดลอง เขาทดสอบบน 6 benchmark กับ 7 โมเดล ชนะหรือเสมอทุกช่อง 52 จาก 52 cells บน GPT-5.5 ดีขึ้น 23 ถึง 25 เปอร์เซ็นต์จากแบบไม่มี skill และไฟล์ที่ได้ยัง transferable คือเอาไปใช้กับ Claude หรือ Gemini ก็ยังเวิร์ก
พูดง่ายๆ คือเมื่อก่อนเราเหมือนเชฟที่ลองสูตรเองทุกวันจนเจอสูตรเด็ด SkillOpt เหมือนมีผู้ช่วยทดลองสูตรให้เป็นพันรอบในห้องทดลอง แล้วยื่นสูตรที่ดีที่สุดมาให้เรา
ลองได้ที่ github.com/microsoft/SkillOpt ครับ ใครทำ agent อยู่แนะนำดูจริงๆ
อยากใช้ AI กับงานจริงเป็นระบบ?
เรียน Claude Method — วิธีคิดและลงมือใช้ Claude/AI กับงานจริง ตั้งแต่วันแรก
📍 โพสต้นฉบับบน Facebook: AI กับ Peesamac
