Tiny AutoScientist — เครื่องมือใหม่จาก Adaption Labs
Tiny AutoScientist คือเครื่องมือใหม่จาก Adaption Labs ที่เพิ่งเปิดตัวเมื่อวานนี้ (10 มิ.ย.) ซึ่งออกแบบมาเทรนโมเดลเล็ก ๆ ที่มีขนาดต่ำกว่า 10B parameters โดยเฉพาะ ผมว่าน่าสนใจสำหรับทุกคนที่ทำสาย local LLM กับ on-device อยู่ครับ
ก่อนจะเข้าเรื่อง Tiny ขอเล่าตัวแม่ก่อน AutoScientist (เปิดตัวไปเมื่อ พ.ค. ที่ผ่านมา) คือระบบ self-improving ที่ไป automate "research loop" ของการเทรนและ align โมเดลทั้งหมด แทนที่นักวิจัยจะนั่งปรับ hyperparameter, learning rate, data mixing, regularization ทีละตัวเอง มันจะ co-optimize ทั้ง data และ training recipe ไปพร้อมกันในลูปเดียว จนคุณภาพ converge ตามเป้าที่ตั้งไว้
ทีนี้ Tiny AutoScientist คือเวอร์ชันที่จับมาทำกับโมเดลขนาดเล็ก ช่วง 0.8B ถึง 8B ซึ่งเป็นช่วงที่ production ส่วนใหญ่ใช้กันจริง ปัญหาของโมเดลเล็กคือมัน sensitive มาก overfit ง่าย ไวต่อ learning rate กับ data quality สุด ๆ คนปรับมือพลาดง่ายและกินเวลานาน Adaption บอกว่าตัวนี้ย่นเวลาจากหลักเดือนเหลือหลักวัน
เรื่องผลลัพธ์ ผมขอเขียนให้ชัดว่านี่เป็นตัวเลขที่บริษัทเคลมเอง ยังไม่มี independent benchmark นะครับ Adaption เคลม +35% relative performance เหนือ config ที่นักวิจัยของเขาปรับมือเอง (เลขนี้มาจาก win rate 48% ขึ้นเป็น 64% บน eval ที่บริษัทออกแบบเอง) ส่วนเงินทุนก็เคลมว่าระดมรอบ seed ได้ราว 50 ล้านดอลลาร์ช่วงต้นปี
ผู้ก่อตั้งคือ Sara Hooker อดีต VP Research จาก Cohere กับ Sudip Roy thesis ของบริษัทคือ capability ของโมเดลไม่ได้ขึ้นกับ scale อย่างเดียว better training ก็ทรงพลังพอ ๆ กับการมีโมเดลใหญ่กว่าได้ use case ที่เล็งคือ edge deployment, on-device inference, งาน latency-sensitive และ regulated industry ที่ข้อมูลต้องอยู่ภายใน
ฟันธงแบบ honest นะครับ ฝั่งดีคือคนสาย local LLM น่าจะตื่นเต้น เพราะมันแก้ pain ที่โมเดลเล็กฝึกยากจริง ๆ และเข้ากับเทรนด์ cost-efficient agent ที่ edge แต่ที่ต้องระวังคือมันเพิ่งเปิดไม่ถึง 24 ชั่วโมง รีวิวจากผู้ใช้จริงแทบยังไม่มี ส่วนใหญ่ยังเป็นการแชร์ข่าว แถมตัว AutoScientist เวอร์ชันก่อนหน้าก็มีคนเทสแล้วบอกว่าบางทีก็ยังสู้ base model ไม่ได้ ฉะนั้นตัวเลข 35% อย่าเพิ่งเชื่อร้อยเปอร์เซ็นต์ รอ independent benchmark กับมือคนใช้จริงก่อนดีกว่าครับ
อยากใช้ AI กับงานจริงเป็นระบบ?
เรียน Claude Method — วิธีคิดและลงมือใช้ Claude/AI กับงานจริง ตั้งแต่วันแรก
📍 โพสต้นฉบับบน Facebook: AI กับ Peesamac
