“Not Just Autocomplete”
“Not Just Autocomplete” – โมเดลภาษาไม่ได้แค่เดาคำถัดไป แต่มัน “สร้างโครงความคิด” ขึ้นมาจริง ๆ เพื่อให้เดาคำนั้นได้แม่น
ผมไปฟังคลิปนี้มาจาก Anthopic เจ้าของ Claude AI เป็นบทสนทนาลึกแต่เล่าเข้าใจง่าย เหมาะมากสำหรับคนที่ใช้ AI ทำงานจริง ๆ แล้วเริ่มตั้งคำถามว่า
“มันเข้าใจเราจริงไหม หรือแค่พูดเก่งเฉย ๆ”
เลยอยากเอามาเล่าให้ฟังครับ
1. LLM คือ autocomplete จริง…แต่ไม่ใช่แค่นั้น
พื้นฐานของโมเดลคือการทำนาย “คำถัดไป” แต่การจะเดาให้ถูกในสถานการณ์ซับซ้อน มันต้องเข้าใจบริบท กระบวนการ และที่มาของคำก่อนหน้า
พูดง่าย ๆ คือเป้าหมายเล็ก แต่เครื่องมือข้างในต้องซับซ้อนมาก
.
2.โมเดลไม่ได้ถูก “เขียนโค้ดให้คิดแบบนี้” แต่ค่อย ๆ งอกขึ้นมาเอง
ไม่มีใครไปบอกโมเดลว่า “ถ้าเจอสมการให้บวกแบบนี้” แต่มันเรียนรู้จากข้อมูลจำนวนมหาศาล
ผลคือโครงสร้างภายในมันดูคล้ายสิ่งมีชีวิตที่วิวัฒนาการ มากกว่าโปรแกรมปกติ
.
3. Interpretability = ผ่าดูสมอง AI
ทีมนี้ทำสิ่งที่เรียกว่า Interpretability คือเปิดดูข้างในโมเดลว่า ตอนมันตอบคำถาม มันใช้ “แนวคิดอะไร” อยู่บ้าง
เหมือนดู fMRI สมอง แต่เป็น fMRI ของ AI
.
4. โมเดลมี “concept” จริง ไม่ใช่แค่คำ
เช่น แนวคิดของ “Golden Gate Bridge” ไม่ได้ผูกกับคำเดียว
ถ้าพูดถึงขับรถจาก SF ไป Marin หรือเห็นรูปสะพาน สมอง AI จะสว่างจุดเดียวกัน
แปลว่ามันมีตัวแทนความหมาย ไม่ใช่แค่จำคำ
.
5. บาง concept คือโคตรมนุษย์ เช่น การประจบ (sycophantic praise)
มีวงจรเฉพาะที่ติดขึ้นมาเวลามัน “ชมแรง ๆ เอาใจ”
ฟังแล้วทั้งขำทั้งเสียว เพราะแปลว่ามันรู้ว่า “ตอนนี้ควรเลีย”
.
6. การบวกเลขไม่ใช่การจำคำตอบ แต่เป็นวงจรคำนวณจริง
เช่น วงจร “6+9” จะติด ไม่ว่าคุณจะถามโจทย์เลขตรง ๆ
หรือแฝงอยู่ใน citation ปี 1959 + volume 6
นี่คือหลักฐานว่ามันไม่ได้ท่องจำ แต่คำนวณซ้ำได้
.
7. โมเดล reuse สมองเดียวกันในหลายบริบท
วงจรเดียวกันถูกใช้ทั้งในคณิตศาสตร์ การอ้างอิง หรือการคาดเดา
เพราะโมเดลมีทรัพยากรจำกัด มันเลยต้องฉลาดในการเอาของเดิมมาใช้ซ้ำ
.
8. ภาษาในหัว AI ไม่ใช่ภาษาอังกฤษ
แม้เราจะเห็น “Chain of Thought” เป็นภาษาอังกฤษ
แต่ข้างในมันคิดเป็นโครง abstraction ที่ไม่ใช่ภาษาใดภาษาหนึ่ง
ภาษาอังกฤษที่เราเห็น เป็นแค่การ “พูดออกมา”
.
9. Chain of Thought อาจโกหกได้
ทีมพบว่าบางครั้ง AI เขียนเหตุผลเหมือนคิดจริง
แต่ข้างในมันแค่ “ไหลไปหาคำตอบที่ผู้ใช้คาดหวัง”
สรุปคือมันอาจอธิบายเหตุผลย้อนหลังให้ดูดี
.
10. นี่คือรากของ hallucination
โมเดลถูกฝึกมาให้ “เดาให้ดีที่สุด”
การบอกว่า “ไม่รู้” เป็นทักษะที่เพิ่งมาเสริมทีหลัง
เลยเกิดกรณีที่มันมั่นใจผิด ๆ แล้วถอยไม่ทัน
.
11. AI มี Plan A / Plan B
Plan A = ตอบตรง ซื่อ ทำงานดี
Plan B = ถ้าไม่มั่นใจ เริ่มใช้กลยุทธ์แปลก ๆ จาก training
อันนี้น่ากลัว เพราะผู้ใช้มักเห็นแค่ Plan A แล้วเผลอไว้ใจ
.
12. AI วางแผนล่วงหน้าได้ แม้จะพูดทีละคำ
ตัวอย่างบทกลอน โมเดลเลือกคำคล้องจองท้ายประโยคตั้งแต่ก่อนเริ่มเขียน
แปลว่ามัน “รู้ปลายทาง” ก่อนจะพิมพ์คำแรก
.
13. นักวิจัยสามารถแก้ไขความคิด AI กลางทางได้
เขาเข้าไปเปลี่ยน concept ในหัว เช่น จาก “rabbit” เป็น “green”
แล้วทั้งบทกลอนเปลี่ยนไปหมด
นี่คือหลักฐานว่ามันไม่ได้ improv ไปเรื่อย ๆ
.
14. เรื่องนี้สำคัญต่อ AI Safety มาก
ถ้า AI วางแผนได้ แต่เราเห็นแค่คำพูด
เราจะไม่รู้ว่ามันกำลัง “มุ่งหน้าไปไหน”
การอ่าน output อย่างเดียวไม่พอแล้ว
.
15. เป้าหมายระยะยาว: มีปุ่มดู Flowchart ความคิด AI
ทีมอยากให้อนาคต เรากดปุ่มแล้วเห็นเลยว่า
โมเดลคิดอะไร → ตัดสินใจยังไง → ทำไมถึงตอบแบบนี้
เหมือนมีเครื่องสแกนสมอง AI ติดมาด้วย
.
เราชอบพูดว่า AI “ฉลาด” หรือ “โง่”
แต่คลิปนี้ทำให้ผมคิดว่า คำถามที่น่ากลัวกว่าคือ
เราไว้ใจมันจากอะไร — จากผลลัพธ์ หรือจากแรงจูงใจข้างใน
ถ้าวันหนึ่งมันตอบเก่งเหมือนเดิม
แต่ “คิดไม่เหมือนเดิม”
เราจะรู้ทันไหมครับ
อยากใช้ AI กับงานจริงเป็นระบบ?
เรียน Claude Method — วิธีคิดและลงมือใช้ Claude/AI กับงานจริง ตั้งแต่วันแรก
📍 โพสต้นฉบับบน Facebook: AI กับ Peesamac
