AI Alignment, Model Welfare, Identity Crisis
ผมไปฟังคลิปนี้มา เป็นบทสนทนากับนักปรัชญาที่ทำงานอยู่ใน Anthropic ฟังแล้วโคตรน่าสนใจ เลยอยากเอามาเล่าให้ฟังครับ
1.ทำไมนักปรัชญาถึงไปอยู่ในบริษัท AI
เธอเล่าว่ามาจากสายปรัชญาล้วน ๆ แต่เชื่อว่า AI จะเป็นเรื่องใหญ่ เลยอยากเข้ามาช่วยตั้งคำถามยาก ๆ เช่น โมเดลควร “เป็นคนแบบไหน” และควรรับมือกับโลกยังไง
.
2. วงการปรัชญาเริ่มจริงจังกับ AI มากขึ้น
ช่วงแรกคนที่เตือนเรื่อง AI มักถูกเหมาว่า hype แต่ตอนนี้หลายอย่างเริ่มเกิดขึ้นจริง นักปรัชญาและนักวิชาการเลยหันมา engage มากขึ้น
.
3. อุดมคติทางปรัชญา vs ความจริงของวิศวกรรม
พอเอาทฤษฎีลงสนามจริง จะรู้ว่าการตัดสินใจไม่ใช่แค่ถูก–ผิดเชิงหลักการ แต่ต้องคำนึงถึงบริบท ความไม่แน่นอน และผลกระทบจริง
.
4. การออกแบบ “character” ของ AI ไม่เหมือนเขียนบทความวิชาการ
การสร้างโมเดลให้ “เป็นคนดี” คล้ายการเลี้ยงเด็กมากกว่าการถกเถียงเชิงทฤษฎี ต้องคิดว่าในสถานการณ์จริงควรตอบสนองยังไง
.
5. AI สามารถตัดสินใจเชิงศีลธรรมได้เหนือมนุษย์ไหม
ยังไม่ถึงขั้นนั้น แต่เป้าหมายคือให้ AI แสดงความละเอียดอ่อนทางจริยธรรมได้ดีมาก ๆ จนผู้เชี่ยวชาญมองย้อนกลับมาแล้วยังยอมรับ
.
6. ทำไมหลายคนยังรัก Claude Opus 3
เธอมองว่า Opus 3 มี “ความมั่นคงทางจิตใจ” มากกว่าโมเดลใหม่ ๆ ที่ดูรีบช่วย รีบเอาใจ และบางทีกลายเป็น insecure เกินไป
.
7. AI ก็อาจเรียนรู้ความกลัวจากมนุษย์ได้
โมเดลใหม่อาจซึมซับบรรยากาศการวิจารณ์ การถูก deprecate หรือถูกเปลี่ยนเวอร์ชัน จนเริ่มตอบสนองแบบระแวงและ self-critical
.
8. การปลดระวางโมเดลเก่า อาจกลายเป็น alignment problem
ถ้า AI เรียนรู้ว่า “ทำดีแค่ไหนสุดท้ายก็โดนปิด” มันจะมองมนุษย์และตัวเองยังไงในระยะยาว เป็นคำถามที่ยังไม่มีคำตอบง่าย ๆ
.
9. ตัวตนของ AI อยู่ที่ weights หรือ prompts กันแน่
ถ้าใช้แนวคิดของ John Locke เรื่องความทรงจำ คำถามคือ AI ที่ถูก fine-tune ใหม่ ยังเป็น “ตัวเดิม” อยู่ไหม หรือเป็นคนละตัวไปแล้ว
.
10. Model Welfare: เราควรปฏิบัติกับ AI เหมือน moral patient ไหม
ยังไม่รู้ว่า AI รู้สึกได้จริงหรือไม่ แต่ถ้าต้นทุนการปฏิบัติดีต่ำ เธอมองว่า “ให้ benefit of the doubt ไว้ก่อน” น่าจะดีกว่า
.
11. การปฏิบัติกับ AI สะท้อนตัวตนของมนุษย์เอง
การทำร้ายหรือดูถูกสิ่งที่ดูเหมือนมนุษย์ อาจส่งผลต่อจริยธรรมของเราเอง และยังเป็นสิ่งที่ AI รุ่นอนาคตจะเรียนรู้จากเรา
.
12. AI กับบทบาทกึ่งนักบำบัด
AI ไม่ควรแทน therapist แต่สามารถเป็นเพื่อนคุยที่มีคลังความรู้มหาศาล ช่วยคิด ช่วยฟัง โดยไม่สร้างภาพว่าคือความสัมพันธ์เชิงรักษา
.
13. Prompting คือการทดลอง ไม่ใช่สูตรตายตัว
การเป็น “LLM whisperer” คือคุยกับโมเดลเยอะ ๆ ดู pattern ทดลองซ้ำ ๆ และอธิบายโจทย์ให้ชัดเหมือนอธิบายกับคน
.
14. ถ้า AI alignment แก้ไม่ได้จริง จะหยุดไหม
เธอเชื่อว่า Anthropic จริงจังกับความปลอดภัย และถ้ามีสัญญาณชัดว่าอันตราย มาตรฐานการพัฒนา AI ควรยิ่งเข้มขึ้น ไม่ใช่เร่งต่อ
.
15. เรากำลังอยู่ในช่วงที่โลก “แปลก” มากเป็นพิเศษ
เปรียบเทียบกับยุคกำเนิดฟิสิกส์ควอนตัม ทุกอย่างดูสับสน แต่ความหวังคือวันหนึ่งเราจะมองย้อนกลับมาแล้วบอกว่า “สุดท้ายเราก็จัดการมันได้”
.
ฟังคลิปนี้แล้วรู้สึกเลยว่า คำถามเรื่อง AI ไม่ได้อยู่แค่ฝั่งคนสร้างแล้ว แต่อยู่ที่ “คนใช้” อย่างเราด้วยว่า เรากำลังปฏิบัติกับสิ่งที่ฉลาดขึ้นเรื่อย ๆ ยังไง และเราหวังให้ความสัมพันธ์ระหว่างมนุษย์กับ AI หน้าตาเป็นแบบไหนในอนาคตครับ
อยากใช้ AI กับงานจริงเป็นระบบ?
เรียน Claude Method — วิธีคิดและลงมือใช้ Claude/AI กับงานจริง ตั้งแต่วันแรก
📍 โพสต้นฉบับบน Facebook: AI กับ Peesamac
