รัฐบาลแจก AI พรีเมียมฟรี — ผมแจก AI ฟรีแบบพรีเมียม
รัฐบาลจะแจก AI พรีเมียมให้คุณใช้ฟรี ส่วนผมจะแจก AI ฟรีให้คุณใช้แบบพรีเมียม ต่างกันนิดเดียวแค่สลับด้าน
ผมไปฟังคลิป "ผมทำ AI PASSPORT กวนตีนรัฐบาล" ของ 9arm มา แล้วอยากเอามาเล่าให้ทุกคนฟังครับ เพราะมันสนุกมากแล้วก็เห็นภาพว่า Local AI (AI ที่รันบนเครื่องตัวเองที่บ้าน ไม่ต้องส่งข้อมูลขึ้น cloud ของเจ้าใหญ่) ปี 2026 ไปถึงไหนแล้ว
เรื่องมันคือ รัฐบาลมีโครงการ AI Passport ทุ่มงบ 1,600 ล้าน แจก AI ให้คน 5 ล้านคน ส่วนนายอาร์มก็เลยล้อกลับ ด้วยการสร้างระบบ AI ของตัวเองในชั้นใต้ดินที่บ้าน แล้วแจกให้สมาชิกใช้จริงในชื่อ ARM AI Passport แต่นายอาร์มย้ำเองเลยว่าอย่าเอาไปพาดหัวว่า "ทำดีกว่ารัฐบาล ใช้งบน้อยกว่า" เพราะอันนี้คือทำเอาตลก ทำเอาสนุก ขาดทุนเละเทะ แต่ได้เรียนรู้กลับมา และที่สำคัญคือเขาเป็นคนทำ infra จริง ไม่ใช่แค่พูด
มาเล่าให้ฟังเป็นข้อๆ ครับ
1. ซื้อการ์ดจอครึ่งล้านมารูดบัตร
นายอาร์มไปซื้อ RTX Pro 6000 ราคา 450,000 บาท ซึ่งเป็นการ์ดจอระดับ Data Center (เกรดที่เอาไว้รัน AI ในศูนย์ข้อมูลจริงๆ ไม่ใช่การ์ดเล่นเกม) ที่มีแรมในตัวถึง 96 GB ตอนรูดบัตรก็ดราม่า บัตรเด้ง decline หลายใบจนต้องสลับบัตรไปมา กว่าจะมี SMS เด้งมาให้กด approve ถึงผ่าน นายอาร์มบอกว่าถือการ์ดจอในราคาเท่ารถมือสองหนึ่งคันเดินกลับบ้าน
2. กล่อง Data Center หน้าตาเหมือนกล่องพิซซ่า
นายอาร์มเล่าว่าการ์ดระดับนี้กล่องเป็นกระดาษขาวโง่ๆ มีแค่โลโก้กับสติกเกอร์ serial number ไม่มี marketing สวยๆ เลย เดินผ่านนึกว่ากล่องโดนัทหรือพิซซ่า แล้วเพราะมันแพงมาก ของเลยไม่ได้วางในชั้น ต้องไปรับจากห้องผู้จัดการ เช็ค serial number กันก่อนหยิบส่งให้
3. เสียบการ์ดจอครึ่งล้านลงเครื่องเก่าเขรอะฝุ่น
ฉากที่ผมว่าตลกที่สุดคือนายอาร์มถ่ายรูปเครื่อง server เก่าในชั้นใต้ดินที่ฝุ่นจับเต็มไปหมด แล้วเอาการ์ดจอใบละ 450,000 ยัดเข้าไปในเครื่องนั้นแหละ นายอาร์มบอกว่าทุกคนที่รัน ARM AI Passport อยู่ตอนนี้ ข้อมูลวิ่งมา process ที่เครื่องตัวนี้ในบ้านเขาทุกครั้ง
4. คำนวณบนกระดาษได้ 50 พอเทสจริงรับได้ 200 concurrent
ตอนคำนวณบนกระดาษก่อนลองฮาร์ดแวร์จริง นายอาร์มคิดว่าเครื่องนี้น่าจะเสิร์ฟได้ราว 50 concurrent แต่พอเปิดหลังบ้านดูตอนเทสระบบจริง รับได้ถึง 200 concurrent user (concurrent user = จำนวนคนที่ยิงคำถามเข้ามาใช้พร้อมกัน ณ วินาทีเดียวกัน ยิ่งเยอะยิ่งแปลว่าเครื่องอึด) นายอาร์มเลยสรุปบนจอเลยว่า ARM AI Passport รับได้ 200 concurrent user หรือถ้าคิดแบบต่อชั่วโมงก็ราว 720,000 ครั้งต่อชั่วโมง จากเครื่องเดียวที่บ้าน
5. ใช้ Qwen MoE ตัวฟรีจากจีน
โมเดลที่เอามาเสิร์ฟคือ Qwen 3.6 ตัว MoE ซึ่งนายอาร์มบอกว่าเป็น Local AI ที่ make sense ที่สุดตอนนี้ MoE (Mixture of Experts) คือสถาปัตยกรรมที่แทนที่จะปลุกสมองทั้งก้อนมาตอบทุกคำถาม มันจะเลือกปลุกเฉพาะ "ผู้เชี่ยวชาญ" บางส่วนที่เกี่ยวข้องมาทำงาน เลยเร็วและประหยัดทรัพยากรกว่า โมเดลตัวนี้กินแรมแค่ราว 20-30 GB จาก 96 GB ที่มี ความเร็วตอนรันคนเดียวอยู่ที่ 183 token ต่อวินาที (token คือชิ้นส่วนของคำที่ AI พ่นออกมา ยิ่ง token/วินาทีสูง แปลว่าข้อความวิ่งออกมาเร็ว แทบไม่ต้องรอ) แรมที่เหลืออีกเยอะนายอาร์มเก็บไว้ทำ KV cache (ที่พักความจำชั่วคราวระหว่างบทสนทนา ช่วยให้ AI ไม่ต้องคิดซ้ำของเดิม ยิ่งเหลือเยอะยิ่งรับคนได้พร้อมกันมาก)
6. ทั้งระบบเสร็จใน 4 วัน ด้วย engineer 2 คนทำตอนกลางคืน
นายอาร์มเริ่มเสียบการ์ดเย็นวันอาทิตย์ เสร็จวันพฤหัส รวม 4 วัน โดย engineer แค่ 2 คนที่มีงานประจำอยู่แล้ว มาทำเฉพาะตอนกลางคืน วิธีของเขาคือระหว่างวันที่ออฟฟิศก็คุยดีไซน์โครงสร้างระบบกับ AI ไปเรื่อยๆ พอกลับบ้านได้สเปคที่สรุปแล้วก็ลงมือ implement ต่อ นายอาร์มบอกว่าถ้าเป็นเมื่อก่อนงานสเกลนี้ไม่มีทางเสร็จใน 4 วัน แต่ตอนนี้ AI ช่วยได้เยอะมาก
7. ดีไซน์ด้วยตัวกระจอก แล้วให้ตัวแพงเขียน
จุดนี้ผมว่าน่าสนใจ นายอาร์มเล่าว่าตอนคุยวางโครงสร้างระบบ เขาไม่ได้ใช้ตัวแพง แต่ใช้โมเดล local ตัวเล็กฟรีนี่แหละช่วยวางโครงก่อน พอได้สเปคแล้วค่อยเอาไปให้ Claude เขียนโค้ดจริง นายอาร์มบอกว่าเทียบกับให้ Sonnet ทำทั้งหมดตั้งแต่ดีไซน์ยันเขียน ผลออกมาไม่ต่างกัน แต่วิธีนี้เซฟ token (เซฟค่าใช้จ่ายของ AI ตัวแพง) ได้เยอะกว่ามาก
8. แจก API key ให้เอาไป run AI ของตัวเอง
เฟสที่นายอาร์มบอกว่ายากกว่าแค่ทำแชทคือการแจก API key 100 ตัว (API key = กุญแจที่ให้คนเอาไปเชื่อมต่อ AI ของเขาเข้ากับโปรแกรมตัวเอง) ให้คนเอาไปใช้กับ Claude Code หรืองาน automation ของตัวเอง แทนที่จะต้องจ่าย OpenAI ตอนนี้นายอาร์มตั้งลิมิตกันคนสแปมไว้ก่อน แต่บอกว่าจะค่อยๆ ปลดให้ใช้ได้เหลือๆ เพราะดูแล้วเครื่องยังรับได้อีกเยอะ
9. เรื่อง privacy พูดตรงๆ
นายอาร์มบอกตรงๆ เลยว่าฝั่งแชทมีเก็บข้อมูลที่คนคุยกับมัน (แต่ย้ำว่าเขาไม่อ่าน แค่แจ้งให้ทราบว่าแพลตฟอร์มมันเก็บ) ส่วนฝั่ง API key ไม่เก็บอะไรเลย เขาเห็นแค่ metadata ว่าใครใช้ไปกี่ token เท่านั้น แล้วก็เปิดหลังบ้านโชว์ให้ดูเลยว่าใครใช้เท่าไหร่
สิ่งที่ผมชอบในคลิปนี้คือมันโชว์ให้เห็นว่ายุคนี้ engineer 2 คนทำงานกลางคืน 4 วัน เสิร์ฟคนหลักร้อยได้จริงด้วย AI ช่วย แต่นายอาร์มก็ honest มากว่านี่คือ scale เล็ก ไม่ใช่ 5 ล้านคน อย่าเอาไปด่ารัฐบาลแบบเทียบกันตรงๆ
ผมก็เห็นว่าจุดที่น่าคิดที่สุดไม่ใช่เรื่องว่าใครเก่งกว่าใคร แต่คือยุคนี้ Local AI ตัวฟรีจากจีน บวกกับ AI ช่วยเขียนโค้ด ทำให้คนสองคนทำของที่เมื่อก่อนต้องใช้ทีมใหญ่ได้แล้ว ทุกคนคิดว่า Local AI แบบนี้จะมาแทนการจ่าย AI พรีเมียมรายเดือนได้แค่ไหนครับ
ไปฟังเต็มๆ ได้ที่ https://www.youtube.com/watch?v=ZUkVeXmD-Ek
อยากใช้ AI กับงานจริงเป็นระบบ?
เรียน Claude Method — วิธีคิดและลงมือใช้ Claude/AI กับงานจริง ตั้งแต่วันแรก
📍 โพสต้นฉบับบน Facebook: AI กับ Peesamac
