Grok 3 ของ xAI ดีกว่าที่คาดไว้ วิธีทดลองใช้ฟรี (ก่อนสมัครสมาชิก)
โมเดลใหม่ของ xAI ขึ้นสู่อันดับต้น ๆ ของกระดานผู้นํา Chatbot Arena และผลการเปรียบเทียบ
Elon Musk เป็นนักลงทุนใน OpenAI เมื่อก่อตั้งขึ้นในปี 2015 เขาได้ตัดความสัมพันธ์กับสตาร์ทอัพโดยสิ้นเชิงโดยกล่าวหาว่าบริษัทได้ออกจากภารกิจที่ไม่แสวงหาผลกําไรเดิม เขาสร้างบริษัท AI ของตัวเอง xAI และด้วยเหตุนี้ โมเดลภาษาขนาดใหญ่ (LLM) ที่เรียกว่า Grok ตอนนี้ บริษัท ได้เปิดตัวโมเดลใหม่ Grok 3 ซึ่งกําลังทะยานขึ้นสู่อันดับต้น ๆ ของกระดานผู้นํา แชทบอท
โกรก 3
เมื่อวันจันทร์ Elon Musk ได้เปิดตัวโมเดล AI ตระกูลล่าสุดของ xAI Grok 3 ผ่านสตรีมสด Grok 3 มีการฝึกอบรมมากกว่า Grok 10 ถึง 2 เท่า ซึ่งเกิดขึ้นได้จากการสร้างศูนย์ข้อมูลในเมมฟิส รัฐเทนนิส ซึ่งเป็นที่ตั้งของ GPU 200,000 ตัว
https://t.co/hEfQ31gANQ
"เรารู้สึกตื่นเต้นที่จะนําเสนอ Grok 3 ซึ่งเราคิดว่ามีความสามารถมากกว่า Grok 2" Musk กล่าวระหว่างการถ่ายทอด สด
ตระกูลโมเดลยังมีโมเดลการให้เหตุผลซึ่งสร้างขึ้นจาก Grok 3 เช่นเดียวกับโมเดลการให้เหตุผลอื่นๆ ในตลาด รวมถึงโมเดล o1 และ o3 ของ OpenAI เบต้า Grok 3 Reasoning คิดนานขึ้นเล็กน้อยเพื่อให้ได้ผลลัพธ์ที่มีคุณภาพ สูงขึ้น
Grok 3 ทุกรุ่นมีไว้เพื่อแข่งขันกับรุ่นชั้นนํา Grok 3 แข่งขันกับ GPT-4o ของ OpenAI และ Gemini ของ Google และ Grok 3 Reasoning แข่งขันกับ 03-mini (สูง), o1 และ Deepseek-R1 ด้วยเวลาน้อยกว่า 24 ชั่วโมงในตลาด ข้อเสนอของ xAI กําลังครองเกณฑ์มาตรฐานและลีดเดอร์บอร์ด
การแสดง
การฝึกอบรมล่วงหน้าของโมเดลสิ้นสุดลงในต้นเดือนมกราคม และแม้ว่าจะยังอยู่ระหว่างการฝึกอบรม แต่ Grok 3 ก็มีประสิทธิภาพเหนือกว่าโมเดลชั้นนําในเกณฑ์มาตรฐาน AI รวมถึง AIME '24 ซึ่งทดสอบการให้เหตุผลทางคณิตศาสตร์ GPQA ซึ่งทดสอบความเชี่ยวชาญด้านวิทยาศาสตร์ โดยเฉพาะชีววิทยา ฟิสิกส์ และเคมี และ LCB ต.ค.-ก.พ. ซึ่งทดสอบความสามารถในการ เขียนโค้ด
โมเดลการให้เหตุผลของ Grok 3 และโมเดลการให้เหตุผลขนาดเล็กของ Grok 3 ยังคงได้รับการพัฒนา แต่จากผลลัพธ์ที่แชร์โดย xAI ระหว่างการสตรีมสด เบต้าของทั้งสองรุ่นสามารถแข่งขันกับ o3-mini (สูง), o1, DeepSeek-R1 และ Gemini-2 Flash Thinking ใน AIME, GPQA และ LCB
นอกเหนือจากเกณฑ์มาตรฐานทางเทคนิคแล้ว Grok 3 ยังไต่อันดับชาร์ตบน Chatbot Arena ซึ่งเป็นแพลตฟอร์มที่คราวด์ซอร์สซิ่งที่ผู้ใช้สามารถประเมิน LLM ได้โดยการแชทกับ LLM สองตัวเคียงข้างกันและเปรียบเทียบคําตอบซึ่งกันและกันโดยไม่ทราบชื่อ ของนางแบบ
BREAKING: Grok-3 เวอร์ชันแรก ๆ (ชื่อรหัส "ช็อคโกแลต") @xAI อันดับ #1 ใน Arena แล้ว! 🏆
Grok-3 คือ:
- รุ่นแรกที่ทําลายคะแนน
1400!- #1 ในทุกหมวดหมู่ เป็นเหตุการณ์สําคัญที่ยากขึ้นเรื่อยๆ
ขอแสดงความยินดีกับ@xAI ในเหตุการณ์สําคัญนี้! ดูกระทู้ 🧵 ... https://t.co/p8z8lccNd5 pic.twitter.com/hShGy8ZN1o
ก่อนการเปิดตัวอย่างเป็นทางการของ Grok 3 รุ่นแรกๆ ได้วิ่งใน Arena ภายใต้ชื่อ "ช็อคโกแลต" และอยู่ในอันดับแรกเหนือ Gemini, GPT-4o, DeepSeek r1 และอื่นๆ ในทุกหมวดหมู่ นอกจากนี้ยังกลายเป็นโมเดลแรกที่ทําลายคะแนน 1400 ในอารีน่า
การค้นหาเชิงลึก
เพื่อตอบสนองความต้องการความสามารถของตัวแทน xAI ยังเปิดตัว DeepSearch ซึ่งคล้ายกับคุณสมบัติการวิจัยเชิงลึกของ OpenAI และ Google ด้วย DeepSearch ผู้ใช้สามารถถามคําถามได้ และ Grok จะคิดให้รอบคอบ ค้นหาเว็บ ส่งออกกระบวนการคิดไปตามที่ดําเนินไป จากนั้นสร้างคําตอบขั้นสุดท้ายที่มีประสิทธิภาพพร้อมข้อมูลและตารางตามความจําเป็น ซึ่งหมายความว่าคุณสามารถขอให้มันค้นคว้าหัวข้อกลับมาอีก 10 นาทีต่อมาและงานจะเสร็จสมบูรณ์
หนึ่งในสิ่งที่โดดเด่นที่สุดคือความสามารถในการเลื่อนดูความคิดของ Grok - "อ่านผ่านจิตใจของ Grok" - และทําความเข้าใจว่ามันมาถึงคําตอบสุดท้ายได้อย่างไร สิ่งนี้ทําให้ประสบการณ์สามารถควบคุมได้มากขึ้นและช่วยให้คุณเข้าใจผลลัพธ์ ได้ดียิ่งขึ้น
วิธีการเข้าถึง
ตั้งแต่วันนี้เป็นต้นไป คุณจะสามารถเข้าถึง Grok บางรุ่นในรุ่นเบต้าได้ Grok 3 มีให้บริการใน X Premium+ ซึ่งยังให้ผู้ใช้เข้าถึงคุณสมบัติล่าสุด ขีดจํากัดการใช้งานที่เพิ่มขึ้น การเข้าถึง DeepSearch และโหมดการให้เหตุผลขั้นสูงโดยคลิกที่ตัวเลือก "คิด" หรือ "สมองใหญ่"
การสมัครสมาชิก X Premium+ มีค่าใช้จ่าย $40 ต่อเดือน เพิ่มขึ้นจาก $22 ก่อนการประกาศ ตามที่ TechCrunch พบ และสมาชิกควรอัปเดตแอปเพื่อดูการอัปเดต
xAI ยังเปิดตัวระดับการสมัครสมาชิกใหม่ SuperGrok ซึ่งคล้ายกับ ChatGPT Pro ซึ่งมีไว้สําหรับแฟนตัวยงที่ต้องการเข้าถึงความสามารถขั้นสูงที่สุดโดยเร็วที่สุด ราคาของแผนนี้ยังไม่ได้รับการเปิดเผย แต่คุณสามารถคาดหวังได้ว่าจะเป็นเพนนีที่มหาศาล เนื่องจากการสมัครสมาชิก Pro ของ OpenAI มีค่าใช้จ่าย $200 ต่อเดือน
สําหรับเวอร์ชันที่สวยงามที่สุด Musk สนับสนุนให้ผู้ใช้รอหนึ่งสัปดาห์ เมื่อถึงเวลานั้น การรวมเสียงใหม่น่าจะพร้อมที่จะปรับใช้
หากคุณต้องการเข้าร่วม Chatbot Arena เพื่อทดลองใช้ Grok 3 โปรดไปที่เว็บไซต์ คลิก Arena เคียงข้างกัน เลือก "early-grok-3" จากเมนูแบบเลื่อนลง แล้ว ป้อนข้อความแจ้งตัวอย่าง แม้ว่าเวทีจะยังคงมี Grok 3 เวอร์ชันแรก แต่ก็ยังเป็นโมเดลที่ทรงพลัง ท้ายที่สุดมันก็ขึ้นสู่จุดสูงสุดของลีดเดอร์บอร์ดเมื่อเทียบกับรุ่นอื่น ๆ ซึ่งอยู่ในเวอร์ชันล่าสุด