ค้นหาเว็บไซต์

Grok 3 ของ xAI ดีกว่าที่คาดไว้ วิธีทดลองใช้ฟรี (ก่อนสมัครสมาชิก)


โมเดลใหม่ของ xAI ขึ้นสู่อันดับต้น ๆ ของกระดานผู้นํา Chatbot Arena และผลการเปรียบเทียบ

Elon Musk เป็นนักลงทุนใน OpenAI เมื่อก่อตั้งขึ้นในปี 2015 เขาได้ตัดความสัมพันธ์กับสตาร์ทอัพโดยสิ้นเชิงโดยกล่าวหาว่าบริษัทได้ออกจากภารกิจที่ไม่แสวงหาผลกําไรเดิม เขาสร้างบริษัท AI ของตัวเอง xAI และด้วยเหตุนี้ โมเดลภาษาขนาดใหญ่ (LLM) ที่เรียกว่า Grok ตอนนี้ บริษัท ได้เปิดตัวโมเดลใหม่ Grok 3 ซึ่งกําลังทะยานขึ้นสู่อันดับต้น ๆ ของกระดานผู้นํา แชทบอท

โกรก 3

เมื่อวันจันทร์ Elon Musk ได้เปิดตัวโมเดล AI ตระกูลล่าสุดของ xAI Grok 3 ผ่านสตรีมสด Grok 3 มีการฝึกอบรมมากกว่า Grok 10 ถึง 2 เท่า ซึ่งเกิดขึ้นได้จากการสร้างศูนย์ข้อมูลในเมมฟิส รัฐเทนนิส ซึ่งเป็นที่ตั้งของ GPU 200,000 ตัว

"เรารู้สึกตื่นเต้นที่จะนําเสนอ Grok 3 ซึ่งเราคิดว่ามีความสามารถมากกว่า Grok 2" Musk กล่าวระหว่างการถ่ายทอด สด

ตระกูลโมเดลยังมีโมเดลการให้เหตุผลซึ่งสร้างขึ้นจาก Grok 3 เช่นเดียวกับโมเดลการให้เหตุผลอื่นๆ ในตลาด รวมถึงโมเดล o1 และ o3 ของ OpenAI เบต้า Grok 3 Reasoning คิดนานขึ้นเล็กน้อยเพื่อให้ได้ผลลัพธ์ที่มีคุณภาพ สูงขึ้น

Grok 3 ทุกรุ่นมีไว้เพื่อแข่งขันกับรุ่นชั้นนํา Grok 3 แข่งขันกับ GPT-4o ของ OpenAI และ Gemini ของ Google และ Grok 3 Reasoning แข่งขันกับ 03-mini (สูง), o1 และ Deepseek-R1 ด้วยเวลาน้อยกว่า 24 ชั่วโมงในตลาด ข้อเสนอของ xAI กําลังครองเกณฑ์มาตรฐานและลีดเดอร์บอร์ด 

การแสดง 

การฝึกอบรมล่วงหน้าของโมเดลสิ้นสุดลงในต้นเดือนมกราคม และแม้ว่าจะยังอยู่ระหว่างการฝึกอบรม แต่ Grok 3 ก็มีประสิทธิภาพเหนือกว่าโมเดลชั้นนําในเกณฑ์มาตรฐาน AI รวมถึง AIME '24 ซึ่งทดสอบการให้เหตุผลทางคณิตศาสตร์ GPQA ซึ่งทดสอบความเชี่ยวชาญด้านวิทยาศาสตร์ โดยเฉพาะชีววิทยา ฟิสิกส์ และเคมี และ LCB ต.ค.-ก.พ. ซึ่งทดสอบความสามารถในการ เขียนโค้ด

โมเดลการให้เหตุผลของ Grok 3 และโมเดลการให้เหตุผลขนาดเล็กของ Grok 3 ยังคงได้รับการพัฒนา แต่จากผลลัพธ์ที่แชร์โดย xAI ระหว่างการสตรีมสด เบต้าของทั้งสองรุ่นสามารถแข่งขันกับ o3-mini (สูง), o1, DeepSeek-R1 และ Gemini-2 Flash Thinking ใน AIME, GPQA และ LCB 

นอกเหนือจากเกณฑ์มาตรฐานทางเทคนิคแล้ว Grok 3 ยังไต่อันดับชาร์ตบน Chatbot Arena ซึ่งเป็นแพลตฟอร์มที่คราวด์ซอร์สซิ่งที่ผู้ใช้สามารถประเมิน LLM ได้โดยการแชทกับ LLM สองตัวเคียงข้างกันและเปรียบเทียบคําตอบซึ่งกันและกันโดยไม่ทราบชื่อ ของนางแบบ

ก่อนการเปิดตัวอย่างเป็นทางการของ Grok 3 รุ่นแรกๆ ได้วิ่งใน Arena ภายใต้ชื่อ "ช็อคโกแลต" และอยู่ในอันดับแรกเหนือ Gemini, GPT-4o, DeepSeek r1 และอื่นๆ ในทุกหมวดหมู่ นอกจากนี้ยังกลายเป็นโมเดลแรกที่ทําลายคะแนน 1400 ในอารีน่า 

การค้นหาเชิงลึก

เพื่อตอบสนองความต้องการความสามารถของตัวแทน xAI ยังเปิดตัว DeepSearch ซึ่งคล้ายกับคุณสมบัติการวิจัยเชิงลึกของ OpenAI และ Google ด้วย DeepSearch ผู้ใช้สามารถถามคําถามได้ และ Grok จะคิดให้รอบคอบ ค้นหาเว็บ ส่งออกกระบวนการคิดไปตามที่ดําเนินไป จากนั้นสร้างคําตอบขั้นสุดท้ายที่มีประสิทธิภาพพร้อมข้อมูลและตารางตามความจําเป็น ซึ่งหมายความว่าคุณสามารถขอให้มันค้นคว้าหัวข้อกลับมาอีก 10 นาทีต่อมาและงานจะเสร็จสมบูรณ์ 

หนึ่งในสิ่งที่โดดเด่นที่สุดคือความสามารถในการเลื่อนดูความคิดของ Grok - "อ่านผ่านจิตใจของ Grok" - และทําความเข้าใจว่ามันมาถึงคําตอบสุดท้ายได้อย่างไร สิ่งนี้ทําให้ประสบการณ์สามารถควบคุมได้มากขึ้นและช่วยให้คุณเข้าใจผลลัพธ์ ได้ดียิ่งขึ้น

วิธีการเข้าถึง

ตั้งแต่วันนี้เป็นต้นไป คุณจะสามารถเข้าถึง Grok บางรุ่นในรุ่นเบต้าได้ Grok 3 มีให้บริการใน X Premium+ ซึ่งยังให้ผู้ใช้เข้าถึงคุณสมบัติล่าสุด ขีดจํากัดการใช้งานที่เพิ่มขึ้น การเข้าถึง DeepSearch และโหมดการให้เหตุผลขั้นสูงโดยคลิกที่ตัวเลือก "คิด" หรือ "สมองใหญ่"

การสมัครสมาชิก X Premium+ มีค่าใช้จ่าย $40 ต่อเดือน เพิ่มขึ้นจาก $22 ก่อนการประกาศ ตามที่ TechCrunch พบ และสมาชิกควรอัปเดตแอปเพื่อดูการอัปเดต 

xAI ยังเปิดตัวระดับการสมัครสมาชิกใหม่ SuperGrok ซึ่งคล้ายกับ ChatGPT Pro ซึ่งมีไว้สําหรับแฟนตัวยงที่ต้องการเข้าถึงความสามารถขั้นสูงที่สุดโดยเร็วที่สุด ราคาของแผนนี้ยังไม่ได้รับการเปิดเผย แต่คุณสามารถคาดหวังได้ว่าจะเป็นเพนนีที่มหาศาล เนื่องจากการสมัครสมาชิก Pro ของ OpenAI มีค่าใช้จ่าย $200 ต่อเดือน 

สําหรับเวอร์ชันที่สวยงามที่สุด Musk สนับสนุนให้ผู้ใช้รอหนึ่งสัปดาห์ เมื่อถึงเวลานั้น การรวมเสียงใหม่น่าจะพร้อมที่จะปรับใช้ 

หากคุณต้องการเข้าร่วม Chatbot Arena เพื่อทดลองใช้ Grok 3 โปรดไปที่เว็บไซต์ คลิก Arena เคียงข้างกัน เลือก "early-grok-3" จากเมนูแบบเลื่อนลง แล้ว ป้อนข้อความแจ้งตัวอย่าง แม้ว่าเวทีจะยังคงมี Grok 3 เวอร์ชันแรก แต่ก็ยังเป็นโมเดลที่ทรงพลัง ท้ายที่สุดมันก็ขึ้นสู่จุดสูงสุดของลีดเดอร์บอร์ดเมื่อเทียบกับรุ่นอื่น ๆ ซึ่งอยู่ในเวอร์ชันล่าสุด