Grok 4 正式推出了!埃隆·馬斯克聲稱它比大多數研究生還要聰明。在 2025 年 7 月 9 日的直播中亮相,xAI 這款最新的聊天機器人承諾帶來令人驚豔的突破。馬斯克表示,Grok 4 能夠處理從程式編碼到跨領域的複雜問題解決,而速度和效率均超越以前的版本。
這次發表會正值馬斯克的公司內部變革之際,X 和 xAI 的領導層變動以及日益增長的內容審核壓力不斷,但聚光燈依舊停留在 Grok 4 上,看看它能否在 GPT-4o、Claude 3 和 Gemini 等競爭者中脫穎而出。
如果你想知道 Grok 4 有哪些新特性,與之前版本的區別,以及如何利用這些特性,這篇文章將為你詳細解惑。
Grok 4 有多好?與 Grok 3 相比有何不同?
Grok 4 在不使用工具的情況下,在「人類最後考驗」中拿到 25.4% 的成績,超越 o3 和 Gemini 2.5 Pro。使用工具後,這一成績提升到 38.6%;而「Grok 4 Heavy」多代理架構更是讓其達到了 44.4%。
- Grok 4 擁有「科學家級的推理能力」。
- 上下文長度從 Grok 3 的 32,000 個字元增加至 Grok 4 的 130,000 個。
- 更快、更準確,幻覺減少,GPU 優化更佳。
- 馬斯克稱 Grok 4 能與 GPT-5 和 Claude 4 Opus 抗衡,並聲言它們已經「用完了測試題」。
xAI 每月在追趕 OpenAI、Google 和 Meta 上投入了大約 10 億美元。3 月份,該公司宣布與 X 正式合併,以共享資源並加速 Grok 的開發,這筆投資似乎正在回報。
Grok 4 是在 xAI 的 Colossus 超級計算機上訓練的,馬斯克稱這使得它具有「科學家級推理能力」。與 Grok 3 相比,新模型現在可以處理長達 130,000 個字元的指令(較之前的 32,000 猛增)。由於更好的 GPU 配置,它還更快,xAI 表示它的準確率更高,幻覺更少。
在發表會上,馬斯克稱 xAI 團隊已經「用完了測試題」,並認為現實本身就是「最終推理測試」。資訊非常明確:xAI 認為 Grok 4 已經準備好在與 GPT-5 和 Claude 4 Opus 等模型的競爭中脫穎而出。
開發者可以使用 Grok 4 嗎?
xAI 推出了兩個版本的 Grok 4,其中一個是為開發者專門設計的。通用版本負責書寫、研究、翻譯以及跨數學、語言和代碼等復雜推理的任務。
面向開發者的版本,Grok 4 Code,旨在與 Cursor 等工具一同工作,協助代碼生成、自動完成、除錯,甚至在你編寫時即抓取錯誤。它被設計為一種為專業人士和業餘愛好者提供的編碼助手,競爭對手包括 GitHub Copilot 和 GPT-4 的代碼解釋器。
初期反饋表明,Grok 4 Code 提供的建議比典型的 AI 編碼工具更為聰慧。它似乎能夠更全面地理解你的整個項目,幫助提供結構和架構建議,並與你的集成開發環境有更深的整合,包括檔案即時編輯和優化建議。
功能 | Grok 4 (通用版) | Grok 4 Code (開發者版) |
---|---|---|
主要特點 | – 呼叫功能– 結構化輸出– 高階推理 | – 代碼生成及完成– 程式錯誤檢測及除錯 |
優勢 | 在自然語言處理、數學、研究、寫作、翻譯上表現強勁 | 能在如 Cursor 等工具中提供上下文感知的代碼輔助 |
使用案例 | 寫作、研究、翻譯、通用任務 | 簡化開發工作流程、撰寫更清晰快捷的代碼 |
整合 | xAI 助手平台 | 整合於如 Cursor 等開發工具 |
Grok 4 還有哪些新功能?
Grok 4 在處理不同類型的內容上有重大升級。不同於只限於文字的 Grok 3,Grok 4 可以理解圖像,並承諾不久將支持視頻。這使它能與 GPT-4o 和 Gemini 2.5 Pro 等頂尖 AI 模型同場競技,但在圖像生成方面,尤其是相對於 Google 的 Imagen 3,仍有不足。
語音對話也在變得更好。回應比以往更自然且不那麼生硬,儘管仍不如像 Gemini Live 這樣流暢。
Grok 4 保留了一項顯著特點:即時網頁訪問的 DeepSearch,特別是從 X 獲取即時訊息的能力。這意味著你可以獲取即時新聞、市場數據或趨勢帖子,而無需離開應用程式或打開瀏覽器。大多數競爭對手至今仍依賴這類訪問。
真正讓 Grok 與眾不同的是其對網路文化的理解能力增強。Grok 4 在抓取網路流行語、笑話及俚語方面比以往更強,使其更能流利運用人們實際在網上交流的語言,賦予其一些其他模型還不具備的個性。
如何訪問 Grok 4?
若要在聊天中嘗試 Grok 4:
- 前往 Grok 網站,使用你的 Super Grok 帳戶登錄。
- 在聊天視窗中,點擊聊天框右上角的模型下拉菜單。
- 選擇 Grok 4 開始使用。
若要通過 API 使用 Grok 4:
- 前往 x.ai/api 登入 API 控制台。
- 點擊 API 金鑰,然後創建 API 金鑰。
- 為你的金鑰命名,點擊保存,你的 Grok API 金鑰就準備好了。
- 要使用 Grok 4 發起 API 呼叫,請使用在 docs.x.ai 提供的程式範例和接口位置。
Grok 4 值得一試嗎?
根據我們在演示中和公開詳情中看到的,Grok 4 在推理、現實世界模擬和處理即時數據方面顯示了顯著的改進。
在發布活動中,Grok 精確地解析了一份 100 頁的房地產文件,清晰解釋了如停車分配和公寓分佈等內容,無論在深度還是清晰度上均超越了許多其他聊天機器人。
在金融任務中,它更是遙遙領先,通過拉取即時股票數據提供清晰的市場動向總結,這是大多數競爭對手迴避或無法實時處理的。
xAI 還展示了與主流模型不同的能力,諸如在放射學(閱讀 X 光片)、歷史分析和遊戲開發中的應用(幫助在 4 小時內建立一款 3D 射擊遊戲)。
此外,xAI 還推出了更真實的語音輸出(如英語口音助手 Eve)和顯示出 Grok 的編程助手能力,如通過糾錯整個原始碼文件。
Grok 4 的價格是多少?
xAI 推出了超高端的 SuperGrok Heavy 計劃,價格為每月 300 美元或每年 3000 美元,成為主要 AI 提供商中最貴的訂閱計劃。
這一計劃為使用者提供 Grok 4 Heavy 及即將到來的工具的早期訪問,包括八月的編碼模型,九月的多模態代理和十月的視頻生成模型。與 GPT-4o Plus 和 Manus AI 一樣,Grok 4 支持 128K 字元的上下文,而 Claude 和 Gemini 則支援更高。Grok 4 Heavy 的上下文大小目前未知。
Grok 4 的限制
Grok 4 在速度和智能上有所改進,但仍然缺乏關鍵功能,這限制了它成為頂尖的日常 AI 工具。
首先,它不能記憶過去的對話。這意味著如果你離開會話後重新回來,必須重新解釋所有事,與 ChatGPT 等能追蹤長期線索的工具還有差距。
毫無組織的聊天整合方案也令人生憂。取相比 OpenAI 提供使用者保存、標籤和返回特定項目的功能,Grok 缺乏相應的工具,只能一次開一個視窗。
Grok 4 的爭議
Grok 承諾的「言論自由 AI」吸引了一些認為主流聊天機器人過於限制的使用者,同時也引發了一些嚴重問題。在 Grok 4 發佈前夕,xAI 緊急推出內容審核工具,因為機器人生成了具有攻擊性或令人反感的回答。
Grok 4 對 AI 競爭意味著什麼?
隨著 GPT-5 的推出和 Google 加大力度推進 Gemini,Grok 4 加入了這場科技巨頭之間迅速進行的競賽。但與他人專注於安全性和可靠性不同,xAI 將重點放在速度、個性化和給開發者更大自由度方面。
如果 Grok 4 能提供其承諾的優勢,可能會吸引渴望更智能的編碼幫助、即時回答和更少限制的高端使用者。
總的來說,Grok 4 似乎是馬斯克的一步大膽舉措——不可預測,充滿潛力,並顯然旨在顛覆現狀。