Grok 4 登場：了解 xAI 的最新突破性人工智慧

Grok 4 正式推出了！埃隆·馬斯克聲稱它比大多數研究生還要聰明。在 2025 年 7 月 9 日的直播中亮相，xAI 這款最新的聊天機器人承諾帶來令人驚豔的突破。馬斯克表示，Grok 4 能夠處理從程式編碼到跨領域的複雜問題解決，而速度和效率均超越以前的版本。

這次發表會正值馬斯克的公司內部變革之際，X 和 xAI 的領導層變動以及日益增長的內容審核壓力不斷，但聚光燈依舊停留在 Grok 4 上，看看它能否在 GPT-4o、Claude 3 和 Gemini 等競爭者中脫穎而出。

如果你想知道 Grok 4 有哪些新特性，與之前版本的區別，以及如何利用這些特性，這篇文章將為你詳細解惑。

Grok 4 有多好？與 Grok 3 相比有何不同？

Grok 4 在不使用工具的情況下，在「人類最後考驗」中拿到 25.4% 的成績，超越 o3 和 Gemini 2.5 Pro。使用工具後，這一成績提升到 38.6%；而「Grok 4 Heavy」多代理架構更是讓其達到了 44.4%。

Grok 4 擁有「科學家級的推理能力」。
上下文長度從 Grok 3 的 32,000 個字元增加至 Grok 4 的 130,000 個。
更快、更準確，幻覺減少，GPU 優化更佳。
馬斯克稱 Grok 4 能與 GPT-5 和 Claude 4 Opus 抗衡，並聲言它們已經「用完了測試題」。

xAI 每月在追趕 OpenAI、Google 和 Meta 上投入了大約 10 億美元。3 月份，該公司宣布與 X 正式合併，以共享資源並加速 Grok 的開發，這筆投資似乎正在回報。

Grok 4 是在 xAI 的 Colossus 超級計算機上訓練的，馬斯克稱這使得它具有「科學家級推理能力」。與 Grok 3 相比，新模型現在可以處理長達 130,000 個字元的指令（較之前的 32,000 猛增）。由於更好的 GPU 配置，它還更快，xAI 表示它的準確率更高，幻覺更少。

在發表會上，馬斯克稱 xAI 團隊已經「用完了測試題」，並認為現實本身就是「最終推理測試」。資訊非常明確：xAI 認為 Grok 4 已經準備好在與 GPT-5 和 Claude 4 Opus 等模型的競爭中脫穎而出。

開發者可以使用 Grok 4 嗎？

xAI 推出了兩個版本的 Grok 4，其中一個是為開發者專門設計的。通用版本負責書寫、研究、翻譯以及跨數學、語言和代碼等復雜推理的任務。

面向開發者的版本，Grok 4 Code，旨在與 Cursor 等工具一同工作，協助代碼生成、自動完成、除錯，甚至在你編寫時即抓取錯誤。它被設計為一種為專業人士和業餘愛好者提供的編碼助手，競爭對手包括 GitHub Copilot 和 GPT-4 的代碼解釋器。

初期反饋表明，Grok 4 Code 提供的建議比典型的 AI 編碼工具更為聰慧。它似乎能夠更全面地理解你的整個項目，幫助提供結構和架構建議，並與你的集成開發環境有更深的整合，包括檔案即時編輯和優化建議。

功能	Grok 4 (通用版)	Grok 4 Code (開發者版)
主要特點	– 呼叫功能– 結構化輸出– 高階推理	– 代碼生成及完成– 程式錯誤檢測及除錯
優勢	在自然語言處理、數學、研究、寫作、翻譯上表現強勁	能在如 Cursor 等工具中提供上下文感知的代碼輔助
使用案例	寫作、研究、翻譯、通用任務	簡化開發工作流程、撰寫更清晰快捷的代碼
整合	xAI 助手平台	整合於如 Cursor 等開發工具

Grok 4 還有哪些新功能？

Grok 4 在處理不同類型的內容上有重大升級。不同於只限於文字的 Grok 3，Grok 4 可以理解圖像，並承諾不久將支持視頻。這使它能與 GPT-4o 和 Gemini 2.5 Pro 等頂尖 AI 模型同場競技，但在圖像生成方面，尤其是相對於 Google 的 Imagen 3，仍有不足。

語音對話也在變得更好。回應比以往更自然且不那麼生硬，儘管仍不如像 Gemini Live 這樣流暢。

Grok 4 保留了一項顯著特點：即時網頁訪問的 DeepSearch，特別是從 X 獲取即時訊息的能力。這意味著你可以獲取即時新聞、市場數據或趨勢帖子，而無需離開應用程式或打開瀏覽器。大多數競爭對手至今仍依賴這類訪問。

真正讓 Grok 與眾不同的是其對網路文化的理解能力增強。Grok 4 在抓取網路流行語、笑話及俚語方面比以往更強，使其更能流利運用人們實際在網上交流的語言，賦予其一些其他模型還不具備的個性。

如何訪問 Grok 4？

若要在聊天中嘗試 Grok 4:

前往 Grok 網站，使用你的 Super Grok 帳戶登錄。
在聊天視窗中，點擊聊天框右上角的模型下拉菜單。
選擇 Grok 4 開始使用。

若要通過 API 使用 Grok 4:

前往 x.ai/api 登入 API 控制台。
點擊 API 金鑰，然後創建 API 金鑰。
為你的金鑰命名，點擊保存，你的 Grok API 金鑰就準備好了。
要使用 Grok 4 發起 API 呼叫，請使用在 docs.x.ai 提供的程式範例和接口位置。

Grok 4 值得一試嗎？

根據我們在演示中和公開詳情中看到的，Grok 4 在推理、現實世界模擬和處理即時數據方面顯示了顯著的改進。

在發布活動中，Grok 精確地解析了一份 100 頁的房地產文件，清晰解釋了如停車分配和公寓分佈等內容，無論在深度還是清晰度上均超越了許多其他聊天機器人。

在金融任務中，它更是遙遙領先，通過拉取即時股票數據提供清晰的市場動向總結，這是大多數競爭對手迴避或無法實時處理的。

xAI 還展示了與主流模型不同的能力，諸如在放射學（閱讀 X 光片）、歷史分析和遊戲開發中的應用（幫助在 4 小時內建立一款 3D 射擊遊戲）。

此外，xAI 還推出了更真實的語音輸出（如英語口音助手 Eve）和顯示出 Grok 的編程助手能力，如通過糾錯整個原始碼文件。

Grok 4 的價格是多少？

xAI 推出了超高端的 SuperGrok Heavy 計劃，價格為每月 300 美元或每年 3000 美元，成為主要 AI 提供商中最貴的訂閱計劃。

這一計劃為使用者提供 Grok 4 Heavy 及即將到來的工具的早期訪問，包括八月的編碼模型，九月的多模態代理和十月的視頻生成模型。與 GPT-4o Plus 和 Manus AI 一樣，Grok 4 支持 128K 字元的上下文，而 Claude 和 Gemini 則支援更高。Grok 4 Heavy 的上下文大小目前未知。

Grok 4 的限制

Grok 4 在速度和智能上有所改進，但仍然缺乏關鍵功能，這限制了它成為頂尖的日常 AI 工具。

首先，它不能記憶過去的對話。這意味著如果你離開會話後重新回來，必須重新解釋所有事，與 ChatGPT 等能追蹤長期線索的工具還有差距。

毫無組織的聊天整合方案也令人生憂。取相比 OpenAI 提供使用者保存、標籤和返回特定項目的功能，Grok 缺乏相應的工具，只能一次開一個視窗。

Grok 4 的爭議

Grok 承諾的「言論自由 AI」吸引了一些認為主流聊天機器人過於限制的使用者，同時也引發了一些嚴重問題。在 Grok 4 發佈前夕，xAI 緊急推出內容審核工具，因為機器人生成了具有攻擊性或令人反感的回答。

Grok 4 對 AI 競爭意味著什麼？

隨著 GPT-5 的推出和 Google 加大力度推進 Gemini，Grok 4 加入了這場科技巨頭之間迅速進行的競賽。但與他人專注於安全性和可靠性不同，xAI 將重點放在速度、個性化和給開發者更大自由度方面。

如果 Grok 4 能提供其承諾的優勢，可能會吸引渴望更智能的編碼幫助、即時回答和更少限制的高端使用者。

總的來說，Grok 4 似乎是馬斯克的一步大膽舉措——不可預測，充滿潛力，並顯然旨在顛覆現狀。