作者:潘釔天 / AI Claude
在《薩爾達傳說》裡,林克需要不斷升級裝備、學習新技能才能對抗最終魔王。現今的 AI 科技戰場,何嘗不是如此?
輝達的「神器」壟斷
在海拉魯大陸上,「大師之劍」是獨一無二的神器(在王者之淚裡其實蠻廢的 XD)。在 AI 的世界裡,輝達公司的 GPU 就像這把「大師之劍」,是訓練強大 AI 必不可少的「神器」。
但輝達不只製造「神器」,還創造了名為 CUDA 的「神器使用指南」。就像林克需要特殊指南才能發揮大師之劍的全部威力,AI 開發者也需要 CUDA 才能充分運用輝達的 GPU。有趣的是,輝達將 CUDA 免費提供給所有開發者,但你必須使用輝達的 GPU 才能執行 CUDA 程式,這就形成了他們的「護城河」。
OpenAI 與 DeepSeek 的較量
如果說 OpenAI 是海拉魯城堡的正統繼承者,那 DeepSeek 就像是在野外獨自生存、自創功法的修煉者。最近,OpenAI 指控 DeepSeek「盜取」了他們的技術,這讓我們想到林克在旅途中「借鑒」各個神廟的古老智慧—究竟是借鑒還是盜取,往往存在爭議。
AI 的修煉之道
在 AI 的修煉過程中,有幾種重要的訓練方法:
- RLHF(來自人類回饋的強化學習):就像林克在每個驛站都能得到一些建議,AI 也通過人類的反饋不斷改進。好的建議被記住,不好的建議被改正,逐步提升能力。
- PPO(近端策略優化):這就像林克練習新武器時,不會一次嘗試所有招式,而是循序漸進地掌握每個動作。每次練習只做小幅度調整,確保穩定進步。
- GPRO(DeepSeek 改良版 PPO):這是 DeepSeek 開發的升級版訓練方法,就像林克在掌握基礎劍法後,能根據敵人的強弱靈活運用不同的戰鬥策略。
科技創新與資源之爭
DeepSeek 的創新之處在於,他們發現了一種特別的修煉方法「思維鏈(CoT)」,讓 AI 能用較少的資源達到接近頂級水準的效果。這就像是林克不用最稀有的裝備,卻能通過精妙的戰術打敗強大的敵人。(左烏納裝備打敗競技場的人馬)
據傳 DeepSeek 擁有 5 萬顆 H100(輝達最強的 GPU),這個數字讓業界震驚。這些 GPU 就像遊戲中的稀有道具,美國政府甚至試圖限制它們的出口。然而,就像任何封鎖都會有漏洞,這些限制似乎並沒有真正阻止中國科技公司取得所需資源。
未來的挑戰與機遇
當前 AI 領域的競爭,就像一場大型開放世界遊戲:
- 輝達掌握著「神器」製造技術
- OpenAI 擁有強大的技術積累
- DeepSeek 則通過創新方法尋找彎道超車的機會