LayerAI 宣佈已將 DeepSeek 的先進 AI 模型——DeepSeek-V3 及 DeepSeek-Coder-V2——整合進平台,大幅提升其 AI 輔助編碼、自然語言處理及互動學習工具的能力。
透過引入 DeepSeek-V3 及 DeepSeek-Coder-V2,LayerAI 加強 了平台對語言的理解及編碼能力,有助於代碼生成、除錯及自然語言處理等應用。DeepSeek-Coder-V2 支援 338 種程式語言,並具備 128K 令牌的上下文長度,使 LayerAI 能為複雜編程項目提供先進的代碼生成和除錯工具。
此外,DeepSeek 的多頭潛在注意力和 DeepSeekMoE 架構,令處理大型數據集和長上下文場景時效能更佳,這對於 AI 驅動的編碼工作至關重要。整合 DeepSeek-V3 亦讓 LayerAI 可以帶來更進階的互動學習體驗,為複雜編程概念即時提供反饋及洞見。
這次合作亦促進了社群協作。由於 DeepSeek 兼容 GitHub 等平台,用戶能無縫進行版本控制與 AI 編碼審查流程。LayerAI 計劃進一步針對特定平台場景微調 DeepSeek 模型,例如專門的編程環境或行業語言應用。
DeepSeek 由對沖基金經理梁文鋒於 2023 年創辦,是中國的人工智能新創公司,發展迅速,迅即成為 AI 界的強勁競爭者。
DeepSeek 所研發的先進 AI 模型,尤以 DeepSeek-V3 及 DeepSeek-R1 為代表,無論表現和美國頂級模型看齊,成本卻更低。以 DeepSeek-V3 為例,訓練所需的計算成本不足 600 萬美元,遠低於美國同業。DeepSeek 的 AI 助手亦已超越 ChatGPT,成為美國 Apple App Store 上最高評分的免費應用程式。
這些進展已明顯衝擊全球 AI 產業,導致如 Nvidia 等大型科技公司股價大跌。隨 DeepSeek 最新研發消息公佈,Nvidia、Super Micro Computer 等主要 AI 概念股出現拋售,反映投資者對 AI 市場格局或將改變的憂慮。DeepSeek 的成功引起中國政界關注,彰顯其在推動本土科技自立及應對美國出口限制方面的戰略意義。

