• DeepSeek發布新論文 同時開源相關記憶模塊Engram

    該論文為北京大學與DeepSeek共同完成,論文提出條件記憶(conditional memory),通過引入可擴展的查找記憶結構,在等參數、等算力條件下顯著提升模型在知識調用、推理、代碼、數學等任務上的表現。

    科技 大模型 2026-01-13 09:08
  • 機構:阿里千問累計下載量7億 是目前全球開發者采用率最高的開源模型

    HuggingFace數據顯示,阿里千問大模型2025年12月下載量超過榜單第2至8名總和,累計下載量已達7億,成為全球開發者采用率最高的開源模型。

    大模型 科技 2026-01-09 15:25
  • 殷勇調研北京月之暗面:在投融資、場景應用、算力供給等方面加大支持力度

    殷勇詳細了解北京月之暗面科技有限公司大模型産品在智能生成、數據分析等方面取得的技術突破以及下一代大模型技術改進和數據訓練情況,關切詢問企業訴求。

    科技 大模型 2026-01-09 14:20
  • DeepSeek更新R1模型論文至86頁

    更新後的文章進一步詳細展示了LLM(大語言模型)的推理能力可以通過純粹的強化學習(RL)來訓練。

    科技 AI 大模型 2026-01-08 21:59
  • 摩爾線程發布開源大模型分布式訓練仿真工具SimuMax的1.1版本

    該版本在完整繼承v1.0高精度仿真能力的基礎上,實現了從單一工具到一體化全棧工作流平台的重要升級,為大模型訓練的仿真與調優提供繫統化支持。

    大模型 科技 AI 2026-01-08 19:18
  • 智譜今日上市唐傑内部信要求全面回歸基礎模型研究

    1月8日智譜上市,首席科學家唐傑内部信宣布即将發布GLM-5,並全面回歸基礎模型研究,以回應DeepSeek沖擊。

    科技 大模型 2026-01-08 10:34
  • 微創機器人完成全球首例大模型自主手術動物實驗

    微創機器人依托MicroGenius多模态模型完成全球首例大模型自主手術動物實驗,填補技術空白並推動AI醫療跨界融合。

    科技 大模型 2026-01-07 10:56
  • 騰訊混元開源翻譯模型1.5 端側可部署

    12月30日,騰訊混元發布並開源翻譯模型1.5,含1.8B與7B兩款,支持33種語言及5種民漢方言互譯,已上線官網與開源社區供端側部署。

    科技 大模型 2025-12-30 16:43
  • 北京:力争在2026年至2028年間培育10個具有國際影響力的開源項目

    北京市計劃在2026至2028年間培育10個國際影響力開源項目,其中5個為國際引領項目,並推動100個行業大模型落地應用,以強化其全球開源領域地位。

    大模型 科技 2025-12-25 16:29
  • 騰訊元寶:接入DeepSeek後用戶增長超過100倍

    自今年2月接入DeepSeek以來,元寶持續更新DeepSeek的最新模型,用戶規模逐步擴大,12月14日當天使用量達到新高,較年初增長超過100倍。

    AI 科技 大模型 2025-12-24 18:14
  • 字節推出形式化數學推理專用模型Seed Prover 1.5

    字節跳動Seed團隊發布SeedProver1.5,16.5小時内生成IMO2025前5題完整Lean證明,得分35/42,達金牌分數線,技術報告已公開並将開放API。

    AI 科技 大模型 2025-12-24 12:47
  • 北京人形機器人創新中心開源XR-1具身VLA大模型

    基于上述開源成果,能夠推動具身智能行業追尋最本質需求,讓機器人真正在各類應用場景下能幹活並且會幹活,推動國内具身智能行業邁向“全自主、更好用”的新階段。

    科技 大模型 2025-12-19 15:50
  • 字節跳動正式發布豆包大模型1.8

    最新的旗艦模型豆包1.8(Doubao-Seed-1.8)面向多模态Agent場景進行了定向優化。其工具調用能力、復雜指令遵循能力及OS Agent能力均得到增強,提升了模型在處理復雜任務時的規劃與執行水平。

    科技 大模型 2025-12-18 17:52
  • 阿里巴巴:千問APP今天開始接入高德

    據介紹,接入高德後的千問AI助手,開始具備物理世界的理解和行動能力。千問不再僅限于回答問題,更能根據精準、動态的現實世界信息。

    大模型 科技 2025-12-18 10:43
  • 火山引擎:豆包日均使用量超過50萬億

    火山引擎總裁譚待12月18日披露,豆包大模型日均使用量超過50萬億,自發布以來增長417倍。

    科技 大模型 2025-12-18 10:41
  • 階躍星辰發布全新AI Agent繫列模型“Step-GUI”

    包括雲端模型Step-GUI、首個面向GUI Agent的MCP協議,以及業内首個支持手機部署的開源端側模型Step-GUI Edge。

    AI 科技 大模型 2025-12-17 20:01
  • 騰訊混元世界模型1.5今日正式發布

    混元世界模型1.5(WorldPlay)首次開源了業界最繫統、最全面的實時世界模型框架,涵蓋數據、訓練、流式推理部署等全鍊路、全環節,並提出了重構記憶力、長上下文蒸餾、基于3D的自回歸擴散模型強化學習等算法模塊。

    科技 大模型 2025-12-17 14:16
  • 英偉達發布第三代開源人工智能模型

    美國芯片巨頭英偉達發布了一繫列新的開源人工智能模型,並表示這些模型将比其之前的産品更快、更便宜、更智能。

    大模型 科技 海外 2025-12-15 22:27
  • OpenAI發布GPT-5.2繫列 稱“最強專業知識工作大模型”

    12月12日,美國AI公司OpenAI推出GPT-5.2繫列,GDPval測試顯示70.9%結果優于或持平44個職業頂尖人士,金融AI場景提升肉眼可見。

    大模型 科技 2025-12-12 09:46
  • 報道:華為2012實驗室已經成立基礎大模型部

    此前,華為曾發布AI人才招募令,面向全球招募具備卓越學術背景和創新精神的年輕科研人才,擁有原創性科研成果的候選人将被優先考慮。

    大模型 科技 公司 2025-12-09 14:17