該模型僅需一張靜态圖片和一段音頻,即可生成面部表情自然、口型一致、肢體動作絲滑的電影級數字人視頻。
“但中國公司将是最強勁的競争對手,因為他們的電力比美國多得多,而且在硬件建設方面實力超強。”
九方智投子公司入駐“模速空間”,與騰訊雲計算合作開發AI企業工具,推動數字化轉型和AI技術研發。
VeOmni采用以模型為中心的分布式訓練方案,可将復雜的分布式並行邏輯與模型計算解耦,為全模态模型組合設置高效的並行訓練方案。
昆侖萬維8月12日開源升級版世界模型Matrix-Game 2.0,顯著提升跨場景長時視頻的時序一致性,支持連續指令輸入。
據介紹,該模型依托盾構/TBM工程大數據中心773條工程線路,1200億條工程建造數據,構建了通用大模型調度中小模型驅動的垂直領域大模型技術體繫。
小紅書發布中國開源首個視覺語言模型dots.vlm1,基于12億參數視覺編碼器和DeepSeek V3 LLM構建,在視覺感知與推理領域達到準SOTA水平。該模型通過大規模預訓練實現高效性能,標志着AI視覺技術的重要突破。
8月7日,阿里通義千問發布Qwen3-4B-Instruct-2507與Qwen3-4B-Thinking-2507,前者非推理性能超越閉源GPT4.1-Nano,後者推理能力接近30B級模型,已在魔搭社區及HuggingFace開源。
亞馬遜宣布将在Bedrock和Sagemaker平台首次提供OpenAI全新開放權重模型,CEO Andy Jassy稱AWS将成企業AI工具超市。
阿里開源全新文生圖模型Qwen-Image,當天即登上全球最大的AI開源社區HuggingFace的模型榜單首位,成為全球熱度最高的開源模型。
阿里雲開源推出20B參數圖像生成模型Qwen-Image,采用MMDiT架構提升文本渲染與圖像編輯精度。作為通義千問繫列首個圖像基礎模型,其開源特性将加速AI技術研發與産業落地。
小米8月4日發布並開源MiDashengLM-7B多模态大模型,該模型在22個評測集上刷新最佳成績,首Token延遲僅為業界先進模型的25%,同等顯存下數據吞吐效率達20倍以上。小米正推進模型終端設備離線部署升級。
小紅書推出面向SNS場景的定制化大模型RedOne,在8項核心社交任務上平均性能提升14.02%,有害内容曝光率降低11.23%。
上海市經信委7月28日發布措施,将發放3億元模型券和1億元語料券,補貼企業調用大模型API及采購高質量語料,單企最高可獲500萬元。
螞蟻數科7月28日在世界人工智能大會發布Agentar-Fin-R1,基于Qwen3,在FinEval1.0、FinanceIQ等基準上超越DeepSeek-R1等同尺寸模型,並聯合工行、甯波銀行等推出Finova評測體繫。
阿里通義千問7月22日發布Qwen3-235B-A22B-Instruct-2507-FP8旗艦模型升級版,長文本處理能力提升至256K。該非思考模式版本已在魔搭社區和HuggingFace開源平台上線,顯著增強復雜任務處理性能。