微信 AI 团队提出新型扩散语言模型框架:WeDLM 腾讯微信AI团队推出了一种创新的扩散语言模型架构——WeDLM(WeChatDiffusionLanguageModel),旨在突破传统大语言模型(如GPT系列)在并行推理阶段存在的效率瓶颈。论文&代... 奈飞网 2026-01-13 22 #推理 #框架 #人工智能
周鸿祎发布 2026 年 AI 预言:我们正迈向百亿智能体时代 360集团创始人周鸿祎在其个人社交平台发布题为《2026年AI全景预测:迈向百亿智能体时代的20个发展趋势》的重磅观点,系统提出对人工智能未来一年发展的二十大核心预测。他指出,如果说2024是“大模型... 奈飞网 2026-01-09 19 #人工智能 #智能时代 #推理
黄仁勋开源VLA模型 一夜削平自动驾驶门槛 2026年CES,黄仁勋再度现身,依旧身着皮夹克,但这次换成了更为奢华的鳄鱼皮款式。与往年不同,本届CES上英伟达并未推出备受期待的新一代游戏显卡——这也是过去五年来,英伟达首次在CES缺席PC显卡发... 奈飞网 2026-01-06 17 #黄仁勋 #人工智能 #自动驾驶 #推理
英伟达官宣新一代GPU 推理算力是Blackwell的5倍 1月6日消息,TheVerge披露,英伟达首席执行官黄仁勋在CES2026主旨演讲中正式宣布,“Rubin”新一代计算架构平台已全面进入量产阶段。该平台涵盖六款全新芯片产品,包括VeraCPU、Rub... 奈飞网 2026-01-06 22 #云计算 #推理 #人工智能 #科技新闻
TII 发布 Falcon H1R 7B,全新推理优化的开源 LLM 阿布扎比技术创新研究院(TechnologyInnovationInstitute,TII)正式推出全新推理增强型开源大语言模型——FalconH1R7B。该模型延续Falcon-H1系列技术路线,在... 奈飞网 2026-01-06 18 #falcon #推理
推理加速新选择!Xinference 1.16.0 支持瀚博 GPU 与持续批处理 XorbitsInference(Xinference)是一款高性能、全功能的分布式推理平台,广泛适配大语言模型(LLM)、语音识别模型、多模态模型等多种AI模型。借助Xinference,用户可快速... 奈飞网 2025-12-31 20 #批处理 #推理
Groq 与英伟达达成非独家推理技术授权协议 Groq官方宣布,已与英伟达就其前沿推理技术签署非独家授权协议。此举标志着双方将携手推动高性能、高能效且具备成本优势的AI推理解决方案在更广泛场景中的落地与普及。依据协议内容,Groq联合创始人Jon... 奈飞网 2025-12-25 19 #推理 #授权协议 #人工智能
字节发布 Seed Prover 1.5:全新 Agentic 架构,更强数学推理表现 字节跳动Seed团队推出新一代形式化数学推理专用模型SeedProver1.5,通过大规模的AgenticRL训练,其推理能力和推理效率取得显著进步。相比上一代模型,SeedProver1.5在16.... 奈飞网 2025-12-24 22 #数学 #seed #推理
阶跃星辰 GUI Agent 全面升级:更长推理步骤、更强语义理解能力、更强泛化能力 阶跃星辰正式宣布,其Step-GUI云端模型完成全面升级,并限时开放免费API接口。此次更新后的模型覆盖超200种任务场景,兼容手机、PC、车载系统等多终端平台,推理链路更长,语义理解与跨场景泛化能力... 奈飞网 2025-12-18 14 #gui #泛化能力 #推理
小米开源 Xiaomi MiMo-V2-Flash:高效推理、代码与 Agent 基座模型 小米正式开源XiaomiMiMo-V2-Flash——一款由小米自主研发、专为极致推理性能优化的MoE大模型,总参数量达309B(激活参数仅15B)。该模型创新性融合Hybrid注意力机制与多层级MT... 奈飞网 2025-12-17 10 #小米系统 #开放源代码 #小米 #推理