Reports
AI-generated structured vendor updates
思科与英特尔合作推出统一边缘平台
思科推出基于英特尔Xeon 6 SoC的Unified Edge平台,针对体育与媒体行业提供边缘AI处理能力。该方案整合网络、安全与计算功能,支持实时粉丝体验与远程制作。
微软联合日本本土运营商构建主权AI基础设施
微软宣布未来四年在日投资100亿美元,核心是与日本樱花互联网和软银合作,通过Azure提供由本土运营商管理的GPU算力服务,确保数据驻留日本。此举旨在满足日本对数据主权和合规性要求严格的AI工作负载需求。
Anthropic与澳大利亚政府签署MOU,深化AI安全研究及区域投资
Anthropic与澳大利亚政府签署谅解备忘录,将在AI安全研究、经济影响评估及基础设施投资方面合作。此举包括向澳研究机构提供300万澳元API额度,并计划在悉尼设立办公室,标志着其亚太战略的正式启动。
Anthropic收购Vercept强化Claude在真实应用中的感知与交互能力
Anthropic收购专注于AI感知与交互的初创公司Vercept,旨在解决AI在真实软件环境中“看”与“操作”的难题,直接提升Claude模型在复杂工作流中的“计算机使用”能力。此次收购是其继Bun之后,围绕AI Agent能力进行的关键技术整合。
Anthropic在悉尼设立亚太第四办公室,探索本地计算能力
Anthropic宣布将在澳大利亚悉尼设立其亚太区第四个办公室,以服务澳新市场。公司计划深化与当地机构的合作,并探索通过第三方合作伙伴在澳大利亚扩展计算能力,以满足企业数据驻留需求。
Anthropic联合谷歌与博通锁定千兆瓦级下一代TPU算力
Anthropic宣布与谷歌及博通达成新协议,锁定数千兆瓦的下一代TPU算力,预计2027年上线。此举旨在支撑其前沿Claude模型的训练与推理,并满足全球客户激增的需求。该合作是Anthropic对美国计算基础设施500亿美元投资承诺的重大扩展。
NVIDIA推动物理AI在机器人领域的技术整合
NVIDIA在机器人周展示物理AI技术突破,通过Isaac Sim模拟平台和Jetson Orin边缘模块加速农业机器人部署。案例显示Aigen利用合成数据训练和开放世界基础模型,实现太阳能机器人精准除草,降低90%除草剂依赖。
NVIDIA优化VC-6解码器架构,提升批量AI视觉管道性能
NVIDIA通过Nsight工具分析,对其VC-6视频解码器进行架构级重构,从单图解码器转向支持批量处理的单一解码器,并优化GPU内核,显著降低批处理场景下的解码延迟,提升AI视觉管道效率。
ARM联合Google优化Gemma 4设备端AI性能
ARM通过Armv9架构的SME2技术加速Google Gemma 4模型在移动设备的运行,实现5.5倍预填充加速和1.6倍解码提速。该合作使开发者无需修改代码即可获得性能优化,推动设备端AI成为移动应用默认架构,降低云端依赖。
英伟达联合谷歌优化Gemma 4,强化本地AI代理基础设施
英伟达宣布与谷歌合作,针对其RTX、DGX Spark及Jetson平台,对Gemma 4系列开源模型进行深度优化。此举旨在将高性能、多模态AI推理能力从云端扩展至边缘设备和个人工作站,为本地AI代理(Agentic AI)提供从2B到31B参数的全栈模型支持。
NVIDIA 优化 Gemma 4 模型以加速本地代理 AI
NVIDIA 与 Google 合作优化 Gemma 4 系列模型,使其能够在从边缘设备到高性能 GPU 的各种 NVIDIA 硬件上高效运行。这些模型支持多种任务,包括推理、编码和代理功能,适用于本地代理 AI 应用。
谷歌发布Gemma 4开源模型,瞄准边缘推理与AI代理架构
谷歌推出Gemma 4开源模型家族,包含从2B到31B的四个版本,强调单位参数性能突破,并原生支持AI代理工作流、多模态与长上下文。其小参数模型专为边缘设备优化,旨在将前沿推理能力扩展至移动与IoT场景。
Google发布Gemma 4开源模型系列
Google推出Gemma 4开源模型系列,包含四种规模变体,特别优化边缘计算和移动设备。该系列支持多模态处理、长上下文窗口和140多种语言,采用Apache 2.0许可。
微软将MAI多模态模型系列全面集成至Foundry平台
微软宣布将自研的MAI多模态模型家族(包括转录、语音、图像模型)全面提供给Foundry平台的开发者。此举旨在通过统一的平台层,降低企业开发者集成和编排多模态AI能力的复杂性,推动AI从独立产品向企业基础设施层转变。
思科推出AI就绪宽带解决方案应对边缘计算挑战
思科发布Agile Services Networking和Unified Edge平台,旨在帮助宽带服务提供商应对AI带来的带宽激增和低延迟需求。该方案通过在网络边缘部署计算和推理能力,减少核心网络负载,并支持智能流量优先级管理。
思科推出验证式AI基础设施解决方案
思科发布经过验证的AI基础设施设计方案,通过与NVIDIA和红帽合作,提供预集成、测试的AI POD解决方案,旨在解决企业DIY AI基础设施时的兼容性和安全问题。该方案包含计算、网络、存储和AI软件的完整堆栈,并提供模块化扩展能力。
AWS与西门子能源深化合作推进数据中心能源解决方案
AWS宣布与西门子能源扩大战略合作,将AWS云服务和AI技术(包括Amazon Bedrock和SageMaker)应用于西门子能源的智能制造和工厂自动化。双方还将共同探索数据中心电力基础设施的创新方案,包括千兆瓦级发电和微电网技术。
AMD发布突破性MLPerf 6.0推理结果,展示多节点扩展与多模态能力
AMD在MLPerf Inference 6.0基准测试中,凭借Instinct MI355X GPU在Llama 2 70B和GPT-OSS-120B模型上首次突破每秒100万令牌的推理吞吐量。其提交强调了多节点扩展效率、对新型文本到视频模型(Wan-2.2-t2v)的快速启用,以及广泛的合作伙伴生态系统复现结果。
ARM推出自研AGI CPU芯片,扩展AI基础设施布局
ARM首次推出自研AGI CPU芯片,突破传统IP授权模式,提供从定制化芯片到完整平台解决方案的全栈能力。此举将重构AI基础设施供应链控制权,推动企业从硬件层优化AI工作负载部署效率。
英特尔在MLPerf推理测试中展示Xeon 6与Arc Pro GPU的AI性能
英特尔在MLPerf Inference v6.0基准测试中展示了其Xeon 6 CPU和Arc Pro B系列GPU的性能,特别是在处理大型语言模型(LLM)时的表现。测试结果显示,配备四块Arc Pro B70 GPU的系统能够处理120B参数的模型,并在多GPU设置中提供高达1.8倍的推理性能提升。