情报
AI 生成的结构化厂商动态简报
思科与AMD联合基准测试:将AI网络控制点从GPU移至智能网卡与交换机
思科与AMD联合发布基于N9000 800G交换机、Pensando Pollara 400智能网卡和MI300X GPU的AI组网基准测试。通过IBPerf和MLPerf测试,展示在incast拥塞下P01/P99带宽均接近400Gbps线速,证明其架构能消除GPU空转,实现确定性性能。
Arm发布创纪录财报,AGI CPU成为AI基础设施新焦点
Arm发布2026财年创纪录业绩,年收入达49.2亿美元,连续三年增长超20%。财报核心亮点是专为智能体AI设计的Arm AGI CPU,其数据中心市场获得超20亿美元客户需求,并获Meta、AWS、Google等巨头支持。
AMD支持SPEC CPU 2026基准测试,强调开放可信性能评估
AMD发表博客支持即将发布的SPEC CPU 2026行业基准测试,强调在AI时代,开放、可复现的CPU性能评估标准对客户进行基础设施决策至关重要。该新基准更新了应用套件,并加强了对裸金属云环境和并行计算的支持。
AWS发布托管MCP服务器,为AI代理提供安全AWS API接入
AWS宣布其托管Model Context Protocol(MCP)服务器正式可用,为Claude Code、Kiro等AI编码代理提供经过认证的、安全的AWS服务访问。该服务器通过固定工具集调用AWS API、检索实时文档,并引入沙箱脚本执行和技能指导,旨在解决AI代理使用过时信息、生成不安全IAM策略等生产环境难题。
谷歌发布Gemma 4开源模型,推动AI代理本地化部署
谷歌发布Gemma 4开源模型系列,采用Apache 2.0许可,并首次引入MoE架构,旨在将高性能AI代理能力直接部署于移动设备和边缘硬件。此举显著降低了复杂AI工作流对云端集群的依赖,为本地化、私有化AI应用开辟新路径。
AMD与OpenAI将MRC网络协议贡献给OCP,推进AI网络规模化
AMD与OpenAI、微软等合作,将专为大规模AI训练设计的网络协议MRC(多路径可靠连接)贡献给开放计算项目OCP。AMD不仅是协议规范的共同制定者,其可编程的Pensando DPU/NIC产品已率先实现MRC的部署与验证,旨在将网络从性能瓶颈转变为弹性、可适应的AI基础设施层。
英伟达通过OCP开放MRC协议,推动AI以太网架构标准化
英伟达宣布将其在Spectrum-X以太网硬件上验证的MRC(多路径可靠连接)RDMA传输协议通过开放计算项目(OCP)开放。该协议旨在通过多路径负载均衡和硬件级故障绕过,提升大规模AI训练集群的网络吞吐量、弹性和GPU利用率。
谷歌通过Agent Platform展示AI原生应用架构范式
谷歌云客户案例展示了基于Gemini Enterprise Agent Platform构建的“流式意识转任务”应用。该架构利用原生音频流、主动工具调用和会话恢复等API,实现了从语音到结构化任务的无缝、低延迟转换,并设计了面向未来语音功能的提供商无关抽象层。
AMD联合OpenAI发布下一代AI训练网络传输协议MRC
AMD联合OpenAI、微软等行业领导者发布Multipath Reliable Connection(MRC)协议规范,旨在解决RoCEv2在超大规模AI训练集群中的性能瓶颈。该协议通过智能包喷洒、选择性重传和网络信号拥塞控制等机制,提升网络带宽利用率和训练任务弹性。
Anthropic与SpaceX达成算力协议,大幅提升Claude服务容量
Anthropic宣布与SpaceX达成协议,将使用其Colossus 1数据中心全部算力,获得超过300兆瓦新容量。此举旨在直接提升Claude Pro和Max订阅者的服务能力,并已立即提高Claude Code和API的使用限制。
AWS将虚拟桌面升级为AI Agent基础设施层
AWS宣布Amazon WorkSpaces支持AI Agent以独立身份和权限直接操作桌面应用,无需API或应用改造。此举将虚拟桌面从人员生产力工具扩展为企业AI Agent的通用运行平台,通过标准MCP协议与主流Agent框架集成。
英特尔在Computex 2026强调CPU在AI计算中的关键角色
英特尔将在Computex 2026上阐述其对AI驱动计算时代的愿景,核心论点是CPU作为AI计算关键引擎的复兴,强调其与GPU/加速器协同,在x86广泛生态基础上构建高效、可扩展的AI系统。
NVIDIA极端协同设计:用Vera Rubin平台锁定代理AI推理的TCO拐点
NVIDIA发布针对代理系统(Agentic Systems)的极端协同设计架构,包括Vera Rubin NVL72、NVLink 6、ConnectX-9、BlueField-4及Spectrum-X。通过推理解耦、KV缓存管理和低延迟网络,试图解决代理工作负载的高token消耗、长上下文和低延迟矛盾,降低每token成本。
思科发布Nexus Dashboard 4.2,强化AI工作负载的网络监控与安全
思科发布数据中心管理平台Nexus Dashboard 4.2,核心升级包括集成Slurm进行AI/HPC作业监控、通过LLDP与NVIDIA网卡联动实现自适应路由,以及推出基于eBPF的零停机漏洞防护功能Live Protect。该版本旨在为混合云和AI基础设施提供统一、智能且安全的运营平面。
思科推出Agentic Workflows,将AI Agent理念引入网络自动化
思科发布Agentic Workflows,旨在为现有Ansible、Terraform、Python自动化工具栈提供一个统一的、支持AI驱动的智能编排层。该平台通过可视化、低代码设计、内置审批与AI辅助,将网络自动化从任务执行转向结果驱动的编排。
七家欧洲科技巨头联合发声,呼吁欧盟改革以捍卫技术主权
ASML、空客、爱立信、Mistral AI等七家欧洲头部科技公司CEO联署公开信,呼吁欧盟简化数字法规、改革竞争政策,以加速工业AI等下一代技术在欧洲的规模化应用,应对全球竞争。
思科通过DevNet实验室提供AI防御主动测试平台实操
思科发布AI Defense Explorer Edition的实操DevNet实验室,允许开发者以自服务方式对AI模型和应用进行智能体驱动的红队测试。该工具通过自然语言设定攻击目标,模拟多轮自适应攻击,旨在将安全测试左移至开发阶段。
Anthropic发布金融行业AI代理模板,加速企业AI工作流部署
Anthropic发布了10个面向金融服务的即用型AI代理模板,涵盖投研、合规、财务等核心场景。这些模板以插件和托管代理形式交付,并与Microsoft 365深度集成,旨在将AI部署周期从数月缩短至数天。此举标志着AI应用正从通用能力向垂直行业深度工作流渗透。
思科推动网络从承载带宽向智能平台演进
思科在服务提供商领域提出,AI驱动的流量模式正在从根本上重塑网络架构,要求网络从静态、被动响应转变为预测性、自适应的智能系统。思科正通过其全栈解决方案组合,帮助运营商实现网络设计、运营和货币化模式的转变。
思科推出Galaxy Mode,展示AI Assistant与AgenticOps现有能力
思科在其AI Assistant中推出限时“银河模式”,重点展示了AgenticOps理念下的多项现有及Beta功能,包括图像识别故障排查、低代码工作流创建和深度推理模式,旨在将网络运维从被动响应转向主动编排。