Reports
AI-generated structured vendor updates
AMD提出Agentic AI驱动数据中心CPU与GPU架构分离
AMD高级副总裁Dan McNamara在官方博客中指出,Agentic AI(智能体AI)正从根本上改变数据中心基础设施架构。它不再仅是增加GPU服务器中的CPU数量,而是需要构建一个独立的、专门用于编排与工具执行的CPU计算层,与GPU密集计算层形成分布式系统。
AMD支持SPEC CPU 2026基准测试,强调开放可信性能评估
AMD发表博客支持即将发布的SPEC CPU 2026行业基准测试,强调在AI时代,开放、可复现的CPU性能评估标准对客户进行基础设施决策至关重要。该新基准更新了应用套件,并加强了对裸金属云环境和并行计算的支持。
Cloudflare利用eBPF-LSM实现零日漏洞运行时缓解
Cloudflare披露其应对Linux内核“Copy Fail”零日漏洞的响应流程。核心在于,其未依赖传统补丁,而是通过eBPF-LSM安全模块实施细粒度运行时阻断,同时利用eBPF进行全栈行为检测与依赖关系测绘,实现了无服务中断的快速缓解。
谷歌发布Gemma 4开源模型,推动AI代理本地化部署
谷歌发布Gemma 4开源模型系列,采用Apache 2.0许可,并首次引入MoE架构,旨在将高性能AI代理能力直接部署于移动设备和边缘硬件。此举显著降低了复杂AI工作流对云端集群的依赖,为本地化、私有化AI应用开辟新路径。
思科研究揭示VLM双重失效模式,暴露AI安全表征层脆弱性
思科AI安全团队研究发现,通过对图像进行微小、有界的像素扰动,可绕过视觉语言模型的安全对齐,揭示出‘可读性恢复’与‘拒绝抑制’两种共存的失效模式。这表明攻击可在不依赖目标模型内部信息的情况下,利用多模态嵌入距离作为攻击指标,暴露了当前基于像素域或OCR过滤的防御机制的局限性。
AMD与OpenAI将MRC网络协议贡献给OCP,推进AI网络规模化
AMD与OpenAI、微软等合作,将专为大规模AI训练设计的网络协议MRC(多路径可靠连接)贡献给开放计算项目OCP。AMD不仅是协议规范的共同制定者,其可编程的Pensando DPU/NIC产品已率先实现MRC的部署与验证,旨在将网络从性能瓶颈转变为弹性、可适应的AI基础设施层。
谷歌通过Agent Platform展示AI原生应用架构范式
谷歌云客户案例展示了基于Gemini Enterprise Agent Platform构建的“流式意识转任务”应用。该架构利用原生音频流、主动工具调用和会话恢复等API,实现了从语音到结构化任务的无缝、低延迟转换,并设计了面向未来语音功能的提供商无关抽象层。
AMD联合OpenAI发布下一代AI训练网络传输协议MRC
AMD联合OpenAI、微软等行业领导者发布Multipath Reliable Connection(MRC)协议规范,旨在解决RoCEv2在超大规模AI训练集群中的性能瓶颈。该协议通过智能包喷洒、选择性重传和网络信号拥塞控制等机制,提升网络带宽利用率和训练任务弹性。
NVIDIA提出面向智能体系统的“极端协同设计”基础设施栈
NVIDIA发布技术博客,系统阐述AI智能体(Agent)工作负载对基础设施的颠覆性需求,并提出其‘极端协同设计’(Extreme Co-Design)技术栈与Vera Rubin平台作为解决方案。核心观点是传统单处理器架构无法满足智能体在长上下文、高缓存命中率和低延迟交互方面的苛刻要求,必须通过计算、网络、存储的跨层优化来重塑AI基础设施。
NVIDIA将cuOpt优化引擎封装为AI Agent技能,加速供应链决策
NVIDIA发布cuOpt Agent Skills,将GPU加速的决策优化引擎封装为AI Agent可调用的标准化技能。该方案允许LLM通过自然语言理解业务问题,并自动调用cuOpt进行数学建模与求解,将传统需数周的供应链优化流程缩短至秒级。
思科通过DevNet实验室提供AI防御主动测试平台实操
思科发布AI Defense Explorer Edition的实操DevNet实验室,允许开发者以自服务方式对AI模型和应用进行智能体驱动的红队测试。该工具通过自然语言设定攻击目标,模拟多轮自适应攻击,旨在将安全测试左移至开发阶段。
Anthropic发布金融行业AI代理模板,加速企业AI工作流部署
Anthropic发布了10个面向金融服务的即用型AI代理模板,涵盖投研、合规、财务等核心场景。这些模板以插件和托管代理形式交付,并与Microsoft 365深度集成,旨在将AI部署周期从数月缩短至数天。此举标志着AI应用正从通用能力向垂直行业深度工作流渗透。
思科推动网络从承载带宽向智能平台演进
思科在服务提供商领域提出,AI驱动的流量模式正在从根本上重塑网络架构,要求网络从静态、被动响应转变为预测性、自适应的智能系统。思科正通过其全栈解决方案组合,帮助运营商实现网络设计、运营和货币化模式的转变。
思科推出Galaxy Mode,展示AI Assistant与AgenticOps现有能力
思科在其AI Assistant中推出限时“银河模式”,重点展示了AgenticOps理念下的多项现有及Beta功能,包括图像识别故障排查、低代码工作流创建和深度推理模式,旨在将网络运维从被动响应转向主动编排。
AMD联合戴尔展示企业AI异构计算战略
AMD在戴尔技术世界大会上强调其异构计算产品组合,旨在为不同企业AI负载匹配合适的算力,并突出硬件安全与可管理性。此举标志着AI基础设施正从通用方案转向针对具体场景的精细化部署。
谷歌发布企业级AI代理平台与第八代TPU,押注“代理时代”
谷歌在Cloud Next '26上推出Gemini企业级代理平台,用于构建和管理自主AI代理工作流,并发布专为代理AI设计的第八代TPU芯片。同时,谷歌还发布了Gemma 4开源模型和Deep Research Max等高级分析工具。
Cloudflare完成“Code Orange”工程,系统性强化全球网络韧性
Cloudflare宣布完成代号“Code Orange”的工程计划,旨在从配置变更、故障隔离、应急响应和知识固化四个层面系统性提升其全球网络的韧性。该计划的核心是引入名为Snapstone的健康中介配置部署系统,并建立名为Codex的AI驱动工程标准库。
微软发布Agent 365,为AI智能体引入企业级身份与治理层
微软宣布其Agent 365平台全面上市,核心动作是将企业现有的身份(Entra)、安全、治理和管理系统扩展至AI智能体及其在企业内的所有交互。此举旨在解决AI智能体规模化部署带来的身份、安全和合规挑战。
英伟达通过NemoClaw与OpenClaw合作,推动企业级自主AI代理安全部署
英伟达通过NemoClaw参考实现,整合OpenShell安全运行时与Nemotron开源模型,为企业提供安全部署“长时运行自主AI代理”的蓝图。此举旨在应对自主AI代理带来的千倍推理需求增长与安全治理挑战,将AI基础设施控制点向本地、安全、可审计的架构迁移。
英伟达发布TensorRT for RTX插件,优化虚幻引擎AI推理性能
英伟达发布针对虚幻引擎5(UE5)的TensorRT for RTX插件,作为其Neural Network Engine(NNE)的新运行时选项。该插件通过即时编译优化,在RTX GPU上为AI后处理(如超分、去噪)任务提供比DirectML等运行时更高的推理吞吐量,展示了英伟达将高效AI推理能力嵌入主流实时图形引擎工作流的努力。