Reports
AI-generated structured vendor updates
英伟达内部规模化部署GPT-5.5驱动AI代理,定义企业AI基础设施新范式
英伟达宣布其超过1万名员工已通过Codex应用,在基于GB200 NVL72的NVIDIA基础设施上规模化使用GPT-5.5。此举不仅展示了前沿模型推理在企业内部工作流中实现‘变革性’生产力的技术可行性,更通过专用的安全云VM架构,为企业部署AI代理提供了可审计、隔离的参考范式。
微软在澳大利亚进行250亿澳元AI与云基础设施投资
微软宣布在澳大利亚进行其史上最大规模投资,总额达250亿澳元,旨在扩大AI和云计算基础设施容量、加强网络安全,并提升全国范围内的数字技能。此举旨在将澳大利亚定位为亚太地区的AI中心。
思科AI安全扩展至谷歌云,构建多云AI运行时防护
思科将其AI Defense安全平台扩展至谷歌云,提供针对AI模型、代理工作流和RAG管道的运行时防护。此举使其完成了对AWS、Azure、谷歌三大公有云的覆盖,旨在为企业提供统一的多云AI安全框架。
Google发布Gemini企业级代理平台,定义AI代理时代技术栈
Google在Next '26上发布Gemini企业级代理平台,提供构建、扩展、治理和优化AI代理的端到端解决方案。该平台整合了新的AI基础设施、数据云、安全防御和任务执行能力,旨在将企业流程统一为单一智能工作流。
思科发布AI-RRM,将AI深度嵌入无线网络控制平面
思科发布AI驱动的无线资源管理(AI-RRM)功能,通过引入时间感知和趋势学习,在非高峰时段主动优化网络,改变了传统RRM的被动响应模式。该服务作为单一架构同时支持云和本地部署,并强调透明度和人机协同,是思科AgenticOps战略的关键组件。
Anthropic MCP协议被曝架构级安全漏洞
安全研究团队OxSecurity发现Anthropic创建维护的MCP协议存在设计缺陷,可导致服务器被诱导执行任意代码(RCE),已分配10个CVE编号且仍在增加。
微软提前启用Fairwater超大规模AI数据中心,定义AI基础设施新标准
微软宣布其位于威斯康星州的Fairwater数据中心提前投入运营。该中心被定位为全球最强大的AI数据中心,集成了数十万个NVIDIA GB200 GPU,通过大规模光纤互连构成单一无缝集群,旨在为下一代AI模型训练和推理提供前所未有的算力规模。
英伟达推动AI基础设施评估指标从FLOPS转向每token成本
英伟达提出应将“每token成本”而非“每美元FLOPS”作为评估AI基础设施的核心经济指标。这标志着从衡量计算输入转向衡量商业输出,涉及硬件、软件、网络的全栈优化,以降低企业AI推理的总拥有成本。
Cisco RSA 2026发布Agentic Workforce安全三支柱方案
Cisco在RSA Conference 2026发布针对AI Agent工作力的三层安全架构:1) Zero Trust for AI Agents - 通过Duo IAM和MCP策略为每个Agent建立身份验证;2) AI Defense Explorer Edition - 动态红队测试工具,支持prompt injection和jailbreak攻击模拟;3) Splunk SOC升级 - Exposure Analytics、Detection Studio、Agentic SOC Expansion,包括Detection Builder Agent和Triage Agent等专用AI代理。同时推出DefenseClaw安全框架和LLM Security Leaderboard。
思科阐述AI Agent框架如何重塑网络运维架构
思科通过博客详细阐述了AI Agentic框架在网络工程中的应用,提出从聊天机器人到多步工作流编排的演进路径。其核心在于将人类专业知识编码为‘技能’文件,通过MCP协议连接基础设施API,并在关键步骤设置人工审批点,实现从任务执行到流程编排的角色转变。
思科分享企业AI助手实战模式,强调确定性安全与引导式交互
思科基于其客户体验部门AI助手的18个月实战经验,提炼出决定企业AI系统成败的非显性模式。核心包括:通过确定性代码而非LLM提示词执行RBAC、主动解决企业术语歧义、减少澄清式交互以提升效率,以及基于系统能力提供引导式后续问题。
三星将Bixby重构为以LLM为核心的设备智能体
三星宣布其语音助手Bixby已完成架构重构,从基于命令的执行模式转变为以LLM为核心的智能体范式。新版Bixby能理解设备上下文与用户意图,自主调用设备功能与API执行复杂多步骤任务,并计划成为三星全系设备的统一交互入口。
三星通过Android Enterprise将企业移动管理扩展至XR头显
三星为Galaxy XR发布关键软件更新,正式引入Android Enterprise支持,将企业级设备管理、安全框架和应用部署能力延伸至扩展现实(XR)设备。此举旨在为XR在企业的大规模、受控部署提供标准化基础,并承诺提供长达五年的软件和安全更新。
思科与斑马技术深化集成:面向零售终端的网络与体验可见性
思科宣布其无线网络(Meraki)与ThousandEyes平台与斑马技术移动设备深度集成,将设备级遥测与端到端网络性能监控引入统一管理界面。此举旨在解决零售、仓储等边缘场景中移动设备连接问题的快速定位与排障,提升运营效率。
微软联合日本本土运营商构建主权AI基础设施
微软宣布未来四年在日投资100亿美元,核心是与日本樱花互联网和软银合作,通过Azure提供由本土运营商管理的GPU算力服务,确保数据驻留日本。此举旨在满足日本对数据主权和合规性要求严格的AI工作负载需求。
Anthropic与Mozilla合作,AI模型可独立发现Firefox高危漏洞
Anthropic宣布其Claude Opus 4.6模型在两周内为Mozilla Firefox发现了22个漏洞,其中14个被定为高危。这标志着AI模型已能独立识别复杂软件中的未知安全漏洞,并初步尝试生成漏洞利用,预示AI在网络安全攻防两端的能力均进入新阶段。
谷歌发布Gemma 4开源模型,瞄准边缘推理与AI代理架构
谷歌推出Gemma 4开源模型家族,包含从2B到31B的四个版本,强调单位参数性能突破,并原生支持AI代理工作流、多模态与长上下文。其小参数模型专为边缘设备优化,旨在将前沿推理能力扩展至移动与IoT场景。
Google发布Gemma 4开源模型系列
Google推出Gemma 4开源模型系列,包含四种规模变体,特别优化边缘计算和移动设备。该系列支持多模态处理、长上下文窗口和140多种语言,采用Apache 2.0许可。
AMD发布突破性MLPerf 6.0推理结果,展示多节点扩展与多模态能力
AMD在MLPerf Inference 6.0基准测试中,凭借Instinct MI355X GPU在Llama 2 70B和GPT-OSS-120B模型上首次突破每秒100万令牌的推理吞吐量。其提交强调了多节点扩展效率、对新型文本到视频模型(Wan-2.2-t2v)的快速启用,以及广泛的合作伙伴生态系统复现结果。
英特尔在MLPerf推理测试中展示Xeon 6与Arc Pro GPU的AI性能
英特尔在MLPerf Inference v6.0基准测试中展示了其Xeon 6 CPU和Arc Pro B系列GPU的性能,特别是在处理大型语言模型(LLM)时的表现。测试结果显示,配备四块Arc Pro B70 GPU的系统能够处理120B参数的模型,并在多GPU设置中提供高达1.8倍的推理性能提升。