情报
AI 生成的结构化厂商动态简报
Anthropic投入1亿美元建立Claude合作伙伴网络
Anthropic宣布投入1亿美元启动Claude合作伙伴网络,为系统集成商、咨询公司等合作伙伴提供技术认证、联合市场开发和专属技术支持,旨在加速企业客户从概念验证到生产部署的进程。
NVIDIA优化VC-6解码器架构,提升批量AI视觉管道性能
NVIDIA通过Nsight工具分析,对其VC-6视频解码器进行架构级重构,从单图解码器转向支持批量处理的单一解码器,并优化GPU内核,显著降低批处理场景下的解码延迟,提升AI视觉管道效率。
谷歌为Gemini API引入Flex与Priority推理层级
谷歌为其Gemini API新增Flex和Priority两个服务层级。Flex是成本优化层级,为延迟容忍型工作负载提供同步接口,价格降低50%;Priority为高可靠性层级,确保关键应用在高峰期的请求不被抢占。此举旨在通过单一界面,让开发者根据AI任务类型(如后台Agent思考与前台交互)灵活平衡成本与可靠性。
谷歌发布Gemma 4开源模型,瞄准边缘推理与AI代理架构
谷歌推出Gemma 4开源模型家族,包含从2B到31B的四个版本,强调单位参数性能突破,并原生支持AI代理工作流、多模态与长上下文。其小参数模型专为边缘设备优化,旨在将前沿推理能力扩展至移动与IoT场景。
Google为Gemini API推出Flex和Priority推理层级
Google在其Gemini API中新增Flex和Priority两个服务层级,允许开发者通过单一接口优化成本和可靠性。Flex针对延迟容忍型工作负载提供50%的成本节约,而Priority则为关键应用提供最高可靠性保障。这一变化简化了AI代理架构中同步和异步任务的管理。
Google发布Gemma 4开源模型系列
Google推出Gemma 4开源模型系列,包含四种规模变体,特别优化边缘计算和移动设备。该系列支持多模态处理、长上下文窗口和140多种语言,采用Apache 2.0许可。
微软将MAI多模态模型系列全面集成至Foundry平台
微软宣布将自研的MAI多模态模型家族(包括转录、语音、图像模型)全面提供给Foundry平台的开发者。此举旨在通过统一的平台层,降低企业开发者集成和编排多模态AI能力的复杂性,推动AI从独立产品向企业基础设施层转变。
思科推动6GHz Wi-Fi作为AI基础设施核心
思科基于对6000名无线决策者的调研,提出6GHz频段是解决AI工作负载网络需求的关键,数据显示采用6GHz的企业AI部署率高出传统网络72%。该主张涉及网络架构升级和安全体系重构。
思科报告:企业无线投资正成为AI时代战略增长引擎
思科发布首份无线状态报告,指出AI、物联网和高带宽应用正推动企业增加无线投资,并产生复合业务回报。报告揭示了“无线AI悖论”:AI既是驱动投资回报的主要动力,也带来了运营复杂性和安全风险。
思科报告揭示AI自动化提升企业无线投资回报
思科首份全球无线状态报告显示,80%企业过去五年增加无线预算,35%计划未来四年追加50%以上投入。采用AI自动化运维的企业获得4倍以上投资回报,每日节省3.2小时人力,但面临AI安全事件导致的年均百万美元损失。
思科报告揭示无线投资与AI的乘数效应
思科发布首份全球无线状态报告,基于对6000多名决策者的调研显示,80%的企业在过去五年增加了无线投资,其中AI驱动的自动化平均每天为IT人员节省3小时20分钟。报告提出'无线AI悖论'概念,指出成功应对复杂性、安全性和人才挑战的企业获得4倍投资回报。
思科提出AgenticOps概念应对AI时代无线网络挑战
思科提出AgenticOps概念,旨在通过自主代理解决AI时代无线网络的复杂性、安全风险和人才缺口问题。该方案强调从传统自动化向机器速度自主运营的转变,并建议企业升级至Wi-Fi 7和6GHz频谱以支持AI工作负载。
思科提出无线AI基础设施四大支柱战略
思科基于其《2026年无线网络状态报告》提出解决无线AI悖论的四大支柱:构建Wi-Fi 7基础平台、实施AgenticOps自动化、整合ISE安全方案以及通过Networking Academy培养人才。该战略强调现代无线基础设施需同时满足AI性能需求与安全运维要求。
AMD发布突破性MLPerf 6.0推理结果,展示多节点扩展与多模态能力
AMD在MLPerf Inference 6.0基准测试中,凭借Instinct MI355X GPU在Llama 2 70B和GPT-OSS-120B模型上首次突破每秒100万令牌的推理吞吐量。其提交强调了多节点扩展效率、对新型文本到视频模型(Wan-2.2-t2v)的快速启用,以及广泛的合作伙伴生态系统复现结果。
谷歌将Veo视频生成模型免费开放,推动AI视频创作平民化
谷歌宣布其AI视频创作工具Vids免费提供高质量视频生成功能,所有个人账户每月可获得10次Veo 3.1模型生成的免费额度,并推出Chrome扩展以简化屏幕录制流程。
Fortinet 发布2026年第一季度财报预告
Fortinet将于美国东部时间2026年5月6日下午1:30举行电话会议,公布其2026年第一季度财务业绩。公司将在其投资者关系网站提供电话会议的现场音频和重播。
英特尔在MLPerf推理测试中展示Xeon 6与Arc Pro GPU的AI性能
英特尔在MLPerf Inference v6.0基准测试中展示了其Xeon 6 CPU和Arc Pro B系列GPU的性能,特别是在处理大型语言模型(LLM)时的表现。测试结果显示,配备四块Arc Pro B70 GPU的系统能够处理120B参数的模型,并在多GPU设置中提供高达1.8倍的推理性能提升。
思科通过嵌入式可视性重构OT安全架构起点
思科在S4x26会议上展示其工业交换机原生集成Cyber Vision传感器,实现OT资产自动发现与基于IEC 62443的虚拟分段,将安全能力直接嵌入网络基础设施层。该方案无需额外硬件即可完成从可视性到策略执行的闭环,显著降低OT安全启动门槛。
谷歌推出Gemini API Docs MCP与Agent Skills优化AI编码代理
谷歌发布Gemini API Docs MCP协议和Agent Skills工具集,通过实时连接最新API文档与注入最佳实践指令,解决AI编码代理的过时代码问题。测试显示组合使用可使通过率提升至96.3%,同时降低63%的token消耗。
思科推出开源AI Agent安全解决方案DefenseClaw
思科发布开源安全解决方案DefenseClaw,针对OpenClaw AI Agent提供四大防护引擎,包括提示检查、工具检测、安装扫描和代码审查功能。该方案通过实操实验室展示如何防御恶意技能、不安全MCP服务器等11.9%已发现的威胁。