Reports
AI-generated structured vendor updates
Cisco DevNet集成托管LLM访问降低AI安全实践门槛
Cisco在其DevNet Learning Labs平台推出托管LLM访问功能,通过LLM代理提供单一OpenAI兼容API端点,支持Azure OpenAI和AWS Bedrock等后端模型。该功能无需API密钥管理,预配置环境使学员可直接调用LLM进行AI安全工具实践,包括A2A协议安全、AI防御等工作流。
思科联合英伟达验证私有AI基础设施快速微调能力
思科IT与英伟达合作,基于Nemotron RAG配方在单颗H200 GPU上实现2-5小时端到端嵌入模型微调。该方案通过120B参数本地LLM生成合成数据,无需人工标注,使NDCG@1指标提升7.3个绝对点。验证了企业私有AI基础设施快速优化领域知识检索的技术路径。
思科通过LangChain中间件统一AI代理安全策略执行
思科发布AI Defense Runtime Protection与LangChain的集成方案,通过中间件提供监控与执行双模式,实现AI代理安全策略的统一执行。该方案生成包含决策、分类和请求ID的运行时合约,支持多种集成路径。思科计划将该集成贡献至LangChain上游并扩展至其他AI环境。
NVIDIA将GPU动态资源分配驱动捐给Kubernetes社区
NVIDIA将其GPU动态资源分配(DRA)驱动捐献给CNCF,使其成为Kubernetes上游项目。此举旨在将GPU编排的核心控制点从厂商专有层上移至开源社区,并协同多家云厂商推动标准化。
Amazon:千叶流山部署2500台机器人、108k㎡物流中心,持续扩展AI驱动的自动化履约网络
Amazon宣布将于2026年3月在日本千叶县流山市运营一个大型物流中心,建筑面积10.8万平方米,部署约2500台‘Amazon Robotics’驱动机器人和26,000个专用货架。该设施利用机器人自动化系统,相比传统货架可提升约40%的库存容量,日均可处理超50万件商品。此举是Amazon在AI与机器人技术深度融合的物流基础设施上的持续投资与规模化部署。
思科发布LLM安全排行榜,推动模型安全标准化评估
思科推出大语言模型安全排行榜,基于单轮和多轮攻击测试提供客观安全排名。该工具采用标准化评估框架,映射攻击数据至思科AI安全分类法,公开排名和方法论。旨在为企业AI部署前提供安全风险评估,填补模型安全基准测试空白。
思科扩展零信任安全至AI代理生态
思科在RSA 2026宣布针对AI代理的安全创新,扩展Zero Trust Access至非人类身份,引入agentic IAM在Duo、MCP策略执行于Secure Access SSE,并推出AI Defense: Explorer Edition自助测试工具及DefenseClaw开源框架,以自动化安全部署。
Check Point发布AI工厂安全蓝图 覆盖GPU至LLM全栈防护
Check Point推出AI工厂安全架构蓝图,建立从GPU硬件层到LLM提示层的全栈防护体系,通过零信任框架实现AI基础设施纵深防御。
AMD与Upstage合作推出基于MI325X的主权AI基础设施方案
AMD与韩国AI公司Upstage深化合作,基于Instinct MI325X加速器构建主权AI基础设施解决方案。通过优化ROCm软件栈实现Solar LLM与硬件平台深度集成,提升AI训练和推理效率。该方案针对韩国市场数据主权要求提供本地化AI算力。
思科通过专有LLM和AgenticOps推进WLAN自治化转型
思科在ABI Research WLAN竞争力排名中获领导者地位,其AI驱动战略核心为专有大型语言模型(基于CCIE专家数据训练)和AgenticOps功能集,包括AI-RRM实时射频优化、AI配置推荐和AI数据包分析器,实现从分析到自动化操作的演进。
AMD与NAVER Cloud合作推进韩国主权AI基础设施建设
AMD与韩国NAVER Cloud宣布深化战略合作,旨在加速韩国主权AI基础设施建设。NAVER Cloud将扩大部署AMD EPYC“威尼斯”处理器,并获得下一代Instinct MI455X GPU的早期访问权限,双方将共同优化AI服务与软件栈。
英伟达发布Cosmos世界模型套件,强化物理AI合成数据与推理能力
英伟达发布其Cosmos世界基础模型(WFM)套件的重要更新,包括Transfer 2.5、Predict 2.5和Reason 2。这些模型旨在加速生成高保真、符合物理规律的合成数据,并支持对机器人、自动驾驶等物理AI系统进行下游任务微调和推理,以解决真实世界数据稀缺的瓶颈。
Meta加速自研AI芯片路线图,专注推理优化
Meta计划两年内推出四代自研AI芯片MTIA系列,采用‘推理优先’设计策略,专注于生成式AI推理任务优化。芯片基于PyTorch和开放计算标准构建,支持数据中心无缝部署。这一快速迭代策略旨在提升计算效率和成本控制。
英伟达Jetson平台推进边缘AI开源模型本地化部署
英伟达通过Jetson边缘AI平台实现开源生成式AI模型的本地化部署,支持包括Qwen3 4B和Mistral 3在内的多种模型在边缘设备运行。平台提供从Jetson Orin Nano到Thor的完整硬件选项,集成计算与内存于SoM以简化设计。关键性能指标显示,Jetson Thor可实现52 tokens/秒的Mistral 3推理速度。
OpenAI推出指令层级挑战技术,强化大模型安全架构
OpenAI推出IH-Challenge训练技术,通过建立指令优先级机制提升大模型的安全可控性和抗提示注入攻击能力。该技术从底层指令逻辑层面优化模型推理架构,标志着大模型安全从内容过滤向指令控制演进。
思科将提示注入防御提升至基础设施层
思科将提示注入类比为新型SQL注入,强调单一防护层不足,需采用分层防御策略。提出在网络层实施微隔离和东西向流量检测,终端层部署EDR异常检测,构建纵深防御架构。
苹果M5芯片集成神经加速器强化本地AI推理
苹果发布M5 Pro和M5 Max芯片,采用Fusion架构集成双晶粒SoC,每个GPU核心内置神经加速器,AI性能相比前代提升4倍。统一内存带宽最高614GB/s,支持128GB内存,针对本地LLM处理和AI模型训练优化。
Trend Micro发布AI安全报告,揭示AI供应链风险与模型攻击面
Trend Micro发布《AI生态系统断层线》报告,系统性地分析了AI供应链中的安全风险,包括模型训练数据污染、第三方插件漏洞以及模型窃取攻击。报告指出,企业AI应用的安全边界已从传统IT基础设施扩展至模型层和数据管道。
Cloudflare威胁报告揭示攻击模式从暴力入侵转向身份渗透
Cloudflare发布2026年威胁情报报告,核心观点是攻击者正从‘破门而入’转向‘登堂入室’,利用AI、供应链攻击和身份欺诈等手段,使得安全防御重心需从边界防护转向内部身份验证与实时威胁情报。
Fundamental推出NEXUS表格模型并与AWS达成战略合作
Fundamental获得2.55亿美元融资,推出专为表格数据设计的大型模型NEXUS,解决传统AI模型处理企业结构化数据的局限性。该模型基于数十亿表格数据训练,无需特征工程,通过AWS SageMaker HyperPod部署。已与多家财富100强企业签约应用于预测场景。