筛选

×
当前筛选 清除全部
关键词: Intel ×
266 情报总数
2/14 当前页
Amazon 其他 2026-06-06

AWS Bedrock 推出兼容 OpenAI/Anthropic API 的新控制台,争夺 AI 推理控制权

AWS 发布 Bedrock 新控制台,基于 bedrock-mantle 端点,原生支持 OpenAI 和 Anthropic API 协议,允许用户无缝切换 GPT、Claude 及开源模型。此举将模型选择与 API 标准化,旨在通过统一推理平面锁定用户工作流,削弱单一模型提供商的 API 壁垒。

Cloudflare 其他 2026-06-05

Cloudflare AI Gateway 引入身份驱动预算,争夺 AI 流量控制层

Cloudflare 在 AI Gateway 中推出基于美元预算的 spend limits 和与 Cloudflare Access 集成的身份驱动预算与路由(closed beta)。该功能允许企业按用户、团队、模型设置预算,并在超限时降级或阻断请求,将 AI 成本控制从模型提供商转移到网关层。

NVIDIA 其他 2026-06-04

NVIDIA Nemotron 3 Ultra:以MoE与MOPD重构AI Agent控制平面,锁定企业推理成本

NVIDIA发布**Nemotron 3 Ultra**,一个550B参数MoE模型(55B活跃),专为AI Agent编排而设计。通过**多教师在线策略蒸馏(MOPD)** 与**Hybrid Mamba-Transformer**架构,其在**SWE-bench**等任务中实现5倍吞吐量提升与30%成本节省,标志着推理控制权从单一模型向分层Agent系统的转移。

Cisco 其他 2026-06-04

Cisco AI Defense与AppOmni集成:将运行时护栏扩展到SaaS AI代理

Cisco宣布AI Defense与AppOmni集成,通过AppOmni AgentGuard实时拦截层,将自定义护栏策略扩展到Microsoft 365 Copilot、ServiceNow Now Assist等SaaS AI代理。统一策略引擎覆盖MCP、聊天、代理间通信,防止提示注入、工具利用和数据泄露。

Cisco 其他 2026-06-03

思科Silicon One扩展至校园:以芯片内嵌控制锁定Agentic AI网络

思科宣布将Silicon One芯片用于校园网络,推出C9550/C9350系列智能交换机,配合Cloud Control平台,实现分布式可见性、持续高性能和自适应可编程。通过深度片上缓冲、身份感知转发和亚秒级策略更新,意图将控制平面从外围设备转移至芯片和云原生编排,以应对AI代理带来的持续流量和安全挑战。

Microsoft 其他 2026-06-02

微软Build大会:从芯片到云构建Agent时代统一生态

微软在Build大会上发布一系列Agent时代基础设施:Project Solara芯片到云平台、Microsoft IQ统一知识层、Rayfin后端生成、Azure HorizonDB、GPU加速分析等,旨在将开发者锁定在微软生态内。

Cisco 其他 2026-06-02

思科借Isovalent与VXLAN ESG,将AI网络控制点从K8s移向统一光纤

思科通过整合Isovalent的eBPF技术至Nexus One,实现从Pod到光纤的端到端可视化,并推出基于VXLAN ESG的AI作业分段,将安全与租户隔离策略直接嵌入底层网络。此举旨在解决Kubernetes‘黑箱’导致的AI推理网络瓶颈与故障定位难题。

Google 其他 2026-06-02

Google 开源 gcs-analytics-core 库,以并行 I/O 和预取优化 Iceberg/Spark 性能

Google Cloud 推出 gcs-analytics-core 开源 Java 库,集成于 Iceberg 1.11.0+ 的 GCSFileIO,通过 Vectored I/O 和 Smart Parquet prefetching 减少扫描延迟。TPC-DS 测试显示扫描时间提升 18%-71%,但执行时间提升有限(大数据集仅 1.58%)。

Intel 其他 2026-06-02

英特尔 Computex 2026:以 18A 和机架级系统重塑 AI 推理控制权

英特尔发布基于 18A 的 Core Ultra Series 3 和 Xeon 6+(288 e-cores),与 Perplexity 合作推出混合本地推理编排,与 Foxconn 共建机架级 AI 基础设施,与 SambaNova 提供解耦推理云。重点强调 CPU 在 agentic AI 中的编排角色,意图将控制平面从 GPU 转移至 x86。

Intel 其他 2026-06-02

Intel联合SambaNova推机架级AI推理,CPU重掌数据中心控制权

Intel在Computex 2026发布基于Xeon 6+与SambaNova SN-50 RDUs的机架级AI基础设施,并展示由Vector Core Compute运营的完全解耦推理云(预填充用NVIDIA Blackwell,解码用RDU)。此举旨在将CPU重新置于AI推理核心,改变训练时代的GPU主导格局。

NVIDIA 其他 2026-06-02

NVIDIA 推交易基础模型:金融 AI 控制点从碎片模型转向统一 GPU 堆栈

NVIDIA 发布 Build Your Own Transaction Foundation Model 开发者示例,联合 Revolut、Mastercard 等金融机构,推动基于 Transformer 的交易基础模型替代碎片化任务模型。该方案依托 Hopper GPU、cuDF 和 Nemotron 框架,将金融数据处理从特征工程转向统一嵌入,实质是控制层向 NVIDIA 硬件生态转移。

ARM 其他 2026-06-02

Arm与NVIDIA联手推出RTX Spark:Agentic AI PC架构从x86转向Arm+GPU紧耦合

Arm与NVIDIA合作推出的RTX Spark采用Arm Grace CPU与Blackwell RTX GPU通过统一内存紧密耦合,专为Agentic AI时代设计,提供超低延迟本地推理能力。该平台标志着Windows on Arm生态的重大突破,旨在满足开发者、创作者和游戏玩家的高性能AI计算需求。

ARM 其他 2026-06-02

Arm与NVIDIA联手推出RTX Spark:统一内存架构重塑Agentic PC生态,合围x86阵营

Arm与NVIDIA合作推出基于Arm Grace CPU和Blackwell RTX GPU的RTX Spark平台,采用统一内存架构,专为Windows on Arm生态下的Agentic AI推理设计。该平台提供1 Petaflop算力,显著降低token处理成本,标志着PC从应用驱动向Agent驱动的根本转变,并得到微软的全面支持。

Amazon 其他 2026-06-02

AWS托管OpenAI GPT-5.5/Codex:控制层从模型转向云平台

AWS在Bedrock上推出OpenAI GPT-5.5、GPT-5.4和Codex编码代理,通过Responses API统一调用。此举将OpenAI前沿模型纳入AWS基础设施,实现数据驻留与容量管理,但用户被锁定在Bedrock生态中。

Cisco 其他 2026-06-02

思科AI Defense升级:以Agent供应链安全为名,行平台锁定之实

思科发布AI Defense重大更新,聚焦AI Agent安全,引入自适应红队测试、策略工作室(Policy Studio)和自动Agent依赖图扫描。新功能旨在实现跨平台(AWS Bedrock、Google ADK、LangChain)的上下文感知保护,但深度绑定Cisco Secure AI Factory与NVIDIA生态,隐藏了性能开销和迁移成本。

Cisco 其他 2026-06-01

Cisco Talos威胁狩猎扩展:跨端点、网络与身份域锁定用户生态

Cisco Talos宣布将威胁狩猎服务从端点扩展到Cisco Firewall(网络流量)和Cisco Duo/Identity Intelligence(身份活动),利用AI引擎持续执行假设驱动搜索,通过Cisco Security Cloud Control统一门户交付发现结果。此举旨在捕获低于传统检测阈值的隐蔽攻击信号。

Google 其他 2026-06-01

AlloyDB Remote MCP Server GA:Google Cloud以开放协议重塑AI代理数据访问生态

Google Cloud宣布AlloyDB Remote MCP Server正式GA,允许AI代理通过HTTP端点安全访问操作型数据。该服务基于开放MCP协议,提供IAM细粒度授权、Model Armor防护和审计日志,并集成AlloyDB的ScaNN向量索引(10亿+向量,6倍速度)与AI函数,旨在成为企业AI代理的单一数据源。

NVIDIA 其他 2026-06-01

NVIDIA发布Vera 88核Arm CPU:控制点从x86转向NVIDIA,智能体计算架构重构

NVIDIA在GTC台北2026发布首款独立数据中心CPU Vera,基于88核Olympus Arm架构,单片mesh网络,LPDDR5X带宽1.2TB/s,性能1.8倍x86。通过NVLink-C2C与GPU紧密耦合,首批客户包括OpenAI和Anthropic,Q3 2026投产。此举将控制点从Intel/AMD移向NVIDIA,重构智能体计算架构。

NVIDIA 其他 2026-06-01

NVIDIA FOX蓝图:工厂控制层从PLC转向AI代理,锁定DGX硬件

NVIDIA发布Factory Operations Blueprint (FOX),基于NemoClaw和DGX Station (GB300 Grace Blackwell Ultra Desktop Superchip)构建自主工厂管理代理,整合机器信号、质量系统与机器人车队,实现全厂智能决策。富士康、和硕、研华、纬创已部署,预计根因分析效率提升80%,劳动生产力提升15%。

HPE 其他 2026-06-01

HPE推NVIDIA Vera CPU服务器,重构Agentic AI硬件生态

HPE发布ProLiant DL394 Gen12,搭载NVIDIA Vera CPU,专为Agentic AI与强化学习设计。强调极致单核性能与高内存带宽,集成iLO安全与Compute Ops Management,并联合Redpanda与NYSE探索金融场景应用。