筛选

×
当前筛选 清除全部
关键词: Generative AI ×
52 情报总数
1/3 当前页
Amazon 其他 2026-06-06

AWS Bedrock 推出兼容 OpenAI/Anthropic API 的新控制台,争夺 AI 推理控制权

AWS 发布 Bedrock 新控制台,基于 bedrock-mantle 端点,原生支持 OpenAI 和 Anthropic API 协议,允许用户无缝切换 GPT、Claude 及开源模型。此举将模型选择与 API 标准化,旨在通过统一推理平面锁定用户工作流,削弱单一模型提供商的 API 壁垒。

Cisco 其他 2026-06-02

思科借Isovalent与VXLAN ESG,将AI网络控制点从K8s移向统一光纤

思科通过整合Isovalent的eBPF技术至Nexus One,实现从Pod到光纤的端到端可视化,并推出基于VXLAN ESG的AI作业分段,将安全与租户隔离策略直接嵌入底层网络。此举旨在解决Kubernetes‘黑箱’导致的AI推理网络瓶颈与故障定位难题。

Cisco 其他 2026-05-29

Cisco与微软合围:浏览器成为零信任新控制平面,SSE集成Edge定标

Cisco Secure Access与Microsoft Edge for Business深度集成,将零信任访问、DLP、AI威胁防护直接嵌入浏览器。通过统一策略引擎,浏览器取代VPN/客户端成为私有应用访问主入口,同时将Copilot等AI代理纳入安全管控,标志着安全控制点从网络层向浏览器层转移。

Cisco 其他 2026-05-28

Cisco Scale-Across架构:硅光融合定义AI跨数据中心网络新标准

Cisco发布Scale-Across方案,基于Silicon One P200路由系统(51.2Tbps)和400G/800G ZR/ZR+相干光模块,结合开放线路系统,旨在解决AI训练因功率限制需跨数据中心分布时的网络性能问题,实现类似单机房的低延迟无损连接。

Apple 其他 2026-05-25

Apple注册genai.apple.com域名,Siri独立App与Extensions系统开启第三方AI入口

Apple在WWDC 2026前注册genai.apple.com域名,预示生成式AI成为平台支柱。Siri将升级为独立App,支持个人上下文、屏幕理解和深度应用操作。底层由Google Gemini驱动并托管在Private Cloud Compute服务器。同时推出Extensions系统,允许Claude、Gemini等第三方AI助手接入,Apple抽成。

AMD 其他 2026-05-20

AMD Ryzen AI Halo与Max PRO 400系列:本地运行300B参数模型,但隐性锁定与工程短板并存

AMD发布Ryzen AI Halo开发者平台(128GB统一内存,支持200B参数模型)及Ryzen AI Max PRO 400系列处理器(首款x86客户端运行300B参数模型)。通过统一内存架构、ROCm优化和OEM合作,推动代理AI从云端走向本地,但实际性能受限于共享内存带宽与散热设计。

Google 其他 2026-05-19

Google I/O 2026:TPU 8t/8i跨数据中心训练与Gemini 3.5 Flash速度革命

Google发布第八代TPU:TPU 8t(训练)和TPU 8i(推理),原始计算力提升3倍,性能功耗比提升2倍。通过JAX/Pathways实现跨100万+TPU的分布式训练。同时推出Gemini 3.5 Flash,输出速度是其他前沿模型的4倍,并在GDPVal等基准上领先。SynthID被OpenAI、Nvidia等采用。

ARM 其他 强信号 2026-05-07

Arm发布创纪录财报,AGI CPU成为AI基础设施新焦点

Arm发布2026财年创纪录业绩,年收入达49.2亿美元,连续三年增长超20%。财报核心亮点是专为智能体AI设计的Arm AGI CPU,其数据中心市场获得超20亿美元客户需求,并获Meta、AWS、Google等巨头支持。

NVIDIA 其他 2026-05-05

NVIDIA极端协同设计:用Vera Rubin平台锁定代理AI推理的TCO拐点

NVIDIA发布针对代理系统(Agentic Systems)的极端协同设计架构,包括Vera Rubin NVL72、NVLink 6、ConnectX-9、BlueField-4及Spectrum-X。通过推理解耦、KV缓存管理和低延迟网络,试图解决代理工作负载的高token消耗、长上下文和低延迟矛盾,降低每token成本。

Cisco 其他 强信号 2026-05-04

思科推动网络从承载带宽向智能平台演进

思科在服务提供商领域提出,AI驱动的流量模式正在从根本上重塑网络架构,要求网络从静态、被动响应转变为预测性、自适应的智能系统。思科正通过其全栈解决方案组合,帮助运营商实现网络设计、运营和货币化模式的转变。

Cisco 其他 强信号 2026-05-04

思科推出Galaxy Mode,展示AI Assistant与AgenticOps现有能力

思科在其AI Assistant中推出限时“银河模式”,重点展示了AgenticOps理念下的多项现有及Beta功能,包括图像识别故障排查、低代码工作流创建和深度推理模式,旨在将网络运维从被动响应转向主动编排。

AMD 其他 中信号 2026-05-04

AMD联合戴尔展示企业AI异构计算战略

AMD在戴尔技术世界大会上强调其异构计算产品组合,旨在为不同企业AI负载匹配合适的算力,并突出硬件安全与可管理性。此举标志着AI基础设施正从通用方案转向针对具体场景的精细化部署。

Google 其他 强信号 2026-05-04

谷歌发布企业级AI代理平台与第八代TPU,押注“代理时代”

谷歌在Cloud Next '26上推出Gemini企业级代理平台,用于构建和管理自主AI代理工作流,并发布专为代理AI设计的第八代TPU芯片。同时,谷歌还发布了Gemma 4开源模型和Deep Research Max等高级分析工具。

NVIDIA 其他 强信号 2026-05-01

英伟达通过NemoClaw与OpenClaw合作,推动企业级自主AI代理安全部署

英伟达通过NemoClaw参考实现,整合OpenShell安全运行时与Nemotron开源模型,为企业提供安全部署“长时运行自主AI代理”的蓝图。此举旨在应对自主AI代理带来的千倍推理需求增长与安全治理挑战,将AI基础设施控制点向本地、安全、可审计的架构迁移。

Cisco 其他 强信号 2026-04-30

思科发布液冷网络交换机,将液冷架构扩展至AI基础设施核心

思科正式发布采用直接芯片液冷设计的N9000与8000系统,将液冷技术从GPU服务器扩展至网络交换机。该产品将带宽密度提升一倍,能耗降低近70%,旨在解决AI集群高功率密度带来的散热挑战。此举标志着数据中心冷却架构正从部件级优化转向系统性重构。

NVIDIA 其他 强信号 2026-04-30

英伟达发布企业级AI工厂参考架构,推动本地AI基础设施标准化

英伟达发布企业级AI工厂参考架构,为本地部署提供从RTX PRO到NVL72的三种标准化配置。该架构整合了计算、网络、存储及软件,旨在将AI基础设施从实验性部署转变为可预测、可扩展的工业化运营平台。

Google 其他 中信号 2026-04-30

谷歌将Gemini AI助手集成至车载平台,替换Google Assistant

谷歌宣布将Gemini AI助手通过软件更新方式,集成至搭载Google built-in的车载平台,取代原有的Google Assistant。该更新将向现有和新车辆推送,初期支持美国英语用户,旨在提供更自然的对话式交互,并集成车辆手册和实时信息以控制导航、音乐和车辆设置。

AMD 其他 强信号 2026-04-29

AMD与Liquid AI探讨从芯片到系统的高效AI架构

AMD CTO与Liquid AI CEO探讨AI架构演进,强调效率是AI从云端向边缘和终端设备扩展的关键。双方认为,通过从芯片到系统的协同设计,可实现低功耗、高响应性的AI推理,支持持续运行的智能体与多模型协同。

Microsoft 其他 强信号 2026-04-29

微软通过IQ与Agent 365平台化AI能力,推动企业向“前沿”转型

微软CEO Judson Althoff阐述其“前沿企业”愿景,核心是推出“Microsoft IQ”和“Agent 365”两大平台能力,旨在将智能与信任系统化地嵌入企业工作流。通过多个大型客户案例,展示了从Copilot规模化部署到自主AI代理(Agent)构建的演进路径,强调通过开放、模型多样的平台实现业务增长。

Google 其他 2026-04-29

Google开放TPU硬件交付,第八代芯片性能跃升直指Nvidia腹地

Google在Q1财报中宣布第八代TPU(TPU 8t/8i),训练性能较前代提升3倍,推理性价比提升80%,并首次计划向客户数据中心直接交付TPU硬件。同时完成Wiz收购,强化AI安全能力。此举标志着Google从云服务商向硬件供应商的战略延伸。