弥合 AI 战略与执行之间的鸿沟。Akamai 搭载 NVIDIA 技术的实例,通过在性能、延迟与成本之间实现最佳平衡,助力您的愿景化为现实。
部署合适的 GPU 以满足您的应用需求和预算
在 Akamai 的 GPU 云服务上持续测试和扩展计算密集型工作负载,而不会耗尽您的基础架构预算。Akamai Cloud 让您可以选择适合自己工作负载需求的 GPU。在需要时轻松部署基于云的 GPU。可预测的定价和低成本的出站流量可帮助您控制成本,并充满信心地扩展机器学习、AI 工作负载、数据处理和其他高性能计算任务。
用 Akamai GPU 驱动您的 AI 战略
利用 Akamai GPU 算力,成就您的宏伟愿景
主要特点
特点
- RTX 4000 Ada GPU 方案提供较低且可预测的 GPU 定价,起价为每小时 0.52 美元
- 配置备份以通过自动化的每日、每周和双周快照保留数据
- 通过 LKE 将 GPU 节点添加至托管的 Kubernetes 集群
- 可轻松将 Shared CPU 或 Dedicated CPU 实例调整为 GPU 实例
- 通过 Akamai Cloud 节省高达 90% 的出站费用(在大多数地区,每 GB 0.005 美元)
- 通过自定义镜像、Terraform 提供程序等设置 CI/CD 管道
- 获取完整支持文档以安装 NVIDIA CUDA 工具包并开始使用
- 通过我们的 UI、API、CLI 和开发工具集成灵活地管理基础架构
- 为所有客户提供 24/7/365 全天候电子邮件和电话支持
Akamai GPU 应用场景
智能体和多模态 AI
智能体和多模态 AI
从被动聊天机器人向具备多步推理和独立任务执行能力的自主代理转变,需要采用具代理能力的智能体 AI。智能体 AI 需要专用硬件,以支持同时处理文本、视觉和音频的大规模吞吐量,从而保持用户期望的实时响应。
NVIDIA RTX PRO™ 6000 Blackwell 在高吞吐架构下每个 GPU 提供 180 GB 显存,有效缓解共享云资源或传统架构中存在的“瓶颈”问题。
通过将这些高内存需求的工作负载迁移到 Akamai 边缘,客户能够减少将数据回传至集中数据中心的延迟,并为用户提供高效的多模态体验。
实时对话式 AI
实时对话式 AI
对话以人类思维的速度进行。为了让 AI 真正沉浸式地参与对话,AI 需要能够跟上对话的节奏。实时对话式 AI 的特点是能够在思维流中即时处理、推理并作出响应。当这一点实现时,数字界面就不再只是输入工具,而成为与 AI 自然流畅的互动。
Akamai Cloud 拥有将此类技术对话推向全球所需的 GPU 算力,在实现规模化扩展的同时,始终保持可预测的经济效益以及行业领先的出方向流量 (Egress) 费率。无论您是正在开发用于引导购物的零售礼宾服务,还是打造互动式的教育辅助导师,我们的 GPU 算力都能助您攻克空间距离的限制,并摆脱不可控成本的困扰。借助 Akamai,您能够将每一次互动转化为极致敏捷的参与体验。
物理 AI 与计算机视觉
物理 AI 与计算机视觉
物理 AI 标志着从数字智能迈向现实世界行动的转变。为了将这一愿景化为现实,AI 必须驻留在数据的诞生地:边缘端。”无论是管理公共交通中的人群安全、实时优化门店库存,还是在工厂车间实现自动质量控制,物理 AI 与计算机视觉都要求能够对海量的视频和传感器流进行即时处理。将这些数据传回集中式数据中心不仅成本高昂,产生的延迟更会让所谓的‘实时决策’变得名不副实。
NVIDIA RTX 4000 Ada 是实现这一转型的理想引擎。该产品专为高密度效能而设计,支持同时处理多路高分辨率摄像头馈送,并提供高级目标检测、分割及空间推理所需的卓越吞吐量。
通过在 Akamai Cloud 上部署这些 GPU,您能够将智能真正带入物理现场。这种近场优势,让自主系统或安全监控工具能够做出极速响应。Akamai 的分布式架构还让您能够应对数据隐私与数据主权等关键挑战。通过将个人身份信息 (PII) 和敏感遥测数据配置在本地处理,您可以在强化安全态势的同时,降低将海量数据集回传至中心化数据中心所产生的成本。Akamai 不仅提供价格合理的极致性能 GPU,更让您能够掌控延迟与出方向流量(Egress)成本,从而助力您实现卓越的性价比。让 AI 走出数据中心,投身现实世界,大显身手。
实时视频转码
实时视频转码
标清画质,绝非平庸之选。面对当下的 8K 视频与高保真媒体需求,您需要的转码引擎绝非仅仅是格式转换,而是能够对那动人心弦的 60 FPS 实时画面进行逐帧增强。边缘端的转码能力助您实现用户梦寐以求的‘高清直播’体验,无论是体育赛事、萌宠瞬间还是爆款病毒视频。同时,它还能规避将数据流回传至中心化数据中心所产生的致命延迟与巨额成本。
NVIDIA RTX PRO 6000 Blackwell GPU 拥有足够显存,可支持多种 8K 视频格式的转码。该硬件支持您在单一统一工作流中,同步配置实时转码、AI 超分辨率(Upscaling)、自动化目标检测以及动态广告植入。通过利用专用硬件编码器,您处理视频的速度可比传统的基于 CPU 的方法快出数倍,从而确保您的直播流能为数百万并发观众降至最低卡顿。
Akamai 极具成本效益的云定价,意味着我们的 Blackwell GPU 不仅能实现惊人的性价比,更能显著降低视频编码的整体成本。
渲染与仿真
渲染与仿真
雄心勃勃的创意和科学愿景不仅需要强大的计算能力,还需要能够突破“内存墙”的平台来支持这些工作负载。高保真渲染、复杂的工业仿真以及大规模数字孪生,是现有最为资源密集的工作负载之一。为了在不牺牲性能的前提下执行这些任务,基础设施必须提供海量的并行处理能力和充足的显存(VRAM),以应对现代专业级应用所渴求的复杂几何模型与高分辨率纹理。
部署在 Akamai 全球分布式云平台上的 NVIDIA RTX 4000 Ada,正是实现这一战略规模化扩展的核心引擎。该架构采用高能效的 Ada Lovelace 架构,并配备 20 GB 高速 GDDR6 显存,支持工程师、建筑师和视觉特效艺术家将海量数据集直接载入 GPU 显存,从而让您能够完全自主掌控数据交换逻辑。
无论是运行用于电影级可视化交互的实时光线追踪,还是执行复杂的流体动力学与分子建模,Akamai Cloud GPU 都能提供卓越的稳定性与专业级性能,助力您的项目以当今时代的效率,完成从灵感构思到最终成果产出的飞跃。
Akamai 预估性强且透明的定价体系,配合低廉的出方向流量(Egress)费用,让您能够自由传输海量仿真结果或高分辨率帧序列,无需担心任何预算‘意外’。通过利用 Akamai 的边缘原生(Edge Native)分布能力,您还可以为全球分布式团队提供强力支持,在当地即刻交付高保真可视化与仿真成果,从而实现无缝的协同体验。
高保真可视化
高保真可视化
随着人才精英的全球化流动,全球化远程设计与工程团队的数量正日益增长。这些分布式团队必须具备高保真地呈现复杂数据的能力,才能高效开展工作。诸如沉浸式 3D 建筑漫游或实时产品配置器等高保真可视化应用,高度依赖于像素级的细节表现以及近乎零延迟的交互体验。传统的集中式托管模式无法为这些跨洲团队提供所需的体验,因为物理距离会引入严重的延迟,不仅破坏了沉浸式感官,更会导致生产力停滞。
部署在 Akamai Cloud 上的 NVIDIA Quadro 架构,旨在将这些专业级愿景转化为触手可及的现实。与通用硬件不同,Quadro GPU 能够提供专业的驱动稳定性及充足的显存容量,为 CAD、BIM 及工程领域的 ISV 认证应用提供核心支撑。
通过将这些资源物理上靠近设计师和相关利益方,Akamai 使您能够提供工作站级性能并实现全球覆盖,而无需昂贵的本地硬件。
赋能您的全球团队,助力他们在宏大项目中实现实时无缝协作。借助 Akamai,您可以大幅削减地理距离对可视化战略的影响,助力您以前所未有的敏捷性与规模,将复杂的数据集转化为令人惊叹的沉浸式交互现实。
进一步了解 Akamai 计算
后续行动
常见问题
GPU 实例已在指定的 Akamai Cloud 区域上线。Akamai 运营着一个遍布全球的分布式云平台,拥有 25 个以上的核心区域以及 4,400 多个全球节点。我们的专家团队将根据您的工作负载与延迟需求,为您精准匹配最佳的 GPU 部署位置。
是的。Akamai 提供 NVIDIA RTX PRO™ 6000 Blackwell Server Edition® GPU 的 1 卡、2 卡和 4 卡配置方案,使团队能够根据其工作负载选择合适的内存和吞吐能力——从微调与推荐引擎,到大型多模态推理、8K 视频和游戏。
申请 GPU 访问权限,开启团队协作。想要快速上手?请访问我们的GitHub repo,在 Kubernetes 环境下部署开源大语言模型 (LLM)。
Akamai 持续开展计算性能基准测试,旨在助力客户获得业务所需的理想性价比。最新发布的基准数据显示,在 Akamai 云平台上运行的 NVIDIA RTX PRO™ 6000 Blackwell,其推理吞吐量最高可达 H100 的 1.63 倍;在 100 个并发请求下,每台服务器的处理能力高达 24,240 TPS。
Akamai 提供灵活的 GPU 购买选项,具体方案将根据 GPU 型号、部署区域及规模而有所不同。我们将根据您的工作负载与规模需求,为您灵活组合最合适的预留承诺、合同条款、GPU 型号及实例规格,以精准匹配您的业务要求。
在更靠近用户的地方运行 AI 推理
Akamai Cloud 的全球布局大幅降低了生产环境 AI 的延迟与带宽成本。
- 推理吞吐量较 H100 提升至 1.63 倍
- 流量费用(Egress)低至 $0.005/GB——告别‘超大规模云厂商税’(hyperscaler tax)
- 专属资源,彻底告别‘喧闹邻居’干扰