エグゼクティブ・サマリー
本番環境へのAI推論の導入:NVIDIA RTX PRO™ 6000 Blackwell GPUへの投資により、ユーザーに近い場所でリアルタイムなAI推論を実行し、より高速かつ一貫したパフォーマンスを実現します。
完全でバランスの取れたプラットフォームの構築:GPU、専用CPU、そしてAkamai Functionsが連携し、エッジとコア全体でパフォーマンスと効率を最適化します。
大規模運用を支えるコア基盤の強化:きめ細かいアクセス制御、可観測性の向上、最新のKubernetesのバージョンアップデート、オブジェクトストレージの提供地域拡大により、エンタープライズクラスでの運用を強力に支援します。
クラウド上のワークロードが複雑化し、特にAI推論においてはリアルタイムな応答と一貫したパフォーマンスの維持が現場の大きな課題となっています。本記事では、GPUベースの推論とグローバル規模のエッジネイティブなコンピュートを組み合わせたAkamai Cloudの最新アーキテクチャを解き明かします。分散型AIアプリケーションの展開基盤として、インフラをどのように設計・最適化すべきかの視点が得られるはずです。
2022年にAkamaiはエンタープライズクラスの本番ワークロードにも対応できる、開発者向けのクラウド構築へと乗り出しました。この決断は、Akamai Cloudの設計方針の土台となっています。Akamai Cloudは、エージェンティックAIに向けた分散型クラウドであり、GPUによるAI推論とエッジネイティブなコンピューティングをグローバル規模で融合しています。当初からの目標は、クラウドインフラとAkamaiのグローバルネットワークを融合させ、より分散化され、レイテンシーに敏感で、ますますリアルタイム性が求められるアプリケーションを支援することでした。
プラットフォームの使われ方は時とともに進化しています。シンプルなワークロードから始まったものが、現在では本番環境で稼働する複雑なシステムへと変貌を遂げており、そこには一貫したパフォーマンスとリアルタイムな応答が求められるAI推論も含まれています。本記事では、 2026年上期のアップデートを通じて、これまでリリースした機能や実際のシステムにおけるパフォーマンス、そしてプラットフォームの今後の方向性についてご紹介します。
コンピュートとデータインフラの強化がもたらすもの
これまで、プラットフォーム構築の大部分は、コンピュート、ストレージ、ネットワーキング、およびクラウドネイティブ・サービス全般にわたるコアインフラ層の強化に注力してきました。
Fermyon社の買収により実現したAkamai Functionsの導入により、このインフラの上に開発者向けのレイヤーを追加しています。同時に、AI推論が本番システムの重要な一部となる中で、AIインフラの拡充も進めています。
NVIDIA RTX PRO™ 6000 Blackwell GPUの提供を開始し、Fermyon社の買収を完了させてAkamai Functionsをプラットフォームに統合しました。さらに、コンピュート、可観測性、データ、および配信にわたるコア機能の強化を継続しています。
こうした進化により、チームが本番環境で実行できるワークロードの範囲が広がり、システムのパフォーマンスの一貫性が向上します。
リアルタイムなパフォーマンスに分散型AI推論が求められる理由
AIは本番システムへと移行しつつあります。現在、推論はアプリケーションの経路に直接組み込まれており、レイテンシー、一貫性、コストのすべてを同時に満たすことが求められています。
2026年上期には、既存のRTX 4000 Ada世代のインスタンス基盤の上に、NVIDIA RTX PRO™ 6000 Blackwell GPUsを導入し、GPUのラインナップを拡充しました。
お客様は、コンピュータービジョン、音声処理、マルチモーダル・アプリケーション、リアルタイム推論など、より要求の厳しいワークロードを本番環境で実行しています。ハイエンドGPUのキャパシティが逼迫する市場において、こうしたインフラへのアクセスは非常に重要です。
GPUの性能はもちろん重要ですが、その計算処理を「どこで」実行するかも同じくらい重要です。
リクエストの発生源やデータが存在する場所の近くで推論を実行できれば、システムの挙動は次のように目に見えて変化します。
レイテンシーの低減
リージョン間トラフィックの削減
レスポンスタイムの一貫性向
リアルタイムアシスタント、パーソナライズ、意思決定システムなどのユースケースを、プロトタイプから本番システムへスムーズに移行
一貫した性能を担保する新たなCPUの選択肢
GPUは推論を処理しますが、その周辺の機能は依然としてCPUのパフォーマンスに依存しています。
API、オーケストレーション、データ処理、統合レイヤーなどはすべて、一貫した動作を必要とします。このレイヤーのパフォーマンスが予測不可能だと、システム全体に悪影響が及びます。
第5世代 AMD EPYC™ プロセッサーを採用し、専用ハードウェアで構成されたG8専用プランでは、リソースのオーバーサブスクリプション(過剰割り当て)のない一貫したパフォーマンスを提供します。ノイジーネイバーに悩まされることも、高負荷時の挙動を心配する必要もありません。
これらのシステムが統合されることで、よりバランスの取れたモデルが形成されます。すなわち、最適な場所に配置された分散型GPUで推論を実行し、アプリケーションの残りの部分は一貫した結果を担保するCPUインフラで実行する、という形です。
エッジネイティブなサーバーレスを加速させるAkamai Functions
これまで、プラットフォームの主軸はインフラ、つまり分散システムを実行するために必要なコンピュート、ストレージ、ネットワーキング、各種サービスにありました。
今回、WebAssemblyベースのエッジネイティブなサーバーレスプラットフォームである Akamai Functionsを追加することで、その上位に開発者向けレイヤーを構築しています。
現代のアプリケーションは単一の場所では完結しません。ロジックをどこで実行し、リクエストをどう処理するかを見極める必要があります。Akamai Functionsにより、開発者は基盤となるインフラを管理することなく、エッジとコアの両方でコードを実行できるようになります。
Akamai EdgeWorkersは、すでにエッジでの低レイテンシーな実行環境を提供しています。Akamai Functionsはこれを拡張し、より幅広い言語(Rust、Go、JavaScript、PythonなどのSDK)をサポートするとともに、ワークロードの実行場所に対するきめ細かい制御を可能にします。
実運用においては、ユーザーに近い場所でリクエストを処理し、負荷の高いロジックはデータやコンピュートの近くに配置することで、推論以外の処理をオフロードし、GPUをより効率的に活用できるようになります。
Akamai Functionsは、構築の自由度を制限することなく、開発体験をシンプルに保つための重要な要素です。
RBACと可観測性によるエンタープライズ・ガバナンスの向上
GPUやAkamai Functionsへの展開に加え、アクセス制御、可視性、運用の一貫性の向上にも注力してきました。
ロールベースアクセス制御(RBAC)を導入し、大まかな権限付与から、よりきめ細かく標準化されたモデルへと移行しました。これにより、チーム間のアクセス管理、オンボーディングやオフボーディングの処理、コンプライアンス要件への対応が、運用のオーバーヘッドを増やすことなく容易になります。
また、可観測性も拡張しました。データベース、オブジェクトストレージ、およびNodeBalancerのリアルタイムなメトリクスが利用可能になりました。監査ログは主要なリージョン全体で提供され、オブジェクトストレージとデータベース向けのアラートも実装されており、今後はさらにカバー範囲を広げていく予定です。
エッジサービス、配信、セキュリティをまたいで運用するチームにとって、TrafficPeakはフルスタック全体の可視性をもたらします。
Kubernetesとプラットフォーム運用の安定化
Kubernetesは、Akamai Cloud上でアプリケーションをチームで実行・運用するための主要な手段す。
Akamaiのマネージド型KubernetesエンジンであるLKEは、継続的なバージョン更新とインフラストラクチャの改善により、常に最新の状態を保っています。最近のリリースには、複数バージョンのKubernetesアップグレード、インフラの改善、Konnectivityなどの基盤となるネットワーキングの更新が含まれています。
アプリケーション層では、App Platform v4.13.0などのアップデートにより、プラットフォームの信頼性と操作性の向上を図っています。最新のオペレーターベースの展開モデルへの移行、非推奨コンポーネントの削除、アップグレードの安定性向上、Argo CD運用の改善を通じて、本番環境でアプリケーションを実行するチームの運用負荷を軽減します。
グローバルなデータアクセスとストレージの拡張
シカゴ、フランクフルト、ロサンゼルス、東京に新たなE3エンドポイントを追加し、オブジェクトストレージの提供範囲を拡大しました。E3エンドポイントはオブジェクトストレージへの高スループットなアクセスを前提に設計されています。より多くのリージョンに配置することで、データの読み書きが行われる場所の近くにデータを保持する選択肢が増え、レイテンシーの低減や不要なリージョン間のデータ移動の回避につながります。
また、メトリクスと監査ログのサポートも追加しました。これにより、外部ツールをつなぎ合わせることなく、データのアクセス状況を把握し、環境全体での変更を追跡できるようになります。
グローバルなデータアクセスと予測可能なコストモデルへのこうした取り組みによって、ForresterのObject Storage Solutions Landscapeに主要なベンダーとして掲載されるなど、外部からの評価にも表れ始めています。
同時に、基盤となるデータおよびネットワーキング層の進化も続けています。Valkey Managed Databaseのベータ版提供を開始しました。ライセンスの制約なしにRedis互換のパフォーマンスとAPIを求めるチームにとって、コストや複雑さを増すことなく、高スループットなインメモリ・ワークロードを実行しやすくなります。
また、Managed Databasesは限定公開でデュアルスタックの仮想プライベートクラウド(VPC)をサポートしました。これにより、ネットワーク環境が進化してもサービスの接続方法を再構築することなく、IPv4環境とIPv6環境の両方でワークロードを実行できるようになります。
分散型AIアプリケーションが描く未来
AI推論は、アプリケーションの構築と運用のあり方を変えつつあります。処理の多くがリアルタイムで行われ、よりユーザーに近い場所で、分散化されたシステム全体で実行されるようになっています。
この変化は新たな課題ももたらします。レイテンシーの許容範囲は狭まり、ワークロードは細分化され、システムはコンピュート、データ、実行環境をまたいで連携する必要があります。これらは中央集権型のモデルでは想定されていなかった要件です。
その一方で、信頼性、可観測性、そしてコアとなるインフラのパフォーマンスは、本番環境でこれらのシステムを運用する上での基本要件として変わりません。
私たちは、こうした新しいモデルを支えるためのプラットフォームを構築しています。
今後の展望
今期のアップデートは以上です。今後も開発を進め、また進捗を共有する予定です。
それまでの間、ぜひAkamai Cloudをご自身でご体験ください。
FAQ
Akamai CloudはNVIDIA RTX PRO™ 6000 Blackwell GPUを提供しており、リアルタイムアプリケーション向けの高性能な分散型AI推論を可能にします。
Akamai Functionsは、WebAssemblyをベースに構築されたエッジネイティブなサーバーレスプラットフォームです。デベロッパーはインフラを管理することなく、エッジ環境とコア環境の両方でコードを実行できるようになります。
ユーザーの近くで推論を実行することで、レイテンシーを削減し、一貫性を向上させ、リージョン間のトラフィックを抑えることができます。これにより、本番環境におけるリアルタイムAIアプリケーションの信頼性がさらに高まります。
Tags