従来型クラウドアーキテクチャの大半が集中型です。つまり、一般ユーザーから非常に離れた場所にある少数の巨大なデータセンターに頼っているということです。AIアプリが集中型であると、データが、リクエストされるたびに、数百・数千マイルの距離を行って戻らなければなりません。こうした長距離移動が実際のレイテンシーを生じさせるのです。音声アシスタントやチャットボットなどのリアルタイムアプリケーションにとっては、100ミリ秒の遅延でさえも、不自然で、人間らしくないインタラクションのように感じさせる要因となります。
集中型クラウドが貴社のAIアプリのパフォーマンスを鈍化させていますか?AIワークロードを、スピードを追求した設計のクラウドに移行しましょう。
Akamai Cloudは、世界中に分散されたインフラ上でGPUを活用したAI推論を提供するため、優位に立つために必要となるリアルタイムのAIパフォーマンスが実現します。予測可能な価格設定で統合型セキュリティを備えた開発者向けの当社のオープンプラットフォーム上で、AIアプリケーションをより迅速に構築し、展開し、スケーリングしていただけます。
リアルタイムアプリケーションの体験には、エッジでの超高速AI推論が必要です。Akamai Cloudなら、すでに対応可能です。
分散されたコンピューティングによって、貴社のモデルとユーザーの間の物理的な距離が解消されるため、アプリはより速く応答することができます。
AI推論の現状:ピーク需要時にAIの50%が正常に機能しない
レイテンシー・ウォールの背後にあるデータと、分散コンピューティングを使用して本番環境のAI ROIを拡張する方法をご確認ください。
お客様事例
リソース
よくある質問(FAQ)
よくある質問(FAQ)
実際のところ、通常はインフラコストが削減されます。集中型クラウドでは、多くの場合、そのエコシステムの外部にデータを移動する際に高いエグレス(出方向の通信)費用が課されます。エッジアーキテクチャであれば、レガシー・クラウド・プロバイダーと比較して、そのようなコストを最小限に抑えることができます。
はい。Akamaiは、専門性の高いバージョンのファインチューニングから大規模なワークロード向けに構築された専用のカスタムクラスター構築まで、あらゆるサイズのモデルを稼働可能な柔軟性を提供します。
セキュリティを支えるのは、Akamaiの分散されたファブリックです。推論はユーザーの近くで実行されるため、機微な情報は公衆インターネットと離れたデータセンターの間を移動する必要がないことが多くあります。当社はAIネイティブのDDoS防御とゼロトラスト・セキュリティを活用し、これをレイヤー化して、貴社のモデルとユーザーの両方を保護します。
集中型クラウドはリアルタイムAIに最適とは言えません。GPUの力をユーザーの近くに移動するには変革が極めて重要となります。これによって、ミリ秒の応答を可能にし、迅速に、セキュアに、そしてコスト効果を維持したまま高パフォーマンスを確実にすることができます。