AkamaiがLayerXを買収へ、あらゆるブラウザ上でAI利用の制御を強化。 詳細を見る

Akamai Inference Cloud

学習済みモデルを、世界規模で安全に稼働するリアルタイムのインテリジェンスに変えます

分散型AI推論向けに最適化されたNVIDIA RTX PRO™ 6000 Blackwell GPUにアクセス。

推論はAIの未来の姿です

AIはトレーニングを通じて思考を学びますが、それを実際に役立たせるのは推論です。推論はモデルを、判断し、応答し、動作するリアルタイムアプリケーションに変換します。推論の提供する体験によって、AIの価値を実感することができます。

Akamai Inference CloudのAIアプリはユーザーの近くで稼働し、迅速な応答と制約のないスケーリングを実現します。

推論のないAIは、可能性を持つ存在でしかない

AIが投資収益率(ROI)に結びつく成果を出していない

クラウドコストの増加とAI導入の遅れにより、収益、競争力、安定性が脅かされています。

AIの性能を大規模に発揮できていない

レイテンシー、GPUの制限、セキュリティギャップにより、グローバルなAI配信が停滞し、コストが増加します。

インフラが引き起こす遅延

複雑なインフラと断片化されたツールは、開発、テスト、および展開のプロセスに遅延を引き起こします。

Akamai Inference Cloudを選ぶ理由

Akamaiは、AI時代に向けて構築された堅牢でグローバルに分散されたクラウドを提供しています。GPUを搭載したコンピューティングをユーザーやデータにより近い場所で提供するため、成長を加速し、競争力を強化し、コストを抑えることができます。

AIをより高速に、ユーザーにより近い場所で実行

GPUを利用したリアルタイムのAI推論は、世界中に、高速でサービスを提供するように設計されています。

エッジでAIワークロードのセキュリティを確保

エッジでの防御は、プロンプトインジェクション、モデルの不正利用、スクレイピング、悪性エージェントから保護するように構築されています。

ロックインなしで、構築とスケーリングが可能

オープンAPIを構築してスケーリングし、スピードを維持しながら、Kubernetesの完全な制御、コストが発生しないエグレス(出方向の通信)、透明な価格設定を実現します。

New AI survey: Inference breaks the latency wall

AI推論の現状:ピーク負荷時にAIの50%が失敗することが判明しました。

レイテンシー・ウォールの背後にあるデータと、分散コンピューティングを使用して本番環境のAI ROIを拡張する方法をご確認ください。

仕組み

エッジでのトラフィック管理とエージェントライフサイクルの制御を活用し、基盤、モデル、データ、および実行といった統合されたAIクラウドスタックを構築します。特化型GPUとAkamaiのエッジネットワークは、Akamaiの適応型セキュリティと可観測性によってサポートされる低レイテンシーの推論を提供し、世界規模でパフォーマンス、保護、効率性を実現します。

特長

  • 特化型GPU
  • トラフィック管理
  • サーバーレス機能
  • 適応型AIセキュリティ
  • エージェントとアプリケーションの構築と管理
  • 分散データ
  • 統一された可観測性
  • データパイプライン
  • オブジェクトストレージ

ユースケース

価値を生み出すAIをどんな場所でも実行できます。あらゆるユースケースで、より高速な応答、よりスマートな自動化、より効果的なリアルタイムの体験を実現します。

エージェンティックAIとアシスタント

エッジ推論と適応型セキュリティを活用し、より高速で正確な応答を提供します。

顧客体験とチャットボット

ユーザーにフラストレーションを与えるレイテンシーを引き起こすことなく、世界規模でAIとのシームレスな対話を提供します。

パーソナライズとレコメンド機能

パーソナライズを強化し、貴社のLLMやカスタムモデルに適した状態でリアルタイムのやり取りを実現します。

自動化と意思決定エンジン

金融テクノロジー業界、ヘルスケア業界、eコマース業界のリアルタイムでの運用を維持する、高頻度でミッションクリティカルな推論をサポートします。

リソース

Akamai Inference Cloudが、NVIDIAと共に、コアからエッジに至るまでAIを変えていく

スケーラブルで安全、そして低レイテンシーのAI推論を世界中に提供し、まもなく台頭するエージェンティックAIと物理AIを強化します。

エッジこそがすべて

当社がAkamai Inference Cloudを構築してエージェンティックWebを提供した理由をご紹介します。

よくある質問(FAQ)

Akamai Inference CloudはAI推論専用に構築されています。従来のクラウドプロバイダーやGPUホスティングサービスとは異なり、Akamaiは、エッジでのコンピューティング、ネットワーク、セキュリティの提供を通じて、企業がAI推論を運用し、インテリジェントな自律型エージェントを世界規模で展開できるようにします。このプラットフォームは、高度な脅威防御、モデル認識型防御、AIネイティブのトラフィック制御を統合して、推論のエンドポイントを保護し、AIのインタラクションのレイヤー全体を保護します。Akamai Inference Cloudをご利用のお客様は、AIへの投資を実際のビジネス成果に変えるために必要なパフォーマンスとコスト効率を実現し、専用の機能を利用することができます。

Akamai Inference Cloudは、AIに投資している組織が競争力を獲得し、運用変革を推進し、将来に備えられるように構築されています。世界中でリアルタイムのパフォーマンスを支援するためのインフラを必要とする、大規模なAIベースのアプリケーションを構築および展開するチームのために設計したソリューションです。以下は、当社が支援している方々の一例です。 

  • MLOps:機械学習のライフサイクル全体を自動化し、モデルの継続的な再トレーニング、展開、および本番環境におけるパフォーマンス監視を担当するエンジニア
  • AIエンジニア:エンドツーエンドのエージェンティックアプリケーションを構築し(事前にトレーニングされたモデルを使用することが多い)、データサイエンスの研究と本番環境用ソフトウェアのギャップを埋めるための橋渡しを担うソフトウェアエンジニア
  • エージェンティック・システム・アーキテクト:複雑な自律型のエージェンティックシステムを設計、構築、管理する、従来よりも高度な業務まで対応するシステムアーキテクト。独立して推論し、計画し、行動し、適応し、高度なビジネス目標の達成に貢献するシステムを手掛けている

推論は、遠隔地にあるデータセンターではなく、ユーザーの近くで実行されます。Akamaiのエッジネットワークはグローバルに分散されているため、トラフィックを最適なGPUリージョンにルーティングし、レイテンシーを低減し、AI 主導の体験に迅速で一貫性のある応答を提供できます。

Akamai Inference Cloudは、Akamaiの超分散型のエッジロケーションを使用してデータと処理を分散させながら、リクエストを最適なモデルにルーティングし、AIファクトリーをエッジに配置します。データと推論をよりユーザーに近い場所に配置することで、顧客のスマートエージェントがユーザーに即座に適応し、トランザクションをリアルタイムで最適化できます。

Akamaiは、ネットワークレベルの防御、適応型の脅威防御、APIセキュリティをエッジで提供し、データやモデルの周辺では設定可能なセキュリティとアクセス制御も可能にします。

Akamaiの事前に構築されたKubernetes開発者プラットフォームを使用して、エージェンティックAIアプリケーションを展開し、監視することができます。MLOpsエンジニアは、vLLM、KServe、NVIDIA Dynamo、NVIDIA NeMo、およびNVIDIA NIMなど、統合された設定済みのKubernetesソフトウェアを活用できます。

このプラットフォームは、NVIDIA RTX PRO 6000 Blackwell Server Edition GPUを搭載したNVIDIA RTX PRO ServerとNVIDIA AI Enterpriseソフトウェアを組み合わせたもので、Akamaiの分散型クラウドコンピューティングのインフラと世界中のエッジネットワークを活用し、世界中に4,400以上の拠点を有しています。

ユースケースについては、当社のチームにご相談ください。お客様のワークロードに適切なGPUおよび展開の設定を選ぶお手伝いをいたします。その後、推論の実行をすぐに始められるようにセットアップのガイダンスを提供します。

黒い眼鏡をかけた人が写っており、コンピューターの画面の明かりで顔が照らされている

今すぐAIコンサルティングをご予約ください

AIは研究段階から本番環境に移行しつつあり、より高速かつスマートで安全な体験を提供することが求められています。推論の最適化からモデルのスケーリング、レイテンシーの削減まで、Akamaiは、エッジでAIを十分に活用できるようにご支援します。

  • AI推論をユーザーの近くに展開し、スケーリングする方法をご覧ください。
  • エッジネイティブのインフラがパフォーマンスを向上させる仕組みについてご説明します。
  • エンタープライズグレードのセキュリティを維持しながらコストを削減する方法をご確認ください。

AIコンサルティングを予約して、可能性を解き放ちましょう。

送信いただきありがとうございます。

弊社のAIコンサルタントが近日中にご連絡し、お話を伺う日時を設定します。