Le nouveau rapport d'enquête d'Akamai, intitulé Rapport sur l'état de l'inférence d'IA, met en évidence une lacune critique en matière d'infrastructure : 50 % des déploiements d'IA en production peinent à maintenir un temps de latence acceptable à grande échelle. L'enquête révèle que, bien que l'inférence d'IA soit désormais utilisée dans des cas d'utilisation stratégiques pour les entreprises, les architectures cloud centralisées ont créé un obstacle lié à la latence qui empêche les organisations de se développer efficacement. Lisez le rapport pour en savoir plus.
- Découvrez le mur de latence : 64 % des entreprises exigent des temps de réponse inférieurs à 250 ms pour leurs principaux cas d'utilisation, mais les systèmes centralisés restent le principal frein à la performance.
- Découvrez les exigences en matière de proximité : 60 % des professionnels reconnaissent qu'il est essentiel d'exécuter les inférences au plus près des utilisateurs finaux pour garantir le succès de la production, même si 46 % d'entre eux restent limités à des régions de cloud unique.
- Relevez les défis liés à l'évolutivité : 50 % des équipes citent la latence en période de pointe comme leur principale contrainte en matière d'évolutivité, ce qui les oblige à se tourner vers le routage automatique du trafic et le calcul distribué.
Téléchargez le rapport complet pour en savoir plus sur les défis d'infrastructure auxquels sont confrontés aujourd'hui les professionnels de l'IA.