theNet by CLOUDFLARE

La qualité de votre IA dépend de son socle

Critères de développement d'une expérience personnalisée et soutenue par IA

Les entreprises s'empressent d'adopter l'IA afin d'améliorer leur efficacité opérationnelle et de bénéficier d'un avantage concurrentiel. 71 % des personnes interrogées dans le cadre d'une enquête récente ont ainsi déclaré que leur entreprise utilisait déjà l'IA générative (GenAI) de manière régulière.

Au-delà de l'utilisation de services d'IA générative existants, de nombreuses entreprises développent leurs propres applications et agents soutenus par IA dans le but de proposer une expérience client hyper-personnalisée. Elles reconnaissent l'opportunité énorme qui réside dans la possibilité de développer des applications et des agents capables de proposer des recommandations d'achat, des informations sur les produits et un support hautement personnalisés à leur clientèle mondiale.

Cet accent mis sur l'hyper-personnalisation coïncide avec la transition vers un nouveau modèle de développement d'applications. Les développeurs divisent de plus en plus leurs applications en composants plus petits, à fonction unique et susceptibles de servir d'agents IA. Ce nouveau modèle permet aux développeurs de produire rapidement de nouveaux agents, tout en améliorant leurs performances, leur résilience et leur sécurité.

La situation ne présente qu'un seul problème : les développeurs s'appuient souvent sur les services d'hyperscalers pour concevoir leurs applications. Ces hyperscalers se révèlent toutefois incapables de prendre en charge ce nouveau modèle applicatif de manière adéquate. Ils ne sont pas prévus pour diffuser des applications ou des agents personnalisés à des millions d'utilisateurs particuliers.

Un socle d'un genre nouveau s'avère donc nécessaire dans cette ère de l'IA : une nouvelle infrastructure permettant de développer et de déployer cette nouvelle génération d'applications et d'agents. Pour définir ce socle, nous devons impérativement comprendre les principaux changements qui surviennent dans le domaine du développement d'applications, identifier les limites des hyperscalers, puis définir les exigences essentielles. Une fois le socle en place, nous pourrons développer des applications et des agents qui répondront à nos objectifs opérationnels et satisferont les attentes de nos clients.


Comment l'IA et les nanoservices transforment le processus de développement d'applications

L'époque où l'on développait de gigantesques applications monolithiques proposant la même expérience à chaque utilisateur touche à sa fin. Deux tendances essentielles convergent pour donner naissance à un nouveau paradigme en matière de développement d'applications. Premièrement, les entreprises font désormais appel à l'IA pour concevoir des expériences hyper-personnalisées. Deuxièmement, elles adoptent un nouveau modèle architectural pour développer et proposer leurs applications.

1. Mettre l'IA au service de l'hyper-personnalisation

Les équipes de développement d'applications ne peuvent plus se permettre de concevoir des expériences génériques et uniformes qui submergent les utilisateurs sous un flot d'informations excessives et d'offres non pertinentes. Les clients d'aujourd'hui, qu'ils officient dans le secteur du commerce, des services financiers, des jeux vidéo ou dans tout autre domaine, attendent de leurs applications qu'elles proposent une expérience engageante qui reflète précisément leurs préférences et leurs intérêts.

Les applications et les agents IA contribuent à offrir cette expérience hyper-personnalisée. De même, elles peuvent le faire à grande échelle, sans contraindre les équipes à augmenter la quantité de travail manuel dans leurs processus de développement.

Imaginons que votre entreprise propose un calendrier sous forme logicielle. Cette application pourrait permettre à vos clients de programmer divers types d'événements spécifiques, comme les matchs de football de leurs enfants. Chaque utilisateur particulier disposerait d'un agent d'IA unique, capable de collecter des informations sur les matchs depuis le calendrier en ligne recensant les événements de la ligue, avant d'alimenter le calendrier personnel de l'utilisateur. L'utilisation d'agents d'IA vous permet de proposer ce type d'expérience individualisée à des milliers, voire à des millions de clients.

2. Passer aux nanoservices

La volonté de proposer une expérience hyper-personnalisée par le biais d'applications et d'agents IA est favorisée par une évolution importante dans le domaine du développement logiciel. Après la transition des applications monolithiques vers les microservices, les développeurs adoptent désormais le modèle des « nanoservices ». Ce modèle décompose les fonctions d'une application en petits éléments autonomes, indépendants et dédiés à une seule tâche, encore plus petits et indépendants que les microservices. À l'instar des microservices, les nanoservices accélèrent le développement et améliorent la résilience des applications, mais introduisent également une nouvelle approche : l'hyper-personnalisation.

Chaque composant d'un nanoservice se comporte comme un agent exécutant une tâche très spécifique et fortement personnalisée. Plutôt que de développer une seule application pour desservir des millions d'utilisateurs, cette architecture vous permet de proposer des millions d'agents uniques et personnalisés.

L'intégration de l'IA au sein de ce modèle architectural vous permet d'utiliser des agents afin de proposer une expérience individualisée à grande échelle. Vous pouvez ainsi envoyer des données utilisateur (une invite, un historique de navigation ou une interaction de chat, par exemple) à un grand modèle linguistique (LLM), puis exécuter une tâche personnalisée en fonction de la sortie traitée par le LLM. Vous avez également la possibilité d'exécuter ce processus une seule fois et de ne plus y faire appel ensuite, ou de le répliquer des millions de fois.

L'association des nanoservices et de l'IA peut donc avoir un impact révolutionnaire sur les différents types d'expériences que vous proposez à vos utilisateurs. Il sera néanmoins difficile de tirer le meilleur parti des nanoservices et de l'IA avec les offres classiques proposées par les hyperscalers.


Identifier les limites des hyperscalers concernant les applications IA

Il n'est pas étonnant que les hyperscalers constituent la destination privilégiée pour le développement et la diffusion d'applications. En effet, ils s'avèrent généralement plus flexibles et économiques que les environnements sur site existants. Toutefois, leurs contraintes en termes de mise à l'échelle, de persistance (statelessness), de limitations au niveau de sécurité et des coûts supplémentaires impliquent qu'ils ne constituent pas le meilleur socle pour l'IA.

Évolutivité

Les hyperscalers sont des outils parfaits pour faire évoluer une application unique. Ils vous permettent en effet de proposer la même application à des milliers d'utilisateurs. Toutefois, les hyperscaleurs ne disposent pas de l'architecture applicative adéquate pour diffuser efficacement des millions d'applications ou d'agents indépendants à des millions d'utilisateurs.

Elles manquent également de processus automatisés permettant d'activer (ou de désactiver) rapidement ces applications et ces agents. Des milliers d'utilisateurs pourraient ainsi souhaiter s'équiper d'un agent d'IA personnalisé pour planifier leurs matchs de football en début de saison. Soudainement et tous en même temps. Pour répondre à cette demande, vous devez être capable d'activer ces agents indépendants en l'espace de quelques millisecondes. Enfin, vous devez être en mesure d'arrêter immédiatement ces applications pour préserver les ressources lorsque la saison se termine et que la demande diminue.

Chez la plupart des hyperscalers, le provisionnement de ressources pour une application particulière constitue un processus manuel qui demande beaucoup de temps. Cet environnement n'est tout simplement pas conçu pour prendre en charge un grand nombre d'applications individuelles et personnalisées.

Absence de persistance

Les hyperscalers ne peuvent vous fournir les capacités de persistance dont vous avez besoin pour exécuter vos agents IA. Un agent IA doit conserver en mémoire le contexte, les préférences de l'utilisateur et les interactions de l'utilisateur d'une session sur l'autre. Cette persistance permet aux utilisateurs de reprendre leurs tâches là où ils les ont laissées plutôt que de devoir tout reprendre à zéro, même après une longue période d'inactivité.

Les hyperscalers privilégient l'évolutivité et la fiabilité par rapport à la persistance. Les systèmes de ces acteurs sont conçus pour ajouter ou supprimer facilement des ressources afin de s'adapter à l'évolution de la demande, mais aussi de les remplacer rapidement en cas de problème. Cette flexibilité sans persistance s'effectue au détriment de la possibilité de conserver des données en mémoire.

Sécurité

Lorsque vous développez des applications et des agents hyper-personnalisés et soutenus par IA, vous devez vous assurer que les données saisies dans l'application ou l'agent d'un utilisateur particulier ne soient jamais accessibles par un autre utilisateur. Si vous tenez un calendrier des matchs de football de votre enfant à l'aide d'un agent IA, par exemple, vous n'avez aucune envie que d'autres utilisateurs puissent avoir accès à sa position géographique.

Les hyperscalers ne peuvent pas sécuriser correctement chaque agent, car ils ne proposent pas d'architecture applicative conçue pour des agents basés sur les nanoservices. De l'injection d'invites au traitement non sécurisé des sorties, en passant par l'empoisonnement des données et les vulnérabilités au niveau de la chaîne d'approvisionnement, vous devez également vous protéger contre la vaste gamme de menaces qui pèsent sur les modèles IA si vous développez des applications et des agents IA. Tous les hyperscalers ne disposent pas des fonctionnalités de sécurité intégrées et suffisantes pour traiter ces menaces.

De même, si vos développeurs passent par un hyperscaler et son modèle IA pour se lancer dans le « vibe coding » (une approche dans laquelle le développeur rédige son code à l'aide d'un LLM), vous devez vous assurer que le modèle n'introduise pas de vulnérabilités de sécurité par mégarde.

Coûts

Les coûts d'exécution d'une application soutenue par IA sur l'infrastructure d'un hyperscaler augmentent rapidement. Ces acteurs vous facturent ainsi chaque entrée saisie au sein d'un modèle IA et chaque sortie produite en retour. D'autres vous facturent la durée d'allocation des ressources, même lorsque ces dernières ne traitent pas de requêtes. Imaginons que l'agent IA qui tient votre calendrier de football consulte régulièrement le calendrier en ligne de la ligue à la recherche de mises à jour des horaires ou des lieux des matchs. L'entreprise qui propose l'application sera facturée par le fournisseur de cloud pour toute la durée pendant laquelle l'application réserve des ressources, même si votre code attend simplement une saisie de l'utilisateur ou une réponse d'une source externe (comme le calendrier en ligne de la ligue).

Vous pourriez également encourir des frais de trafic sortant élevés. Les hyperscalers facturent ces frais lorsqu'ils diffusent des données à un utilisateur par l'intermédiaire d'une application hébergée chez un autre fournisseur de cloud ou lorsqu'ils transfèrent des données de leur cloud vers un autre. En outre, des frais de trafic sortant régionaux peuvent toujours s'appliquer, même si les données sont transférées au sein du même cloud.


Quels sont les quatre critères essentiels d'une plateforme IA ?

Vous devez considérer quatre exigences clés lors du choix d'une plateforme cloud pour développer et exécuter des applications soutenues par IA.

1. Évolutivité plusieurs-à-plusieurs (many-to-many)

Premièrement, la plateforme doit disposer d'une couche applicative conçue pour prendre en charge les nanoservices qui permettent la proposition d'applications et d'agents IA hyper-personnalisés. Vous devez être facilement en mesure de produire des millions d'applications et d'agents personnalisés avec précision, capables de tous s'exécuter simultanément et tous distribués à proximité des utilisateurs, à la périphérie du réseau. Enfin, vous devez également pouvoir activer ou désactiver automatiquement ces applications, en quelques millisecondes.

2. Persistance

La plateforme doit vous permettre de concevoir des agents persistants qui conservent le contexte en mémoire pendant quelques minutes, des heures, des jours ou des semaines. Contrairement aux architectures serverless traditionnelles sans conservation de l'état (stateless), une plateforme persistante (stateful) permettra aux agents de reprendre l'interaction après une période prolongée et d'effectuer des tâches complexes de longue durée.

3. Mesures intégrées de sécurité des applications

La plateforme qui conviendra le mieux au développement de solutions soutenues par IA vous permettra d'intégrer facilement des mesures de sécurité à vos applications et vos agents. Elle vous permettra également de concevoir des nanoservices sécurisés et discrets qui protègent vos données sensibles. En attendant, elle proposera aux développeurs tous les outils nécessaires pour produire en toute sécurité leurs applications par vibe coding, en prévenant les fuites de données, les attaques par injection d'invites et les autres menaces susceptibles d'apparaître lors de l'intégration de modèles IA aux applications.

4. Absence de frais excessifs

Une plateforme de développement d'IA fondamentale doit proposer plusieurs moyens de réduire les coûts d'exécution d'applications IA. La mise en cache des réponses des modèles IA peut réduire les frais liés aux jetons, par exemple. De cette façon, vous n'aurez ainsi pas à payer un grand nombre d'appels au modèle IA si les utilisateurs saisissent la même entrée de manière répétée.

La plateforme devrait également vous permettre de facturer les frais selon le « temps réel écoulé » (wall time), c'est-à-dire en vous évitant de payer le temps pendant lequel vos applications et vos agents attendent une entrée ou une réponse. Elle ne devrait vous facturer que le temps pendant lequel vos applications sont effectivement actives. De même, la plateforme ne doit pas vous facturer de frais de trafic sortant, car vous pouvez avoir besoin de déplacer des données d'un environnement de stockage vers un autre.


Mettre en œuvre le socle pour l'IA

Cloudflare vous propose un socle évolutif, sûr et économique pour le développement, l'exécution et la sécurisation de vos applications et de vos agents soutenus par IA. Cloudflare dispose d'un vaste catalogue de services permettant de simplifier le développement d'applications et d'agents IA, dont une plateforme conçue pour accélérer le développement de l'IA, un SDK destiné au développement d'agents soutenus par IA, des services de sécurité disponibles pour protéger vos applications IA et une solution de stockage d'objets permettant de stocker des ensembles de données à la croissance rapide sans encourir de frais de trafic sortant.

Fait particulièrement important, la plateforme Cloudflare est conçue pour prendre en charge le modèle des nanoservices, qui vous permet de concevoir et de diffuser des millions d'applications et d'agents hyper-personnalisés à l'échelle souhaitée. Elle dispose également de la fonctionnalité de persistance nécessaire à la conservation du contexte entre deux sessions. Enfin, alors que les hyperscalers vous contraignent à assembler plusieurs services distincts pour développer, sécuriser et déployer vos applications, Cloudflare vous propose toutes ces fonctionnalités au sein de la même plateforme, un cloud de connectivité unique et unifié. Le réseau mondial Cloudflare vous permet d'exécuter vos applications et vos agents à proximité des utilisateurs afin de vous assurer une expérience réactive et à faible latence.

L'utilisation de la plateforme Cloudflare en tant que socle pour l'IA vous permet de développer et de déployer des applications et des agents innovants et hyper-personnalisés, rapidement, en toute sécurité et à moindre coût. Une fois ce socle en place, vous pourrez chercher à optimiser le ROI de l'IA pour votre entreprise, tout en réduisant les risques.

Cet article fait partie de notre série consacrée aux nouvelles tendances et évolutions qui affectent les décideurs en matière de technologies aujourd'hui.



Approfondir le sujet

Notre e-book intitulé Garantir la sûreté des pratiques concernant l'IA : guide de la création d'une stratégie évolutive en matière d'IA à l'intention des RSSI vous permettra de découvrir comment soutenir les initiatives en matière d'IA au sein de votre entreprise, tout en améliorant leur sécurité.





Conclusions essentielles

Cet article vous permettra de mieux comprendre les aspects suivants :

  • Comment l'IA et les nanoservices transforment le processus de développement d'applications

  • Les raisons pour lesquelles les hyperscalers ne peuvent pas soutenir de manière adéquate les applications IA

  • Trois exigences à l'égard des plateformes permettant de développer des applications IA


Ressources associées


Recevez un récapitulatif mensuel des tendances Internet les plus populaires !