Las empresas se apresuran a adoptar la IA para mejorar la eficiencia operativa y obtener una ventaja competitiva. De hecho, en una encuesta reciente, el 71 % de los encuestados informó de que sus organizaciones ya utilizaban habitualmente la IA generativa.
Además de emplear los servicios de IA generativa existentes, muchas organizaciones están desarrollando sus propias aplicaciones y agentes de IA para ofrecer experiencias hiperpersonalizadas a los clientes. Reconocen la enorme oportunidad de crear aplicaciones y agentes que ofrezcan recomendaciones de compra, información de productos y soporte altamente personalizados para su base de clientes global.
Este enfoque en la hiperpersonalización coincide con una transición hacia un nuevo modelo para el desarrollo de aplicaciones. Cada vez más, los desarrolladores dividen las aplicaciones en componentes más pequeños y de función única que pueden servir como agentes de IA. Este nuevo modelo permite a los desarrolladores producir nuevos agentes rápidamente, a la vez que mejora su rendimiento, resistencia y seguridad.
Solo hay un problema: los desarrolladores suelen usar hiperescaladores para crear aplicaciones. Pero esos hiperescaladores no pueden dar soporte adecuado a este nuevo modelo de aplicación. No están diseñados para proporcionar aplicaciones o agentes personalizados a millones de usuarios individuales.
Necesitamos una nueva base para esta era de la IA — una nueva infraestructura para desarrollar e implementar estas aplicaciones y agentes de nueva generación. Encontrar esa base comienza por comprender los cambios clave en el desarrollo de aplicaciones, identificar las limitaciones de los hiperescaladores y, a continuación, definir los requisitos esenciales. Una vez que establezcamos las bases, podremos crear aplicaciones y agentes que aborden nuestros objetivos empresariales y satisfagan las expectativas de nuestros clientes.
Los días de crear aplicaciones grandes y monolíticas que ofrecen la misma experiencia a todos los usuarios están llegando a su fin. Dos tendencias clave están confluyendo para dar lugar a un nuevo paradigma en el desarrollo de aplicaciones. Las organizaciones están utilizando la IA para crear experiencias hiperpersonalizadas y están adoptando un nuevo modelo de arquitectura para crear y ofrecer aplicaciones.
Los equipos que desarrollan aplicaciones ya no pueden crear experiencias genéricas y estandarizadas que abrumen a los usuarios con información excesiva y ofertas irrelevantes. Hoy en día, los clientes, ya sea en el sector minorista, los servicios financieros, los videojuegos o cualquier otro ámbito, esperan que las aplicaciones ofrezcan experiencias atractivas que reflejen sus preferencias e intereses concretos.
Las aplicaciones y los agentes de IA ayudan a ofrecer esas experiencias hiperpersonalizadas. Y pueden hacerlo a escala, sin que los equipos tengan que aumentar el trabajo de desarrollo manual.
Supongamos que tu empresa ofrece un software de calendario. Es posible que desees permitir que tus clientes programen tipos específicos de eventos, como los partidos de fútbol de un niño. Cada persona tendría un agente de IA único, que podría recopilar información de los partidos del calendario de eventos en línea de la liga y, a continuación, completar el calendario personalizado de cada persona. El uso de agentes de IA te permite ofrecer estas experiencias individualizadas a miles o millones de clientes.
El impulso de crear experiencias hiperpersonalizadas con aplicaciones y agentes de IA se ve favorecido por un cambio importante en el desarrollo de software. Tras la transición de las aplicaciones monolíticas a los microservicios, los desarrolladores están adoptando ahora un modelo de "nanoservicios". Este modelo divide las funciones de las aplicaciones en componentes pequeños, autónomos y con un único propósito, aún más pequeños e independientes que los microservicios. Al igual que el enfoque de microservicios, los nanoservicios ayudan a acelerar el desarrollo y mejorar la resiliencia de las aplicaciones, pero también permiten la hiperpersonalización.
Cada componente del nanoservicio funciona como un agente que realiza una tarea muy específica y altamente personalizada. En lugar de crear una sola aplicación que sirva a millones de usuarios, esta arquitectura te permite ofrecer millones de agentes únicos y personalizados.
La integración de la IA en este modelo de arquitectura te permite utilizar agentes para ofrecer experiencias individualizadas a escala. Puedes enviar la entrada del usuario (como una instrucción, el historial de navegación o una interacción de chat) a un modelo de lenguaje de gran tamaño (LLM) y, a continuación, ejecutar una tarea personalizada basada en el resultado. Puedes ejecutar el proceso una vez y cerrarlo, o usarlo millones de veces.
Por lo tanto, la combinación de nanoservicios con la IA puede tener un impacto revolucionario en los tipos de experiencias que ofreces a los usuarios. Aun así, aprovechar al máximo los nanoservicios y la IA será difícil con las soluciones típicas de los hiperescaladores.
No es de extrañar que los hiperescaladores sean el destino preferido para crear y entregar aplicaciones. Generalmente, son mucho más flexibles y rentables que los entornos locales heredados. Aun así, las limitaciones de escalabilidad, la falta de estado, las limitaciones de seguridad y los costes adicionales implican que no sean la mejor base para la IA.
Los hiperescaladores son excelentes para escalar una sola aplicación. Con un hiperescalador, puedes entregar la misma aplicación a miles de usuarios. Sin embargo, los hiperescaladores no cuentan con la arquitectura de aplicaciones adecuada para ofrecer de manera eficiente millones de aplicaciones o agentes independientes a millones de usuarios.
También carecen de los procesos automatizados para activar y desactivar esas aplicaciones y agentes rápidamente. Es posible que tengas miles de usuarios que, de repente, quieran un agente de IA personalizado para programar partidos de fútbol cuando empiece la temporada. Para satisfacer la demanda, es necesario activar esos agentes independientes prácticamente de forma simultánea. Cuando termina la temporada y la demanda disminuye, debes desactivar esas aplicaciones inmediatamente para ahorrar recursos.
Con la mayoría de los hiperescaladores, el aprovisionamiento de recursos para una aplicación individual es un proceso manual que requiere mucho tiempo. Ese entorno simplemente no está diseñado para admitir numerosas aplicaciones individuales y personalizadas.
Los hiperescaladores no pueden proporcionar la persistencia de estado necesaria para ejecutar agentes de IA. Un agente de IA debe recordar el contexto, las preferencias del usuario y las interacciones del usuario de una sesión a otra. Esta función de guardar el estado permite a los usuarios continuar su tarea justo donde la dejaron, en lugar de tener que empezar desde el principio, incluso si ha habido un periodo de inactividad prolongado.
Sin embargo, los hiperescaladores priorizan la escalabilidad y la fiabilidad por encima del mantenimiento del estado. Los hiperescaladores están diseñados para que los recursos se puedan añadir o eliminar fácilmente para adaptarse a la demanda cambiante, y para que se reemplacen rápidamente cuando algo falle. Esa flexibilidad sin estado tiene el inconveniente de que los datos se conservan en la memoria.
Cuando creas aplicaciones y agentes hiperpersonalizados basados en IA, debes asegurarte de que los datos de la aplicación o agente de un usuario nunca sean accesibles para otro usuario. Por ejemplo, si realizas un seguimiento del horario de fútbol de tu hijo con un agente de IA, no querrás que otras personas tengan acceso a la ubicación de tu hijo.
Dado que los hiperescaladores no ofrecen arquitecturas de aplicaciones diseñadas para agentes basados en nanoservicios, no pueden proteger adecuadamente a cada agente. Si estás creando aplicaciones y agentes de IA, también debes protegerte contra la amplia gama de amenazas a las que se enfrentan los modelos de IA, desde la inyección de instrucciones y el manejo poco seguro de los resultados, hasta el envenenamiento de datos y las vulnerabilidades de la cadena de suministro. No todos los hiperescaladores cuentan con suficientes capacidades de seguridad integradas para gestionar estas y otras amenazas.
Y si tus desarrolladores están utilizando un hiperescalador y su modelo de IA para la "vibe coding", en la que un LLM ayuda a escribir el código, debes asegurarte de que el modelo no introduzca inadvertidamente vulnerabilidades de seguridad.
Los costes de ejecutar una aplicación con tecnología de IA en un hiperescalador aumentan rápidamente. Te cobran por cada entrada y resultado de un modelo de IA. Otros te cobran por el tiempo que los recursos están asignados, incluso si estos no están procesando solicitudes. Supongamos que el agente de IA que rastrea los horarios de fútbol comprueba repetidamente el calendario en línea de la liga para ver si hay actualizaciones de los horarios o las ubicaciones de los partidos. El proveedor de la nube le cobrará a la empresa que proporciona la aplicación por todo el tiempo que los recursos estén reservados, incluso si tu código solo está esperando la entrada del usuario o una respuesta de una fuente externa (como el calendario en línea de la liga).
También podría incurrir en altas tarifas de salida por datos. Los hiperescaladores cobran esas tarifas cuando entregan datos a un usuario a través de una aplicación en un proveedor de nube diferente o cuando transfieren datos de su nube a otra. Si transfieren datos dentro de una nube, aún existe la posibilidad de que se generen cargos de salida regionales.
Al seleccionar una plataforma basada en la nube para crear y ejecutar aplicaciones con tecnología de IA, existen cuatro requisitos clave.
En primer lugar, la plataforma debe proporcionar una capa de aplicación diseñada para admitir los nanoservicios que posibilitan aplicaciones y agentes de IA hiperpersonalizadas. Necesitas desarrollar fácilmente millones de aplicaciones y agentes adaptados con precisión, que se ejecuten todos a la vez y se entreguen cerca de los usuarios, en el perímetro. Y deberías poder iniciar o detener esas aplicaciones automáticamente, en milisegundos.
La plataforma debería permitirte crear agentes con estado que conserven el contexto en la memoria durante minutos, horas, días o semanas. A diferencia de las arquitecturas tradicionales sin servidor y sin estado, una plataforma con estado permitirá a los agentes reanudar las interacciones tras un periodo prolongado y ejecutar tareas complejas de larga duración.
La mejor plataforma para el desarrollo de la IA te permitirá integrar fácilmente la seguridad en aplicaciones y agentes. Podrás crear nanoservicios seguros y discretos que protegen los datos confidenciales. Al mismo tiempo, proporcionará herramientas que permitirán a los desarrolladores programar con confianza, evitando fugas de datos, ataques de inyección rápida y otras amenazas que pueden surgir al integrar modelos de IA en aplicaciones.
Una plataforma de IA fundamental debe ofrecer diversas formas de minimizar los costes de ejecutar aplicaciones de IA. Por ejemplo, almacenar en caché las respuestas del modelo de IA puede reducir las tarifas de tokens. Si los usuarios proporcionan la misma entrada repetidamente, no pagarás por numerosas llamadas al modelo de IA.
La plataforma también debería permitirte evitar las tarifas por "tiempo de espera", cuando las aplicaciones y los agentes están esperando entradas o respuestas. Solo deberían cobrarte cuando tus aplicaciones estén realmente haciendo algo. Dado que podría ser necesario mover datos de un entorno de almacenamiento a otro, la plataforma debe eliminar las tarifas de salida de datos.
Cloudflare ofrece una base escalable, segura y rentable para crear, ejecutar, y proteger aplicaciones y agentes con tecnología de IA. Cloudflare ofrece una amplia cartera de servicios para optimizar el desarrollo de aplicaciones y agentes de IA, entre los que se incluye una plataforma para acelerar el desarrollo de la IA, un SDK para crear agentes con tecnología de IA, servicios de seguridad para proteger las aplicaciones de IA y almacenamiento de objetos para almacenar conjuntos de datos de rápido crecimiento sin incurrir en tarifas de salida.
Es importante destacar que la plataforma de Cloudflare está diseñada para admitir el modelo de nanoservicios, lo que le permite crear y escalar millones de aplicaciones y agentes hiperpersonalizados. También proporciona la persistencia necesaria para mantener el contexto entre sesiones. Y mientras que los hiperescaladores te obligan a integrar varios servicios distintos para crear, proteger e implementar aplicaciones, Cloudflare ofrece todas las capacidades en una única plataforma de conectividad cloud unificada. La red global de Cloudflare te permite ejecutar esas aplicaciones y agentes cerca de los usuarios individuales, lo que proporciona experiencias receptivas y de baja latencia.
El uso de Cloudflare como base de IA puede ayudarte a crear y ofrecer aplicaciones y agentes innovadores e hiperpersonalizados de forma rápida, segura y rentable. Con esa base establecida, puedes trabajar para maximizar aún más el retorno de la inversión de la IA para tu empresa, al tiempo que reduces los riesgos.
Este artículo forma parte de un conjunto de publicaciones sobre las últimas tendencias y temas que afectan a los responsables de la toma de decisiones sobre tecnología en la actualidad.
Descubre cómo promover las iniciativas de IA en la empresa y mejorar la seguridad en "Garantizar prácticas seguras para el uso de la IA | Guía del CISO sobre cómo crear una estrategia de IA escalable".
Después de leer este artículo podrás entender:
Cómo la IA y los nanoservicios están transformando el desarrollo de aplicaciones
¿Por qué los hiperescaladores no pueden dar soporte adecuado a las aplicaciones de IA?
3 requisitos para las plataformas de desarrollo de aplicaciones de IA
La gobernanza de la IA empieza por la gobernanza de los datos
Guía sobre el desarrollo asistido por IA para directores técnicos