As empresas estão correndo para adotar a IA para aprimorar a eficiência operacional e obter vantagem competitiva. Na verdade, em uma pesquisa recente, 71% dos entrevistados relataram que suas organizações já estavam usando IA generativa (GenAI) regularmente.
Além de empregar os serviços de GenAI existentes, muitas organizações estão criando seus próprios aplicativos com tecnologia de IA e agentes de IA para oferecer experiências hiperpersonalizadas aos clientes. Elas reconhecem a enorme oportunidade de criar aplicativos e agentes que forneçam recomendações de compra, informações de produtos e suporte altamente personalizados para sua base de clientes global.
Esse foco na hiperpersonalização coincide com uma mudança em direção a um novo modelo para o desenvolvimento de aplicativos. Os desenvolvedores estão dividindo cada vez mais os aplicativos em componentes menores e de função única que podem servir como agentes de IA. Esse novo modelo permite que os desenvolvedores produzam novos agentes rapidamente, ao mesmo tempo em que aprimoram seu desempenho, resiliência e segurança.
Há apenas um problema: os desenvolvedores costumam usar hiperescaladores para criar aplicativos. No entanto, esses hiperescaladores não conseguem suportar adequadamente esses novos modelos de aplicativos. Eles não foram projetados para fornecer aplicativos ou agentes personalizados a milhões de usuários individuais.
Precisamos de uma nova base para essa era da IA, uma nova infraestrutura para criar e implementar esses aplicativos e agentes de última geração. A descoberta dessa base começa com a compreensão das principais mudanças no desenvolvimento de aplicativos, identificando as limitações dos hiperescaladores e, em seguida, definindo os requisitos essenciais. Assim que tivermos a base estabelecida, podemos criar aplicativos e agentes que atendam aos objetivos de negócios e às expectativas de nossos clientes.
Os dias de desenvolver aplicativos grandes e monolíticos que fornecem a mesma experiência a cada usuário estão chegando ao fim. Duas tendências importantes estão trabalhando juntas para criar um novo paradigma no desenvolvimento de aplicativos: as organizações estão utilizando IA para criar experiências hiperpersonalizadas e estão adotando um novo modelo arquitetônico para construir e distribuir aplicativos.
As equipes que desenvolvem aplicativos não podem mais produzir experiências genéricas e padronizadas que sobrecarregam os usuários com informações excessivas e ofertas irrelevantes. Atualmente, os clientes, seja no varejo, em serviços financeiros, em jogos ou em qualquer outro setor, esperam que os aplicativos proporcionem experiências atraentes que reflitam suas preferências e seus interesses exatos.
Aplicativos e agentes de IA ajudam a proporcionar essas experiências hiperpersonalizadas. E eles podem fazer isso em escala, sem exigir que as equipes aumentem o trabalho de desenvolvimento manual.
Digamos que sua empresa ofereça um software de calendário. Talvez você queira permitir que seus clientes agendem tipos específicos de eventos, como jogos de futebol infantil. Cada indivíduo teria um agente de IA exclusivo, que poderia coletar informações de jogos do calendário de eventos on-line da liga e, em seguida, preencher o calendário personalizado de cada indivíduo. O uso de agentes de IA permite que você ofereça essas experiências individualizadas a milhares ou milhões de clientes.
O impulso para criar experiências hiperpersonalizadas com aplicativos e agentes de IA é facilitado por uma mudança importante no desenvolvimento de software. Após a transição de aplicativos monolíticos para microsserviços, os desenvolvedores agora estão adotando um modelo de “nanoserviços”. Este modelo divide as funções de aplicativos em componentes pequenos, independentes e de propósito único, ainda menores e mais independentes do que os microsserviços. Assim como a abordagem de microsserviços, os nanosserviços ajudam a acelerar o desenvolvimento e a melhorar a resiliência dos aplicativos, mas também possibilitam a hiperpersonalização.
Cada componente de nanosserviço funciona como um agente, executando uma tarefa muito específica e altamente personalizada. Em vez de criar um único aplicativo que atenda milhões de usuários, essa arquitetura permite que você forneça milhões de agentes exclusivos e personalizados.
A integração da IA nesse modelo arquitetônico permite que você use agentes para fornecer experiências individualizadas em escala. Você pode enviar a entrada do usuário (como um prompt, histórico de navegação ou interação de chat) para um grande modelo de linguagem (LLM) e, em seguida, executar uma tarefa personalizada com base na saída. Você pode executar o processo uma vez e desativá-lo ou usá-lo milhões de vezes.
Acoplar nanosserviços com IA pode, então, pode ter um impacto revolucionário nos tipos de experiência que você oferece aos usuários. Ainda assim, tirar o máximo proveito dos nanosserviços e da IA será difícil com as ofertas típicas de hiperescaladores.
Não é surpresa que os hiperescaladores sejam o destino preferido para desenvolver e distribuir aplicativos. Eles geralmente são muito mais flexíveis e econômicos do que os ambientes no local legados. Ainda assim, restrições de escalabilidade, ausência de estado, limitações de segurança e custos adicionais significam que não são a melhor base para IA.
Os hiperescaladores são excelentes para escalar um único aplicativo. Com um hiperescalador, você pode fornecer o mesmo aplicativo único para milhares de usuários. No entanto, os hiperescaladores não possuem a arquitetura de aplicativos adequada para fornecer de forma eficiente milhões de aplicativos ou agentes independentes para milhões de indivíduos.
Eles também não possuem os processos automatizados para ativar ou desativar esses aplicativos e agentes rapidamente. Você pode ter milhares de usuários que, de repente, desejam um agente de IA personalizado para agendar partidas de futebol quando a temporada começar. Para atender à demanda, você precisa ativar esses agentes independentes em questão de milissegundos. Quando a temporada termina e a demanda diminui, é necessário desativar esses aplicativos imediatamente para conservar recursos.
Na maioria dos hiperescaladores, o provisionamento de recursos para um aplicativo individual é um processo manual demorado. Esse ambiente simplesmente não foi projetado para oferecer suporte a vários aplicativos individuais e personalizados.
Os hiperescaladores não conseguem fornecer a continuidade de estado necessária para executar agentes de IA. Um agente de IA deve lembrar o contexto, as preferências do usuário e as interações do usuário de uma sessão para outra. Essa continuidade de estado permite que os usuários retomem suas tarefas exatamente de onde pararam, em vez de terem que recomeçar do zero, mesmo após um longo período de inatividade.
Mas os hiperescaladores priorizam a escalabilidade e a confiabilidade em vez da continuidade de estado. Os hiperescaladores são projetados para que os recursos possam ser adicionados ou removidos facilmente para acomodar a demanda variável e rapidamente substituídos quando algo der errado. Essa flexibilidade sem estado tem o custo de reter dados na memória.
Ao desenvolver aplicativos e agentes com tecnologia de IA hiperpersonalizados, é necessário garantir que os dados do aplicativo/agente de um usuário nunca estejam acess íveis a outro usuário. Se você estiver acompanhando a programação de futebol de seu filho com um agente de IA, por exemplo, não vai querer que outras pessoas tenham acesso à localização dele.
Como os hiperescalers não oferecem arquiteturas de aplicativos projetadas para agentes baseados em nanosserviços, eles não conseguem proteger adequadamente cada agente. Se você está desenvolvendo aplicativos e agentes de IA, também precisa se proteger contra a grande variedade de ameaças que os modelos de IA enfrentam, desde injeção de prompts e tratamento inseguro de saídas, até envenenamento de dados e vulnerabilidades na cadeia de suprimentos. Nem todos os hiperescaladores possuem recursos de segurança integrados suficientes para lidar com essas e outras ameaças.
E se seus desenvolvedores estiverem usando um hiperescalador e o modelo de IA dele para fazer “vibe coding”, onde um LLM está ajudando a escrever o código, você precisa ter certeza de que o modelo não introduza inadvertidamente vulnerabilidades de segurança.
Os custos de executar um aplicativo com tecnologia de IA em um hiperescalador aumentam rapidamente. Eles cobram por cada entrada e cada saída de um modelo de IA. Outros cobram pelo tempo em que os recursos ficam alocados, mesmo que esses recursos não estejam processando solicitações. Digamos que o agente de IA que monitora os horários dos jogos de futebol verifique repetidamente o calendário on-line da liga para obter atualizações sobre os horários ou locais dos jogos. A empresa que fornece o aplicativo será cobrada pelo provedor de nuvem por todo o período em que os recursos estiverem reservados, mesmo que o código esteja apenas aguardando a entrada do usuário ou uma resposta de uma fonte externa (como o calendário on-line da liga).
Você também pode incorrer em altas taxas de saída para dados. Os hiperescaladores cobram essas taxas quando entregam dados a um usuário por meio de um aplicativo em um provedor de nuvem diferente ou transferem dados de sua nuvem para outra. Se eles transferirem dados dentro de uma nuvem, ainda existe a possibilidade de cobrança de taxas de saída regionais.
Ao selecionar uma plataforma baseada em nuvem para desenvolver e executar aplicativos com tecnologia de IA, há quatro requisitos principais.
Primeiramente, a plataforma deve fornecer uma camada de aplicação projetada para suportar os nanosserviços que viabilizam aplicativos e agentes de IA hiperpersonalizados. Você precisa produzir facilmente milhões de aplicativos e agentes precisamente personalizados, todos executados simultaneamente, e todos entregues perto dos usuários, na borda. E você deve ser capaz de ativar e desativar esses aplicativos automaticamente, em milissegundos.
A plataforma deve permitir que você crie agentes com estado que mantenham o contexto na memória por minutos, horas, dias ou semanas. Ao contrário das arquiteturas sem servidor e sem estado tradicionais, uma plataforma com continuidade de estado permitirá que os agentes retomem as interações após um longo período de tempo e executem tarefas complexas e de longa duração.
A melhor plataforma para desenvolvimento de IA permite que você incorpore facilmente a segurança em aplicativos e agentes. Isso permite que você crie nanosserviços seguros e discretos que protegem dados confidenciais. E ao mesmo tempo, fornece ferramentas que permitem que os desenvolvedores programem com confiança, evitando o vazamento de dados, ataques de injeção de prompts e outras ameaças que podem surgir ao integrar modelos de IA a aplicativos.
Uma plataforma de IA básica deve oferecer diversas maneiras de minimizar os custos de execução de aplicativos de IA. Por exemplo, fazer armazenamento em cache de respostas de modelos de IA pode reduzir as taxas de token. Se os usuários fornecerem a mesma entrada repetidamente, você não pagará por inúmeras chamadas ao modelo de IA.
A plataforma também deve permitir que você evite as taxas por "tempo total decorrido", quando aplicativos e agentes estão esperando por entradas ou respostas Ela devem cobrar você somente quando seus aplicativos estiverem realmente fazendo algo. E como pode ser necessário mover dados de um ambiente de armazenamento para outro, a plataforma deve eliminar as taxas de saída de dados.
A Cloudflare oferece uma base escalável, segura e econômica para desenvolver, executar e proteger aplicativos e agentes com tecnologia de IA. A Cloudflare oferece um amplo portfólio de serviços para otimizar o desenvolvimento de aplicativos de IA e de agentes de IA, incluindo uma plataforma para acelerar o desenvolvimento de IA, um SDK para criar agentes com tecnologia de IA, serviços de segurança para proteger aplicativos de IA e armazenamento de objetos para armazenar conjuntos de dados de rápido crescimento sem incorrer em taxas de saída.
É importante ressaltar que a plataforma da Cloudflare foi projetada para ser compatível com o modelo de nanosserviços, permitindo desenvolver e escalar milhões de aplicativos e agentes hiperpersonalizados. Ela também fornece a continuidade de estado necessária para manter o contexto entre as sessões. E enquanto os hiperescaladores fazem com que você combine vários serviços distintos para desenvolver, proteger e implementar aplicativos, a Cloudflare oferece todos os recursos em uma única plataforma de nuvem de conectividade unificada. A rede global da Cloudflare permite que voc ê execute esses aplicativos e agentes próximo aos usuários, proporcionando experiências responsivas e de baixa latência.
Usar a Cloudflare como base para a IA pode ajudar você a criar e fornecer aplicativos e agentes inovadores e hiperpersonalizados de forma rápida, segura e com economia. Com essa base estabelecida, você pode trabalhar para maximizar ainda mais o ROI da IA para sua empresa, ao mesmo tempo em que reduz os riscos.
Este artigo é parte de uma série sobre as tendências e os assuntos mais recentes que influenciam os tomadores de decisões de tecnologia hoje em dia.
Saiba como apoiar as iniciativas de IA empresarial e, ao mesmo tempo, aprimorar a segurança no guia Garantir práticas seguras de IA: um guia para CISOs sobre como criar uma estratégia de IA escalável.
Após ler este artigo, você entenderá:
Como a IA e os nanosserviços estão transformando o desenvolvimento de aplicativos
Por que os hyperscalers não conseguem apoiar adequadamente aplicativos de IA
Três requisitos para plataformas de desenvolvimento de aplicativos de IA