Cloudflare의 theNet

AI의 성능은 그 토대를 따라갑니다

개인 맞춤형 AI 기반 경험 구축을 위한 기준

기업들은 운영 효율성을 개선하고 경쟁 우위를 확보하기 위해 AI 도입에 박차를 가하고 있습니다. 실제로 최근 설문 조사에서 응답자의 71%가 조직에서 이미 생성형 AI(GenAI)를 정기적으로 사용하고 있다고 답했습니다.

기존 생성형 AI 서비스를 활용하는 것 외에도, 많은 조직이 고도로 개인화된 고객 경험을 제공하기 위해 자체 AI 기반 애플리케이션과 AI 에이전트를 구축하고 있습니다. 이들은 전 세계 고객 기반에 고도로 맞춤화된 구매 추천, 제품 정보 및 지원을 제공하는 애플리케이션과 에이전트를 만들 수 있는 엄청난 기회를 인지하고 있습니다.

이러한 초개인화에 대한 집중은 애플리케이션 개발의 새로운 모델로의 전환과 맞물려 있습니다. 개발자들은 애플리케이션을 AI 에이전트 역할을 수행할 수 있는 더 작고 단일 기능만 하는 구성 요소로 점차 분해하고 있습니다. 이 새로운 모델을 통해 개발자는 성능, 복원성 및 보안을 개선하면서 새로운 에이전트를 신속하게 생산할 수 있습니다.

문제는 단 하나, 개발자들이 애플리케이션을 개발할 때 하이퍼스케일러를 사용하는 경우가 많다는 것입니다. 그러나 하이퍼스케일러는 이 새로운 애플리케이션 모델을 제대로 지원할 수 없습니다. 수백만 명의 개별 사용자에게 맞춤형 애플리케이션 또는 에이전트를 제공하도록 설계되어 있지 않기 때문입니다.

우리에게는 AI 시대에 맞는 새로운 토대가 필요합니다. 즉 차세대 애플리케이션과 에이전트를 구축하고 배포하기 위한 새로운 인프라가 필요합니다. 이러한 토대를 찾는 일은 애플리케이션 개발의 주요 변화를 이해하고 하이퍼스케일러의 한계를 파악한 다음 필수 요구 사항을 정의하는 것에서 시작됩니다. 일단 토대가 마련되면, 비즈니스 목표를 해결하고 고객의 기대를 충족하는 애플리케이션과 에이전트를 구축할 수 있습니다.


AI 및 나노 서비스가 애플리케이션 개발을 혁신하는 방식

모든 사용자에게 동일한 경험을 제공하는 대규모의 모놀리식 애플리케이션을 구축하는 시대는 저물고 있습니다. 이제 애플리케이션 개발에 새로운 패러다임을 불러오기 위해 두 가지 핵심 트렌드가 함께 만들어지고 있습니다. 조직에서는 AI를 사용하여 고도로 개인화된 경험을 창출하고, 새로운 아키텍처 모델을 채택하여 애플리케이션을 구축하고 제공하고 있는 것입니다.

1. 초개인화에 AI 집중

애플리케이션을 개발하는 팀은 더 이상 과도한 정보와 관련 없는 제안으로 사용자를 압도하는 획일적인 방식으로 애플리케이션 환경을 제공해서는 안 됩니다. 오늘날 고객은 리테일, 금융 서비스, 게임 등 어떤 분야에서든 애플리케이션이 자신의 정확한 선호도와 관심사를 반영하는 매력적인 경험을 제공하기를 기대합니다.

AI 애플리케이션과 에이전트는 이러한 초개인화된 경험을 제공하는 데 도움이 됩니다. 또한 팀에서 수동 개발 작업을 늘리지 않고도 대규모로 이를 수행할 수 있습니다.

귀사에서 캘린더 소프트웨어를 제공한다고 가정해 보겠습니다. 고객이 자녀의 축구 경기와 같은 특정 유형의 이벤트를 예약할 수 있는 기능을 넣을 수 있을 것입니다. 각 사용자가 고유한 AI 에이전트를 가지게 되며, 이 에이전트는 리그의 온라인 이벤트 일정에서 경기 정보를 수집하여 개인 맞춤형 캘린더를 채워줍니다. AI 에이전트를 사용하면 수천 또는 수백만 명의 고객에게 이러한 맞춤형 경험을 제공할 수 있습니다.

2. 나노서비스로 전환

AI 애플리케이션 및 에이전트를 통해 초개인화된 경험을 제공하려는 움직임은 소프트웨어 개발의 중요한 변화에 의해 촉진됩니다. 모놀리식 애플리케이션에서 마이크로서비스로 전환한 후, 개발자들은 이제 “나노서비스” 모델을 도입하고 있습니다. 이 모델은 애플리케이션 기능을 작고 독립적인 단일 목적 구성 요소로 분리하며, 이는 마이크로서비스보다도 더 세분화되고 자율적인 구조를 지향합니다. 마이크로서비스 접근 방식과 마찬가지로, 나노서비스는 개발 가속화 및 애플리케이션 복원성 향상에 기여하며, 고도의 개인화 또한 가능하게 합니다.

각 나노서비스 구성 요소는 에이전트로서 기능하며, 매우 구체적이고 고도로 맞춤화된 작업을 수행합니다. 수백만 명의 사용자를 대상으로 하는 단일 애플리케이션을 구축하는 대신, 이 아키텍처를 통해 수백만 개의 고유하고 맞춤화된 에이전트를 제공할 수 있습니다.

이 아키텍처 모델에 AI를 통합하면 에이전트를 통해 개별화된 경험을 대규모로 제공할 수 있습니다. 사용자 입력(프롬프트, 검색 기록, 채팅 등)을 대규모 언어 모델(LLM)에 보내고, 그 결과를 바탕으로 개인 맞춤형 작업을 실행할 수 있는 것입니다. 프로세스를 한 번 실행하고 종료하거나, 수백만 번 사용할 수도 있습니다.

따라서 나노서비스와 AI를 결합하는 것은 사용자에게 제공하는 경험의 종류에 혁신적인 영향을 줄 수 있습니다. 그럼에도 불구하고, 일반적인 하이퍼스케일러 제품으로는 나노서비스와 AI를 최대한 활용하기 어려울 수 있습니다.


AI 애플리케이션을 위한 하이퍼스케일러의 한계 식별

하이퍼스케일러가 애플리케이션 구축 및 제공에 선호되는 수단이라는 것은 당연합니다. 일반적으로 기존 온프레미스 환경보다 훨씬 유연하고 비용 효율적이기 때문입니다. 하지만 확장 가능성 제약, 스테이트리스 특성, 보안 한계, 추가적인 비용 등은 AI를 위한 최선의 토대가 아니라는 것을 의미합니다.

확장 가능성

하이퍼스케일러는 단일 애플리케이션 확장성이 뛰어납니다. 하이퍼스케일러를 사용하면 동일한 단일 애플리케이션을 수천 명의 사용자에게 제공할 수 있습니다. 그러나 하이퍼스케일러는 수백만 명의 개인에게 수백만 개의 독립적인 애플리케이션 또는 에이전트를 효율적으로 제공할 수 있는 적합한 애플리케이션 아키텍처를 갖추고 있지는 않습니다.

또한 애플리케이션과 에이전트를 신속하게 시작하거나 중단하는 자동화된 프로세스가 부족합니다. 시즌이 시작될 때 축구 경기 일정 관리를 위한 맞춤형 AI 에이전트를 원하는 사용자가 갑자기 수천 명 생길 수 있습니다. 이 수요를 충족하려면 독립 에이전트를 순식간에 가동해야 합니다. 그리고 시즌이 종료되고 수요가 줄어들면 리소스를 절약하기 위해 해당 애플리케이션을 즉시 스핀다운(종료)해야 합니다.

대부분의 하이퍼스케일러에서 개별 애플리케이션에 대한 리소스 프로비저닝은 시간이 오래 걸리는 수동 작업입니다. 그러한 환경은 수많은 개별 맞춤형 애플리케이션을 지원하도록 설계되지 않았습니다.

스테이트리스 특성

하이퍼스케일러는 AI 에이전트 실행에 필요한 스테이트풀 특성을 제공할 수 없습니다. AI 에이전트는 한 세션에서 다음 세션으로 컨텍스트, 사용자 선호도 및 사용자 상호 작용을 기억해야 합니다. 이러한 스테이트풀 특성은 사용자가 애플리케이션을 상당한 기간 동안 사용하지 않은 경우에도 처음부터 작업을 다시 시작하는 대신 작업을 중단한 지점에서 바로 시작할 수 있도록 해줍니다.

그러나 하이퍼스케일러는 스테이트풀 특성보다 확장성과 안정성을 우선적으로 고려합니다. 하이퍼스케일러는 변화하는 수요에 대응하기 위해 리소스를 쉽고 빠르게 추가 또는 제거할 수 있도록 설계되었으며, 문제가 발생 시 신속하게 교체할 수 있습니다. 이러한 스테이트리스 유연성은 데이터를 메모리에 보관해야 한다는 단점과 함께합니다.

보안

고도로 개인화된 AI 기반 애플리케이션 및 에이전트를 만들 때에는 한 사용자의 애플리케이션/에이전트 데이터에 다른 사용자가 액세스할 수 없도록 해야 합니다. 예를 들어, AI 에이전트로 자녀의 축구 일정을 관리하는 경우, 다른 사람이 자녀의 위치 정보에 접근하는 것을 원하지 않을 것입니다.

하이퍼스케일러는 나노서비스 기반 에이전트를 위해 설계된 애플리케이션 아키텍처를 제공하지 않으므로 각 에이전트를 적절히 보호할 수 없습니다. AI 애플리케이션이나 에이전트를 개발하고 있다면, 프롬프트 삽입, 출력 처리 취약점, 데이터 포이즈닝, 공급망 취약점 등 AI 모델이 당면한 다양한 위협으로부터 보호하는 것도 필수적입니다. 모든 하이퍼스케일러가 이러한 위협과 기타 보안 문제를 처리할 만큼 충분한 내장 보안 기능을 갖춘 것은 아닙니다.

그리고 개발자가 LLM을 사용하여 코드를 작성하는 데 도움이 되는 "바이브 코딩"을 위해 하이퍼스케일러와 그 AI 모델을 사용하는 경우, 모델이 의도치 않게 보안 취약점을 발생시키지 않도록 해야 합니다.

비용

AI 기반 애플리케이션을 하이퍼스케일러에서 실행하면 비용이 빠르게 증가합니다. AI 모델에 대한 모든 입력과 출력이 요금 부과 대상이 되기 때문입니다. 리소스가 요청을 처리하지 않는 시간에도 할당된 시간에 대해 요금을 청구하는 곳도 있습니다. 축구 일정 관리 AI 에이전트가 리그 온라인 캘린더에서 경기 시간 또는 장소 업데이트를 반복적으로 확인한다고 가정해 보겠습니다. 코드가 사용자 입력을 대기하거나 리그 온라인 캘린더와 같은 외부 소스로부터 응답을 기다리는 경우에도, 클라우드 공급자는 리소스가 예약된 모든 시간에 대해 애플리케이션 제공 회사에 요금을 부과합니다.

높은 데이터 송신료가 발생할 수도 있습니다. 하이퍼스케일러는 다른 클라우드 공급자의 애플리케이션을 통해 사용자에게 데이터를 제공하거나 자체 클라우드에서 다른 클라우드로 데이터를 전송할 때 데이터 송신료를 부과합니다. 클라우드 내에서 데이터를 전송하는 경우에도 지역 데이터 송신료가 발생할 수 있습니다.


AI 플랫폼의 네 가지 주요 기준은 무엇입니까?

AI 기반 애플리케이션을 구축 및 실행하기 위한 클라우드 기반 플랫폼을 선택할 때, 네 가지 주요 요구 사항을 확인해야 합니다.

1. 다대다 확장성

첫째, 플랫폼은 고도로 개인화된 AI 애플리케이션과 에이전트를 구현하는 나노서비스를 지원하도록 설계된 애플리케이션 계층을 제공해야 합니다. 수백만 개의 정밀하게 맞춤화된 애플리케이션과 에이전트를 손쉽게 생성할 수 있어야 하며, 이들 모두 동시에 실행되면서 사용자 가까이 에지에서 제공되어야 합니다. 또한 이러한 애플리케이션을 밀리초 내에 자동으로 확장하거나 축소할 수 있어야 합니다.

2. 스테이트풀 특성

이 플랫폼을 통해 몇 분, 몇 시간, 며칠 또는 몇 주 동안 메모리에 컨텍스트를 보존하는 스테이트풀 에이전트를 구축할 수 있어야 합니다. 기존의 스테이트리스/서버리스 아키텍처와 달리, 스테이트풀 플랫폼은 에이전트가 오랜 시간이 지난 후에도 상호 작용을 재개하고 복잡한 장기 실행 작업을 수행할 수 있도록 지원합니다.

3. 애플리케이션 보안 기본 탑재

AI 개발에 가장 적합한 플랫폼은 애플리케이션과 에이전트에 보안 기능을 쉽게 구축할 수 있도록 지원해야 합니다. 이를 통해 중요한 데이터를 보호하는 안전하고 분리된 나노서비스를 만들 수 있습니다. 동시에, 개발자들이 자신 있게 코드를 작성할 수 있도록 지원하는 도구를 제공하여, AI 모델을 애플리케이션과 통합할 때 발생할 수 있는 데이터 유출, 프롬프트 삽입 공격 등 다양한 위협을 방지할 수 있어야 합니다.

4. 과도한 수수료 방지

토대가 되는 AI 플랫폼은 AI 애플리케이션 실행 비용을 최소화하는 다양한 방법을 제공해야 합니다. 예를 들어, AI 모델 응답을 캐싱하면 토큰 수수료를 줄일 수 있습니다. 사용자가 동일한 입력을 반복적으로 제공하더라도 AI 모델을 여러 번 호출한 데 따른 요금이 부과되지 않아야 합니다.

또한, 이 플랫폼에서는 애플리케이션과 에이전트가 입력 또는 응답을 기다리는 동안 발생하는 '실제 경과 시간'에 대한 수수료가 없어야 합니다. 대신, 애플리케이션이 실제로 작업을 수행할 때만 요금이 부과되어야 합니다. 데이터를 한 스토리지 환경에서 다른 스토리지 환경으로 이동해야 할 수도 있으므로 데이터 송신 수수료도 없어야 합니다.


AI를 위한 토대 구현

Cloudflare에서는 AI 기반 애플리케이션 및 에이전트를 구축, 실행보호하기 위한 확장 가능하고 안전하며 비용 효율적인 토대를 제공합니다. Cloudflare는 AI 개발 가속화를 위한 플랫폼, AI 기반 에이전트 구축을 위한 SDK, AI 애플리케이션 보호를 위한 보안 서비스, 빠르게 증가하는 데이터 세트를 저장하기 위한 개체 스토리지 등 AI 애플리케이션과 AI 에이전트 개발을 간소화하기 위한 광범위한 서비스 포트폴리오를 송신료 없이 제공합니다.

중요한 것은 Cloudflare 플랫폼이 수백만 개의 고도로 개인화된 애플리케이션과 에이전트를 구축하고 확장할 수 있도록 지원하는 나노서비스 모델을 위해 설계되었다는 점입니다. 또한 세션 간 컨텍스트 유지를 위한 스테이트풀 특성도 갖추고 있습니다. 하이퍼스케일러는 애플리케이션을 구축, 보호, 배포하기 위해 여러 개의 개별 서비스를 연결해야 하지만, Cloudflare는 단일 통합 클라우드 연결성 플랫폼에서 모든 기능을 제공합니다. Cloudflare의 글로벌 네트워크를 통해 개별 사용자와 가까운 위치에서 애플리케이션과 에이전트를 실행하여 응답성이 뛰어나고 짧은 대기 시간을 경험할 수 있습니다.

Cloudflare를 AI의 토대로 활용하면 혁신적이고 고도로 개인화된 애플리케이션과 에이전트를 신속하고 안전하며 경제적으로 구축하고 제공할 수 있습니다. 이러한 토대 위에서 위험을 줄이면서 기업의 AI 투자 수익률(ROI)을 더욱 극대화할 수 있습니다.

이 글은 오늘날의 기술 의사 결정자에게 영향을 주는 최신 동향 및 주제에 대한 시리즈 중 일부입니다.



이 주제에 관해 자세히 알아보세요.

안전한 AI 관행 보장: 확장 가능한 AI 전략 수립 방법에 대한 CISO 가이드에서 보안을 강화하면서 엔터프라이즈 AI 이니셔티브를 지원하는 방법을 알아보세요.





핵심 사항

이 글을 읽고 나면 다음을 이해할 수 있습니다.

  • AI 및 나노 서비스가 애플리케이션 개발을 혁신하는 방식

  • 하이퍼스케일러가 AI 애플리케이션을 제대로 지원할 수 없는 이유

  • AI 애플리케이션 개발 플랫폼을 위한 3가지 요구 사항


관련 자료


가장 인기있는 인터넷 인사이트에 대한 월간 요약을 받아보세요!