LLM Agent Business Cases
LLM Agent Business Cases
기본 사례 조사
Klarna (핀테크) - “상담원 700명 분의 업무”
AI가 실제 인력의 업무량을 대체한 가장 유명하고 파급력 있는 사례다.
- 구체적 성과:
- 처리량: 도입 첫 달에만 230만 건의 대화를 처리했다. 이는 전체 고객 서비스 채팅의 3분의 2에 해당한다.
- 효율성: 고객 만족도는 인간 상담원과 동일하게 유지하면서도, 문제 해결 시간은 11분에서 2분 미만으로 단축했다.
- 재무적 영향: Klarna는 이를 통해 2024년에 4,000만 달러(약 530억 원)의 수익 개선 효과가 있을 것으로 추산했다.
- 에이전트 기능: 단순히 대화만 하는 것이 아니라, 시스템에 접속해 환불 및 반품 처리를 사람의 승인 없이 규정에 따라 직접 수행한다.
Frontier Airlines (여행/항공) - 운영 자동화
미국의 저가 항공사 Frontier는 공격적으로 ‘전화 상담’을 없애고 AI 에이전트로 전환했다.
- 구체적 성과:
- 전환: 고객 서비스 전화번호를 없앴다. 전화를 걸면 챗봇을 이용하라는 안내가 나오고 끊긴다.
- 기술: 단순한 시나리오 챗봇이 아니라, RAG(검색 증강 생성) 기술을 활용한 에이전트 시스템을 도입했다. 항공사의 방대한 정책 문서를 실시간으로 참조하여, 항공권 변경이나 크레딧 발급 같은 업무를 시스템상에서 직접 실행한다.
- 결과: 현재 수백만 명의 승객이 AI 채팅 도구를 기본 인터페이스로 사용 중이다.
Morgan Stanley (금융) - “AI @ Morgan Stanley”
직원을 대체하는 것이 아니라, 직원의 능력을 증강(Augment)시키는 내부용 에이전트의 대표 사례다.
- 구체적 성과:
- 도구: GPT-4 기반의 ‘AI @ Morgan Stanley Assistant’를 자체 개발했다.
- 데이터: 은행 내부의 10만 건 이상의 리서치 리포트, 지적 자산, 투자 정책 데이터를 학습하고 검색한다.
- 도입률: 2024/2025년 기준, 자산 관리 팀의 98%가 이 도구를 업무에 사용하고 있다.
- 워크플로우: 자산 관리사가 “테크 주식 리스크 관리는 어떻게 해야 해?”라고 물으면, 에이전트가 관련 내부 정책을 찾아 요약하고, 근거가 되는 원본 문서 링크를 함께 제시하여 규정 위반을 방지한다.
Nubank (은행) - Cognition ‘Devin’ 활용
‘Devin’은 Cognition Labs가 만든 AI 소프트웨어 엔지니어 제품이며, 라틴 아메리카의 거대 핀테크 기업 Nubank가 이를 실제 업무에 도입했다.
- 구체적 성과:
- 작업: Nubank는 ‘레거시 코드 마이그레이션(오래된 코드를 최신 언어/형식으로 바꾸는 작업)’에 Devin을 투입했다. 이는 개발자들이 기피하는 지루하고 시간 소모적인 작업이다.
- 효율성: 인간 엔지니어가 수작업으로 할 때보다 12배 높은 효율을 기록했다.
- 에이전트 행동: Devin은 단순히 코드를 짜는 게 아니라, 코드를 실행해 보고(Test), 오류가 나면 로그를 분석해 스스로 수정(Fix)한 뒤 최종 결과물을 제출했다.
Mercari (이커머스) - 쇼핑 어시스턴트 ‘Merchat AI’
미국 시장에서 중고거래 앱 Mercari가 도입한 쇼핑 에이전트 사례다.
- 구체적 성과:
- 기능: 사용자의 모호한 의도를 파악해 검색 필터로 변환한다.
- 구현: 사용자가 “90년대 파티에 입고 갈 빈티지 옷 찾아줘”라고 말하면, 에이전트가 ‘90년대’, ‘빈티지’, ‘의류’라는 맥락을 이해하고, 검색 조건을 [카테고리: 의류, 연대: 1990-1999, 스타일: 레트로] 등으로 스스로 설정해 물건을 찾아준다.
B2B 사례 조사
Salesforce (제공) → Wiley (도입: 글로벌 출판/교육 기업)
세일즈포스의 새로운 에이전트 플랫폼인 ‘Agentforce’를 도입하여 고객 서비스의 질을 바꾼 사례다.
- 배경: Wiley는 교과서 및 연구 논문을 다루는 기업으로, 학기가 시작될 때마다 “내 구독 상품이 왜 안 되나요?”, “책 배송은 언제 되나요?” 같은 문의가 폭주했다. 기존의 구형 챗봇은 답변을 못 하고 상담원에게 넘기기 일쑤였다.
- 활용 방법
- Wiley는 Salesforce의 Agentforce를 도입했다.
- 이 에이전트는 미리 입력된 대본을 읽는 게 아니라, Wiley의 지식 베이스(Knowledge Base)와 CRM) 데이터에 직접 접근 권한을 가졌다.
- 고객이 문의하면 에이전트가 스스로 고객의 주문 기록을 조회하고, 배송사 시스템을 확인한 뒤, “현재 배송 지연 중이며 2일 뒤 도착 예정입니다”라고 답하거나 환불 절차를 수행했다.
- 구체적 성과
- 과거에 비해 사람의 개입 없이 사건을 해결하는 자동 해결률(Resolution Rate)이 50% 이상 증가했다.
- 단순 문의 처리에 투입되던 상담 인력을 줄이고, 복잡한 연구 지원 업무에 재배치하여 운영 효율을 높였다.
Intercom (제공) → Nuvei (도입: 글로벌 핀테크/결제 기업)
고객 상담 솔루션 기업 Intercom이 만든 AI 에이전트 ‘Fin’을 B2B로 도입한 사례다.
- 배경: Nuvei는 전 세계 가맹점에 결제 시스템을 제공한다. 개발자들이 API 연동 문제로 기술적인 질문을 많이 하는데, 내용이 너무 어려워 일반 상담원이 처리하기 힘들고 답변에 시간이 오래 걸렸다.
- 활용 방법
- Nuvei는 Intercom의 ‘Fin’ 에이전트를 도입하고, 자사의 방대한 기술 문서(API Documentation)와 개발자 가이드를 학습시켰다.
- Fin 에이전트는 고객(개발자)이 “오류 코드 503이 뜹니다”라고 물으면, 문서를 검색해 원인을 파악하고 해결 코드를 즉시 제시한다. 만약 해결 못 하면 “기술 지원 팀 티켓을 생성할까요?”라고 묻고 직접 티켓을 발행한다.
- 구체적 성과
- 고객 지원 비용을 50% 절감했다.
- 고객 만족도 점수(CSAT)가 인간 상담원만 있을 때보다 오히려 향상되었다.
- 에이전트가 문의의 상당수를 즉시 해결함으로써, 인간 엔지니어들이 단순 반복 답변에서 해방되었다.
AWS (제공) → Lonely Planet (도입: 여행 가이드북 기업)
아마존의 ‘Amazon Bedrock’을 활용해 여행 일정 설계 에이전트를 구축한 사례다.
- 배경: 론리플래닛은 50년간 쌓아온 방대한 여행지 데이터가 있었지만, 책이나 정적인 웹페이지 형태라 사용자가 일일이 찾아봐야 했다.
- 활용 방법
- AWS Bedrock의 Claude 모델을 기반으로 에이전트를 구축했다.
- 이 에이전트는 론리플래닛의 독점 여행 콘텐츠 데이터베이스를 조회할 수 있는 도구를 갖췄다.
- 사용자가 “도쿄에서 3일간 조용한 골목 여행을 하고 싶어”라고 말하면, 에이전트가 데이터를 검색해 구체적인 3일 치 동선을 짜고, 각 장소에 대한 론리플래닛의 리뷰를 요약해 제공한다.
- 구체적 성과
- 여행 일정 생성 시간이 수 시간(사용자 검색 시간)에서 60초 미만으로 단축되었다.
- 단순 검색 대비 사용자 체류 시간이 늘어나고, 추천된 호텔/투어 예약으로 이어지는 전환율 기회가 창출되었다.
Harvey (제공) → PwC (도입: 글로벌 회계/컨설팅 펌)
법률/세무 전문 에이전트 스타트업 Harvey가 대형 컨설팅 펌에 솔루션을 판매한 사례다.
- 배경: PwC의 변호사와 회계사들은 매일 수천 페이지의 계약서와 세법 문서를 검토하는 데 엄청난 시간을 썼다.
- 활용 방법
- PwC는 Harvey와 독점 파트너십을 맺고, 전 세계 4,000명 이상의 법률 전문가에게 이 에이전트 접근 권한을 줬다.
- 에이전트는 계약서를 업로드하면 “제3조 2항이 최신 EU 규정에 위배될 소지가 있음”과 같이 구체적인 리스크를 지적하고, 수정 문구를 작성해 제안한다.
- 구체적 성과
- 법률 실사(Due Diligence) 및 계약 분석 업무 속도가 40% 이상 빨라졌다.
- 반복적인 문서 검토 시간을 줄임으로써, 고객에게 더 높은 수준의 전략적 자문을 제공할 수 있게 되었다.
Service-as-a-Software
공급망 및 구매 (Procurement) - “자율 협상 에이전트”
단순히 주문을 넣는 게 아니라, 공급업체와 ‘가격 및 계약 조건 협상’을 직접 계획하고 수행하는 사례이다.
- 제공 기업: Pactum AI
- 도입 기업: Walmart (월마트)
- 활용 방법
- 월마트는 수만 개의 소규모 공급업체와 거래하는데, 구매 담당자가 일일이 이들과 계약을 갱신하거나 가격 협상을 하는 것은 불가능했다. (인건비 문제).
- Pactum의 AI 에이전트에게 “이 공급업체들과 계약을 갱신하되, 예산은 5% 절감하고 지불 조건은 60일로 맞춰봐”라는 목표를 준다.
- 계획 및 실행: 에이전트는 과거 데이터를 분석해 협상 전략을 짭니다. 그 후 공급업체(사람)에게 챗봇으로 말을 걸어 “원자재 값이 올랐으니 가격을 올려달라”는 상대의 말에 “그럼 지불 기한을 당겨줄 테니 가격은 동결하자”는 식으로 실시간 줄다리기(협상)를 한다. 합의가 되면 계약서까지 써서 체결한다.
- 구체적 성과
- 에이전트가 접촉한 공급업체의 68%와 협상을 타결했다.
- 이를 통해 평균 6.8%의 비용 절감 효과를 냈으며, 월마트 구매팀은 전략적인 대형 계약에만 집중할 수 있게 되었다.
재무 및 회계 (Accounting) - “자율 회계 팀”
송장을 읽는 것을 넘어, ‘언제 돈을 줄지’ 자금 집행을 계획하는 사례다.
- 제공 기업: Vic.ai
- 도입 기업: Elkjøp (북유럽 최대 전자제품 유통사)
- 활용 방법
- Vic.ai는 유입되는 수만 장의 송장을 분석해 ‘어떤 계정과목’으로 처리할지 스스로 판단한다.
- 계획 및 실행: 더 중요한 건 결제 타이밍 계획이다. 에이전트가 “이 송장은 지금 결제하면 2% 조기 납부 할인을 받을 수 있다”거나 “현금 흐름을 위해 마감일에 맞춰 결제하자”는 의사결정을 스스로 내려 자금 집행 스케줄을 짠다.
- 구체적 성과
- 전체 송장 처리 업무의 80% 이상을 사람의 개입 없이 에이전트가 단독으로 수행했다.
- 회계팀은 단순 전표 입력에서 벗어나 재무 분석 업무로 전환되었다.
인사 및 채용 (Recruiting) - “AI 헤드헌터”
이력서 필터링을 넘어, 인재를 찾아내고 ‘영입 시나리오’를 짜서 인터뷰까지 잡아오는 사례다.
- 제공 기업: Moonhub
- 도입 기업: Anthropic (Claude 개발사), Inflection AI
- 활용 방법
- 기업이 “5년 차 이상의 백엔드 엔지니어가 필요해”라고 요청한다.
- 계획 및 실행: Moonhub의 에이전트는 링크드인, 깃허브 등을 뒤져 숨은 인재를 찾는다. 그리고 그 사람에게 보낼 맞춤형 영입 제안 메일을 작성하여 발송한다. 답장이 없으면 “바쁘시겠지만 확인 부탁한다”며 후속 메일(Follow-up)을 보낼 계획까지 세우고 실행한다. 후보자가 관심을 보이면 인터뷰 일정까지 조율한다.
- 구체적 성과
- 전통적인 헤드헌팅 펌보다 2배 빠른 속도로 채용을 성사시켰다.
- 인간 리크루터가 하는 ‘소싱(Sourcing)’과 ‘아웃리치(Outreach)’ 업무를 에이전트가 전담했다.
마케팅 (Marketing) - “브랜드 마케터”
카피 한 줄이 아니라, 브랜드 가이드라인을 준수하며 ‘캠페인 전체 콘텐츠’를 기획하고 생성하는 사례다.
- 제공 기업: Typeface
- 도입 기업: LG 전자 (글로벌 마케팅 부서)
- 활용 방법
- LG전자는 전 세계에 일관된 브랜드 메시지를 전달해야 했다.
- Typeface 에이전트에 LG의 브랜드 톤앤매너(글체, 색감 등)와 제품 정보를 학습시킨다.
- 계획 및 실행: “신제품 세탁기 런칭 캠페인을 해줘”라고 하면, 에이전트가 인스타그램용 이미지, 블로그용 상세 글, 뉴스레터 문안 등을 매체별 특성에 맞게 세트로 기획하고 제작한다. 디자이너와 카피라이터가 한 팀으로 일하는 것과 같은 결과를 낸다.
- 구체적 성과
- 콘텐츠 제작 시간을 획기적으로 단축하면서도, 전 세계 어느 채널에서나 브랜드 일관성(Brand Consistency)을 유지하는 데 성공했다.
This post is licensed under CC BY 4.0 by the author.