AI コパイロットが日常になった5つの産業 ― 公開事例と研究で読む導入パターン

GitHub·Klarna·Allen & Overy·BCG·Siemens — 기업 공식 발표와 공개 연구로 확인된 산업별 AI 코파일럿 도입 사례, 그리고 숫자가 말해주지 않는 한계까지.

한 산업이 아니다

AI 코파일럿은 "개발자 도구"의 이미지에서 시작했지만, 2023~2025년 사이 법률·컨설팅·고객 서비스·제조·물류까지 일상 도구로 들어왔다. 이 글은 익명 사례나 추정치가 아니라, 기업이 직접 발표했거나 공개 연구로 검증된 사례만 모아 산업별 도입 패턴을 정리한다. 모든 수치에는 원 출처를 달았다.

#	산업	사례	공개 근거
1	소프트웨어 개발	GitHub Copilot 통제 실험 + METR 연구	논문 2편 (arXiv)
2	법률	Allen & Overy × Harvey	회사 공식 발표 (2023)
3	컨설팅	BCG × Harvard 필드 실험	HBS 워킹페이퍼 (2023)
4	고객 서비스	Klarna AI 어시스턴트 + NBER 연구	프레스릴리스 + 논문
5	제조·물류	Siemens × thyssenkrupp, DHL	프레스릴리스 (2024)

1. 소프트웨어 개발 — 가장 많이 측정됐고, 결과가 갈린다

가장 유명한 통제 실험은 GitHub 연구팀의 2022년 실험이다. 전문 개발자 95명에게 JavaScript HTTP 서버 구현 과제를 주고 무작위로 Copilot 사용 여부를 나눴다. Copilot 그룹은 55.8% 빨리 과제를 끝냈고(1시간 11분 vs 2시간 41분), 완료율도 더 높았다(78% vs 70%). 특히 경력이 짧은 개발자의 이득이 컸다. (arXiv:2302.06590)

그러나 반대 방향의 결과도 있다. METR의 2025년 무작위 통제 실험에서는 평균 100만 줄 이상 코드베이스에서 5년 이상 일해 온 숙련 오픈소스 개발자 16명이 실제 이슈 246건을 처리했는데, AI 도구(주로 Cursor + Claude)를 허용한 과제가 오히려 19% 더 오래 걸렸다. 흥미로운 건 인식 격차다 — 참가자들은 사전에 24% 단축을 예상했고, 실험이 끝난 뒤에도 20% 빨라졌다고 믿었다. (METR, 2025)

두 연구를 겹쳐 읽으면 패턴이 나온다: 작고 독립적인 과제 + 낮은 숙련도일수록 이득이 크고, 크고 익숙한 코드베이스 + 높은 숙련도일수록 이득이 줄거나 역전된다.

2. 법률 — Allen & Overy의 Harvey 전사 도입

글로벌 로펌 Allen & Overy(현 A&O Shearman)는 2023년 2월, OpenAI 모델 기반 법률 AI 플랫폼 Harvey를 전사 도입한다고 발표했다. 2022년 11월부터 진행한 시범 기간 동안 43개 오피스의 변호사 약 3,500명이 4만 건 안팎의 쿼리를 실제 클라이언트 업무에 사용했다. 용도는 계약서 초안, 판례 리서치, 실사(due diligence) 보조 등이다. (A&O Shearman 공식 발표)

주목할 점은 도입 방식이다. A&O는 Harvey 산출물에 대해 "변호사의 검증 필수"를 정책으로 못박았다. 즉 법률처럼 오류 비용이 큰 산업의 진입점은 "대체"가 아니라 초안 생성 + 인간 검증이었다.

관련 워크플로우 정리: /tools/lawyer-ai-tools

3. 컨설팅 — BCG × Harvard의 "들쭉날쭉한 경계" 실험

2023년 Harvard·Wharton·MIT 연구진과 BCG가 진행한 필드 실험은 컨설턴트 758명에게 실제 컨설팅 업무와 유사한 18개 과제를 주고 GPT-4 사용 여부를 무작위 배정했다. 결과는 두 얼굴이었다. (Dell'Acqua et al., HBS Working Paper 24-013)

AI가 잘하는 과제(프런티어 안): 과제 완료량 +12.2%, 속도 +25.1%, 품질 +40%
AI가 못하는 과제(프런티어 밖): 정답 도달률이 통제 그룹보다 19%p 하락

연구진은 이를 "jagged technological frontier(들쭉날쭉한 기술 경계)"라 불렀다. AI가 잘하는 일과 못하는 일의 경계가 직관적이지 않아서, 경계 밖 과제에 AI를 쓰면 오히려 자신 있게 틀리게 된다는 것. 어느 과제가 경계 안인지 판별하는 능력 자체가 새 직무 역량이라는 게 이 실험의 핵심 함의다.

4. 고객 서비스 — Klarna의 전면 도입과 부분 회귀

핀테크 Klarna는 2024년 2월, OpenAI 기반 AI 어시스턴트가 출시 첫 달에 230만 건의 대화(전체 고객 채팅의 3분의 2)를 처리했고, 이는 풀타임 상담원 약 700명 분량이라고 발표했다. 문제 해결 시간은 평균 11분에서 2분 미만으로 줄었고, 재문의는 25% 감소, 2024년 이익 개선 효과를 4,000만 달러로 추정했다. (Klarna 프레스릴리스, OpenAI 케이스스터디)

그런데 이 사례의 진짜 교훈은 그 다음이다. 2025년 CEO Sebastian Siemiatkowski는 언론 인터뷰에서 "비용 절감을 너무 우선했다"며 인간 상담 인력을 다시 채용하겠다고 밝혔다. 복잡하고 감정적인 케이스에서 품질 저하가 드러났기 때문이다. 전면 자동화가 아니라 AI-인간 분담 재설계로 회귀한 것.

학술 근거도 같은 방향이다. NBER 연구(Brynjolfsson·Li·Raymond)는 상담원 5,179명 데이터를 분석해, AI 어시스턴트 도입이 시간당 문제 해결 수를 평균 14% 올렸지만 그 효과가 신입·저숙련 상담원에서 34%로 집중되고 최상위 숙련자에게는 미미했음을 보였다. (NBER w31161)

5. 제조·물류 — 코드와 문서가 진입점

제조에서는 Siemens가 2024년 11월, 산업 현장용 생성형 AI 어시스턴트 Industrial Copilot을 확장하고 thyssenkrupp Automation Engineering이 이를 채택해 2025년부터 글로벌 거점의 기계 엔지니어링에 적용한다고 발표했다. 용도는 PLC 제어 코드(SCL) 생성, TIA Portal 통합, 기계 시각화 자동 생성 등 — 제조에서도 진입점은 결국 "코드 초안"이다. (Siemens 프레스릴리스)

물류에서는 DHL Supply Chain이 2024년 10월, BCG X와 함께 생성형 AI를 도입해 고객 데이터 클렌징·초기 분석, 물류 솔루션 설계 보조, 문의 요약, 법무 문서 처리에 적용 중이라고 발표했다. 정량 수치는 공개하지 않았지만, "솔루션 설계 엔지니어의 제안서 작성 리드타임 단축"을 핵심 효과로 꼽았다. (DHL Group 프레스릴리스)

공개 사례들이 공통으로 보여주는 4가지

패턴	근거 사례
이득은 신입·저숙련에 집중된다	NBER(+34% vs 숙련자 미미), GitHub 실험(저경력 이득 최대)
숙련자 + 복잡한 도메인에선 역효과 가능	METR(-19%), BCG 프런티어 밖(-19%p)
전면 대체는 되돌림이 온다	Klarna의 2025년 인간 상담 재채용
산업 불문 진입점은 "초안 생성 + 인간 검증"	A&O(계약 초안), Siemens(PLC 코드), DHL(제안서)

내 직무에 적용할 때의 체크리스트

공개 사례에서 도출되는 실무 질문은 세 가지다. 이것은 데이터가 아니라 질문이므로, 답은 각자의 업무에서 직접 측정해야 한다.

내 과제는 프런티어 안인가 밖인가? — 반복적·독립적·검증 쉬운 과제(초안, 분류, 요약)는 안쪽일 확률이 높고, 깊은 도메인 맥락이 필요한 과제는 밖일 수 있다
검증 비용을 계산에 넣었는가? — METR 실험의 교훈: 체감 속도와 실측 속도는 다르다. 도입 전후를 같은 지표로 재라
어디까지 맡길지의 선을 문서화했는가? — A&O의 "변호사 검증 필수"처럼, AI-인간 분담선을 명시한 조직이 되돌림 비용을 줄인다

출처 (전체)

Peng et al., The Impact of AI on Developer Productivity: Evidence from GitHub Copilot (2023) — arxiv.org/abs/2302.06590
METR, Measuring the Impact of Early-2025 AI on Experienced Open-Source Developer Productivity (2025) — metr.org
Dell'Acqua et al., Navigating the Jagged Technological Frontier (HBS Working Paper 24-013, 2023) — aiinstitute.hbs.edu
Klarna, AI assistant handles two-thirds of customer service chats in its first month (2024) — klarna.com
Brynjolfsson, Li & Raymond, Generative AI at Work (NBER w31161, 2023; QJE 2025 게재) — nber.org/papers/w31161
A&O Shearman, A&O announces exclusive launch partnership with Harvey (2023) — aoshearman.com
Siemens, Industrial Copilot expanded, adopted by thyssenkrupp (2024) — press.siemens.com
DHL Group, DHL Supply Chain implements Generative AI (2024) — group.dhl.com

AI 코파일럿이 일상이 된 5개 산업 — 공개된 실사례와 연구로 보는 도입 패턴

한 산업이 아니다

1. 소프트웨어 개발 — 가장 많이 측정됐고, 결과가 갈린다

2. 법률 — Allen & Overy의 Harvey 전사 도입

3. 컨설팅 — BCG × Harvard의 "들쭉날쭉한 경계" 실험

4. 고객 서비스 — Klarna의 전면 도입과 부분 회귀

5. 제조·물류 — 코드와 문서가 진입점

공개 사례들이 공통으로 보여주는 4가지

내 직무에 적용할 때의 체크리스트

출처 (전체)

같은 축의 다른 글

AI 코딩 도구가 바꾼 신입 개발자 채용 — 2026년 글로벌 데이터

프롬프트 엔지니어링: 2026년 시장 생존 핵심 역량 5가지

2026년 AI 코딩의 진짜 상태 — 무엇이 끝났고 무엇이 시작됐나

AI 안전·평가 직무 진입 가이드 — 비전공자 12주 트랙

모든 직업과 모든 에이전트의 인프라