Chain of Draft: LLM의 효율적인 추론을 위한 새로운 패러다임

안녕하세요.

최근 몇 년간 인공지능(AI) 기술이 발전하면서 대형 언어 모델(LLM)이 다양한 문제를 해결하는 데 중요한 역할을 하고 있습니다. 특히, 복잡한 문제를 해결하기 위해 Chain-of-Thought(CoT)라는 방식이 도입되었습니다. CoT는 문제를 단계별로 나누어 설명하면서 답을 찾아가는 방식이지만, 이 과정에서 너무 많은 텍스트가 생성되고 계산 비용이 증가하는 문제가 발생합니다.

이를 해결하기 위해 체인 오브 드래프트(CoD)라는 새로운 접근 방식이 제안되었습니다. CoD는 필요한 핵심 정보만 포함하는 간결한 중간 단계를 생성하여, 계산 비용과 응답 시간을 줄이면서도 높은 정확도를 유지하는 방법입니다. 본 글에서는 CoD가 무엇인지, 어떻게 작동하는지, 그리고 기존 방식보다 어떤 장점이 있는지 자세히 알아보겠습니다.

CoT 추론 이해하기

기존의 CoT 방식은 모델이 문제를 해결하는 과정을 여러 단계로 나누어 설명하도록 합니다. 이를 통해 모델이 논리적인 흐름을 따를 수 있도록 도와주며, 복잡한 문제에서도 정확한 답을 도출할 수 있습니다. 예를 들어, 다음과 같은 문제가 있다고 가정해 보겠습니다.

문제: 제인은 20개의 사탕을 가지고 있었습니다. 그는 덴니에게 몇 개를 주었고, 남은 사탕은 12개입니다. 제인은 덴니에게 몇 개의 사탕을 주었을까요?

CoT 방식으로 해결하면 다음과 같은 답변이 나옵니다.

CoT 방식:

제인은 처음에 20개의 사탕을 가지고 있었습니다.

덴니에게 일부 사탕을 주었습니다.

이후 남은 사탕은 12개입니다.

덴니에게 준 사탕의 개수를 계산하려면 20에서 12를 빼야 합니다.

20 - 12 = 8이므로, 제인은 덴니에게 8개의 사탕을 주었습니다.

이 방식은 정확하지만, 불필요한 설명이 많아 토큰 사용량이 증가하고 응답 속도가 느려질 수 있습니다.

Chain of Draft (CoD)란?

CoD는 인간이 문제를 해결하는 방식에서 영감을 얻어 만들어진 개념입니다. 사람들이 문제를 해결할 때, 모든 과정을 상세히 기록하는 것이 아니라 핵심 정보만 간략히 정리하는 경우가 많습니다. 예를 들어, 위의 사탕 문제를 해결할 때 우리는 다음과 같은 간단한 메모를 남길 수 있습니다.

CoD 방식:
20 - x = 12; x = 8

이렇게 핵심 정보만 정리하는 방식이 바로 CoD의 핵심 원리입니다. 즉, CoD는 필요한 정보만 포함하여 간결하게 답을 도출하는 방식입니다.

체인 오브 드래프트의 주요 장점

⭐ 효율성: 불필요한 단계를 줄여 모델이 더 적은 리소스로 답을 생성할 수 있습니다.
⚡ 응답 속도 향상: 짧은 답변을 생성하기 때문에 실행 속도가 빠릅니다.
💰 비용 절감: 계산량이 줄어들어 AI를 운영하는 비용이 절감됩니다.

LLM에서 CoD 구현

CoD 방식은 GPT-4o 및 Claude 3.5와 같은 최신 AI 모델에서도 적용할 수 있습니다.

CoD 프롬프팅 방식 설정: 모델이 최소한의 정보로 답변하도록 프롬프팅을 조정합니다.
예제 제공: CoD 방식을 따르는 예제를 몇 개 제공하여 모델이 적절한 형식으로 답변하도록 유도합니다.
테스트 및 검증: CoD 방식이 정확한 답변을 제공하는지 검증합니다.

CoD의 실험적 평가

연구진은 CoD 방식의 효과를 검증하기 위해 여러 실험을 진행했습니다. 대표적인 실험 결과는 다음과 같습니다.

🔬 GSM8K 벤치마크(산술 문제 해결 테스트): CoD는 CoT보다 80% 적은 토큰을 사용하면서도 91%의 정확도를 유지했습니다.
🔬 BIG-Bench 데이터셋(상식 추론 테스트): CoD 방식은 CoT보다 92.4% 적은 토큰을 사용하면서도 높은 정확도를 유지했습니다.
🔬 동전 던지기 실험(논리 추론 테스트): CoD는 CoT보다 짧은 답변을 생성하면서도 동일한 정확도를 기록했습니다.

결론

CoD는 기존 CoT 방식의 문제점을 해결하기 위한 혁신적인 방법입니다. 불필요한 정보를 줄이면서도 정확도를 유지할 수 있기 때문에, 다양한 AI 모델에서 활용될 가능성이 큽니다. 특히, AI의 응답 속도를 높이고 운영 비용을 절감할 수 있다는 점에서 매우 실용적인 접근 방식이라고 할 수 있습니다.

출처

[1] 논문 : https://arxiv.org/pdf/2502.18600
[2] github : https://github.com/sileix/chain-of-draft

GitHub - sileix/chain-of-draft: Code and data for the Chain-of-Draft (CoD) paper

Code and data for the Chain-of-Draft (CoD) paper . Contribute to sileix/chain-of-draft development by creating an account on GitHub.

github.com

'AI 논문 > LLM' 카테고리의 다른 글

Chain-of-Agents: 긴 컨텍스트 처리를 위한 에이전트 협업 (2)	2025.03.14
[논문리뷰] s1: Simple test-time scaling (2)	2025.02.10

앨런의 인공지능 탐구생활

Chain of Draft: LLM의 효율적인 추론을 위한 새로운 패러다임

CoT 추론 이해하기

Chain of Draft (CoD)란?

체인 오브 드래프트의 주요 장점

결론

출처

'AI 논문 > LLM' 카테고리의 다른 글

티스토리툴바

Chain of Draft: LLM의 효율적인 추론을 위한 새로운 패러다임

CoT 추론 이해하기

Chain of Draft (CoD)란?

체인 오브 드래프트의 주요 장점

결론

출처

'AI 논문 > LLM' 카테고리의 다른 글

관련글

티스토리툴바