안녕하세요.
오늘은 AI 리서치 도구의 혁신이라 불리는 CleverBee에 대해 소개드립니다. 이 오픈소스 프로젝트는 웹 브라우징부터 요약, 보고서 생성까지 자동으로 수행하는 'AI 비서'입니다. 특히 LLM(대형언어모델)을 활용해 정보의 수집과 정리를 돕는 점이 매우 인상적인데요. 복잡한 정보 속에서 유용한 지식만 쏙쏙 뽑아주는 이 도구, 과연 어떻게 동작할까요? 오늘 이 글을 통해 CleverBee의 원리와 기능, 활용법까지 상세하게 안내해드리겠습니다.
CleverBee 소개 및 배경
📌 왜 AI 리서치 도구가 필요할까요?
오늘날 우리는 하루에도 수천 개의 웹페이지와 뉴스를 접합니다. 하지만 중요한 정보만 골라내는 건 여전히 사람의 몫이었죠.
- ✔️ 검색어 입력 → 수많은 링크 → 클릭 → 읽기 → 정리
- ❌ 시간 소모가 크고, 실수 가능성도 존재
이런 한계를 해결하기 위해 등장한 것이 바로 CleverBee입니다. CleverBee는 AI의 힘을 빌려 웹 검색부터 콘텐츠 요약, 분석, 보고서 정리까지 풀-오토 리서치 시스템을 구현했습니다.
🤖 프로젝트 개요
- 개발사: SureScaleAI
- 언어: Python 기반
- 라이선스: AGPL-3.0
- 주요 기술: LLM (Gemini, Claude), Playwright, Chainlit
💡 간단히 말하면, CleverBee는 GPT나 Claude 같은 LLM을 여러 개 조합해 '연구 조교'처럼 작동하는 툴입니다.
주요 기능
🧠 LLM 중심의 지능형 리서치 프로세스
CleverBee는 단일 모델이 아닌, 역할 분담된 여러 AI 모델을 활용합니다:
- 📝 Gemini 2.5 Pro – 최종 보고서 작성 및 기획 담당
- 🔄 Gemini 2.5 Flash – 연구 진행 상황 점검 및 다음 단계 판단
- 📃 Gemini 2.0 Flash – 중간 웹 콘텐츠 요약
이 덕분에 복잡한 리서치 과정이 분산되어 더 정확하고, 더 빠르게 진행됩니다.
🌐 자동 웹 브라우징 및 콘텐츠 추출
웹 크롤링은 Playwright라는 툴을 사용해 실행됩니다. CleverBee는 아래와 같은 과정을 자동으로 수행합니다:
- 🔍 검색어 기반 웹 페이지 탐색
- 📄 HTML 콘텐츠 다운로드
- 🧼 Markdown 형식으로 클린 정리
🛠️ 인터랙티브 UI & 외부 도구 연결
사용자는 Chainlit 기반의 웹 인터페이스를 통해 직관적으로 작업을 진행할 수 있습니다. 또한 MCP(Model Context Protocol)를 통해 외부 도구와 쉽게 연결되며, 유연한 확장이 가능합니다.
LLM 아키텍처 구조 및 콘텐츠 분석
📊 콘텐츠 정제 및 분석 방식
단순한 요약이 아닙니다. CleverBee는 아래와 같은 방식으로 콘텐츠를 '의미 단위'로 정리합니다:
- 🔧 HTML → Markdown 변환으로 시각적 노이즈 제거
- 🔍 키워드 추출 및 중요 문장 요약
- 🧩 보고서 구성요소(제목, 요지, 인사이트) 자동 배치
💰 토큰 추적 및 비용 관리
LLM을 쓰면 API 비용이 걱정되시죠? CleverBee는 NormalizingCache라는 SQLite 기반 캐시를 활용해 같은 질문에 대해 반복 요금이 발생하지 않도록 설계되었습니다.
💡 실제로 GPT API를 쓰는 앱에서 가장 흔한 비용 누수 포인트를 해결한 사례입니다.
🧩 다양한 LLM 지원 구조
CleverBee는 Google의 Gemini 외에도 아래와 같은 다양한 모델과 호환됩니다:
- 🧠 Claude (Anthropic)
- 💻 로컬 모델 (llama.cpp 기반 GGUF 포맷)
이는 기업 내부망에서도 프라이버시 걱정 없이 활용할 수 있게 해줍니다.
설치 및 실행 방법
🛠️ 설치 준비 과정
설치는 매우 간단하며 GitHub에 공개된 스크립트를 그대로 사용할 수 있습니다.
- 📥 저장소 클론:
git clone https://github.com/SureScaleAI/cleverbee.git
- 📂 디렉토리 이동:
cd cleverbee
- ⚙️ 설치 스크립트 실행:
bash setup.sh
- 🚀 애플리케이션 시작:
bash run.sh
🖥️ 시스템 호환성
- ✔️ macOS: 완벽 지원 (Intel & Apple Silicon)
- ✔️ Linux: GPU 인식 기능 포함
- ⚠️ Windows: WSL(Windows Subsystem for Linux) 통해 제한적 실행
💡 로컬에서도 작동하지만, GPU 활용을 위해서는 Linux 환경이 가장 적합합니다.
장단점 및 향후 발전 방향
✅ 장점
- 🧠 고도화된 LLM 분산 구조
- 📈 토큰 캐싱으로 운영비 절감
- 🌐 웹에서 정보 수집과 요약을 통합
- 💻 로컬 모델과의 연동으로 보안성 향상
⚠️ 단점
- ❗ 도메인 전문가의 검토 여전히 필요
- ❗ Windows 완전 지원 아님 (WSL 필수)
- ❗ 모델 성능은 최신 API 또는 설정에 의존
🚀 향후 발전 방향
- 🔧 UI/UX 개선 (보다 직관적인 인터페이스 예고)
- 🤝 협업 기능 추가 (멀티 유저 리서치 지원)
- 🧠 로컬 LLM 최적화 및 ONNX 지원 검토 중
결론
CleverBee는 LLM과 자동 브라우징 기술을 통합해 리서치 과정을 극적으로 단순화한 도구입니다. 과거에는 사람 손으로 일일이 수행하던 작업들을 이제는 AI가 빠르고 정밀하게 처리해줍니다. 보고서 작성, 정보 요약, 경쟁 분석 등 다양한 분야에서 적용 가능하며, 특히 자동화와 비용 최적화 측면에서 큰 강점을 지닙니다. 앞으로 더 많은 사용자들이 이 혁신적인 리서치 도구의 가능성을 실감하게 될 것입니다. AI 리서치의 새로운 표준, 바로 CleverBee입니다.
출처
https://github.com/SureScaleAI/cleverbee
GitHub - SureScaleAI/cleverbee: CleverBee - The Open Source Deep Researcher Tool
CleverBee - The Open Source Deep Researcher Tool. Contribute to SureScaleAI/cleverbee development by creating an account on GitHub.
github.com
'AI 오픈소스' 카테고리의 다른 글
샤오미 MiMo: AI 추론 혁신을 선도하는 언어모델 (1) | 2025.05.02 |
---|---|
DeepSeek Prover V2 공개, AI가 수학을 증명하는 시대 (1) | 2025.05.01 |
하이브리드 추론을 탑재한 최첨단 Qwen3 모델 소개 (1) | 2025.04.29 |
AI 에이전트, 이제는 진짜 컴퓨터를 쓴다! c/ua 완벽 가이드 (1) | 2025.04.28 |
MAGI-1, 영상 콘텐츠의 혁신을 이끄는 생성형 AI (3) | 2025.04.27 |