본문 바로가기
AI 오픈소스

CleverBee: 오픈소스 AI 리서치 도구 활용 가이드

by 앨런튜링1 2025. 4. 30.
반응형

안녕하세요.

오늘은 AI 리서치 도구의 혁신이라 불리는 CleverBee에 대해 소개드립니다. 이 오픈소스 프로젝트는 웹 브라우징부터 요약, 보고서 생성까지 자동으로 수행하는 'AI 비서'입니다. 특히 LLM(대형언어모델)을 활용해 정보의 수집과 정리를 돕는 점이 매우 인상적인데요. 복잡한 정보 속에서 유용한 지식만 쏙쏙 뽑아주는 이 도구, 과연 어떻게 동작할까요? 오늘 이 글을 통해 CleverBee의 원리와 기능, 활용법까지 상세하게 안내해드리겠습니다.

 

 


CleverBee 소개 및 배경

📌 왜 AI 리서치 도구가 필요할까요?

오늘날 우리는 하루에도 수천 개의 웹페이지와 뉴스를 접합니다. 하지만 중요한 정보만 골라내는 건 여전히 사람의 몫이었죠.

  • ✔️ 검색어 입력 → 수많은 링크 → 클릭 → 읽기 → 정리
  • ❌ 시간 소모가 크고, 실수 가능성도 존재

이런 한계를 해결하기 위해 등장한 것이 바로 CleverBee입니다. CleverBee는 AI의 힘을 빌려 웹 검색부터 콘텐츠 요약, 분석, 보고서 정리까지 풀-오토 리서치 시스템을 구현했습니다.

🤖 프로젝트 개요

  • 개발사: SureScaleAI
  • 언어: Python 기반
  • 라이선스: AGPL-3.0
  • 주요 기술: LLM (Gemini, Claude), Playwright, Chainlit

💡 간단히 말하면, CleverBee는 GPT나 Claude 같은 LLM을 여러 개 조합해 '연구 조교'처럼 작동하는 툴입니다.


주요 기능

🧠 LLM 중심의 지능형 리서치 프로세스

CleverBee는 단일 모델이 아닌, 역할 분담된 여러 AI 모델을 활용합니다:

  1. 📝 Gemini 2.5 Pro – 최종 보고서 작성 및 기획 담당
  2. 🔄 Gemini 2.5 Flash – 연구 진행 상황 점검 및 다음 단계 판단
  3. 📃 Gemini 2.0 Flash – 중간 웹 콘텐츠 요약

이 덕분에 복잡한 리서치 과정이 분산되어 더 정확하고, 더 빠르게 진행됩니다.

🌐 자동 웹 브라우징 및 콘텐츠 추출

웹 크롤링은 Playwright라는 툴을 사용해 실행됩니다. CleverBee는 아래와 같은 과정을 자동으로 수행합니다:

  • 🔍 검색어 기반 웹 페이지 탐색
  • 📄 HTML 콘텐츠 다운로드
  • 🧼 Markdown 형식으로 클린 정리

🛠️ 인터랙티브 UI & 외부 도구 연결

사용자는 Chainlit 기반의 웹 인터페이스를 통해 직관적으로 작업을 진행할 수 있습니다. 또한 MCP(Model Context Protocol)를 통해 외부 도구와 쉽게 연결되며, 유연한 확장이 가능합니다.


반응형

LLM 아키텍처 구조 및 콘텐츠 분석

📊 콘텐츠 정제 및 분석 방식

단순한 요약이 아닙니다. CleverBee는 아래와 같은 방식으로 콘텐츠를 '의미 단위'로 정리합니다:

  • 🔧 HTML → Markdown 변환으로 시각적 노이즈 제거
  • 🔍 키워드 추출 및 중요 문장 요약
  • 🧩 보고서 구성요소(제목, 요지, 인사이트) 자동 배치

💰 토큰 추적 및 비용 관리

LLM을 쓰면 API 비용이 걱정되시죠? CleverBee는 NormalizingCache라는 SQLite 기반 캐시를 활용해 같은 질문에 대해 반복 요금이 발생하지 않도록 설계되었습니다.

💡 실제로 GPT API를 쓰는 앱에서 가장 흔한 비용 누수 포인트를 해결한 사례입니다.

🧩 다양한 LLM 지원 구조

CleverBee는 Google의 Gemini 외에도 아래와 같은 다양한 모델과 호환됩니다:

  • 🧠 Claude (Anthropic)
  • 💻 로컬 모델 (llama.cpp 기반 GGUF 포맷)

이는 기업 내부망에서도 프라이버시 걱정 없이 활용할 수 있게 해줍니다.


설치 및 실행 방법

🛠️ 설치 준비 과정

설치는 매우 간단하며 GitHub에 공개된 스크립트를 그대로 사용할 수 있습니다.

  1. 📥 저장소 클론:
    git clone https://github.com/SureScaleAI/cleverbee.git
  2. 📂 디렉토리 이동:
    cd cleverbee
  3. ⚙️ 설치 스크립트 실행:
    bash setup.sh
  4. 🚀 애플리케이션 시작:
    bash run.sh

🖥️ 시스템 호환성

  • ✔️ macOS: 완벽 지원 (Intel & Apple Silicon)
  • ✔️ Linux: GPU 인식 기능 포함
  • ⚠️ Windows: WSL(Windows Subsystem for Linux) 통해 제한적 실행

💡 로컬에서도 작동하지만, GPU 활용을 위해서는 Linux 환경이 가장 적합합니다.


장단점 및 향후 발전 방향

✅ 장점

  • 🧠 고도화된 LLM 분산 구조
  • 📈 토큰 캐싱으로 운영비 절감
  • 🌐 웹에서 정보 수집과 요약을 통합
  • 💻 로컬 모델과의 연동으로 보안성 향상

⚠️ 단점

  • ❗ 도메인 전문가의 검토 여전히 필요
  • ❗ Windows 완전 지원 아님 (WSL 필수)
  • ❗ 모델 성능은 최신 API 또는 설정에 의존

🚀 향후 발전 방향

  • 🔧 UI/UX 개선 (보다 직관적인 인터페이스 예고)
  • 🤝 협업 기능 추가 (멀티 유저 리서치 지원)
  • 🧠 로컬 LLM 최적화 및 ONNX 지원 검토 중

결론

CleverBee는 LLM과 자동 브라우징 기술을 통합해 리서치 과정을 극적으로 단순화한 도구입니다. 과거에는 사람 손으로 일일이 수행하던 작업들을 이제는 AI가 빠르고 정밀하게 처리해줍니다. 보고서 작성, 정보 요약, 경쟁 분석 등 다양한 분야에서 적용 가능하며, 특히 자동화와 비용 최적화 측면에서 큰 강점을 지닙니다. 앞으로 더 많은 사용자들이 이 혁신적인 리서치 도구의 가능성을 실감하게 될 것입니다. AI 리서치의 새로운 표준, 바로 CleverBee입니다.


출처

https://github.com/SureScaleAI/cleverbee

 

GitHub - SureScaleAI/cleverbee: CleverBee - The Open Source Deep Researcher Tool

CleverBee - The Open Source Deep Researcher Tool. Contribute to SureScaleAI/cleverbee development by creating an account on GitHub.

github.com

 

반응형