안녕하세요 앨런입니다.
오늘은 전자책을 오디오 북으로 변환하는 도구인 Audiblez v4를 소개해드립니다.
Audiblez v4가 신규 버전으로 업데이트 되면서 전자책을 오디오북으로 더욱 자연스럽게 변환할 수 있습니다. 해당 신규 버전은 CUDA 지원, 새로운 GUI, 그리고 다양한 언어를 지원하여 더욱 편리하게 사용할 수 있습니다. 버전 업데이트가 되면서 다양한 언어를 지원하지만 현재 한국어는 지원되지 않습니다.
Apache 라이센스로 전차책 (.epub) 을 오디오북(.m4b) 으로 변환하는 어플리케이션에 활용가능해 보입니다.
TTS 모델
- Kokoro-82M은 최근 공개된 텍스트-음성 변환(TTS) 모델로, 단 8,200만 개의 파라미터로 매우 자연스러운 음성을 생성합니다.
- 이 모델은 Apache 라이선스로 배포되었으며, 100시간 미만의 오디오 데이터로 학습되었습니다.
주요 기능
- 다양한 플랫폼 지원: MacOS, Linux, Windows에서 사용 가능
- 다국어 지원: 영어, 스페인어, 프랑스어, 힌디어, 이탈리아어, 일본어, 포르투갈어, 중국어 등 다양한 언어의 음성을 지원
- CUDA 가속: GPU를 활용하여 빠른 변환 속도 제공
- 커버 이미지 포함: 최종 오디오북에 커버 이미지가 포함됩니다.
- 챕터 타임스탬프: 오디오북에 챕터 타임스탬프가 추가되어 편리하게 사용할 수 있습니다.
음성 샘플
Audiblez에서 제공하는 다양한 음성 샘플을 들어보세요:
음성 | 코드 | 오디오 |
---|---|---|
미국 영어 여성 | af_heart | |
미국 영어 남성 | am_michael | |
스페인어 여성 | ef_dora | |
프랑스어 여성 | ff_siwis |
설치 방법
Audiblez를 설치하려면 Python 3가 필요합니다. 아래 명령어를 사용하여 설치할 수 있습니다:
Ubuntu/Debian
sudo apt install ffmpeg espeak-ng
pip install audiblez
Mac
brew install ffmpeg espeak-ng
pip install audiblez
사용 방법
전자책을 오디오북으로 변환하려면 다음 명령어를 사용하세요:
audiblez book.epub -v af_sky
이 명령어는 book.m4b
파일을 생성하여 오디오북을 들을 수 있게 해줍니다.
GPU에서 실행하기
기본적으로 Audiblez는 CPU에서 실행되지만, --cuda
옵션을 사용하면 GPU를 활용할 수 있습니다. 이를 통해 변환 속도를 더욱 높일 수 있습니다.
Audiblez v4는 전자책을 오디오북으로 변환하는 데 있어 매우 유용한 도구입니다. 다양한 언어와 음성을 지원하며, 빠른 변환 속도를 자랑합니다. 지금 바로 사용해 보세요!
출처
https://claudio.uk/posts/audiblez-v4.html
📚 Audiblez v4: Generate audiobooks from e-books
A guide on how to convert .epub e-books into high-quality audiobooks narrated by neural text-to-speech
claudio.uk
'AI 오픈소스' 카테고리의 다른 글
[AI 오픈소스] OpenManus: AI 에이전트 구축을 위한 혁신적인 오픈소스 프로젝트 (3) | 2025.03.11 |
---|---|
[AI 오픈소스] QwQ-32B: Deepseek-R1급 성능의 AI 추론 모델 (2) | 2025.03.11 |
[AI 오픈소스] OlmOCR - PDF문서에서 텍스트를 추출하는 오픈소스 도구 (1) | 2025.03.07 |
[AI 오픈소스] Open-Interface: LLM으로 컴퓨터 화면 제어하기 (1) | 2025.03.02 |
[AI 오픈소스] Zonos-v0.1: 다중 언어 지원의 고품질 텍스트-투-스피치 (TTS) 모델 (4) | 2025.02.16 |