TaleStreamAI:从小说ID到短视频的AI自动化创作流水线
【免费下载链接】TaleStreamAIAI小说推文全自动工作流,自动从ID到视频项目地址: https://gitcode.com/gh_mirrors/ta/TaleStreamAI
TaleStreamAI是一款专为小说推文创作设计的全自动AI工作流工具,它能够将起点中文网等平台的小说内容自动转化为高质量短视频。通过集成多个人工智能模型,该项目实现了从小说内容抓取、分镜生成、图片绘制、音频合成到视频剪辑的全流程自动化,大幅提升了小说推文创作的效率。
技术架构解析:模块化AI协同系统
TaleStreamAI采用模块化设计,每个功能模块独立负责特定的处理任务,通过标准化的数据格式进行通信。这种架构确保了系统的可扩展性和维护性。
核心模块功能拆解
内容获取模块(app/main.py)
# 小说内容抓取流程 def get_book_content(book_id: str) -> str: """获取起点小说内容并保存为HTML格式""" url = f"https://www.qidian.com/book/{book_id}/" # 使用Cookie认证获取完整内容 response = requests.get(url, headers=headers) return response.text分镜生成模块(app/board.py)
- 基于Gemini-2.0-Flash模型分析小说章节内容
- 自动生成视频分镜脚本,包括场景描述和镜头语言
- 输出结构化JSON格式的分镜数据
提示词优化模块(app/prompt.py)
- 使用DeepSeek-V3模型润色分镜提示词
- 优化图片生成的质量和一致性
- 支持多线程处理,提升处理效率
图片生成模块(app/image.py)
- 调用Stable Diffusion API生成场景图片
- 集成LoRA模型实现国风插画风格
- 支持高清修复功能,提升图片质量
音频合成模块(app/audio.py)
- 使用CosyVoice2-0.5B模型生成语音旁白
- 支持多API密钥轮询,提高并发处理能力
- 自动匹配角色语音特征
实战配置指南:快速搭建创作环境
环境准备与依赖安装
TaleStreamAI使用uv包管理器进行依赖管理,确保Python版本≥3.10:
# 安装uv包管理器 pip install uv # 创建Python虚拟环境 uv venv --python 3.12 # 激活虚拟环境(Windows) .\.venv\Scripts\activate # 安装项目依赖 uv add -r requirements.txt # 安装GPU加速的PyTorch(根据CUDA版本选择) uv pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118关键配置参数详解
创建.env配置文件,包含以下核心参数:
# 起点中文网Cookie配置(用于获取完整小说内容) COOKIE=your_qidian_cookie_here # AI模型API配置 AL_API_KEY=your_aliyun_api_key GEMINI_API_KEY=your_gemini_api_key AUDIO_API_KEY=your_audio_api_key # Stable Diffusion配置 SD_API_URL=http://127.0.0.1:7860/sdapi/v1/txt2img SD_LORA=, style outfits <lora:国风插画SDXL:1>,hanfu,tang SD_STEPS=20 # 视频生成参数 PORTRAIT_MODE=True # 竖屏模式 VIDEO_WIDTH=750 # 视频宽度 VIDEO_HEIGHT=1280 # 视频高度 MOVE_DISTANCE=0.1 # 图片移动距离硬件加速配置
项目支持GPU加速的视频处理,需要安装FFmpeg GPU加速版:
# 检查FFmpeg硬件加速支持 ffmpeg -hwaccels # 输出应包含以下加速选项: # cuda, vaapi, dxva2, qsv, d3d11va, opencl, vulkan工作流执行:从小说ID到成品视频
分步执行模式
对于需要精细控制的场景,可以分步执行各个模块:
# 1. 获取小说内容 uv run app/main.py # 2. 生成分镜脚本 uv run app/board.py # 3. 优化提示词 uv run app/prompt.py # 4. 生成场景图片 uv run app/image.py # 5. 合成语音旁白 uv run app/audio.py # 6. 生成字幕文件 uv run app/tts.py # 7. 制作分镜视频 uv run app/video.py # 8. 最终视频合成 uv run app/video_end.py全自动一键执行
对于批量处理需求,可以直接运行主程序:
# 全自动处理指定小说ID uv run main.py系统将自动执行完整的创作流程,从小说ID开始,最终生成完整的短视频文件。
性能优化与最佳实践
并发处理配置
TaleStreamAI支持多线程处理,显著提升处理效率:
# 音频生成线程数(根据CPU核心数调整) AUDIO_THREADS=8 # 视频生成线程数(根据GPU性能调整) VIDEO_THREADS=4内存与显存管理
Whisper语音识别模型提供多种规格选择,适应不同硬件配置:
| 模型规格 | 参数量 | 最低显存要求 | 适用场景 |
|---|---|---|---|
| Tiny | 39M | ~1GB | 低配置设备 |
| Base | 74M | ~1GB | 基础应用 |
| Small | 244M | ~2GB | 平衡性能 |
| Medium | 769M | ~5GB | 高质量转录 |
| Large | 1550M | ~10GB | 专业级应用 |
错误处理与重试机制
项目内置了完善的错误处理和重试机制:
def generate_board_json(chapter_content: str, max_retries=3, retry_delay=2): """生成分镜JSON,支持重试机制""" for attempt in range(max_retries): try: # API调用逻辑 response = client.chat.completions.create(...) return response.choices[0].message.content except Exception as e: if attempt < max_retries - 1: time.sleep(retry_delay) continue else: raise e扩展应用场景
多平台内容适配
通过调整视频参数,可以生成适合不同平台的视频格式:
# 抖音/快手竖屏配置 PORTRAIT_MODE=True VIDEO_WIDTH=750 VIDEO_HEIGHT=1280 # B站横屏配置 PORTRAIT_MODE=False VIDEO_WIDTH=1920 VIDEO_HEIGHT=1080 # 小红书方形视频配置 PORTRAIT_MODE=False VIDEO_WIDTH=1080 VIDEO_HEIGHT=1080自定义风格模板
项目支持通过修改LoRA模型和提示词模板,实现不同风格的视频创作:
# 国风插画风格 SD_LORA=, style outfits <lora:国风插画SDXL:1>,hanfu,tang # 现代简约风格 SD_LORA=, style outfits <lora:现代插画SDXL:1>,minimal,clean # 奇幻冒险风格 SD_LORA=, style outfits <lora:奇幻插画SDXL:1>,fantasy,adventure批量处理与自动化调度
结合脚本和任务调度器,可以实现小说推文的批量自动化生产:
#!/bin/bash # 批量处理多个小说ID novel_ids=("1043294775" "1043294776" "1043294777") for novel_id in "${novel_ids[@]}" do echo "处理小说ID: $novel_id" python main.py --book_id $novel_id sleep 60 # 避免API频率限制 done技术优势与创新点
1. 端到端自动化流程
TaleStreamAI实现了从小说内容获取到视频生成的全流程自动化,无需人工干预,大幅降低创作门槛。
2. 多模型协同工作
项目整合了多个先进的AI模型,包括Gemini-2.0-Flash、DeepSeek-V3、CosyVoice2-0.5B等,形成完整的创作链条。
3. 灵活的配置系统
通过环境变量和配置文件,用户可以轻松调整视频风格、分辨率、时长等参数,满足不同平台的需求。
4. 高效的并发处理
支持多线程和GPU加速,能够快速处理大量内容,适合批量生产场景。
5. 开源可扩展架构
模块化设计使得开发者可以轻松添加新的功能模块或替换现有组件。
获取与使用
要开始使用TaleStreamAI进行小说推文创作,只需执行以下命令:
git clone https://gitcode.com/gh_mirrors/ta/TaleStreamAI cd TaleStreamAI按照上述配置指南设置环境变量和API密钥,即可启动你的AI创作之旅。无论是个人创作者还是内容生产团队,TaleStreamAI都能提供高效、稳定的自动化创作解决方案,让内容创作变得更加简单和高效。
【免费下载链接】TaleStreamAIAI小说推文全自动工作流,自动从ID到视频项目地址: https://gitcode.com/gh_mirrors/ta/TaleStreamAI
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考