TaleStreamAI:从小说ID到短视频的AI自动化创作流水线
2026/5/2 23:58:27 网站建设 项目流程

TaleStreamAI:从小说ID到短视频的AI自动化创作流水线

【免费下载链接】TaleStreamAIAI小说推文全自动工作流,自动从ID到视频项目地址: https://gitcode.com/gh_mirrors/ta/TaleStreamAI

TaleStreamAI是一款专为小说推文创作设计的全自动AI工作流工具,它能够将起点中文网等平台的小说内容自动转化为高质量短视频。通过集成多个人工智能模型,该项目实现了从小说内容抓取、分镜生成、图片绘制、音频合成到视频剪辑的全流程自动化,大幅提升了小说推文创作的效率。

技术架构解析:模块化AI协同系统

TaleStreamAI采用模块化设计,每个功能模块独立负责特定的处理任务,通过标准化的数据格式进行通信。这种架构确保了系统的可扩展性和维护性。

核心模块功能拆解

内容获取模块(app/main.py)

# 小说内容抓取流程 def get_book_content(book_id: str) -> str: """获取起点小说内容并保存为HTML格式""" url = f"https://www.qidian.com/book/{book_id}/" # 使用Cookie认证获取完整内容 response = requests.get(url, headers=headers) return response.text

分镜生成模块(app/board.py)

  • 基于Gemini-2.0-Flash模型分析小说章节内容
  • 自动生成视频分镜脚本,包括场景描述和镜头语言
  • 输出结构化JSON格式的分镜数据

提示词优化模块(app/prompt.py)

  • 使用DeepSeek-V3模型润色分镜提示词
  • 优化图片生成的质量和一致性
  • 支持多线程处理,提升处理效率

图片生成模块(app/image.py)

  • 调用Stable Diffusion API生成场景图片
  • 集成LoRA模型实现国风插画风格
  • 支持高清修复功能,提升图片质量

音频合成模块(app/audio.py)

  • 使用CosyVoice2-0.5B模型生成语音旁白
  • 支持多API密钥轮询,提高并发处理能力
  • 自动匹配角色语音特征

实战配置指南:快速搭建创作环境

环境准备与依赖安装

TaleStreamAI使用uv包管理器进行依赖管理,确保Python版本≥3.10:

# 安装uv包管理器 pip install uv # 创建Python虚拟环境 uv venv --python 3.12 # 激活虚拟环境(Windows) .\.venv\Scripts\activate # 安装项目依赖 uv add -r requirements.txt # 安装GPU加速的PyTorch(根据CUDA版本选择) uv pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

关键配置参数详解

创建.env配置文件,包含以下核心参数:

# 起点中文网Cookie配置(用于获取完整小说内容) COOKIE=your_qidian_cookie_here # AI模型API配置 AL_API_KEY=your_aliyun_api_key GEMINI_API_KEY=your_gemini_api_key AUDIO_API_KEY=your_audio_api_key # Stable Diffusion配置 SD_API_URL=http://127.0.0.1:7860/sdapi/v1/txt2img SD_LORA=, style outfits <lora:国风插画SDXL:1>,hanfu,tang SD_STEPS=20 # 视频生成参数 PORTRAIT_MODE=True # 竖屏模式 VIDEO_WIDTH=750 # 视频宽度 VIDEO_HEIGHT=1280 # 视频高度 MOVE_DISTANCE=0.1 # 图片移动距离

硬件加速配置

项目支持GPU加速的视频处理,需要安装FFmpeg GPU加速版:

# 检查FFmpeg硬件加速支持 ffmpeg -hwaccels # 输出应包含以下加速选项: # cuda, vaapi, dxva2, qsv, d3d11va, opencl, vulkan

工作流执行:从小说ID到成品视频

分步执行模式

对于需要精细控制的场景,可以分步执行各个模块:

# 1. 获取小说内容 uv run app/main.py # 2. 生成分镜脚本 uv run app/board.py # 3. 优化提示词 uv run app/prompt.py # 4. 生成场景图片 uv run app/image.py # 5. 合成语音旁白 uv run app/audio.py # 6. 生成字幕文件 uv run app/tts.py # 7. 制作分镜视频 uv run app/video.py # 8. 最终视频合成 uv run app/video_end.py

全自动一键执行

对于批量处理需求,可以直接运行主程序:

# 全自动处理指定小说ID uv run main.py

系统将自动执行完整的创作流程,从小说ID开始,最终生成完整的短视频文件。

性能优化与最佳实践

并发处理配置

TaleStreamAI支持多线程处理,显著提升处理效率:

# 音频生成线程数(根据CPU核心数调整) AUDIO_THREADS=8 # 视频生成线程数(根据GPU性能调整) VIDEO_THREADS=4

内存与显存管理

Whisper语音识别模型提供多种规格选择,适应不同硬件配置:

模型规格参数量最低显存要求适用场景
Tiny39M~1GB低配置设备
Base74M~1GB基础应用
Small244M~2GB平衡性能
Medium769M~5GB高质量转录
Large1550M~10GB专业级应用

错误处理与重试机制

项目内置了完善的错误处理和重试机制:

def generate_board_json(chapter_content: str, max_retries=3, retry_delay=2): """生成分镜JSON,支持重试机制""" for attempt in range(max_retries): try: # API调用逻辑 response = client.chat.completions.create(...) return response.choices[0].message.content except Exception as e: if attempt < max_retries - 1: time.sleep(retry_delay) continue else: raise e

扩展应用场景

多平台内容适配

通过调整视频参数,可以生成适合不同平台的视频格式:

# 抖音/快手竖屏配置 PORTRAIT_MODE=True VIDEO_WIDTH=750 VIDEO_HEIGHT=1280 # B站横屏配置 PORTRAIT_MODE=False VIDEO_WIDTH=1920 VIDEO_HEIGHT=1080 # 小红书方形视频配置 PORTRAIT_MODE=False VIDEO_WIDTH=1080 VIDEO_HEIGHT=1080

自定义风格模板

项目支持通过修改LoRA模型和提示词模板,实现不同风格的视频创作:

# 国风插画风格 SD_LORA=, style outfits <lora:国风插画SDXL:1>,hanfu,tang # 现代简约风格 SD_LORA=, style outfits <lora:现代插画SDXL:1>,minimal,clean # 奇幻冒险风格 SD_LORA=, style outfits <lora:奇幻插画SDXL:1>,fantasy,adventure

批量处理与自动化调度

结合脚本和任务调度器,可以实现小说推文的批量自动化生产:

#!/bin/bash # 批量处理多个小说ID novel_ids=("1043294775" "1043294776" "1043294777") for novel_id in "${novel_ids[@]}" do echo "处理小说ID: $novel_id" python main.py --book_id $novel_id sleep 60 # 避免API频率限制 done

技术优势与创新点

1. 端到端自动化流程

TaleStreamAI实现了从小说内容获取到视频生成的全流程自动化,无需人工干预,大幅降低创作门槛。

2. 多模型协同工作

项目整合了多个先进的AI模型,包括Gemini-2.0-Flash、DeepSeek-V3、CosyVoice2-0.5B等,形成完整的创作链条。

3. 灵活的配置系统

通过环境变量和配置文件,用户可以轻松调整视频风格、分辨率、时长等参数,满足不同平台的需求。

4. 高效的并发处理

支持多线程和GPU加速,能够快速处理大量内容,适合批量生产场景。

5. 开源可扩展架构

模块化设计使得开发者可以轻松添加新的功能模块或替换现有组件。

获取与使用

要开始使用TaleStreamAI进行小说推文创作,只需执行以下命令:

git clone https://gitcode.com/gh_mirrors/ta/TaleStreamAI cd TaleStreamAI

按照上述配置指南设置环境变量和API密钥,即可启动你的AI创作之旅。无论是个人创作者还是内容生产团队,TaleStreamAI都能提供高效、稳定的自动化创作解决方案,让内容创作变得更加简单和高效。

【免费下载链接】TaleStreamAIAI小说推文全自动工作流,自动从ID到视频项目地址: https://gitcode.com/gh_mirrors/ta/TaleStreamAI

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询