MarkItDown 安装与视频转文字
2026/7/2 3:10:13 网站建设 项目流程

一、核心目标

使用微软官方 MarkItDown 工具,将.mp4视频文件转换为 Markdown 格式的会议文字纪要。


二、前置依赖与安装步骤

1. 关键前提:Python 版本要求

  • MarkItDown 官方要求Python ≥ 3.10,Python 3.8 及以下版本会直接报错。
  • 本次使用Python 3.12版本,安装时必须勾选「Add Python.exe to PATH」

2. MarkItDown 官方包安装(离线方式)

  1. 访问微软官方仓库
  2. 点击「Code → Download ZIP」下载源码包。
  3. 解压后,将packages/markitdown文件夹复制到D:\markitdown
  4. 用 Python 3.12 执行离线安装:
py -3.12 -m pip install D:\markitdown -i https://pypi.tuna.tsinghua.edu.cn/simple
  1. 安装全功能依赖(支持视频 / 音频 / Office 文档):
py -3.12 -m pip install "markitdown[all]" -i https://pypi.tuna.tsinghua.edu.cn/simple

3. 必装工具:FFmpeg(视频 / 音频处理依赖)

报错提示:Couldn't find ffmpeg or avconv→ 必须安装 FFmpeg 才能解析视频文件。

安装步骤:

  1. 下载地址:Download FFmpeg
  2. 下载ffmpeg-release-full_build-www.gyan.dev.7z,解压后进入bin文件夹。
  3. ffmpeg.exeffprobe.exe复制到D:\python312\Scripts目录。

验证安装:

ffmpeg -version

三、视频转文字操作指南

1. 路径格式注意事项

  • 避免手动输入路径,推荐:选中文件 → Shift + 右键 →「复制为路径」,直接粘贴到命令中。
  • 路径中不能有中文引号 "",必须使用英文双引号"包裹完整路径。

2. 单文件转换命令

py -3.12 -m markitdown "你的视频文件路径.mp4" -o "输出文件夹\输出文件名.md"

示例(本次使用):

py -3.12 -m markitdown "C:\Users\admin\Desktop\2021-09-08 18.24.35 850371713\meeting_01.mp4" -o "C:\Users\admin\Desktop\output\meeting_01.md"

3. 批量转换文件夹内所有 MP4

cd "视频文件夹路径" dir *.mp4 | ForEach-Object { py -3.12 -m markitdown $_.FullName -o "C:\Users\admin\Desktop\output\$($_.BaseName).md" }

四、常见问题与解决方案

问题现象根因解决方案
ERROR: markitdown requires Python >=3.10Python 版本过低(3.8)安装 Python 3.12,用py -3.12强制调用新版
FileNotFoundError: 系统找不到指定的文件路径错误 / 包含特殊符号用 Shift+右键 复制路径,删除中文引号
生成的.md文件为空缺少 FFmpeg,无法解析视频音频安装 FFmpeg 并复制到 Python 的 Scripts 目录
markitdown: error: unrecognized arguments路径未被完整包裹用英文双引号"完整包裹文件路径
网络代理 / 镜像源下载失败国内网络限制使用清华源-i https://pypi.tuna.tsinghua.edu.cn/simple,或离线安装

五、最终验证

安装验证:

py -3.12 -m markitdown --version

正常输出:0.1.6b2或更高版本号。

转换验证:运行转换命令后,打开输出的.md文件,确认视频语音已成功转写为文字内容。


六、补充说明

  • MarkItDown 对视频的语音转文字功能目前处于测试阶段,依赖 Whisper 模型,需确保网络通畅。

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询