返回列表 发布新帖
查看: 226|回复: 8

有哪些方式可以解析 B 站、抖音的视频的文本?

菜的抠脚发表于 2026-5-15 01:24:04 来自手机版 | 查看全部 |阅读模式
刷视频的时候经常听到一些醍醐灌顶的观点,但是视频收藏起来之后就很难找到、或者说索引出来。

要是能解析成文本保存到笔记中就好了。

V 友们,知道有什么效率高、成本低的方案吗?
回复

使用道具 举报

我们都是小怪兽发表于 2026-5-15 01:24:09 来自手机版 | 查看全部
你问下 ai ,它会帮你安装音频转文字,再帮你提炼。
豆包也可以提炼抖音视频的内容
回复

使用道具 举报

云朵收集者发表于 2026-5-15 01:40:06 来自手机版 | 查看全部
yt-dlp + whisper + 随便找个 LLM 总结 自己写个脚本感觉不会很难
回复

使用道具 举报

咕咕鸡发表于 2026-5-15 01:43:21 来自手机版 | 查看全部
如果大部分的内容都是文字稿转视频配上动画的,确实语音转文字是个不错的省流方案,要是配合本地语音模型加上 llm 感觉是个不错的方案,先 mark 回头手搓一个
回复

使用道具 举报

独行发表于 2026-5-15 02:13:04 来自手机版 | 查看全部
yt-dlp 下载音频, 本地大模型 ASR 转文字。
回复

使用道具 举报

野得像风发表于 2026-5-15 02:35:05 来自手机版 | 查看全部
用 wispher 模型转换一下?
回复

使用道具 举报

仙辞发表于 2026-5-15 02:47:04 来自手机版 | 查看全部
抖音可用豆包
回复

使用道具 举报

bob13551发表于 2026-5-15 09:40:06 | 查看全部
绝大多数的“总结”方案都是直接扒字幕的。

也就是说,如果你要的视频观点、内容主要以语言的形式呈现,那么效果就不错。
如果是以视觉效果呈现,成本就比较高了。

举个例子,比如有的 up 喜欢说“结论如图”/“自己截屏查看”,这种情况市面上的“总结”方案就做不到。
回复

使用道具 举报

Enn发表于 2026-5-15 11:40:06 来自手机版 | 查看全部
@sentinelK 对的,有些视频没有字幕或者某些敏感内容只有语音没有字幕时候就缺失
回复

使用道具 举报

懒得打字嘛,点击右侧快捷回复
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表