返回列表 发布新帖
查看: 45|回复: 4

有没有比 whisper large v3 更准更强的

阿追发表于 昨天 14:53 来自手机版 | 查看全部 |阅读模式
我平时用来输出词级字幕,最近测试了 qwen 的 asr 感觉准确率和时间戳都不是很准啊。。
回复

使用道具 举报

Vion发表于 昨天 14:53 来自手机版 | 查看全部
比  large v3  更准的是 medium. large 不管是中文还是日文,幻觉太多了
回复

使用道具 举报

1228076385发表于 昨天 15:55 | 查看全部
感觉 v3 不如 v2 ,尤其是处理日语方面
回复

使用道具 举报

青青子衿发表于 昨天 16:19 来自手机版 | 查看全部
那太多了,中文的话豆包,多语言的话

elevenlabs ,soniox
回复

使用道具 举报

赤〆夜发表于 1 小时前 来自手机版 | 查看全部
反正我是觉得 Whisper 已经过时了,而且过时好几年了。

sensevoice 这类比较新的非自回归的模型,可能效果都比它好。
回复

使用道具 举报

懒得打字嘛,点击右侧快捷回复
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表