阿追 发表于 2026-6-2 14:53:04

有没有比 whisper large v3 更准更强的

我平时用来输出词级字幕,最近测试了 qwen 的 asr 感觉准确率和时间戳都不是很准啊。。

Vion 发表于 2026-6-2 14:53:07

比large v3更准的是 medium. large 不管是中文还是日文,幻觉太多了

1228076385 发表于 2026-6-2 15:55:07

感觉 v3 不如 v2 ,尤其是处理日语方面

青青子衿 发表于 2026-6-2 16:19:04

那太多了,中文的话豆包,多语言的话

elevenlabs ,soniox

赤〆夜 发表于 2026-6-3 00:00:06

反正我是觉得 Whisper 已经过时了,而且过时好几年了。

sensevoice 这类比较新的非自回归的模型,可能效果都比它好。

zhaodage522 发表于 2026-6-3 09:20:11

qwen3-asr 不错的,对中文、方言支持比 whisper 好

chengwei5714869 发表于 2026-6-3 13:20:05

是挺神奇的,有时候 base 也比 large 准
页: [1]
查看完整版本: 有没有比 whisper large v3 更准更强的