FFmpeg 8 支持实时生成字幕
FFmpeg 8(代号Huffman)集成语音识别模型Whisper,支持实时为视频生成字幕。Whisper由OpenAI开发,whisper.cpp为Georgi Gerganov开发的本地运行版本。 2025-8-29 06:16:31 Author: www.solidot.org(查看原文) 阅读量:13 收藏

刚刚释出的开源编解码器 FFmpeg 8 集成了语音识别和转录机器学习模型 Whisper,意味着它支持实时为视频生成字幕。FFmpeg 8 代号为 Huffman,以 1952 年发明的 Huffman 编码算法名字命名。Huffman 算法是历史最悠久的无损压缩算法之一。Whisper 模型由 OpenAI 于 2022 年 9 月发布,whisper.cpp 是 Georgi Gerganov 在 Whisper 基础上开发的本地和离线运行版本。

www.theregister.com/2025/08/28/ffmpeg_8_huffman/


文章来源: https://www.solidot.org/story?sid=82171
如有侵权请联系:admin#unsafe.sh