开源上新|FunASR英文离线文件转写软件包发布
FunASR是由阿里巴巴智能计算研究院语音实验室开源的语音识别框架,集成了语音端点检测、语音识别、标点预测等领域的工业级模型的训练和部署。
今年7月初,FunASR开源社区发布了离线文件转写软件包,实现了高精度、高效率、高并发的长音频离线文件转写,并在8月份发布了支持实时语音听写软件包,既可以实时地进行语音转文字,而且能够在说话句尾用高精度的转写文字修正输出。
https://github.com/alibaba-damo-academy/FunASR/blob/main/funasr/runtime/docs/SDK_tutorial_en_zh.md
>>>便捷部署
>>>高精度
Paraformer-en模型与Whisper-small-en模型相比,参数量相近,Whisper受益于68+万小时训练数据,相比于Paraformer-en模型5万小时训练数据,识别效果有一定优势(学术集差距在相对10%左右,工业集差距相对4%)。Paraformer模型受益于其非自回归结构,计算效率优势较大,相比于同参数量的Whisper-small-en模型,推理速度提升10倍以上,对于服务部署更加友好。
RTF测试GPU机器V100,CPU机器为Intel(R) Xeon(R) Platinum 8369B CPU @ 2.90GHz; - funasr已经支持whisper模型,上述表格可以通过funasr快速进行测试。
>>>高推理效率
FunASR软件包中的语音端点检测(VAD)、语音识别(ASR)、标点断句(PUNC)模型均通过onnx 量化导出实现推理加速,其中ASR模型为基于Paraformer的非自回归模型,相比于目前普遍采用的自回归模型具有明显的推理效率优势,可同时支持多线并发,可以准确、高效的对音频进行转写。我们采用Librispeech test_clean测试集测试了软件包的转写加速比,CPU8369B上的吞吐率为448,即每小时可以推理448小时音频。
不同配置下的详细吞吐率指标如下表:
表2 FunASR英文离线文件转写软件包性能测试
注:测试机器为 Intel(R) Xeon(R) Platinum 8369B CPU @ 2.90GHz 16core-32processor with avx512_vnni
更多详细结果详见benchmark👇:
https://github.com/alibaba-damo-academy/FunASR/blob/main/funasr/runtime/docs/benchmark_onnx_cpp.md
>>>长音频链路
FunASR软件包提供了一套完整的语音识别链路,包括语音端点检测(VAD)、语音识别(ASR)、标点断句(PUNC),可用于高效转写长音频,无需用户进行二次开发。我们在一个长音频测试集上(时长为0~24min)分别对asr链路、vad+asr+punc链路进行了测试,asr链路在并发32线时会OOM,vad+asr+punc链路的吞吐率为334,相比asr链路有明显优势。
不同配置下的详细吞吐率指标如下表:
表3 FunASR英文离线文件转写软件包长音频输入性能测试
精简操作,即刻安装,FunASR软件包当前已开源。
>>>步骤:
第一步:下载安装部署工具
curl -O https://isv-data.oss-cn-hangzhou.aliyuncs.com/ics/MaaS/ASR/shell/funasr-runtime-deploy-offline-cpu-en.sh
第二步:安装部署
sudo bash funasr-runtime-deploy-offline-cpu-en.sh install --workspace ./funasr-runtime-resources
图2 html网页客户端体验
同时我们在云端部署了FunASR实时语音转写服务,用户可以直接在浏览器中进行体验:
永久福利 直投简历
简历投递:[email protected]
最新评论
推荐文章
作者最新文章
你可能感兴趣的文章
Copyright Disclaimer: The copyright of contents (including texts, images, videos and audios) posted above belong to the User who shared or the third-party website which the User shared from. If you found your copyright have been infringed, please send a DMCA takedown notice to [email protected]. For more detail of the source, please click on the button "Read Original Post" below. For other communications, please send to [email protected].
版权声明:以上内容为用户推荐收藏至CareerEngine平台,其内容(含文字、图片、视频、音频等)及知识版权均属用户或用户转发自的第三方网站,如涉嫌侵权,请通知[email protected]进行信息删除。如需查看信息来源,请点击“查看原文”。如需洽谈其它事宜,请联系[email protected]。
版权声明:以上内容为用户推荐收藏至CareerEngine平台,其内容(含文字、图片、视频、音频等)及知识版权均属用户或用户转发自的第三方网站,如涉嫌侵权,请通知[email protected]进行信息删除。如需查看信息来源,请点击“查看原文”。如需洽谈其它事宜,请联系[email protected]。