最新迭代|FunASR离线文件转写软件包2.0
FunASR是由达摩院语音实验室开源的一款语音识别工具包,集成了语音端点检测、语音识别、标点预测等领域的工业级模型的训练和部署,吸引了众多开发者参与体验和开发。在7月初,FunASR社区发布了离线文件转写软件包,实现了高精度、高效率、高并发的长音频离线文件转写,并在8月份发布了支持流式语音识别软件包。
与此同时,FunASR面对社区用户的需求与反馈进行优化与支持,推出离线文件转写软件包2.0,主要有三个方面的更新——集成ffmpeg支持多种音视频输入、支持热词模型、支持时间戳模型。
(8月初发布)FunASR实时语音听写软件包:
https://github.com/alibaba-damo-academy/FunASR/blob/main/funasr/runtime/docs/SDK_tutorial_online_zh.md
▎离线文件转写软件包2.0
图1 FunASR离线文件转写软件包2.0的新增特征
▎自定义热词与时间戳预测技术
图2 时间戳预测与热词激励模型结构
>>>自定义热词
图3 热词激励实验结果
>>>时间戳预测
图4 时间戳预测精度对比
▎使用指南
FunASR离线文件转写软件包当前已经开源。工具包地址:
https://github.com/alibaba-damo-academy/FunASR/blob/main/funasr/runtime/docs/SDK_tutorial_zh.md
curl -O https://isv-data.oss-cn-hangzhou.aliyuncs.com/ics/MaaS/ASR/shell/funasr-runtime-deploy-offline-cpu-zh.sh
第二步:安装部署
sudo bash funasr-runtime-deploy-offline-cpu-zh.sh install --workspace ./funasr-runtime-resources
离线文件转写(时间戳模型):
同时我们在云端分别部署了FunASR离线文件转写服务与实时听写服务,用户在浏览器中输入下面网址,即可进行体验:
离线文件转写(热词模型):https://101.37.77.25:1335/static/index.html
离线文件转写(时间戳模型):https://101.37.77.25:1334/static/index.html
实时听写:https://101.37.77.25:1336/static/index.html
永久福利 直投简历
简历投递:[email protected]
最新评论
推荐文章
作者最新文章
你可能感兴趣的文章
Copyright Disclaimer: The copyright of contents (including texts, images, videos and audios) posted above belong to the User who shared or the third-party website which the User shared from. If you found your copyright have been infringed, please send a DMCA takedown notice to [email protected]. For more detail of the source, please click on the button "Read Original Post" below. For other communications, please send to [email protected].
版权声明:以上内容为用户推荐收藏至CareerEngine平台,其内容(含文字、图片、视频、音频等)及知识版权均属用户或用户转发自的第三方网站,如涉嫌侵权,请通知[email protected]进行信息删除。如需查看信息来源,请点击“查看原文”。如需洽谈其它事宜,请联系[email protected]。
版权声明:以上内容为用户推荐收藏至CareerEngine平台,其内容(含文字、图片、视频、音频等)及知识版权均属用户或用户转发自的第三方网站,如涉嫌侵权,请通知[email protected]进行信息删除。如需查看信息来源,请点击“查看原文”。如需洽谈其它事宜,请联系[email protected]。