(简体中文|English)
PP-ASR 是一个 提供 ASR 功能的工具。其提供了多种中文和英文的模型,支持模型的训练,并且支持使用命令行的方式进行模型的推理。 PP-ASR 也支持流式模型的部署,以及个性化场景的部署。
语音识别的基本流程如下图所示:
PP-ASR 的主要特点如下:
paddlespeech asr --model xxx --input xxx.wav
方式调用各个预训练模型进行推理。支持的预训练模型列表:released_model。 其中效果较好的模型为 Ds2 Online Wenetspeech ASR0 Model 以及 Conformer Online Wenetspeech ASR1 Model。 两个模型都支持流式 ASR。 更多关于模型设计的部分,可以参考 AIStudio 教程:
模型的训练的参考脚本存放在 examples 中,并按照 examples/数据集/模型
存放,数据集主要支持 aishell 和 librispeech,模型支持 deepspeech2 模型和 u2 (conformer/transformer) 模型。
具体的执行脚本的步骤记录在 run.sh
当中。具体可参考: asr1
PP-ASR 支持在使用pip install paddlespeech
后 使用命令行的方式来使用预训练模型进行推理。
具体支持的功能包括:
具体的使用方式可以参考: speech_recognition
PP-ASR 支持流式ASR的服务部署。支持 语音识别 + 标点处理两个功能同时使用。
server 的 demo: streaming_asr_server
网页上使用 asr server 的效果展示:streaming_asr_demo_video
关于服务部署方面的更多资料,可以参考 AIStudio 教程:
针对个性化场景部署,提供了特征提取(fbank) => 推理模型(打分库)=> TLG(WFST, token, lexion, grammer)的 C++ 程序。具体参考 speechx。
如果想快速了解和使用,可以参考: custom_streaming_asr
关于支持个性化场景部署的更多资料,可以参考 AIStudio 教程:
关于如果使用 PP-ASR,可以看这里的 install,其中提供了 简单、中等、困难 三种安装方式。如果想体验 paddlespeech 的推理功能,可以用 简单 安装方式。
Вы можете оставить комментарий после Вход в систему
Неприемлемый контент может быть отображен здесь и не будет показан на странице. Вы можете проверить и изменить его с помощью соответствующей функции редактирования.
Если вы подтверждаете, что содержание не содержит непристойной лексики/перенаправления на рекламу/насилия/вульгарной порнографии/нарушений/пиратства/ложного/незначительного или незаконного контента, связанного с национальными законами и предписаниями, вы можете нажать «Отправить» для подачи апелляции, и мы обработаем ее как можно скорее.
Опубликовать ( 0 )