(简体中文|English)
PP-TTS 是 PaddleSpeech 自研的流式语音合成系统。在实现前沿算法的基础上,使用了更快的推理引擎,实现了流式语音合成技术,使其满足商业语音交互场景的需求。
语音合成基本流程如下图所示:
PP-TTS 默认提供基于 FastSpeech2 声学模型和 HiFiGAN 声码器的中文流式语音合成系统:
PaddleSpeech TTS 模型之间的性能对比,请查看 TTS-Benchmark。
Default FastSpeech2:tts3/run.sh
流式 FastSpeech2:tts3/run_cnndecoder.sh
HiFiGAN:voc5/run.sh
一键式实现语音合成:text_to_speech
个性化语音合成 - 基于 FastSpeech2 模型的个性化语音合成:style_fs2
会说话的故事书 - 基于 OCR 和语音合成的会说话的故事书:story_talker
元宇宙 - 基于语音合成的 2D 增强现实:metaverse
一键式搭建非流式语音合成服务:speech_server
一键式搭建流式语音合成服务:streaming_tts_server
更多教程,包括模型设计、模型训练、推理部署等,请参考 AIStudio 教程:PP-TTS:流式语音合成原理及服务部署
Вы можете оставить комментарий после Вход в систему
Неприемлемый контент может быть отображен здесь и не будет показан на странице. Вы можете проверить и изменить его с помощью соответствующей функции редактирования.
Если вы подтверждаете, что содержание не содержит непристойной лексики/перенаправления на рекламу/насилия/вульгарной порнографии/нарушений/пиратства/ложного/незначительного или незаконного контента, связанного с национальными законами и предписаниями, вы можете нажать «Отправить» для подачи апелляции, и мы обработаем ее как можно скорее.
Опубликовать ( 0 )