(简体中文|English)
PP-TTS is a streaming speech synthesis system developed by PaddleSpeech. Based on the implementation of SOTA Algorithms, a faster inference engine is used to realize streaming speech synthesis technology to meet the needs of commercial speech interaction scenarios.
Pipline of TTS:
PP-TTS provides a Chinese streaming speech synthesis system based on FastSpeech2 and HiFiGAN by default:
PaddleSpeech TTS models' benchmark: TTS-Benchmark。
Default FastSpeech2: tts3/run.sh
Streaming FastSpeech2: tts3/run_cnndecoder.sh
HiFiGAN:voc5/run.sh
text_to_speech - convert text into speech: text_to_speech
style_fs2 - multi style control for FastSpeech2 model: style_fs2
story talker - book reader based on OCR and TTS: story_talker
metaverse - 2D AR with TTS: metaverse
Non-streaming TTS Server: speech_server
Streaming TTS Server: streaming_tts_server
For more tutorials please see: PP-TTS:流式语音合成原理及服务部署
Вы можете оставить комментарий после Вход в систему
Неприемлемый контент может быть отображен здесь и не будет показан на странице. Вы можете проверить и изменить его с помощью соответствующей функции редактирования.
Если вы подтверждаете, что содержание не содержит непристойной лексики/перенаправления на рекламу/насилия/вульгарной порнографии/нарушений/пиратства/ложного/незначительного или незаконного контента, связанного с национальными законами и предписаниями, вы можете нажать «Отправить» для подачи апелляции, и мы обработаем ее как можно скорее.
Опубликовать ( 0 )