- Преобразование аудио (до 60 секунд) в текстовое представление, что позволяет машине "понять" человеческую речь, как будто бы она получила "ухо", которое может "слушать".
- Быстрый интерактивный API для преобразования голосового сообщения в текст в режиме реального времени, поддерживающий отправку результатов распознавания сразу после записи звука.
- Эта способность распознавания речи предоставляется через Websocket API, который обеспечивает универсальный интерфейс для разработчиков.
- Websocket API имеет возможность поточной передачи данных, что делает его подходящим для сцен AI, требующих поточной передачи данных, таких как одновременная запись и распознавание речи.
- В отличие от SDK, WebAPI легковесен и многоплатформен; в отличие от HTTP API, протокол Websocket API имеет преимущество нативной поддержки кросс-доменного доступа.
- Для использования горячих слов в сервисе распознавания речи Stream WebAPI войдите на платформу Xinfei Open Platform, найдите консоль управления -> мои приложения -> распознавание речи -> личные горячие слова и загрузите свои горячие слова.
# Используйте команду npm для установки
$ npm i @muguilin/xf-voice-dictation
# Используйте команду yarn для установки
$ yarn add @muguilin/xf-voice-dictation
【Обратите внимание】: Сервис использует три ключевых параметра для аутентификации: APPID, APISecret, APIKey. Эти данные можно получить на официальном сайте (https://www.xfyun.cn/services/voicedictation).
【Внимание】: Длина APISecret и APIKey очень похожа, поэтому будьте внимательны при заполнении!
import { XfVoiceDictation } from '@muguilin/xf-voice-dictation';
let times = null;
const xfVoice = new XfVoiceDictation({
APPID: 'xxx',
APISecret: 'xxx',
APIKey: 'xxx',
// Адрес запроса WebSocket (необязательный параметр, по умолчанию wss://iat-api.xfyun.cn/v2/iat)
// url: '',
// Обработка событий изменения состояния записи
onWillStatusChange: function(oldStatus, newStatus) {
// Здесь вы можете реализовать логику взаимодействия страницы: обратный отсчет (время записи ограничено 60 секундами), анимация записи, взаимодействие кнопок и т.д.
console.log('Состояние распознавания:', oldStatus, newStatus);
}
});
// Обработка изменения результатов распознавания
onTextChange: function(text) {
// Здесь можно реализовать логику взаимодействия с интерфейсом: отображение текста на странице
console.log('Распознанный текст:', text);
}
``` // Если за последние 3 секунды ничего не было сказано, то распознавание автоматически завершается (через 60 секунд также происходит автоматическое завершение)
if (text) {
clearTimeout(times);
times = setTimeout(() => {
this.stop();
}, 3000);
};
}, // Обработка ошибок распознавания
onError: function(error) {
console.log('Ошибка:', error);
}
});
// Добавление событий к DOM-элементам для запуска голосового распознавания!
// xfVoice.start();
// Добавление событий к DOM-элементам для остановки голосового распознавания!
// xfVoice.stop();
Вы можете оставить комментарий после Вход в систему
Неприемлемый контент может быть отображен здесь и не будет показан на странице. Вы можете проверить и изменить его с помощью соответствующей функции редактирования.
Если вы подтверждаете, что содержание не содержит непристойной лексики/перенаправления на рекламу/насилия/вульгарной порнографии/нарушений/пиратства/ложного/незначительного или незаконного контента, связанного с национальными законами и предписаниями, вы можете нажать «Отправить» для подачи апелляции, и мы обработаем ее как можно скорее.
Комментарии ( 0 )