1 В избранное 0 Ответвления 0

OSCHINA-MIRROR/am009-TMSpeech

Присоединиться к Gitlife
Откройте для себя и примите участие в публичных проектах с открытым исходным кодом с участием более 10 миллионов разработчиков. Приватные репозитории также полностью бесплатны :)
Присоединиться бесплатно
Клонировать/Скачать
Внести вклад в разработку кода
Синхронизировать код
Отмена
Подсказка: Поскольку Git не поддерживает пустые директории, создание директории приведёт к созданию пустого файла .keep.
Loading...
README.md

TMSpeech

Видео демонстрация: https://www.bilibili.com/video/BV1rX4y1p7Nx/

Ключевые слова: распознавание речи в текст, реальное время субтитры, распознавание речи на собраниях, отображение субтитров для текста песен, просмотр истории распознавания

TMSpeech — это приложение для Windows, которое позволяет в реальном времени преобразовывать речь в текст с использованием WASAPI для захвата звука с компьютера (внутренней записи). Приложение преобразует речь в текст и отображает его в виде субтитров для текста песен. Приложение работает даже при полном отключении звука на компьютере.

Вы можете:

  • На собраниях быть уверены, что вы не пропустите важную информацию, даже если вы отвлеклись. Вы можете просто посмотреть историю распознавания речи. (Имя проекта происходит из этого)
  • Вести реальное время транскрипцию собраний, автоматически создавать протоколы собраний и сохранять их в файл. По умолчанию результаты распознавания сохраняются по дате в папке TMSpeechLogs в папке "Мои документы".

Проект основан на sherpa-onnx и доработан. На моем ноутбуке с процессором AMD Yö5800u было замерено, что CPU занимает менее 5% при работе приложения.

Спасибо за предоставление фреймворка и моделей распознавания речи проекту sherpa-onnx.

ДемонстрацияБезрамочное окно, которое можно перемещать и изменять размер

Обычное окно распознавания

Окно при наведении курсора

Использование

Скачайте последнюю версию с Release страницы, распакуйте архив и запустите TMSpeech.GUI.exe. Для удобства использования вы можете создать ярлык на рабочем столе.

Мы ценим вашу обратную связь

Вы считаете, что это полезно, но есть недостатки? Пожалуйста, нажмите здесь создать обсуждение и оставьте ваш отзыв!

  • Точность распознавания невысока?
    • Это может быть связано с использованием лучшей модели. В настоящее время мы поддерживаем модели онлайн-трансдьюсера из проекта sherpa-onnx. Вы можете скачать другие модели здесь и изменить путь к модели в настройках.
    • Хотите использовать свою модель? Если вы нашли более эффективную открытую модель, пожалуйста, поделитесь ей с нами!
  • Необходимы дополнительные функции?
    • Пожалуйста, нажмите здесь создать issue и сообщите нам!
    • Если вы знакомы с разработкой Windows/C#, вы можете отправить pull request. Если у вас возникли проблемы во время разработки, вы можете создать issue и обсудить их с нами.

Процесс релиза- В Visual Studio правой кнопкой мыши щелкните по проекту и выберите Publish, добавьте конфигурацию публикации в папку.

  • Нажмите Show all settings для изменения конфигурации публикации,
    • Configuration установите на Release,
    • выберите Deployment mode как self-contained,
    • установите target runtime на win-x64.
  • Скопируйте папку с моделями в папку публикации, переименуйте её в models и упакуйте в zip-файл.
  • Тестируйте все функции на компьютере разработчика и ещё одном компьютере.

Комментарии ( 0 )

Вы можете оставить комментарий после Вход в систему

Введение

Инструмент для отвлечения во время конференций Tencent Meeting: https://github.com/jxlpzqc/TMSpeech Развернуть Свернуть
C#
MIT
Отмена

Обновления (3)

все

Участники

все

Недавние действия

Загрузить больше
Больше нет результатов для загрузки
1
https://api.gitlife.ru/oschina-mirror/am009-TMSpeech.git
git@api.gitlife.ru:oschina-mirror/am009-TMSpeech.git
oschina-mirror
am009-TMSpeech
am009-TMSpeech
master