1 В избранное 0 Ответвления 0

OSCHINA-MIRROR/chatopera-Synonyms

Присоединиться к Gitlife
Откройте для себя и примите участие в публичных проектах с открытым исходным кодом с участием более 10 миллионов разработчиков. Приватные репозитории также полностью бесплатны :)
Присоединиться бесплатно
Клонировать/Скачать
CHANGELOG.md 3.8 КБ
Копировать Редактировать Web IDE Исходные данные Просмотреть построчно История
gitlife-traslator Отправлено 01.12.2024 07:50 7741d32

3.23

  • Используйте chatoperastore для загрузки файла модели.

3.16

  • Воспользуйтесь ссылкой для скачивания пакета github vector.

3.15

  • Устраните конфликт экспорта jieba, перейдите на раскрытие только интерфейсов keywords и seg.
  • Исправьте ошибки в vocab.txt.

3.13

  • Сократите зависимости.
  • Экспортируйте jieba как synonyms.jieba.

3.12

  • Используйте более крупный вектор слов, с лексиконом более 42W слов.
  • Оптимизируйте скорость загрузки.

3.11

  • Поддержите определение количества слов в запросе, по умолчанию — 10 слов.

3.10

  • При вычислении расстояния редактирования исключайте стоп-слова.

3.9

  • Исправление ошибки.

3.8

  • Получение вектора предложения после сегментации, вектор формируется в виде BoW.
    sentence: предложение после сегментации через пробел
    ignore: если False, то при OOV генерируется случайный вектор

3.7

  • Измените путь импорта utils в word2vec.py на локальный путь.
  • Предоставьте доступ к функции vector fn.

3.6

  • Исправлено: сравнение гарантирует, что обмен двумя предложениями приводит к одинаковому результату.

3.5

  • В соответствии с реальной ситуацией уменьшите влияние расстояния вектора на оценку близости.

3.3

  • Добавлен интерфейс сегментации.
  • Улучшена загрузка словаря при инициализации сегментатора.
  • Используется исходный код jieba для сегментации.
  • Glog используется в качестве модуля вывода журнала.

3.2

  • Лицензия на публикацию изменена на MIT.

3.1

  • Кэш соседей для близких по пространству слов для повышения скорости отклика.
  • Обработка OOV в nearby, возврат ([], []).

3.0 — Более простая настройка и конфигурация, но с дополнительными затратами.

  • Исключены nearby words, используется kdtree для поиска ближайших слов в пространстве.
  • Зависимость от sk-learn увеличена, но предварительная обработка векторов слов уменьшена.
  • Словарь, используемый для сегментации, оптимизирован, также можно использовать переменные среды для объявления основного словаря.
  • Поддержка пользовательских моделей word2vec, использование переменных среды для объявления.

2.5

  • Использование пространственно близких слов для оптимизации вычисления расстояния редактирования.

2.3

  • Увеличение стратегии сглаживания при вычислении сходства.

v1.6

  • Вместо thulac в качестве токенизатора используется jieba.
  • Уточнение журнала консоли для Jupyter notebook.

Опубликовать ( 0 )

Вы можете оставить комментарий после Вход в систему

1
https://api.gitlife.ru/oschina-mirror/chatopera-Synonyms.git
git@api.gitlife.ru:oschina-mirror/chatopera-Synonyms.git
oschina-mirror
chatopera-Synonyms
chatopera-Synonyms
master