200 oschina mirror 1717164241
0
Последняя версия MMSeg4j 1.9.1 не поддерживает Lucene 5.0. Измените исходный код MMSeg4j для поддержки lucene5.x.
Не обновлено
200 oschina mirror 1717164241
0
На основе ik-analyzer, который является токенизатором, была реализована совместимость с различными версиями lucene. Домашняя страница проекта ik-analyzer находится по адресу: https://code.google.com/archive/p/ik-analyzer/.
Не обновлено
200 oschina mirror 1717164241
0
Не обновлено
200 oschina mirror 1717164241
0
Через веб-сервер осуществляется централизованное управление ресурсами для сегментации текста в Word. Этот сайт является зеркальным сайтом word_web на GitHub и используется только для резервного копирования.
Не обновлено
200 oschina mirror 1717164241
0
Китайский плагин для анализа, использующий IK-анализ для Elasticsearch.
5 месяцев назад
200 oschina mirror 1717164241
0
Elasticsearch — удобная версия, интегрированы некоторые часто используемые плагины.
5 месяцев назад
200 oschina mirror 1717164241
0
Не обновлено
200 oschina mirror 1717164241
0
**Анализ лексики китайского языка (LAC)** Разбиение текста на китайском языке на отдельные слова (Word Segmentation) — это процесс разделения непрерывного естественного языкового текста на последовательность слов, которые имеют смысловую обоснованность...
5 месяцев назад
200 oschina mirror 1717164241
0
5 месяцев назад
200 oschina mirror 1717164241
0
Модуль для сегментации естественного языка, предназначенный для сегментации больших объёмов китайских текстов, наследует различные инструменты сегментации.
Не обновлено
200 oschina mirror 1717164241
0
5 месяцев назад
200 oschina mirror 1717164241
0
Paoding — это токенизатор, основанный на Lucene 4.x.
Не обновлено
200 oschina mirror 1717164241
0
Быстрый анализ сегментации слов в китайском языке.
Не обновлено
200 oschina mirror 1717164241
0
5 месяцев назад
200 oschina mirror 1717164241
0
5 месяцев назад