200 oschina mirror 1717164241
0
Последняя версия MMSeg4j 1.9.1 не поддерживает Lucene 5.0. Измените исходный код MMSeg4j для поддержки lucene5.x.
Не обновлено
200 oschina mirror 1717164241
0
На основе ik-analyzer, который является токенизатором, была реализована совместимость с различными версиями lucene. Домашняя страница проекта ik-analyzer находится по адресу: https://code.google.com/archive/p/ik-analyzer/.
Не обновлено
200 oschina mirror 1717164241
0
Китайский плагин для анализа, использующий IK-анализ для Elasticsearch.
5 месяцев назад
200 oschina mirror 1717164241
0
200 oschina mirror 1717164241
0
5 месяцев назад
200 oschina mirror 1717164241
0
**Анализ лексики китайского языка (LAC)** Разбиение текста на китайском языке на отдельные слова (Word Segmentation) — это процесс разделения непрерывного естественного языкового текста на последовательность слов, которые имеют смысловую обоснованность...
5 месяцев назад
200 oschina mirror 1717164241
0
Прежде всего, благодарим автора jieba fxsjy за его бескорыстный вклад. Без него мы бы не познакомились с алгоритмом сегментации слов jieba и у нас не было бы текущей версии на Java.
5 месяцев назад
200 oschina mirror 1717164241
0
Superword — это проект с открытым исходным кодом на Java, посвящённый изучению анализа английских слов и дополнительного чтения. Эта площадка является зеркальным сайтом проекта Superword на GitHub и используется только для резервного копирования данных.
5 месяцев назад
200 oschina mirror 1717164241
0
Плагин IK Analysis интегрирует анализатор Lucene IK (http://code.google.com/p/ik-analyzer/) в opensearch, поддерживает пользовательский словарь.
5 месяцев назад
200 oschina mirror 1717164241
0
Модуль для сегментации естественного языка, предназначенный для сегментации больших объёмов китайских текстов, наследует различные инструменты сегментации.
Не обновлено
200 oschina mirror 1717164241
0
5 месяцев назад
200 oschina mirror 1717164241
0
200 oschina mirror 1717164241
0
Java открытый проект cws_evaluation: оценка результатов работы китайского токенизатора. Этот сайт является зеркальным сайтом cws_evaluation на GitHub, используется только для резервного копирования.
5 месяцев назад
200 oschina mirror 1717164241
0
Использование Office позволяет проводить сегментацию текста, которая может применяться к китайскому, тайскому и другим языкам.
Не обновлено
200 oschina mirror 1717164241
0
5 месяцев назад