На основе ik-analyzer, который является токенизатором, была реализована совместимость с различными версиями lucene. Домашняя страница проекта ik-analyzer находится по адресу: https://code.google.com/archive/p/ik-analyzer/.
Через веб-сервер осуществляется централизованное управление ресурсами для сегментации текста в Word. Этот сайт является зеркальным сайтом word_web на GitHub и используется только для резервного копирования.
**Анализ лексики китайского языка (LAC)**
Разбиение текста на китайском языке на отдельные слова (Word Segmentation) — это процесс разделения непрерывного естественного языкового текста на последовательность слов, которые имеют смысловую обоснованность...
Модуль для сегментации естественного языка, предназначенный для сегментации больших объёмов китайских текстов, наследует различные инструменты сегментации.