1 В избранное 0 Ответвления 0

OSCHINA-MIRROR/ganjingcun-ansj_seg

Присоединиться к Gitlife
Откройте для себя и примите участие в публичных проектах с открытым исходным кодом с участием более 10 миллионов разработчиков. Приватные репозитории также полностью бесплатны :)
Присоединиться бесплатно
Клонировать/Скачать
Внести вклад в разработку кода
Синхронизировать код
Отмена
Подсказка: Поскольку Git не поддерживает пустые директории, создание директории приведёт к созданию пустого файла .keep.
Loading...
README.md

Ansj 中文分词

==================

Использование

Резюме

Это реализация китайского сегментации на основе модели семантики Google и модели условных случайных полей. Скорость сегментации достигает примерно 200 000 слов в секунду (проверено на Mac Air), а точность может достигать более 96 %.

В настоящее время реализованы:

— китайская сегментация;

— распознавание китайских имён;

— пользовательский словарь.

Может применяться в обработке естественного языка и подходит для проектов с высокими требованиями к сегментации.

Скачать jar

  1. Посетите http://maven.ansj.org/org/ansj/, чтобы загрузить последнюю версию ansj_seg/. Если вы используете версию 1.x, загрузите tree_split.jar. Если вы используете версию 2.x, скачайте nlp-lang.jar.

  2. Импортируйте в Eclipse и запустите программу.

Maven

  1. В вашем pom.xml добавьте:
<project...>
    ....

    <repositories>
        <repository>
            <id>mvn-repo</id>
            <url>http://maven.ansj.org/</url>
        </repository>
    </repositories>
    ....
</project>
  1. В разделе dependencies добавьте следующее (на самом деле версия должна быть последней):
    <dependencies>
        ....
        
        <dependency>
            <groupId>org.ansj</groupId>
            <artifactId>ansj_seg</artifactId>
            <version>1.41</version>
        </dependency>
        ....
    </dependencies>

Вызов demo

Если вы хотите протестировать эффект, вы можете вызвать этот простой интерфейс:

String str = "欢迎使用ansj_seg,(ansj中文分词)在这里如果你遇到什么问题都可以联系我.我一定尽我所能.帮助大家.ansj_seg更快,更准,更自由!" ;
System.out.println(ToAnalysis.parse(str));

[欢迎/, 使用/, ansj/, _/, seg/, ,/, (/, ansj/, 中文/, 分词/, )/, 在/, 这里/, 如果/, 你/, 遇到/, 什么/, 问题/, 都/, 可以/, 联系/, 我/, 房/, 我/, 一定/, 尽/, 我/, 所/, 能/, ./, 帮助/, 大家/, ./, ansj/, _/, seg/, 更/, 快/, ,/, 更/, 准/, ,/, 更/, 自由/, !/]

Примечание:

  • Текст запроса содержит технические термины и понятия из области разработки программного обеспечения.
  • В тексте запроса присутствуют ссылки на внешние ресурсы.
  • Текст содержит фрагменты кода на языке программирования Java.
  • Перевод выполнен с учётом контекста и технических терминов.

Комментарии ( 0 )

Вы можете оставить комментарий после Вход в систему

Введение

Описание недоступно Развернуть Свернуть
Apache-2.0
Отмена

Обновления

Пока нет обновлений

Участники

все

Недавние действия

Загрузить больше
Больше нет результатов для загрузки
1
https://api.gitlife.ru/oschina-mirror/ganjingcun-ansj_seg.git
git@api.gitlife.ru:oschina-mirror/ganjingcun-ansj_seg.git
oschina-mirror
ganjingcun-ansj_seg
ganjingcun-ansj_seg
master