Ansj 中文分词
==================
http://nlpchina.github.io/ansj_seg/ — помощь по использованию.
http://demo.ansj.org — онлайн-тестирование.
Это реализация китайского сегментации на основе модели семантики Google и модели условных случайных полей. Скорость сегментации достигает примерно 200 000 слов в секунду (проверено на Mac Air), а точность может достигать более 96 %.
В настоящее время реализованы:
— китайская сегментация;
— распознавание китайских имён;
— пользовательский словарь.
Может применяться в обработке естественного языка и подходит для проектов с высокими требованиями к сегментации.
Посетите http://maven.ansj.org/org/ansj/, чтобы загрузить последнюю версию ansj_seg/. Если вы используете версию 1.x, загрузите tree_split.jar. Если вы используете версию 2.x, скачайте nlp-lang.jar.
Импортируйте в Eclipse и запустите программу.
<project...>
....
<repositories>
<repository>
<id>mvn-repo</id>
<url>http://maven.ansj.org/</url>
</repository>
</repositories>
....
</project>
<dependencies>
....
<dependency>
<groupId>org.ansj</groupId>
<artifactId>ansj_seg</artifactId>
<version>1.41</version>
</dependency>
....
</dependencies>
Если вы хотите протестировать эффект, вы можете вызвать этот простой интерфейс:
String str = "欢迎使用ansj_seg,(ansj中文分词)在这里如果你遇到什么问题都可以联系我.我一定尽我所能.帮助大家.ansj_seg更快,更准,更自由!" ;
System.out.println(ToAnalysis.parse(str));
[欢迎/, 使用/, ansj/, _/, seg/, ,/, (/, ansj/, 中文/, 分词/, )/, 在/, 这里/, 如果/, 你/, 遇到/, 什么/, 问题/, 都/, 可以/, 联系/, 我/, 房/, 我/, 一定/, 尽/, 我/, 所/, 能/, ./, 帮助/, 大家/, ./, ansj/, _/, seg/, 更/, 快/, ,/, 更/, 准/, ,/, 更/, 自由/, !/]
Примечание:
Вы можете оставить комментарий после Вход в систему
Неприемлемый контент может быть отображен здесь и не будет показан на странице. Вы можете проверить и изменить его с помощью соответствующей функции редактирования.
Если вы подтверждаете, что содержание не содержит непристойной лексики/перенаправления на рекламу/насилия/вульгарной порнографии/нарушений/пиратства/ложного/незначительного или незаконного контента, связанного с национальными законами и предписаниями, вы можете нажать «Отправить» для подачи апелляции, и мы обработаем ее как можно скорее.
Комментарии ( 0 )