friso.mix_len = 2
friso.lna_len = 1
friso.add_syn = 1
@date 2013-06-13
friso.clr_stw = 0
@date 2013-06-13
friso.keep_urec = 0
@date 2013-10-25
friso.spx_out = 0
@date 2013-10-25
friso.en_sseg = 1
friso.st_minl = 2
friso.kpuncs = @%.#&+
friso.nthreshold = 2000000
friso.mode = 2
Friso — это плагин, который предоставляет возможность сегментации для PHP5, PHP7, OCaml, Lua.
**Языки | Связывание | Автор | Статус** |
---|---|---|---|
PHP | php5-binding | dongyado<dongyado@gmail.com> | Завершено |
PHP | php7-binding | dongyado<dongyado@gmail.com> | Завершено |
OCaml | ocaml-binding | https://github.com/kandu | Завершено |
Sphinx | sphinx-binding | lionsoul<chenxin619315@gmail.com> | В разработке |
Lua | lua-binding | lionsoul<chenxin619315@gmail.com> | В разработке |
/*
* Первый шаг: объявить три объекта
*/
friso_t friso; /* Объект Friso для сегментации */
friso_config_t config; /* Объект конфигурации Friso */
friso_task_t task; /* Задача Friso */
/* Второй шаг: инициализировать соответствующие объекты */
friso = friso_new();
config = friso_new_config();
task = friso_new_task();
/* Из файла friso.ini инициализировать Friso */
if (friso_init_from_ifile(friso, config, "адрес файла friso.ini") != 1) {
/* Ошибка инициализации Friso */
}
/*
* Режим сегментации по умолчанию устанавливается из файла friso.ini
* Можно настроить режим сегментации с помощью функции friso_set_mode (простой, сложный, режим обнаружения)
* Простой режим: __FRISO_SIMPLE_MODE__
* Сложный режим: __FRISO_COMPLEX_MODE__
* Режим обнаружения: __FRISO_DETECT_MODE__
* Например, здесь установлен сложный режим сегментации:
*/
friso_set_mode(config, __FRISO_COMPLEX_MODE__);
/* Третий шаг: установить текст для сегментации */
friso_set_text(task, "Текст для сегментации");
/* Четвёртый шаг: получить сегментированный текст */
while (config->next_token(friso, config, task) != NULL) {
/*
В task хранится результат сегментации,
task->token->word: содержимое токена
task->token->offset: смещение токена в исходном тексте
task->token->length: длина токена (в байтах)
task->token->rlen: фактическая длина токена после преобразования (длина - количество байт)
*/
printf("%s ", task->token->word);
}
/* Пятый шаг: освободить объекты */
friso_free_task(task);
friso_free_config(config);
friso_free(friso);
LEX_CEM_WORDS: [ lex-cemixed.lex; ]
LEX_CN_LNAME: [ lex-lname.lex; ]
LEX_CN_SNAME: [ lex-sname.lex; ]
LEX_CN_DNAME1: [ lex-dname-1.lex; ]
LEX_CN_DNAME2: [ lex-dname-2.lex; ]
LEX_CN_LNA: [ lex-ln-adorn.lex; ]
LEX_STOPWORDS: [ lex-stopword.lex; ]
LEX_ENPUN_WORDS: [ lex-en-pun.lex; ]
LEX_EN_WORDS: [ lex-en.lex; ]
Добавление новых лексиконов
Определите категорию: сначала определите категорию лексикона, который вы хотите добавить.
Создайте новый лексикон: например, если вы хотите создать лексикон для хранения названий растений, создайте файл lex-plants.lex в папке dict/ и добавьте в него слова по одному на строку.
Включите лексикон: следующий важный шаг — включить этот лексикон в friso.lex.ini. Обычно лексиконы относятся к категории CJK, поэтому просто добавьте lex-plants.lex как строку в LEX_CJK_WORDS.
LEX_CJK_WORDS: [ lex-main.lex; lex-admin.lex; lex-chars.lex; lex-cn-mz.lex; lex-cn-place.lex; lex-company.lex; lex-festival.lex; lex-flname.lex; lex-food.lex; lex-lang.lex; lex-nation.lex; lex-net.lex; lex-org.lex; lex-touris.lex;
# Новый лексикон названий растений
lex-plants.lex;
]
Добавьте новые слова в лексикон
Найдите соответствующий лексикон, откройте его в текстовом редакторе и добавьте новые слова, следуя формату Friso:
Friso формат слов:
Слово / синонимы
Синонимам не присваивается значение null, а несколько синонимов разделяются запятыми, например:
你好
研究 / 琢磨,研讨,钻研
Вы можете оставить комментарий после Вход в систему
Неприемлемый контент может быть отображен здесь и не будет показан на странице. Вы можете проверить и изменить его с помощью соответствующей функции редактирования.
Если вы подтверждаете, что содержание не содержит непристойной лексики/перенаправления на рекламу/насилия/вульгарной порнографии/нарушений/пиратства/ложного/незначительного или незаконного контента, связанного с национальными законами и предписаниями, вы можете нажать «Отправить» для подачи апелляции, и мы обработаем ее как можно скорее.
Комментарии ( 0 )