Friso 1.6.3 (будущая версия):
Фильтр токенов Sphinx.
Сложное вторичное разделение китайского языка.
Поддержка Autotools.
Поддержка Friso deb и rmp: Debian & Ubuntu: sudo apt-get install libfriso0 libfriso-dev; CentOS & Fedora: sudo yum install libfriso libfriso-devel.
Пометка частей речи для китайского языка.
Распознавание китайских цифр.
Преобразование китайских цифр в арабские.
Распознавание имён собственных.
Автоматическое обновление словарной базы.
Friso 1.6.2 (текущая версия) — сделано.
lionsoul@lionsoul-ThundeRobot:/Code/C/friso/src$ valgrind --tool=memcheck --leak-check=full friso -init ../friso.ini
==6752== Memcheck, a memory error detector
==6752== Copyright (C) 2002-2015, and GNU GPL'd, by Julian Seward et al.
==6752== Using Valgrind-3.11.0 and LibVEX; rerun with -h for copyright info
==6752== Command: friso -init ../friso.ini
==6752==
Initialized in 1.620453sec
Mode: Complex
+-Version: 1.6.2 (UTF-8)
+-----------------------------------------------------------+
| friso - a chinese word segmentation writen by c. |
| bug report email - chenxin619315@gmail.com. |
| or: visit http://code.google.com/p/friso. |
| java edition for http://code.google.com/p/jcseg |
| type 'quit' to exit the program. |
+-----------------------------------------------------------+
friso>> 研究生命起源
分词结果:
研究 琢磨 研讨 钻研 生命 起源
Done, cost < 0.027772sec
friso>> quit
Thanks for trying friso.
==6752==
==6752== HEAP SUMMARY:
==6752== in use at exit: 0 bytes in 0 blocks
==6752== total heap usage: 555,930 allocs, 555,930 frees, 18,237,934 bytes allocated
==6752==
==6752== All heap blocks were freed -- no leaks are possible
==6752==
==6752== For counts of detected and suppressed errors, rerun with: -v
==6752== ERROR SUMMARY: 0 errors from 0 contexts (suppressed: 0 from 0)
Friso 1.6.1:
В файле friso.ini добавлена поддержка относительного пути к файлу friso.lex_dir. — сделано.
Исправлено две утечки памяти. — сделано.
Улучшено распознавание слов, состоящих из китайских и английских букв, например, 高3. — сделано.
Оптимизирован словарь, добавлены новые слова. — сделано.
Исправлено два программных дефекта в функциях friso_dic_add и array_list_insert. — сделано.
Добавлена проверка режима разделения, которая возвращает только слова из словаря. — сделано.
Интегрирован PHP-расширение, которое идеально поддерживает PHP-разделение. — сделано.
Friso 1.6.0:
В функции friso_stirng.c#utf8_decimal_string инициализировано значение bytes = 0, устранена ошибка Run-Time Check Failed в WinNT. — сделано.
Реализовано вторичное разделение сложных английских и цифровых комбинаций, таких как QQ2013, на qq2013, qq, 2013. — сделано.
Поддерживается кодировка GBK. — сделано.
В файл friso.ini добавлен пользовательский список знаков препинания, удалены по умолчанию знаки препинания «^,/,-,'». — сделано.
Переменные заменены масками. — сделано.
В результате разделения friso_hits_t улучшены возвращаемые значения для части речи и длины слова, исправлены ошибки смещения. — сделано.
Проведена оптимизация, например, добавлено дополнение синонимов (обычных/sphinx), сложная логика принятия решений заменена использованием масок, что не только уменьшило объём кода, но и повысило эффективность выполнения. — сделано.
Возвращается больше информации, включая часть речи, длину, реальную длину и часть речи (ожидается реализация). — сделано.
Добавлен автоматический перенос файлов заголовков при установке (usr/include/friso), можно использовать include <friso/xx.h> для ссылки на файлы заголовков. — сделано.
Friso 1.5:
Добавлен вывод Sphinx, синонимы разделены символом «|», например, исследование|анализ|обсуждение|углублённое исследование жизни. — сделано.
Исправлены все исходные файлы tst-xxx. Файлы API были изменены после того, как тестовые образцы не были обновлены. — сделано.
Исправлен дефект в функции friso.c#next_basic_latin, где комбинация «число + пробел + единица» объединяла числа и единицы без пробела. — сделано.
Исправлен дефект в friso.c#next_basic_latin, где сочетание «число + китайский + пробел» приводило к искажению символов. — сделано.
Внедрён friso_config_t для многоконфигурационного использования, чтобы избежать неудобств, связанных с глобальной конфигурацией. — сделано.
Friso 1.4:
Не удалось распознать десятичные дроби и единицы измерения. Изменена функция friso_string#utf8_numeric_string(). — сделано.
Изменено распознавание смешанных китайских и английских слов (теперь можно распознавать любые комбинации китайского и английского языков). Английский китайский: b超, английский китайский английский: a美1, английский китайский китайский: a哆啦a梦, китайский английский: 卡拉ok, китайский английский китайский: 哆啦a梦, китайский китайский английский: 中文a美a. — сделано.
Изменены правила объединения единиц измерения, теперь можно объединять единицы измерения на любом языке, например, ℃,℉. — сделано.
Для неизвестных символов предоставляется переключатель для определения, сохранять или фильтровать. — сделано.
Добавлены английские синонимы (добавлен лексикон lex-en.lex). — сделано.
Friso 1.3:
Устранены конфликты с C++ и VS (string и __value). — сделано.
Некоторые простые функции используют макроопределения вместо вызовов функций, уменьшая количество вызовов функций. — сделано.
Сохранено разделение английских полных и полуширинных и китайских знаков препинания (можно отключить ненужные знаки препинания через стоп-слова). Стоп-слова уже содержат все сохранённые знаки препинания. — сделано.
Исправлена ошибка в функции friso_string#utf8_en_punctuation(). — сделано.
Исправлена ошибка смещения результата разделения (используйте начало этого слова в качестве смещения). — сделано.
Исправлена ошибка friso_lexicon#friso_dic_load. — сделано.
Реализован поиск слов C++ и C# (добавлено lex-en-pun.lex). — сделано.
Реализовано распознавание смешанных китайских и английских слов, например, 卡拉ok (добавлено lex-cemix.lex). — сделано.
Обновлён Makefile, оптимизирована цель clean и обеспечена совместимость с компиляцией 64-битных систем. — сделано.
Обновлён словарь, добавлено несколько новых слов и удалено несколько ненужных слов. — сделано.
Добавлена документация по разработке Friso.pdf. — сделано. Предоставлен Makefile для Cygwin — Makefile.cygwin, для компиляции friso на системе WinNT используйте этот Makefile.
Была повторно интегрирована лексическая база данных jcseg, добавлено несколько новых слов.
Добавлен документ CHANGES, в документ README добавлена информация о конфигурации тестирования.
Friso-1.1:
Добавлены следующие две функции:
Friso-1.0:
Вы можете оставить комментарий после Вход в систему
Неприемлемый контент может быть отображен здесь и не будет показан на странице. Вы можете проверить и изменить его с помощью соответствующей функции редактирования.
Если вы подтверждаете, что содержание не содержит непристойной лексики/перенаправления на рекламу/насилия/вульгарной порнографии/нарушений/пиратства/ложного/незначительного или незаконного контента, связанного с национальными законами и предписаниями, вы можете нажать «Отправить» для подачи апелляции, и мы обработаем ее как можно скорее.
Опубликовать ( 0 )