#php-пиньинь
PHP модуль для конвертации китайских иероглифов в пиньинь без использования сторонних компонентов (поддерживает редкие иероглифы).
Прежний модуль конвертации уже не удовлетворяет требованиям, поэтому был переработан и оптимизирован.
Метод: сначала используется таблица кодировки GBK, а затем используются словари для редких иероглифов.
(Необходимо наличие расширения PHP mbstring)
class Pinyin {
// $str - иероглифы для конвертации (только UTF-8)
// $first_char - если true, то берутся только начальные буквы
// $split_char - разделитель между буквами
// $except_char - список символов, которые следует исключить
static function get($str, $first_char = false, $split_char = '', $except_char = '');
}
$str = '是默认的编码方式。对于英文文件是ASCII编码,对于简体中文文件是GB2312编码,魍魉,交媾,蒯草';
Pinyin::get($str);
Pinyin::get($str, false, '-');
Pinyin::get($str, true, '-');
Откройте keywords.txt, переместите словарь в keywords.txt, сохраните его в кодировке UTF-8.
Запустите команду php make.php find
.
Откройте new_dict.txt с помощью блокнота или другого редактора,
и вы увидите нераспознанные слова следующего вида (пример):
А
Аа
...
Добавьте соответствующие произношения после каждого слова через пробел:
А а
Аа аа
...
Запустите команду php make.php make
,
и новый словарь будет добавлен в pinyin.class.php.
Переместите этот новый файл в проект, чтобы он мог распознавать ранее нераспознанные слова.
Вы можете оставить комментарий после Вход в систему
Неприемлемый контент может быть отображен здесь и не будет показан на странице. Вы можете проверить и изменить его с помощью соответствующей функции редактирования.
Если вы подтверждаете, что содержание не содержит непристойной лексики/перенаправления на рекламу/насилия/вульгарной порнографии/нарушений/пиратства/ложного/незначительного или незаконного контента, связанного с национальными законами и предписаниями, вы можете нажать «Отправить» для подачи апелляции, и мы обработаем ее как можно скорее.
Комментарии ( 0 )