В настоящее время htmlparser по-прежнему использует метод замены строк для обеспечения совместимости шаблонов. Этот метод не отличается высокой эффективностью и не является гибким, что приводит к жёсткой привязке разбора к шаблонам.
Добавить поддержку процессора, чтобы обеспечить свободный анализ структуры HTML.
Процессор — это функция, которая используется для определения того, является ли полученный парсером элемент началом или концом.
Информация, содержащаяся в процессоре:
— тип, который используется для описания текущего содержимого: element/attribute/text/cdata/comment;
— имя тега, если тип — element;
— предыдущий символ;
— текущий символ;
— следующий символ.
Функция должна возвращать следующую информацию:
— ожидаемый символ, при возврате которого обработчик будет запущен снова при чтении этого символа;
— стоп-символ, при достижении которого чтение должно быть остановлено, даже если ожидаемый символ не был найден.
Можно ли использовать регулярные выражения для ожидаемых и стоп-символов?
Вы можете оставить комментарий после Вход в систему
Неприемлемый контент может быть отображен здесь и не будет показан на странице. Вы можете проверить и изменить его с помощью соответствующей функции редактирования.
Если вы подтверждаете, что содержание не содержит непристойной лексики/перенаправления на рекламу/насилия/вульгарной порнографии/нарушений/пиратства/ложного/незначительного или незаконного контента, связанного с национальными законами и предписаниями, вы можете нажать «Отправить» для подачи апелляции, и мы обработаем ее как можно скорее.
Опубликовать ( 0 )