1 В избранное 0 Ответвления 0

OSCHINA-MIRROR/xuwangcheng-html-to-word

Присоединиться к Gitlife
Откройте для себя и примите участие в публичных проектах с открытым исходным кодом с участием более 10 миллионов разработчиков. Приватные репозитории также полностью бесплатны :)
Присоединиться бесплатно
Клонировать/Скачать
README.md 3.7 КБ
Копировать Редактировать Web IDE Исходные данные Просмотреть построчно История
gitlife-traslator Отправлено 30.11.2024 12:11 631ec5d

Более совершенное решение

Все могут обратиться к плагину, который написал этот друг. В основном он реализует большую часть преобразования HTML-тегов в Word: https://github.com/draco1023/poi-tl-ext

Html To Word

Преобразование форматированного текста HTML в Word

В 2019 году для бизнеса потребовалось преобразовать данные форматированного HTML на переднем конце в документы Word. После поиска в интернете выяснилось, что большинство решений преобразуют весь HTML в версию Word для веб-просмотра. Однако наши требования включали объединение множества различных элементов форматированного HTML и динамическое добавление заголовков, изображений и другого контента. Поэтому мы отказались от версии Word для веб. Позже мы обнаружили poi-tl (http://deepoove.com/poi-tl/), который позволяет напрямую создавать шаблоны Word. Изучив требования, мы пришли к следующему решению:

  • Использовать шаблоны poi-tl для создания документов Word с динамическими заголовками и оглавлениями;
  • Создавать статистические изображения с помощью jfreeChart и передавать их через параметры шаблонов poi-tl;
  • Анализировать форматированный текст с помощью Jsoup и преобразовывать различные HTML-теги в объекты Word с помощью пользовательских стратегий poi-tl.

Я собрал код и надеюсь, что он поможет другим с аналогичными требованиями.

О расширении обработки тегов

Создайте соответствующий класс обработчика в пакете com.xuwangcheng.html2word.handler и наследуйте от BaseHtmlTagHandler. Реализуйте методы getMatchTagName и handleHtmlElement. Для конкретной реализации кода необходимо сначала изучить некоторые функции poi-tl и обратиться к http://deepoove.com/poi-tl/.

На данный момент реализованы теги table, img, span, sup и другие. Преобразование других тегов зависит от индивидуальных требований. Если у вас есть готовый код, пожалуйста, отправьте PR, чтобы помочь большему количеству друзей.

Не поддерживается преобразование CSS-стилей. Если вам требуется более детальный анализ стилей CSS, рассмотрите возможность расширения или используйте плагин poi-tl-ext, рекомендованный выше.

Если у вас возникли вопросы, вы можете связаться со мной через QQ или WeChat. Контактная информация указана на моей личной странице в Code Cloud.

Опубликовать ( 0 )

Вы можете оставить комментарий после Вход в систему

1
https://api.gitlife.ru/oschina-mirror/xuwangcheng-html-to-word.git
git@api.gitlife.ru:oschina-mirror/xuwangcheng-html-to-word.git
oschina-mirror
xuwangcheng-html-to-word
xuwangcheng-html-to-word
master