1 В избранное 0 Ответвления 0

OSCHINA-MIRROR/xuwangcheng-html-to-word

Присоединиться к Gitlife
Откройте для себя и примите участие в публичных проектах с открытым исходным кодом с участием более 10 миллионов разработчиков. Приватные репозитории также полностью бесплатны :)
Присоединиться бесплатно
Клонировать/Скачать
Внести вклад в разработку кода
Синхронизировать код
Отмена
Подсказка: Поскольку Git не поддерживает пустые директории, создание директории приведёт к созданию пустого файла .keep.
Loading...
README.md

Более совершенное решение

Все могут обратиться к плагину, который написал этот друг. В основном он реализует большую часть преобразования HTML-тегов в Word: https://github.com/draco1023/poi-tl-ext

Html To Word

Преобразование форматированного текста HTML в Word

В 2019 году для бизнеса потребовалось преобразовать данные форматированного HTML на переднем конце в документы Word. После поиска в интернете выяснилось, что большинство решений преобразуют весь HTML в версию Word для веб-просмотра. Однако наши требования включали объединение множества различных элементов форматированного HTML и динамическое добавление заголовков, изображений и другого контента. Поэтому мы отказались от версии Word для веб. Позже мы обнаружили poi-tl (http://deepoove.com/poi-tl/), который позволяет напрямую создавать шаблоны Word. Изучив требования, мы пришли к следующему решению:

  • Использовать шаблоны poi-tl для создания документов Word с динамическими заголовками и оглавлениями;
  • Создавать статистические изображения с помощью jfreeChart и передавать их через параметры шаблонов poi-tl;
  • Анализировать форматированный текст с помощью Jsoup и преобразовывать различные HTML-теги в объекты Word с помощью пользовательских стратегий poi-tl.

Я собрал код и надеюсь, что он поможет другим с аналогичными требованиями.

О расширении обработки тегов

Создайте соответствующий класс обработчика в пакете com.xuwangcheng.html2word.handler и наследуйте от BaseHtmlTagHandler. Реализуйте методы getMatchTagName и handleHtmlElement. Для конкретной реализации кода необходимо сначала изучить некоторые функции poi-tl и обратиться к http://deepoove.com/poi-tl/.

На данный момент реализованы теги table, img, span, sup и другие. Преобразование других тегов зависит от индивидуальных требований. Если у вас есть готовый код, пожалуйста, отправьте PR, чтобы помочь большему количеству друзей.

Не поддерживается преобразование CSS-стилей. Если вам требуется более детальный анализ стилей CSS, рассмотрите возможность расширения или используйте плагин poi-tl-ext, рекомендованный выше.

Если у вас возникли вопросы, вы можете связаться со мной через QQ или WeChat. Контактная информация указана на моей личной странице в Code Cloud.

Комментарии ( 0 )

Вы можете оставить комментарий после Вход в систему

Введение

Описание недоступно Развернуть Свернуть
MulanPSL-2.0
Отмена

Обновления

Пока нет обновлений

Участники

все

Недавние действия

Загрузить больше
Больше нет результатов для загрузки
1
https://api.gitlife.ru/oschina-mirror/xuwangcheng-html-to-word.git
git@api.gitlife.ru:oschina-mirror/xuwangcheng-html-to-word.git
oschina-mirror
xuwangcheng-html-to-word
xuwangcheng-html-to-word
master