1 В избранное 0 Ответвления 0

OSCHINA-MIRROR/webcollector-WebCollector

 / Детали:

Проблемы с кодировкой при сборе веб-страниц

Предстоит сделать
Владелец
Создано  
24.11.2024

При сборе этой веб-страницы ответ имеет тип contentType: text/html;charset=utf-8.

Однако при автоматическом определении языка кодировка определяется как GB2312, и на странице также есть метатег:

Но когда я извлекаю данные из программы, они отображаются корректно только при использовании UTF-8.

Я считаю, что при определении кодировки страницы следует отдавать предпочтение информации из заголовка, а если её нет, то использовать метатеги или автоматическое определение.

Комментарий (0)

GitLife Service Account Задача создана

Вход Перед тем как оставить комментарий

Статус
Ответственный
Контрольная точка
Pull Requests
Связанные запросы на слияние могут быть закрыты после их объединения
Ветки
Дата начала   -   Крайний срок
-
Закрепить/Открепить
Приоритет
Участники(1)
1
https://api.gitlife.ru/oschina-mirror/webcollector-WebCollector.git
git@api.gitlife.ru:oschina-mirror/webcollector-WebCollector.git
oschina-mirror
webcollector-WebCollector
webcollector-WebCollector