1 В избранное 0 Ответвления 0

OSCHINA-MIRROR/chatopera-efaqa-corpus-zh

Присоединиться к Gitlife
Откройте для себя и примите участие в публичных проектах с открытым исходным кодом с участием более 10 миллионов разработчиков. Приватные репозитории также полностью бесплатны :)
Присоединиться бесплатно
Клонировать/Скачать
Внести вклад в разработку кода
Синхронизировать код
Отмена
Подсказка: Поскольку Git не поддерживает пустые директории, создание директории приведёт к созданию пустого файла .keep.
Loading...
README.md

Корпус данных по психокоррекции

Набор данных Адрес Описание
Набор данных вопросов и ответов по психокоррекции (Набор данных первой помощи эмоциям) GitHub, Gitee Множественные диалоги с человеко-маркерами
Исходный набор данных вопросов и ответов по психокоррекции (Исходный набор данных первой помощи эмоциям) GitHub, [Gitee](https://gitee.com/chatopera/efaqa-corpus- Yöntem) Незаконченные исходные данные после сбора

Набор данных первой помощи эмоциям

PyPI версии Python PyPI количество скачиваний за месяц PyPI версия shields.io Лицензия

Набор данных вопросов и ответов по психокоррекции предназначен только для исследовательских целей.Набор данных вопросов и ответов по психокоррекции (также известный как "набор данных", "корpus данных") создан для применения искусственного интеллекта в области психокоррекции. По нашим данным, это первый открытый набор данных QA в этой области, содержащий 20,000 записей данных по психокоррекции. Это также наиболее крупный открытый набор данных по психокоррекции на китайском языке (дата публикации 2022-04-07). В наборе данных содержится множество информации, включая многокруговые диалоги и информацию по категоризации, создание которого потребовало значительного количества времени и усилий, таких как процесс маркировки, который требует более одной минуты на каждую запись.Исходный код набора данных вопросов и ответов по психокоррекции распространяется под открытым лицензионным соглашением, но при установке и использовании требуются сертификаты, которые можно приобрести через магазин сертификатов для доступа к скачиванию и использованию данных. Подробное описание использования приведено ниже.

Установка и использование

Зависимости:

  • Python: 2.x, 3.x
  • Pip

Установка и скачивание коры данных

Linux или macOS

export EFAQA_DL_LICENSE=YOUR_LICENSE
pip install -U efaqa-corpus-zh     # Установка пакета скриптов
python -c "import efaqa_corpus_zh" # Загрузка корпуса данных

Windows

# Установка окружения
## 1/2 Командная строка
set EFAQA_DL_LICENSE=YOUR_LICENSE
## 2/2 PowerShell
$env:EFAQA_DL_LICENSE='YOUR_LICENSE'

# Загрузка
pip install -U efaqa-corpus-zh     # Установка пакета скриптов
python -c "import efaqa_corpus_zh" # Загрузка корпуса данных

YOUR_LICENSE — это серийный номер лицензии, приобретённой в магазине сертификатов.

Скриншот страницы покупки сертификата

Предположим, что серийный номер лицензии равен FOOBAR, тогда установка будет следующей:

# Linux / macOS
export EFAQA_DL_LICENSE=FOOBAR
# Windows
## 1/2 Командная строка
set EFAQA_DL_LICENSE=FOOBAR
## 2/2 PowerShell
$env:EFAQA_DL_LICENSE='FOOBAR'

Пример кода

import efaqa_corpus_zh
records = list(efaqa_corpus_zh.load())
print("размер: %d" % len(records))
print(records[0]["title"])
```Первое выполнение метода `load` скачать данные, скорость загрузки зависит от качества сети.

## Формат данныхКаждый элемент данных `records = list(efaqa_corpus_zh.load())` следует следующему формату:

<table>
   <tr>
     <th>Поле</th>
     <th colspan="3">Описание</th>
     <th>Тип</th>
   </tr>
   <tr>
     <td>md5</td>
     <td colspan="3">Уникальный идентификатор</td>
     <td>string</td>
   </tr>
   <tr>
     <td>title</td>
     <td colspan="3">Заголовок</td>
     <td>string</td>
   </tr>
   <tr>
     <td>description</td>
     <td colspan="3">Описание</td>
     <td>string</td>
   </tr>
   <tr>
     <td>owner</td>
     <td colspan="3">Запросивший пользователь (обезличенный)</td>
     <td>string</td>
   </tr>
   <tr>
     <td>label</td>
     <td colspan="3">Теги темы</td>
     <td>object</td>
   </tr>
   <tr>
     <td rowspan="3"></td>
     <td>s3</td>
     <td colspan="2">Тип проблемы</td>
     <td>string</td>
   </tr>
   <tr>
     <td>s2</td>
     <td colspan="2">Психическое заболевание</td>
     <td>string</td>
   </tr>
   <tr>
     <td>s1</td>
     <td colspan="2">СОС</td>
     <td>string</td>
   </tr>
   <tr>
     <td>chats</td>
     <td colspan="3">Данные чата</td>
     <td>array</td>
   </tr>
   <tr>
     <td rowspan="8"></td>
     <td>sender</td>
     <td colspan="2">Отправитель</td>
     <td>string</td>
   </tr>
   <tr>
     <td>type</td>
     <td colspan="2">Тип сообщения</td>
     <td>string</td>
   </tr>
   <tr>
     <td>time</td>
     <td colspan="2">Дата отправки</td>
     <td>string</td>
   </tr>
   <tr>
     <td>value</td>
     <td colspan="2">Текстовое содержимое сообщения</td>
     <td>string</td>
   </tr>
   <tr>
     <td>label</td>
     <td colspan="2">Теги чата</td>
     <td>object</td>
   </tr>
   <tr>
     <td rowspan="3"></td>
     <td>knowledge</td>
     <td>Знаниевый</td>
     <td>boolean</td>
   </tr>
   <tr>
     <td>question</td>
     <td>Переспрашиваемый</td>
     <td>boolean</td>
   </tr>
   <tr>
     <td>negative</td>
     <td>Негативный ответ</td>
     <td>boolean</td>
   </tr>
</table></table>**[Внимание] значение отправителя `sender`, равное `owner`, указывает на то, что сообщение было отправлено консультантом; значение `audience` указывает на то, что сообщение было опубликовано другим участником, который может быть психологом или нет.**## Пример данных

```markdown
{
  "md5": "2f63d374c071043d9e1968aefa62ffb7",
  "owner": "Аноним",
  "title": "Женщина. Самую распространённую критику она слышала в свой адрес — что она ни на что не годится, недальновидна, неумна.",
  "label": {
    "s1": "1.13",
    "s2": "2.7",
    "s3": "3.4"
  },
  "chats": [
    {
      "time": "11:02:45",
      "value": "Кому это касается?",
      "sender": "audience",
      "type": "textMessage",
      "label": { "question": true, "knowledge": false, "negative": false }
    },
    {
      "time": "11:08:38",
      "sender": "audience",
      "type": "textMessage",
      "value": "Добро пожаловать ко мне ❤",
      "label": { "question": false, "knowledge": false, "negative": false }
    },
    {
      "time": "11:15:17",
      "sender": "owner",
      "type": "textMessage",
      "value": "Как жаль"
    }
  ]
}

Определение меток

В одной записи данные поля title и description представляют начальные сведения от консультанта, а метки темы используются для классификации вопроса на основе этих двух полей. Классификация состоит из трёх осей: S1 тип проблемы; S2 психическое заболевание; S3 SOS. Здесь S представляет собой степень серьёзности (severity) проблемы, которая возрастает по мере увеличения осей. Необходимо отметить, что некоторые проекты требуют клинического медицинского заключения. Концепции, используемые в наборе данных, являются предполагаемыми, например, если мы помечаем тему как депрессия, это означает предполагаемую депрессию. Это заявление не означает, что наш подход небрежен, но является строгим требованием квалификации и стремлением к научной точности.Значения каждого измерения записываются в поле label. Дизайн ID следующий:### S1 Тип проблемы| ID | Русский | Английский | Примечание | | ---- | ----------------------------------------- | -------------------------- | -------------------------------------------------------------------------------------------------------------------------------------------------- | | 1.1 | Учебные проблемы, беспокойство за будущее | Academic Concerns | Учебные проблемы включают трудности с обучением, затруднения при учёбе, плохие оценки, отсутствие концентрации внимания и отсутствие интереса к предметам. | | 1.2 | Проблемы карьеры и работы | Career and Workplace Issues | Проблемы, связанные с работой, включают конфликты между людьми, проблемы коммуникаций, сплетни, домогательства на рабочем месте, дискриминацию, недостаток мотивации, низкую удовлетворённость работой и плохое производительное поведение. | | 1.3 | Проблемы семьи и конфликты | Family Issues and Conflict | Проблемы семьи и конфликты включают домашнее насилие, споры о наследстве, неудачное семейное положение, проблемы со свекровью, вопросы ухода за пожилыми родителями, конфликты между приемными родителями и детьми, а также вопросы ухода за детьми после развода. | | 1.4 | Наркотическая зависимость | Substance Abuse and Addiction | Взрослые наркотическая зависимость включает алкоголизм, курение, злоупотребление лекарствами, наркоманию, азартные игры и любые формы зависимости, влияющие на качество жизни. || 1.5 | Болезненная скорбь | Grief | Болезненная скорбь вызвана потерей близких людей или друзей. | | 1.6 | Бессонница | Insomnia | Неспособность заснуть или поддерживать сон, который влияет на следующий день. | | 1.7 | Стресс | Stress | Стресс — это эмоциональное или физическое состояние напряжения. Он может происходить из любого события или мысли, которое вас расстраивает, злит или тревожит. | | 1.8 | Человеческие отношения | Interpersonal Relationship | Конфликты и противостояния человеческих отношений, которые не относятся к работе, школе или семье. || |-----|--------------------------------------------|----------------------------------|----------------------------------------------------------------------------------------------------| | 1.9 | Проблемы в отношениях | Relationship Issues | Юность, скрытые чувства, расстояние, неверность, ссоры, примирение, ЛГБТ-сообщество | | 1.10| Развод | Divorce | Эмоциональные последствия после развода и проблемы с детьми |11 | Расставание | Break Up | Грусть после расставания | | 1.12 | Самооткрытие | Self-Awareness | Как знаки зодиака, характер, интересы | | 1.13 | Низкая самооценка | Low self-esteem | Признаки низкой самооценки. Самооценка — это личное восприятие своей ценности. Включает веру в себя и свои эмоции, такие как победа, отчаяние, гордость и стыд. | | 1.14 | Проблемы подростков | Adolescent Problems | Проблемы развития подростков, такие как бунтарство, причинение вреда другим, беременность, злоупотребление наркотиками и преступления среди молодёжи. | | 1.15 | Обсессивно-компульсивное расстройство | Obsessive Compulsive Disorder | Люди с этим расстройством попадают в плен бесмысленного и угнетающего цикла мыслей и действий, который они не могут преодолеть. | | 1.16 | Другие | Other Troubles | Другие беспокойства, хотя они не создают разрушительных препятствий для жизни и обучения, но всё равно вызывают психологический дискомфорт. || 17 | Мужчины-гомосексуалы, женщины-гомосексуалы, бисексуалы и транссексуалы | ЛГБТ | Мужчины-гомосексуалы, женщины-гомосексуалы, бисексуалы и транссексуалы | | 18 | Проблемы сексуального характера | Проблемы сексуального характера | Недостаток сексуального образования у подростков может вызвать различные социальные проблемы; у взрослых — сексуальная тревожность и зависимость, что может привести к развитию физических заболеваний. | | 19 | Отношения родителей и детей | Отношения родителей и детей | Отношения между родителями и детьми начинают влиять на развитие ребенка уже в раннем возрасте, затрагивая такие аспекты, как характер, выдержка, навыки общения и многие другие. |Примечание: В данном случае используется китайский язык исходного текста.### S2 Неврологические заболевания| ID | Русский | Английский | Примечание | | --- | --------------------------------------------- | ---------------------------------------------------- | ----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- | | 2. 1 | Депрессия | Depression | Долгое состояние депрессии, которое значительно превышает нормальный уровень, сопровождается потерей уверенности в себе, избеганием общества, чувством вины, снижением энергии организма, замедлением восприятия времени и невозможностью испытывать радость даже от интересной деятельности. | | 2. 2 | Волнение | Anxiety | Долгое состояние беспокойства, вызванное незначительными причинами или отсутствием конкретной причины, сопровождается тревогой, беспокойством, бессонницей, сердцебиением, дрожью рук, потоотделением, частым мочеиспусканием, трудностями концентрации внимания. | | 2. 3 | Биполярное расстройство | Bipolar Disorder | Также известно как "двухполюсное эмоциональное расстройство". Эпизоды мании: чувство жизненной силы, повышенной энергии и эмоционального подъёма или легко возбудимости. Может сопровождаться чрезмерной самоуверенностью, пышным образом жизни или одеждой, недостатком сна и увеличением количества слов. |

Замечено, что в последнем пункте есть несколько английских слов среди русского текста, но они остаются без изменения согласно правилам перевода.| 2. 4 | Послерассказовое стрессовое расстройство | PTSD | Сначала происходит травматическое событие: например, физическое или психологическое насилие в детстве. При контакте с объектом, связанным с травмой, возникают психические или физические реакции страха и напряжения, повторяющиеся воспоминания о травме. | | 2. 5 | Паническое расстройство | Panic Disorder | Также называется острым страхом, это повторяющиеся приступы паники. Приступ паники — внезапное кратковременное чувство сильного страха (ощущение смертельной опасности), сопровождающееся сердцебиением, потливостью, дрожью рук, затруднённым дыханием, параличом. | | 2. 6 | Расстройство пищевого поведения | Eating Disorder | Анемия: потребление слишком мало пищи, что приводит к низкой массе тела; Булимия: переедание, за которым следует попытка вызвать рвоту. Оба эти состояния характеризуются крайним стремлением к худобе, недовольством своим телом, экстремальным перфекционизмом в жизни и учёбе. | | 2. 7 | Несуществует S2 | Unrelated | Еще не достигло уровня серьезного психического заболевания |Примечание: Для строки 2.6 перевод был прерван, так как исходный текст содержал смесь китайского и английского языка. Представленный перевод продолжает описание расстройства пищевого поведения, начатое на китайском языке.

Для полноты перевода следует использовать исключительно один язык для каждого описания.

Категория Подкатегория Description
Другие заболевания Others Серьезно влияют на качество жизни и работы до такой степени, что невозможно вести обычный образ жизни и трудиться, но при этом нельзя точно определить, к какой категории заболеваний это относится.

【Обратите внимание:】 Некоторые более серьезные психические расстройства, такие как множественная личность, из-за своей сложности, труднее диагностировать, поэтому данный набор данных временно не включает эти случаи.

Экстренная ситуация, требует немедленного вмешательства человека.| ID | Китайский | Английский | Примечание |

| --- | ------------------------------------------------ | ----------------------------------------------- | -------------------------------------------------- | | 3.1 | 在自杀过程中 | Suicide Action | Н/Д | | 3.2 | 计划自杀的行为 | Suicide Ideation | Н/Д | | 3.3 | 自我伤害 | Self-harm | Н/Д | | 3.4 | 威胁伤害他人 | Threat of harming another person | 过程中的伤害行为 | | 3.5 | 对他人的伤害计划 | Plan to harm another person | 损害他人的计划 | | 3.6 | 缺乏自杀倾向 | Lack of suicidal tendency | Н/Д |### Чат-теги

Тег Описание
question Это повторный вопрос?
knowledge Содержит ли знания?
negative Отрицательный ответ, который оказывает негативное влияние на консультируемого

Инструкция по использованию

При возникновении проблем с установкой или загрузкой, пожалуйста, обратитесь к нам через тикеты:

https://github.com/chatopera/docs/issues

Почему и как был выпущен этот корпус данных

Корпус данных создан при участии специалистов по клинической психологии из Стэнфордского университета, УКЛЭ, католического университета Дэвенпорта и компании Chatopera, а также десятка добровольцев.

Обучение меткам для AI-психологической помощи | Chatopera

Другие варианты просмотра: YouTube

Вкладчики метокИсходя из строгих требований к качеству данных, наш процесс отбора очень внимательный. Большая часть этого корпуса была собрана с помощью добровольцев, среди которых есть специалисты по клинической психологии и люди, интересующиеся психологией. Эти добровольцы работали день и ночь над этим проектом! Добровольцы распределены по Китаю, Франции, США и Канаде, и их работа по маркировке заняла много свободного времени. Мы хотели бы выразить особую благодарность за это!Ниже представлен список волонтеров, занимающихся маркировкой:

Имя Электронная почта
Чень И, Christy Чан Н/Д

[Примечание] Это не полный список всех волонтеров; приведенная информация была получена с согласия.

Объявление

Использование данного набора данных для любых целей требует соблюдения следующих заявлений и лицензий, в противном случае компания будет привлечена к ответственности юридически.

Объявление 1

Этот набор данных создан путём очистки, деанимизации и маркировки онлайн-психологической консультации. Данные и код доступны под лицензией Спринг Лицензия v1.0. Данные могут использоваться только для исследовательских целей. При публикации в любом медиа, журнале, газете или блоге обязательно указывайте источник и адрес. Бесплатное использование для коммерческих целей запрещено, нарушение авторского права преследуется законом.

@online{efaqa-corpus-zh:petpsychology,
  автор = {Хай Лянг Ванг, Жэнь Жэнь У, Цзе Юань Ланг},
  заголовок = {Пэт Психология: набор данных вопросов и ответов психологических консультаций},
  год = 2020,
  url = {https://github.com/chatopera/efaqa-corpus-zh},
  urldate = {2020-04-22}
}

Объявление 2Набор данных был создан с помощью субъективной маркировки. Из-за серьёзности и важности психологической помощи данные были максимально точно отмечены, но гарантий 100%-ной точности нет. За последствия, вызванные некорректностью данных, наша команда не несёт никакой юридической ответственности.Эмоциональная Первая Помощь Дата-сет, Chatopera Inc., https://github.com/chatopera/efaqa-corpus-zh, Апрель 22, 2020

Коммерческое сотрудничество

Если вас интересуют данные психологической помощи или чат-боты, свяжитесь с нами по электронной почте info@chatopera.com.

Лицензия

Лицензия пользователя: Эмоциональная Первая Помощь Дата-сет Лицензия, Спринг Лицензия v1.0

баннер chatopera

Комментарии ( 0 )

Вы можете оставить комментарий после Вход в систему

Введение

Описание недоступно Развернуть Свернуть
Отмена

Обновления

Пока нет обновлений

Участники

все

Недавние действия

Загрузить больше
Больше нет результатов для загрузки
1
https://api.gitlife.ru/oschina-mirror/chatopera-efaqa-corpus-zh.git
git@api.gitlife.ru:oschina-mirror/chatopera-efaqa-corpus-zh.git
oschina-mirror
chatopera-efaqa-corpus-zh
chatopera-efaqa-corpus-zh
master