Набор данных | Адрес | Описание |
---|---|---|
Набор данных вопросов и ответов по психокоррекции (Набор данных первой помощи эмоциям) | GitHub, Gitee | Множественные диалоги с человеко-маркерами |
Исходный набор данных вопросов и ответов по психокоррекции (Исходный набор данных первой помощи эмоциям) | GitHub, [Gitee](https://gitee.com/chatopera/efaqa-corpus- Yöntem) | Незаконченные исходные данные после сбора |
Набор данных вопросов и ответов по психокоррекции предназначен только для исследовательских целей.Набор данных вопросов и ответов по психокоррекции (также известный как "набор данных", "корpus данных") создан для применения искусственного интеллекта в области психокоррекции. По нашим данным, это первый открытый набор данных QA в этой области, содержащий 20,000 записей данных по психокоррекции. Это также наиболее крупный открытый набор данных по психокоррекции на китайском языке (дата публикации 2022-04-07). В наборе данных содержится множество информации, включая многокруговые диалоги и информацию по категоризации, создание которого потребовало значительного количества времени и усилий, таких как процесс маркировки, который требует более одной минуты на каждую запись.Исходный код набора данных вопросов и ответов по психокоррекции распространяется под открытым лицензионным соглашением, но при установке и использовании требуются сертификаты, которые можно приобрести через магазин сертификатов для доступа к скачиванию и использованию данных. Подробное описание использования приведено ниже.
Зависимости:
export EFAQA_DL_LICENSE=YOUR_LICENSE
pip install -U efaqa-corpus-zh # Установка пакета скриптов
python -c "import efaqa_corpus_zh" # Загрузка корпуса данных
# Установка окружения
## 1/2 Командная строка
set EFAQA_DL_LICENSE=YOUR_LICENSE
## 2/2 PowerShell
$env:EFAQA_DL_LICENSE='YOUR_LICENSE'
# Загрузка
pip install -U efaqa-corpus-zh # Установка пакета скриптов
python -c "import efaqa_corpus_zh" # Загрузка корпуса данных
YOUR_LICENSE
— это серийный номер лицензии, приобретённой в магазине сертификатов.
Предположим, что серийный номер лицензии равен FOOBAR
, тогда установка будет следующей:
# Linux / macOS
export EFAQA_DL_LICENSE=FOOBAR
# Windows
## 1/2 Командная строка
set EFAQA_DL_LICENSE=FOOBAR
## 2/2 PowerShell
$env:EFAQA_DL_LICENSE='FOOBAR'
import efaqa_corpus_zh
records = list(efaqa_corpus_zh.load())
print("размер: %d" % len(records))
print(records[0]["title"])
```Первое выполнение метода `load` скачать данные, скорость загрузки зависит от качества сети.
## Формат данныхКаждый элемент данных `records = list(efaqa_corpus_zh.load())` следует следующему формату:
<table>
<tr>
<th>Поле</th>
<th colspan="3">Описание</th>
<th>Тип</th>
</tr>
<tr>
<td>md5</td>
<td colspan="3">Уникальный идентификатор</td>
<td>string</td>
</tr>
<tr>
<td>title</td>
<td colspan="3">Заголовок</td>
<td>string</td>
</tr>
<tr>
<td>description</td>
<td colspan="3">Описание</td>
<td>string</td>
</tr>
<tr>
<td>owner</td>
<td colspan="3">Запросивший пользователь (обезличенный)</td>
<td>string</td>
</tr>
<tr>
<td>label</td>
<td colspan="3">Теги темы</td>
<td>object</td>
</tr>
<tr>
<td rowspan="3"></td>
<td>s3</td>
<td colspan="2">Тип проблемы</td>
<td>string</td>
</tr>
<tr>
<td>s2</td>
<td colspan="2">Психическое заболевание</td>
<td>string</td>
</tr>
<tr>
<td>s1</td>
<td colspan="2">СОС</td>
<td>string</td>
</tr>
<tr>
<td>chats</td>
<td colspan="3">Данные чата</td>
<td>array</td>
</tr>
<tr>
<td rowspan="8"></td>
<td>sender</td>
<td colspan="2">Отправитель</td>
<td>string</td>
</tr>
<tr>
<td>type</td>
<td colspan="2">Тип сообщения</td>
<td>string</td>
</tr>
<tr>
<td>time</td>
<td colspan="2">Дата отправки</td>
<td>string</td>
</tr>
<tr>
<td>value</td>
<td colspan="2">Текстовое содержимое сообщения</td>
<td>string</td>
</tr>
<tr>
<td>label</td>
<td colspan="2">Теги чата</td>
<td>object</td>
</tr>
<tr>
<td rowspan="3"></td>
<td>knowledge</td>
<td>Знаниевый</td>
<td>boolean</td>
</tr>
<tr>
<td>question</td>
<td>Переспрашиваемый</td>
<td>boolean</td>
</tr>
<tr>
<td>negative</td>
<td>Негативный ответ</td>
<td>boolean</td>
</tr>
</table></table>**[Внимание] значение отправителя `sender`, равное `owner`, указывает на то, что сообщение было отправлено консультантом; значение `audience` указывает на то, что сообщение было опубликовано другим участником, который может быть психологом или нет.**## Пример данных
```markdown
{
"md5": "2f63d374c071043d9e1968aefa62ffb7",
"owner": "Аноним",
"title": "Женщина. Самую распространённую критику она слышала в свой адрес — что она ни на что не годится, недальновидна, неумна.",
"label": {
"s1": "1.13",
"s2": "2.7",
"s3": "3.4"
},
"chats": [
{
"time": "11:02:45",
"value": "Кому это касается?",
"sender": "audience",
"type": "textMessage",
"label": { "question": true, "knowledge": false, "negative": false }
},
{
"time": "11:08:38",
"sender": "audience",
"type": "textMessage",
"value": "Добро пожаловать ко мне ❤",
"label": { "question": false, "knowledge": false, "negative": false }
},
{
"time": "11:15:17",
"sender": "owner",
"type": "textMessage",
"value": "Как жаль"
}
]
}
В одной записи данные поля title
и description
представляют начальные сведения от консультанта, а метки темы используются для классификации вопроса на основе этих двух полей. Классификация состоит из трёх осей: S1
тип проблемы; S2
психическое заболевание; S3
SOS. Здесь S
представляет собой степень серьёзности (severity
) проблемы, которая возрастает по мере увеличения осей. Необходимо отметить, что некоторые проекты требуют клинического медицинского заключения. Концепции, используемые в наборе данных, являются предполагаемыми, например, если мы помечаем тему как депрессия, это означает предполагаемую депрессию. Это заявление не означает, что наш подход небрежен, но является строгим требованием квалификации и стремлением к научной точности.Значения каждого измерения записываются в поле label
. Дизайн ID следующий:### S1 Тип проблемы| ID | Русский | Английский | Примечание |
| ---- | ----------------------------------------- | -------------------------- | -------------------------------------------------------------------------------------------------------------------------------------------------- |
| 1.1 | Учебные проблемы, беспокойство за будущее | Academic Concerns | Учебные проблемы включают трудности с обучением, затруднения при учёбе, плохие оценки, отсутствие концентрации внимания и отсутствие интереса к предметам. |
| 1.2 | Проблемы карьеры и работы | Career and Workplace Issues | Проблемы, связанные с работой, включают конфликты между людьми, проблемы коммуникаций, сплетни, домогательства на рабочем месте, дискриминацию, недостаток мотивации, низкую удовлетворённость работой и плохое производительное поведение. |
| 1.3 | Проблемы семьи и конфликты | Family Issues and Conflict | Проблемы семьи и конфликты включают домашнее насилие, споры о наследстве, неудачное семейное положение, проблемы со свекровью, вопросы ухода за пожилыми родителями, конфликты между приемными родителями и детьми, а также вопросы ухода за детьми после развода. |
| 1.4 | Наркотическая зависимость | Substance Abuse and Addiction | Взрослые наркотическая зависимость включает алкоголизм, курение, злоупотребление лекарствами, наркоманию, азартные игры и любые формы зависимости, влияющие на качество жизни. || 1.5 | Болезненная скорбь | Grief | Болезненная скорбь вызвана потерей близких людей или друзей. |
| 1.6 | Бессонница | Insomnia | Неспособность заснуть или поддерживать сон, который влияет на следующий день. |
| 1.7 | Стресс | Stress | Стресс — это эмоциональное или физическое состояние напряжения. Он может происходить из любого события или мысли, которое вас расстраивает, злит или тревожит. |
| 1.8 | Человеческие отношения | Interpersonal Relationship | Конфликты и противостояния человеческих отношений, которые не относятся к работе, школе или семье. ||
|-----|--------------------------------------------|----------------------------------|----------------------------------------------------------------------------------------------------|
| 1.9 | Проблемы в отношениях | Relationship Issues | Юность, скрытые чувства, расстояние, неверность, ссоры, примирение, ЛГБТ-сообщество |
| 1.10| Развод | Divorce | Эмоциональные последствия после развода и проблемы с детьми |11 | Расставание | Break Up | Грусть после расставания |
| 1.12 | Самооткрытие | Self-Awareness | Как знаки зодиака, характер, интересы |
| 1.13 | Низкая самооценка | Low self-esteem | Признаки низкой самооценки. Самооценка — это личное восприятие своей ценности. Включает веру в себя и свои эмоции, такие как победа, отчаяние, гордость и стыд. |
| 1.14 | Проблемы подростков | Adolescent Problems | Проблемы развития подростков, такие как бунтарство, причинение вреда другим, беременность, злоупотребление наркотиками и преступления среди молодёжи. |
| 1.15 | Обсессивно-компульсивное расстройство | Obsessive Compulsive Disorder | Люди с этим расстройством попадают в плен бесмысленного и угнетающего цикла мыслей и действий, который они не могут преодолеть. |
| 1.16 | Другие | Other Troubles | Другие беспокойства, хотя они не создают разрушительных препятствий для жизни и обучения, но всё равно вызывают психологический дискомфорт. || 17 | Мужчины-гомосексуалы, женщины-гомосексуалы, бисексуалы и транссексуалы | ЛГБТ | Мужчины-гомосексуалы, женщины-гомосексуалы, бисексуалы и транссексуалы |
| 18 | Проблемы сексуального характера | Проблемы сексуального характера | Недостаток сексуального образования у подростков может вызвать различные социальные проблемы; у взрослых — сексуальная тревожность и зависимость, что может привести к развитию физических заболеваний. |
| 19 | Отношения родителей и детей | Отношения родителей и детей | Отношения между родителями и детьми начинают влиять на развитие ребенка уже в раннем возрасте, затрагивая такие аспекты, как характер, выдержка, навыки общения и многие другие. |Примечание: В данном случае используется китайский язык исходного текста.### S2 Неврологические заболевания| ID | Русский | Английский | Примечание |
| --- | --------------------------------------------- | ---------------------------------------------------- | ----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- |
| 2. 1 | Депрессия | Depression | Долгое состояние депрессии, которое значительно превышает нормальный уровень, сопровождается потерей уверенности в себе, избеганием общества, чувством вины, снижением энергии организма, замедлением восприятия времени и невозможностью испытывать радость даже от интересной деятельности. |
| 2. 2 | Волнение | Anxiety | Долгое состояние беспокойства, вызванное незначительными причинами или отсутствием конкретной причины, сопровождается тревогой, беспокойством, бессонницей, сердцебиением, дрожью рук, потоотделением, частым мочеиспусканием, трудностями концентрации внимания. |
| 2. 3 | Биполярное расстройство | Bipolar Disorder | Также известно как "двухполюсное эмоциональное расстройство". Эпизоды мании: чувство жизненной силы, повышенной энергии и эмоционального подъёма или легко возбудимости. Может сопровождаться чрезмерной самоуверенностью, пышным образом жизни или одеждой, недостатком сна и увеличением количества слов. |
Замечено, что в последнем пункте есть несколько английских слов среди русского текста, но они остаются без изменения согласно правилам перевода.| 2. 4 | Послерассказовое стрессовое расстройство | PTSD | Сначала происходит травматическое событие: например, физическое или психологическое насилие в детстве. При контакте с объектом, связанным с травмой, возникают психические или физические реакции страха и напряжения, повторяющиеся воспоминания о травме. | | 2. 5 | Паническое расстройство | Panic Disorder | Также называется острым страхом, это повторяющиеся приступы паники. Приступ паники — внезапное кратковременное чувство сильного страха (ощущение смертельной опасности), сопровождающееся сердцебиением, потливостью, дрожью рук, затруднённым дыханием, параличом. | | 2. 6 | Расстройство пищевого поведения | Eating Disorder | Анемия: потребление слишком мало пищи, что приводит к низкой массе тела; Булимия: переедание, за которым следует попытка вызвать рвоту. Оба эти состояния характеризуются крайним стремлением к худобе, недовольством своим телом, экстремальным перфекционизмом в жизни и учёбе. | | 2. 7 | Несуществует S2 | Unrelated | Еще не достигло уровня серьезного психического заболевания |Примечание: Для строки 2.6 перевод был прерван, так как исходный текст содержал смесь китайского и английского языка. Представленный перевод продолжает описание расстройства пищевого поведения, начатое на китайском языке.
Для полноты перевода следует использовать исключительно один язык для каждого описания.
Категория | Подкатегория | Description |
---|---|---|
Другие заболевания | Others | Серьезно влияют на качество жизни и работы до такой степени, что невозможно вести обычный образ жизни и трудиться, но при этом нельзя точно определить, к какой категории заболеваний это относится. |
【Обратите внимание:】 Некоторые более серьезные психические расстройства, такие как множественная личность, из-за своей сложности, труднее диагностировать, поэтому данный набор данных временно не включает эти случаи.
| --- | ------------------------------------------------ | ----------------------------------------------- | -------------------------------------------------- | | 3.1 | 在自杀过程中 | Suicide Action | Н/Д | | 3.2 | 计划自杀的行为 | Suicide Ideation | Н/Д | | 3.3 | 自我伤害 | Self-harm | Н/Д | | 3.4 | 威胁伤害他人 | Threat of harming another person | 过程中的伤害行为 | | 3.5 | 对他人的伤害计划 | Plan to harm another person | 损害他人的计划 | | 3.6 | 缺乏自杀倾向 | Lack of suicidal tendency | Н/Д |### Чат-теги
Тег | Описание |
---|---|
question | Это повторный вопрос? |
knowledge | Содержит ли знания? |
negative | Отрицательный ответ, который оказывает негативное влияние на консультируемого |
При возникновении проблем с установкой или загрузкой, пожалуйста, обратитесь к нам через тикеты:
https://github.com/chatopera/docs/issues
Корпус данных создан при участии специалистов по клинической психологии из Стэнфордского университета, УКЛЭ, католического университета Дэвенпорта и компании Chatopera, а также десятка добровольцев.
Обучение меткам для AI-психологической помощи | Chatopera
Другие варианты просмотра: YouTube
Имя | Электронная почта |
---|---|
Чень И, Christy Чан | Н/Д |
[Примечание] Это не полный список всех волонтеров; приведенная информация была получена с согласия.
Использование данного набора данных для любых целей требует соблюдения следующих заявлений и лицензий, в противном случае компания будет привлечена к ответственности юридически.
Этот набор данных создан путём очистки, деанимизации и маркировки онлайн-психологической консультации. Данные и код доступны под лицензией Спринг Лицензия v1.0. Данные могут использоваться только для исследовательских целей. При публикации в любом медиа, журнале, газете или блоге обязательно указывайте источник и адрес. Бесплатное использование для коммерческих целей запрещено, нарушение авторского права преследуется законом.
@online{efaqa-corpus-zh:petpsychology,
автор = {Хай Лянг Ванг, Жэнь Жэнь У, Цзе Юань Ланг},
заголовок = {Пэт Психология: набор данных вопросов и ответов психологических консультаций},
год = 2020,
url = {https://github.com/chatopera/efaqa-corpus-zh},
urldate = {2020-04-22}
}
Если вас интересуют данные психологической помощи или чат-боты, свяжитесь с нами по электронной почте info@chatopera.com.
Лицензия пользователя: Эмоциональная Первая Помощь Дата-сет Лицензия, Спринг Лицензия v1.0
Вы можете оставить комментарий после Вход в систему
Неприемлемый контент может быть отображен здесь и не будет показан на странице. Вы можете проверить и изменить его с помощью соответствующей функции редактирования.
Если вы подтверждаете, что содержание не содержит непристойной лексики/перенаправления на рекламу/насилия/вульгарной порнографии/нарушений/пиратства/ложного/незначительного или незаконного контента, связанного с национальными законами и предписаниями, вы можете нажать «Отправить» для подачи апелляции, и мы обработаем ее как можно скорее.
Комментарии ( 0 )