1 В избранное 0 Ответвления 0

OSCHINA-MIRROR/charles_kiko-famCircle

Клонировать/Скачать
README.md 20 КБ
Копировать Редактировать Web IDE Исходные данные Просмотреть построчно История
Отправлено 02.06.2025 11:18 063d1f6

Анализ генетической семьи famCircle, визуализация тандемных повторов

Процесс анализа

Схема процесса

Обработка генома
Путь:

Предварительная обработка: последовательности для сравнения, фильтрация результатов сравнения, сканирование колинеарности, вычисление KS
Поиск с помощью HMMER (скрытые марковские модели)
Оценка распределения количества тандемных повторов
Основной программный выбор:

inner

Форматирование данных typing
Визуализация inner

outer

Форматирование данных typing
Визуализация outer

part: локальная визуализация тандемных повторов

Разделение типов репликации членов семьи:

Фильтрация колинеарности

Тандемная репликация
Ближняя репликация
Дублирование всего генома
Репликация с помощью транспозонов
Разбросанная репликация

Отображение KS

Дублирование всего генома KS
Блоковое отображение KS
Круговое отображение колинеарности всего генома
Локальное отображение колинеарности

Установка и использование программы

Установка

С PyPI: https://pypi.org/project/famCircle/ Скачать и установить пакет на локальном компьютере

    Команды

pip install xx/xx/famCircle-*.*.*.tar.gz
pip install xx/xx/famCircle-*.*.*-py3-none-any.whl

Локальная установка

Установка через pip

    Команды``` pip install famCircle

![Установка онлайн](在线安装截图.png)
## Настройка программы
Путь установки /famCircle/conf.ini
![Файл настроек](配置文件详细.png)

[ini] hmmer_path = ~/bin/

Путь к установке hmm

clustalw_path = ~/bin/clustalw

Путь к установке clustalw

muscle_path = ~/bin/muscle

Путь к установке muscle

mafft_path = ~/bin/mafft

Путь к установке mafft

yn00_path = ~/bin/yn00

Путь к установке paml

pal2nal_path = ~/bin/pal2nal.pl

Путь к установке pal2nal

## Использование программы
![Группа общения](交流群.jpg)
### help

famCircle -h

### Настройка файлов, пример outer

famCircle -o ? > total.conf # Замена famCircle -o ? >> total.conf # Добавление

#### Файл GFF
! [Пример файла GFF](gff.png)
    Столбцы файла GFF слева направо соответствуют:
    Хромосома, Идентификатор гена, Начальная позиция, Конечная позиция, Строка (положительная или отрицательная), Относительное положение гена на хромосоме, Примечания
#### Файл lens
! [Пример файла lens](lens.png)
    Столбцы файла lens слева направо соответствуют:
    Хромосома, Количество нуклеотидов на хромосоме, Количество генов на хромосоме
#### Файл blast
! [Пример файла blast](blast.png)
    Файл blast использует стандартный формат M8
#### Файлы CDS и PEP
! [Пример файла CDS](cds.png)
! [Пример файла PEP](pep.png)
    Файл CDS содержит последовательность нуклеиновых кислот генов, а файл PEP — последовательность белков, соответствующих этим генам
    Оба файла имеют формат FASTA
#### Файл колинеарности
! [Пример файла колинеарности](wgdi.png)
    Пример файла колинеарности имеет формат [результата колинеарности WGDI](http://wgdi.readthedocs.io/en/latest/collinearity.html), а также поддерживает результаты сканирования колинеарности из MCScanX
#### Файл KS
! [Пример файла KS](ks.png)
    Программа поддерживает [результаты вычисления KS из WGDI](http://wgdi.readthedocs.io/en/latest/ks.html), а также результаты вычисления KS из встроенных модулей программы
#### Файл HMM (скрытая марковская модель)
! [Пример скрытой марковской модели](hmm.png)    Программа использует [скрытые марковские модели геновых семейств из PFAM](http://pfam.xfam.org/)
 #### Файл семейства
 ! [Пример файла семейства](family.png)
     Файл семейства генов генерируется программой, начальный файл содержит только первую колонку с идентификаторами генов семейства. После классификации семейства добавляется вторая колонка с цветом (разные категории имеют разные цвета).

famCircle -o total.conf

    Из-за ограничений на изображения в Gitee, ниже приведены примеры, взятые из скриншотов программы. Изображения, сгенерированные программой, имеют гораздо более высокое разрешение.

#### [filter_unit]# Фильтрация blast файла
    blast = old blast file# Старый blast файл
    number = 10# Количество лучших несамосвязанных пар
    outfile = new blast file# Выходной файл

#### [circle_all]# Общая схема коллинеарности
    lens1 = lens1 file# Файл длины хромосом для вида 1
    lens2 = lens2 file# Файл длины хромосом для вида 2
    gff1 = gff1 file# Файл GFF для вида 1
    gff2 = gff2 file# Файл GFF для вида 2
    genepairs = block file# Файл сопоставления коллинеарности между видами
    genepairsfile_type = MCScanX# Поддерживает результаты MCScanX и ColinearScan
    block = 6# Минимальная длина блока коллинеарности
    savefile = save file (*.png, *.pdf)# Форматы выходных файлов
![Коллинеарные блоки](https://images.gitee.com/uploads/images/2021/1016/000047_3cc36919_8074509.png "ca.png")#### [line]# Локальная схема коллинеарности
    genepairs = pairs file
    genepairsfile_type = WGDI# Поддерживает результаты WGDI
    lens1 = lens1 file# Файл длины хромосом для вида 1
    lens2 = lens2 file# Файл длины хромосом для вида 2
    gff1 = gff1 file# Файл GFF для вида 1
    gff2 = gff2 file# Файл GFF для вида 2
    chr1_name = chr1 name# Название хромосомы 1
    chr2_name = chr2 name# Название хромосомы 2
    savefile = savefile(.png,.pdf)# Поддерживает форматы .png и .pdf
![Локальная коллинеарность](https://images.gitee.com/uploads/images/2021/1016/000115_d944aba8_8074509.png "l.png")#### [Ks]# Многопоточное вычисление Ks
    cds_file = cds file# Файл CDS
    pep_file = pep file# Файл PEP
    align_software = muscle# Использует muscle для многопроцессорного выравнивания
    pairs_file = gene pairs file# Файл пар генов
    ks_file = ks result# Файл результатов Ks

#### [Ks_block]# Кolineарные гомологичные геновые блоки ks ядерной плотности графика  
    ks = ks файл# Ввод ks файла  
    area = 0,2.5  
    model = YN00/NG86  
    genepairs = блоковый файл  
    genepairsfile_type = WGDI  
    block = 6  
    savefile = файл для сохранения (*.png, *.pdf)  
![ks_block](https://images.gitee.com/uploads/images/2021/1016/000140_9af20f52_8074509.png "kb.png")

#### [circle]# Коалинейные ks круговые диаграммы  
    lens1 = lens1 файл  
    lens2 = lens2 файл  
    gff1 = gff1 файл  
    gff2 = gff2 файл  
    genepairs = genepairs файл  
    genepairsfile_type = MCScanX  
    ks = ks файл  
    Ks_concern = 0,1.5# Диапазон ks  
    block = 6  
    savefile = сохранить файл (*.png, *.pdf)  
![Коалинейные — ks](https://images.gitee.com/uploads/images/2021/1016/000209_bbc61706_8074509.png "c.png")#### [hmmer] Идентификация геновых семейств  
    pep = pep файл#файл белковых последовательностей  
    cds = cds файл#файл CDS  
    hmmmoldpath = hmm файл#путь к файлу с моделью HMM геновых семейств  
    format_conversion = False  
    comparison = clustal#многосекционный алгоритм выравнивания  
    e_value1 = значение1#установка порога для построения специфического файла HMM  
    e_value2 = значение2#установка порога для отбора кандидатов геновых семейств#### [circle_family]#Диаграмма распределения геновых семейств  
    lens = lens файл  
    gff = gff файл  
    genepairs = блок файл  
    genepairsfile_type = MCScanX  
    genefamily = семейство файл#файл кандидатов геновых семейств  
    block = 6  
    savefile = сохранить файл (*.png, *.pdf)  
![Распределение семейств](https://images.gitee.com/uploads/images/2021/1016/000242_31aa7da7_8074509.png "cf.png") 

#### [screen]#Диаграмма распределения количества геновых семейств  
    domainpath = домен файл#путь к файлу с результатами hmmsearch  
    lens = lens файл  
    gff = gff файл  
    chro_name = имя хромосомы#название хромосомы  
    series = 25#  
    outpath = выходной файл  
![Распределение количества](https://images.gitee.com/uploads/images/2021/1016/000354_283bcc7d_8074509.png "ath1.png")#### [typing]  
    domainpath = файл домена  
    domainlist = имя генома  
    savefile = выходной файл#### [outer]#Распределение всех членов ген-семейства и внешний круг диаграммы tandem  
    lens = файл линз  
    gff = gff файл  
    ks = ks файл  
    pair_file = файл пар  
    file_type = WGDI/BLAST#Поддерживает файлы WGDI и BLAST  
    genefamily = файл семейства генов#Файл с кандидатами из ген-семейства  
    Ks_concern = 0,0.15#диапазон значений Ks  
    cluster = 16#расстояние между кластерами  
    parameter = False  
    savecsv = выходной файл (*.csv)  
    savefile = сохраненный файл (*.png, *.pdf)   
![все члены семейства](https://images.gitee.com/uploads/images/2021/1016/000427_a77a01cc_8074509.png "o.png")#### [inner]#Распределение ген-семейства и внутренний круг диаграммы tandem
    lens = lens file  
    gff = gff file  
    ks = ks file  
    pair_file = pair file  
    file_type = WGDI/BLAST#Поддерживает файлы WGDI и BLAST  
    genefamily = family file#Файл с кандидатами из ген-семейства  
    Ks_concern = 0, 0.15  
    cluster = 16  
    relation = False  
    savecsv = out file (*.csv)  
    savefile = save file (*.png, *.pdf)  
![все члены семейства](https://images.gitee.com/uploads/images/2021/1016/000509_2700d2ee_8074509.png "i.png")

#### [part]#Локальная колинеарность ген-семейства  
    lens = lens file  
    gff = gff file  
    chro_name = chro name  
    genefamily = family file  
    pairs_file = outer/inner pairs csv  
    interval = 0, 9000  
    space = 0.005  
    clusters = True  
    savefile = save file (*.png, *.pdf)  
    в процессе разработки#### [filterWGD]#
    gff = gff файл  
    ks = ks файл  
    min_ks = 0.0/0.0/другое  
    colinearity_file = файл колинеарности  
    colinearity_type = WGDI/ColinearScan  
    block = 10  
    multiple = множественный  
    area1 = min,max  
    savefile = файл сохранения (файл колинеарности WGD)  
#### [tandem]#
Тандемные повторы распределения  
    lens = файл длин  
    gff = gff файл  
    pair_file = файл пар  
    file_type = BLAST  
    ks = ks файл  
    genefamily = файл семейства  
    position = конец  
    Ks_concern = 0,1.5  
    outother = файлы вне (*.txt)  
    outfile = выходной файл (*.txt)  
    savefile = файл сохранения (*.png, *.pdf)  
![Тандемные повторы](https://images.gitee.com/uploads/images/2021/1016/000623_af6be778_8074509.png "td.png")#### [proximal]#Проксимальные повторы распределения  
    lens = lens file  
    gff = gff file  
    pair_file = pair file  
    file_type = BLAST  
    ks = ks file  
    genefamily = family file  
    position = end  
    Ks_concern = 0, 1.5  
    outother = out other (*.txt)  
    outfile = out file (*.txt)  
    savefile = save file (*.png, *.pdf)   
![Проксимальные повторы](https://images.gitee.com/uploads/images/2021/1016/000655_50320e76_8074509.png "pd.png")#### [WGD_family]#Распределение после полного геномного удвоения  
    lens = файл линз  
    gff = файл GFF  
    genepairs = файл пар  
    file_type = famCircle  
    ks = файл KS  
    genefamily = файл семейств  
    Ks_concern = 0,1.5  
    outother = выходной файл (*.txt)  
    outfile = выходной файл (*.txt)  
    savefile = файл сохранения (*.png, *.pdf)  
![Полное геномное удвоение](https://images.gitee.com/uploads/images/2021/1016/000720_5322f5bd_8074509.png "wgd.png")#### [trd]#Распределение транспонированных элементов  
    lens = файл линз  
    gff = файл GFF  
    ks = файл KS  
    genepairs = файл пар  
    file_type = famCircle  
    genefamily = файл семейств  
    Ks_concern = 0,1.5  
    outother = выходной файл (*.txt)  
    outfile = выходной файл (*.txt)  
    savefile = файл сохранения (*.png, *.pdf)  
![Первичные повторы](https://images.gitee.com/uploads/images/2021/1016/000749_a2e1d0cb_8074509.png "trd.png")#### [dispersed]#Распределение разбросанных повторов  
    lens = файл линз  
    gff = файл GFF  
    blast = файл пар  
    ks = файл KS  
    genefamily = файл семейств  
    position = конец  
    Ks_concern = 0,1.5  
    outfile = выходной файл (*.txt)  
    savefile = файл сохранения (*.png, *.pdf)  
![Разбросанные повторы](https://images.gitee.com/uploads/images/2021/1016/000822_ef8b3a63_8074509.png "dsd.png")#### [family_pair]  
    family_list = файл семейств  
    gene_pair = файл пар генов  
    pairfile_type = blast  
    parameter = 5  
    savefile = выходной файл

Опубликовать ( 0 )

Вы можете оставить комментарий после Вход в систему

1
https://api.gitlife.ru/oschina-mirror/charles_kiko-famCircle.git
git@api.gitlife.ru:oschina-mirror/charles_kiko-famCircle.git
oschina-mirror
charles_kiko-famCircle
charles_kiko-famCircle
master