Учебники

Биопайтон — Анализ генома

Геном — это полный набор ДНК, включая все его гены. Анализ генома относится к изучению отдельных генов и их роли в наследовании.

Геном Диаграмма

Геномная диаграмма представляет генетическую информацию в виде диаграмм. Biopython использует модуль Bio.Graphics.GenomeDiagram для представления GenomeDiagram. Модуль GenomeDiagram требует установки ReportLab.

Шаги для создания диаграммы

Процесс создания диаграммы обычно следует следующему простому шаблону —

  • Создайте FeatureSet для каждого отдельного набора объектов, которые вы хотите отобразить, и добавьте к ним объекты Bio.SeqFeature.

  • Создайте GraphSet для каждого графика, который вы хотите отобразить, и добавьте к ним данные графика.

  • Создайте дорожку для каждой дорожки, которую вы хотите на диаграмме, и добавьте GraphSets и FeatureSets к нужным дорожкам.

  • Создайте диаграмму и добавьте к ней дорожки.

  • Скажите Диаграмму, чтобы нарисовать изображение.

  • Запишите изображение в файл.

Создайте FeatureSet для каждого отдельного набора объектов, которые вы хотите отобразить, и добавьте к ним объекты Bio.SeqFeature.

Создайте GraphSet для каждого графика, который вы хотите отобразить, и добавьте к ним данные графика.

Создайте дорожку для каждой дорожки, которую вы хотите на диаграмме, и добавьте GraphSets и FeatureSets к нужным дорожкам.

Создайте диаграмму и добавьте к ней дорожки.

Скажите Диаграмму, чтобы нарисовать изображение.

Запишите изображение в файл.

Давайте возьмем пример входного файла GenBank —

https://raw.githubusercontent.com/biopython/biopython/master/Doc/examples/ls_orchid.gbk и прочитайте записи из объекта SeqRecord, а затем, наконец, нарисуйте диаграмму генома. Это объясняется ниже,

Сначала мы импортируем все модули, как показано ниже —

>>> from reportlab.lib import colors 
>>> from reportlab.lib.units import cm 
>>> from Bio.Graphics import GenomeDiagram

Теперь импортируйте модуль SeqIO для чтения данных —

>>> from Bio import SeqIO 
record = SeqIO.read("example.gb", "genbank")

Здесь запись читает последовательность из файла genbank.

Теперь создайте пустую диаграмму, чтобы добавить трек и набор функций —

>>> diagram = GenomeDiagram.Diagram(
   "Yersinia pestis biovar Microtus plasmid pPCP1") 
>>> track = diagram.new_track(1, name="Annotated Features") 
>>> feature = track.new_set()

Теперь мы можем применить изменения цветовой темы, используя альтернативные цвета от зеленого до серого, как определено ниже —

>>> for feature in record.features: 
>>>    if feature.type != "gene": 
>>>       continue 
>>>    if len(feature) % 2 == 0: 
>>>       color = colors.blue 
>>>    else: 
>>>       color = colors.red 
>>> 
>>>    feature.add_feature(feature, color=color, label=True)

Теперь вы можете увидеть ответ ниже на вашем экране —

<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d3dc90> 
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d3dfd0> 
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x1007627d0> 
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d57290> 
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d57050> 
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d57390> 
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d57590> 
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d57410> 
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d57490> 
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d574d0>

Давайте нарисуем диаграмму для вышеуказанных входных записей —

>>> diagram.draw(
   format = "linear", orientation = "landscape", pagesize = 'A4', 
   ... fragments = 4, start = 0, end = len(record)) 
>>> diagram.write("orchid.pdf", "PDF") 
>>> diagram.write("orchid.eps", "EPS") 
>>> diagram.write("orchid.svg", "SVG") 
>>> diagram.write("orchid.png", "PNG")

После выполнения вышеуказанной команды вы можете увидеть следующее изображение, сохраненное в вашем каталоге Biopython.

** Result **
genome.png

Создание диаграммы

Вы также можете нарисовать изображение в круговом формате, внеся следующие изменения:

>>> diagram.draw(
   format = "circular", circular = True, pagesize = (20*cm,20*cm), 
   ... start = 0, end = len(record), circle_core = 0.7) 
>>> diagram.write("circular.pdf", "PDF")

Обзор хромосом

Молекула ДНК упакована в нитевидные структуры, называемые хромосомами. Каждая хромосома состоит из ДНК, плотно обмотанной много раз вокруг белков, называемых гистонами, которые поддерживают ее структуру.

Хромосомы не видны в ядре клетки — даже под микроскопом — когда клетка не делится. Тем не менее, ДНК, которая составляет хромосомы, становится более плотно упакованной во время клеточного деления и затем видна под микроскопом.

У людей каждая клетка обычно содержит 23 пары хромосом, что в общей сложности составляет 46. Двадцать две из этих пар, называемые аутосомами, выглядят одинаково как у мужчин, так и у женщин. 23-я пара, половые хромосомы, различается между мужчинами и женщинами. У самок есть две копии Х-хромосомы, а у самцов — одна Х и одна Y-хромосома.