Центр геномных исследований в Красноярске

Знаете ли вы, что такое центр геномных исследований, где он находится и чем занимается? Скорее всего, нет. Красноярский Центр геномных исследований был недавно создан в Сибирском федеральном университете при сотрудничестве с Центром защиты леса Красноярского края. Чем же заняты его ученые?

Мне удалось побывать в гостях у красноярских генетиков и всё выяснить. Одна из основных задач центра — расшифровка генетического кода двух сибирских хвойных деревьев — лиственницы и кедра (он же сосна сибирская).

IMG_2848

Сначала берем пипетку…

Информация, записанная в ДНК, с помощью нуклеотидов, букв генетического алфавита, элементарных единиц генетического кода, — это набор своеобразных алгоритмов, описывающих все процессы в живом организме, начиная от синтеза белков и роста клеток и заканчивая его поведением, если речь идет о животных. Ученые стремятся расшифровать эту информацию для того, чтобы понять как развивается организм, а если удастся и повлиять на его развитие или создать организмы с заданными свойствами.

IMG_2869

потом капаем в баночку…

Так зачем ученым из красноярского центра нужно расшифровать геном хвойных деревьев? Геном любого живого существа хранит в себе огромное количество информации. С таким уровнем архивирования данных не сравнится ни один современный компьютер. В том же геноме хвойных можно найти не только гены, которые вызывают болезни и губят сибирские леса, но и гены, отвечающие за устойчивость к засухе, насекомым-вредителям, неблагоприятным условиям среды.

Геном любого сложного организма это непрерывная линейная последовательность из миллиардов крошечных нуклеотидов-буковок. Что же делать исследователям с таким гигантским «предложением»? Выход простой — разделить на части и изучить каждую отдельно. Ученые «делят» цепочки ДНК на небольшие участки с помощью специального прибора, секвенатора, а полную последовательность потом восстанавливают с помощью компьютера. Этот процесс можно сравнить с восстановлением книги по символам. В отдельности каждый символ не несет смысла, но книга в целом — источник знаний.

IMG_2853

потом нагреваем…

О новейшем секвенаторе ДНК стоит сказать отдельно. Эта гордость центра — прибор HiSeq 2000 компании Illumina — прибыла к нам из Америки. В России есть только три таких секвенатора. Один из них в Красноярске. Процесс секвенирования — это определение последовательности участков генов, целых генов или всего генома.

IMG_2859

потом центрифугируем…

Технология не новая, многие о ней слышали. Обычно дешевые приборы за раз могут прочитать небольшое количество участков ген. В нашем центре можно одновременно читать сотни кусочков ДНК длиной 100 пар нуклеотидов с двух концов каждого кусочка. То есть для секвенирования вся ДНК нужного нам организма разрезается на фрагменты разной длины и прибор читает по 100 нуклеотидов с каждого конца фрагмента. Если длина фрагмента 180 пар нуклеоитидов — то он будет прочитан полностью с перекрытием 20 нуклеотидов, если длина — 500 пар нуклеотидов, то между прочитанными концами будет вставка из 300 неизвестных нуклеотидов, если длина 5000, то останется 4800 неизвестных нуклеотидов. Преимущество нашего прибора заключается в том, что качество чтений выше, чем у других секвенаторов и он выдает огромное количество данных.

IMG_2850

потом проводим еще с десяток подготовительных операций…

Любознательный читатель спросит, а что же делать с неизвестными нуклеотидами в длинном кусочке. А ничего. Дело в том, что при секвенировании случайным образом на кусочки разрезается одинаковая ДНК из многих клеток. Считается, что для точного определения генетической последовательности нужно, чтобы каждый участок гена был продублирован при анализе несколько раз. В результате неизвестных (непрочитанных) нуклеоитидов в геноме не остается. Если цепочка нуклеотидов осталась непрочитанной в одном из кусочков, она обязательно будет прочитана в другом кусочке, где этот участок окажется в начале или в конце отрезанного кусочка.

IMG_2900

и еще много раз капаем, капаем, капаем… (на самом деле процесс существенно отличается от представленной последовательности картинок, но менее сложным от этого он не становится)

Кстати, красноярцы выбрали не простые объекты исследований — геномы сибирской лиственницы и кедровой сосны в 4-7 раз больше генома человека. Полная расшифровка произойдет не завтра и даже не послезавтра. Для обработки полученных секвенатором данных нужны компьютеры с огромной оперативной памятью и вычислительной мощностью. К примеру геном человека с помощью 48 процессоров и 512 Гб оперативной памяти собирается за 3,5 недели, геном мыши — за 3 недели (основную нагрузку дает ПО, восстанавливающее из коротких фрагментов ДНК линейную последовательность с одновременным анализом данных). В центре уже получен 1 терабайт данных, который ждет своей очереди у компьютера. Полученные результаты будут внесены в единый международный банк нуклеотидных последовательностей EMBL на радость всей мировой науки.

IMG_2855

Алексей Ибе запускает подготовительный процесс

Кто же разгадает секрет наших деревьев? Возглавляет исследование Константин Крутовский, профессор Техасского агро-механического университета (США) и Гёттингенского университета (Германия). Ученые из его группы (а это в основном, молодые люди) в любой момент могут получить у него консультацию, даже если его нет в Красноярске. А экскурсию для нас провели сотрудники центра геномных исследований: Юлия Путинцева — научный сотрудник, координатор центра и руководитель сектора биоинформатики, Ксения Дейч и Алексей Ибе. За что им огромное спасибо.

IMG_2877

Юлия Путинцева и Ксения Дейч вместе с секвенатором HiSeq 2000


Екатерина Карпенко


20 мая 2013 г.

Рубрики

Обсуждение

  1. Побольше бы таких экскурсий :)


Похожие записи