Геном как хранилище информации: как и зачем искусственно сохранять данные в ДНК
Геном как хранилище информации: как и зачем искусственно сохранять данные в ДНК

В цепочку генов можно записать в 60 раз больше информации, чем на сегодняшние носители. Теперь можно копировать информацию с любого цифрового носителя напрямую в ДНК, фактически превращая клетки живых организмов в миниатюрные устройства для записи и хранения данных. Рассказываем, как это работает.

Какая информация есть в ДНК

ДНК представляет собой последовательность нуклеотидов. Их всего четыре: аденин, гуанин, тимин, цитозин.

Для кодирования информации каждому из них приписывают цифру-код. Например, тимин — 0, гуанин — 1, аденин — 2, цитозин — 3.

Последовательность нуклеотидов позволяет «кодировать» информацию о различных типах РНК. Все эти типы РНК синтезируются на матрице ДНК за счет копирования последовательности ДНК в последовательность РНК, синтезируемой в процессе транскрипции, и принимают участие в биосинтезе белков (процессе трансляции).

Помимо кодирующих последовательностей, ДНК клеток содержит последовательности, выполняющие регуляторные и структурные функции. Кроме того, в геноме эукариот часто встречаются участки, принадлежащие «генетическим паразитам», например, транспозонам.

Кодирование начинается с того, что все буквы, цифры и изображения переводят в двоичный код, то есть последовательность нулей и единиц, а их уже — в последовательность нуклеотидов, то есть четверичный код.

Считывать ДНК можно по-разному. Самая распространенная методика — цепочку молекулы ДНК копируют с помощью оснований, у каждого из которых есть цветовая метка. Затем очень чувствительный детектор считывает данные, и по цветам компьютер восстанавливает последовательность нуклеотидов.

Как в ДНК появляется новая информация

Делается это при помощи технологии CRISPR-Cas9, ее еще называют генетическими ножницами. Она была разработана восемь лет назад, а в 2020 году удостоена Нобелевской премии по химии.

Ранее записывать информацию нужно было долго и при помощи специального оборудования. Однако группа ученых из Колумбийского университета автоматизировала этот процесс.

Нам удалось научить клетки разговаривать с компьютером посредством электронных сигналов и таким образом скачивать информацию с любого электронного носителя. 

Харрис Ванг, профессор системной биологии 

Авторы объясняют, что они переводят двоичный код компьютерной программы в электрические импульсы, которые посылают в клетку. На ее поверхности есть рецепторы, которые воспринимают эти сигналы и уже переводят их на язык ДНК, автоматически выстраивая нужную последовательность генома.

В результате к цепочке ДНК добавляется так называемый прицеп, или дополнительный фрагмент. В отличие от цифровой компьютерной информации, он представляет собой набор букв генетического кода, то есть аналоговый шифр, поэтому ученый сравнивает этот отрезок с магнитной лентой.

Взаимодействие фактора транскрипции STAT3 с ДНК (показана в виде синей спирали)

Какой объем информации можно записать в ДНК

С помощью новой технологии сотрудников Колумбийского университета удалось закодировать и прочитать 2,14 МБ информации. Итоговая физическая плотность записи составила 215 000 000 ГБ на грамм нуклеиновой кислоты.

Один оборот спирали ДНК в B-форме — это примерно 10 пар нуклеотидов. Кодирующей будет одна из нитей, так как вторая всегда комплиментарна первой.

Таким образом, есть 10 ячеек, в каждой из которых может быть одна из четырех букв: А, Т, Г, Ц.

При использовании четвертичного или двоичного кодирования плотность кодирования информации в ДНК составляет два бита на ячейку, то есть 20 бит на один оборот спирали, линейный размер которого примерно 3,4 нм объемом  ~11 м3 — это то, что можно записать. 

Сегодня можно создавать процессоры, в которых 1 бит записывается на 10 нанометрах. Таким образом, в ДНК, исходя из линейных размеров, можно записать примерно в 60 раз больше информации.

Насколько надежно записывать информацию на ДНК

В марте 2017 года журнал Science опубликовал статью американских ученых, которым удалось записать 2*1017 байт на грамм ДНК. Биологи подчеркивают, что не потеряли ни байта. 

К несомненным преимуществам записи информации на ДНК относится огромная плотность хранения данных, а также стабильность носителя — правда, лишь при низких температурах.

В ДНК информация записана в трехмерном аналоговом виде, а это наиболее устойчивая форма. В таком виде данные могут храниться сотни тысяч, а то и миллионы лет, заявил профессор системной биологии Харрис Ванг.

Вывод

Несмотря на все преимущества, технология записи информации на ДНК находится на начальном этапе своего развития. На сегодняшний день синтез ДНК остается все еще очень дорогим, поэтому за мегабайт данных, записанных на ДНК-«флешку», придется заплатить порядка 3,5 тыс. долларов.

Ученым еще предстоит разработать технологию автоматической передачи информации с ДНК. Также важно упростить способ передачи информации из компьютера в клетку. Сейчас для этого используется поток электронов, но в будущем его заменят чем-нибудь другим.

Например, переменным магнитным полем или температурой внешней среды. Или даже обычным лучом света — ведь фоторецепторы есть у большинства живых организмов.

hightech.fm

Nurqanat BaizaqNurqanat Baizaq
3 года назад 1562
0 комментариев
О блоге
0
2274723 208 535 4879 232