Техно

К 2020 году вся информация будет храниться на ДНК

К этому времени ученым предстоит решить две задачи — снизить стоимость этой технологии и сократить время, необходимое для считывания данных с нового носителя

Фото: vokrugsveta.ru

По словам американского ученого, известного как "один из отцов интернета", лауреата премии Тьюринга Винтона Серфа, все традиционные носители информации чрезвычайно уязвимы и, продолжая их использовать, человечество приближает эпоху "цифрового мрачного средневековья". "Мы беспечно швыряем все наши данные в то, что может стать информационной черной дырой", - говорит он.

Поэтому одна из главных технологических задач, требующая быстрого решения, - поиск альтернативных способов хранения информации. Одна из наиболее многообещающих технологий - кодирование данных в молекулах ДНК. Преимущества такого носителя очевидны: ДНК не только чрезвычайно компактна, но и вместительна. Молекулярный диск весом всего 28 г способен вместить более 300 тыс. терабайт информации. Для сравнения: существующие устройства имеют максимальный объем 5 терабайт. Второй немаловажный плюс - длительное хранение информации. В прохладном темном месте молекулы ДНК способны пережить века, тогда как максимальный срок службы жестких дисков - 50 лет. Кроме того, для хранения молекулярных носителей не требуется электричества (как для жестких дисков). Да и вообще, как шутят ученые, природа использует ДНК для хранения и передачи информации около 3,5 млрд лет, что является лучшим подтверждением надежности такой системы. Дезоксирибонуклеиновую кислоту можно получить из останков доисторических животных, возраст которых насчитывает несколько десятков тысяч лет, причем эту информацию можно расшифровать.

Для кодирования информации в ДНК подходит тот же способ, что и для преобразования информации перед загрузкой на жесткий диск. Но если для зашифровки данных для компьютера используются нули и единицы, то в ДНК задействованы четыре нуклеотида, являющихся основой для ее построения: А, С, Т и G. Каждому из них соответствует определенная последовательность компонентов, которые при помощи химических реакций выстраиваются в определенном порядке, образуя цепь. Процесс, как говорят ученые, напоминает нанизывание на нить жемчуга. А при декодировке данных применяется обычный спектрометр - устройство, которое во всех мировых лабораториях используется для считывания последовательности ДНК.
Новейшее доказательство эффективности молекулярных носителей данных представили специалисты из Швейцарского федерального технологического института в Цюрихе. На выставке Американского химического общества, которая проходила с 16 по 20 августа в Бостоне, команда исследователей под руководством профессора Роберта Грасса продемонстрировала оригинальные ДНК-диски. В рамках эксперимента молекулы дезоксирибонуклеиновой кислоты поместили в сферы из диоксида кремния - вещества, которое может храниться на протяжении многих веков. В течение недели ДНК-версии текстов нагревали до температуры 70 градусов, моделируя процесс старения: такие условия соответствовали хранению ин­формации на протяжении 2 тыс. лет при температуре 10 градусов. Ученые говорят, что если понизить температуру до минус 18 градусов, то ДНК-данные продержатся в неизменном состоянии несколько миллионов лет. Кста­ти, именно такая температура поддерживается в международном хранилище семян "Сваль­бард" в Норвегии.

Сейчас кодирование 83 килобайтов информации обошлось почти в $1,5 тыс. Соответственно, кодировка Wikipedia стоила бы миллиарды долларов

Исследователи из института в Цюрихе закодировали пока небольшой объем информации - 83 килобайта текста из Швей­царс­кого федерального устава и 1291 килобайт с текстом Архи­ме­да X в. После декодировки ДНК все данные были воспроизведены без ошибок. Грасс и его коллеги уже приближаются к решению следующей задачи - созданию метода поиска конкретных данных в цепи ДНК. "В хранилище ДНК у вас есть капля жидкости, содержащая плавающие молекулы с закодированной информацией, - говорит Грасс. - Мы можем прочитать все целиком, что содержится в этой капле, но найти в ней конкретное место, отдельный файл пока невозможно". Сейчас исследователи разрабатывают способы маркировки определенных блоков информации в цепочках ДНК.

Эффективность записи данных в молекулах дезоксирибонуклеиновой кислоты также продемонстрировали специалисты из Ин- ститута Вайса Гарвардского университета. Они закодировали таким образом целую книгу по синтетической биологии с иллюстрациями: 5,27-мегабитный том содержит 53246 слов и 11 фотографий в формате JPEG. На сегодня это крупнейший объем записанной на ДНК небиологической информации.

Один из ведущих авторов исследования, профессор генетики из Института Вайса Джордж Черч рассказывает, что после проведения обратного кодирования вы­­явилось только две ошибки на миллион бит в файле объемом 5,27 мегабита - это всего несколько неточностей, которых в печатных книгах такого объема обычно больше.
Специалисты из Гарварда считают, что запись информации лучше производить не на естественные, а на полимерные ДНК. Во-первых, "поведение" таких молекул полностью предсказуемо в отличие от искусственно выращенных живых ДНК, которые могут удалять фрагменты данных самопроизвольно. Во-вторых, можно синтезировать полимерные цепочки любой длины с заданной структурой.

Фото: hsto.org

Пока главными препятствиями для массового внедрения новой технологии хранения информации являются ее дороговизна и время, затрачиваемое на извлечение данных. К примеру, для синтеза ДНК, в которой закодированы 10 мегабайт информации, требуется несколько дней, а расшифровка этих данных производится в течение восьми часов. Однако, учитывая быстрые темпы развития технологии, можно рассчитывать на то, что этот вопрос будет решен в ближайшие два-три года. По мнению Черча, запись информации на ДНК и ее просмотр будут производиться, как при съемке обычных фильмов.

Решится со временем и финансовый вопрос. Для кодирования 83 килобайтов информации швейцарским ученым потребовалось около $1,5 тыс. Соответственно, кодировка Wikipedia обошлась бы сейчас в миллиарды. Стоимость технологии снизится по мере удешевления секвенирования - "чтения" ДНК. Благо, за последние четыре года такие методики подешевели почти в тысячу раз и их стоимость продолжает уменьшаться. По прогнозам знаменитого генетика, специалиста по компьютерным технологиям из Ка- лифорнийского университета в Санта-Крус Дэвида Хосслера, всего через несколько лет ДНК придет на смену магнитным лентам, на которых сейчас хранятся государственные архивы и другие редко используемые данные, а к 2020 г. хранение данных на ДНК станет уже распространенной практикой.

Опубликовано в еженедельнике "Деловая столица" от 31 августа 2015 г. (№34-35/744-745 )