«Окаменелости» цифровой цивилизации
Начнем обзор с заметки, в которой речь пойдет не о какой-то конкретной новой технологии хранения данных, а о фундаментальных проблемах сохранения информации, которые поднял в своей статье американский ученый и писатель Дэвид Пог.
Он начал с размышлений о все возрастающей актуальности задачи по спасению данных, когда-либо записанных на магнитной ленте. В самом деле, все эти миллиарды часов VHS медленно гниют в наших подвалах и на чердаках. В эпоху видеокамер и аудиокассет лишь немногие из нас задумывались о недалеком будущем, когда под рукой не будет устройств, способных проиграть обычную кассету. Но разве мы стали с тех пор мудрее? Сегодня мы сохраняем большинство наших воспоминаний на жестких дисках. Жесткие диски всегда будут у нас под рукой, не так ли?
Нет, не так! В качестве стандартного компонента компьютера они существуют всего около 30 лет – это же мгновение ока на большой человеческой временной шкале. К тому же, жесткий диск имеет ограниченный срок службы – десять лет, да и то, если повезет.
Уже сейчас многие компьютеры используют флэш-память вместо традиционных жестких дисков, а некоторые продвинутые девайсы, например, Google Chromebooks, отправляют большинство своих данных на хранение в Интернет.
Может быть, облачное хранение это и есть решение проблемы? Именно так нам говорят владельцы онлайновых хранилищ: «Когда вы храните ваши аудиозаписи, фотографии и видео в Интернете, они находятся там в полной безопасности, потому что коммерческие центры обработки данных в широком масштабе применяют резервное копирование. Ваши данные в «облаке» легко доступны, и облачные хранилища легко перейдут от сегодняшних больших жестких дисков к тому формату, который появится в будущем».
Но здесь опять было бы самонадеянно считать, что то, что мы используем сегодня, по-прежнему будет доминирующим форматом через десятки или даже сотни лет. Возраст самого Интернета как популярной публичной системы – около 25 лет. Действительно ли это безопасно – доверить наши самые ценные записи веб-сайтам, если YouTube всего 11 лет, Vimeo – 12 лет, Flickr – 12 лет, а Google Photo – год? Вы правда ожидаете, что эти сайты переживут десятилетия и их увидят ваши внуки?
Посмотрите, насколько короткой «продолжительностью жизни» обладают наши форматы хранения. Увы, сегодня мы не располагаем «волшебными цифровыми контейнерами» для хранения наших данных, которые будут доступны для наших внуков.
Жизнь «вечных» форматов – книг, картин, скульптур, которые оставались нетронутыми сотни лет после их создания, в основном уже завершена. Единственный способ сохранить свои файлы и записи – переходить каждое десятилетие на наиболее перспективные системы хранения данных. Это требует усилий, но иначе миллионы записей не переживут и одного поколения.
«Облачный посредник» для телефона
Новый сервис, разработанный в университете Бингемтон (государственный университет Нью-Йорка), сможет повысить производительность мобильных устройств при хранении данных в «облаке». Как известно, система хранения и вычислительная мощность мобильных устройств ограничены компактными размерами девайсов, что определяет необходимость хранения данных в «облаке». Однако с увеличением количества мобильных приложений, которые используют «облако», пользователь начинает сталкиваться с различными трудностями. Так, постоянная синхронизация данных по сотовым сетям (которые, к тому же, нередко перегружены) заметно снижает срок службы аккумулятора.
Владельцы мобильных устройств, как справедливо отмечает в своей работе Йефин Чжан, доцент кафедры информатики университета Бингемтон, зачастую устанавливают на свои компактные устройства целый ворох разнообразных приложений, разработчики которых далеко не всегда обладают достаточным уровнем компетенций для создания эффективно работающего кода. Отсюда естественным образом возникают различные осложнения, особенно когда дело касается таких сложных вопросов, как работа приложений с инновационными облачными технологиями.
Йефин Чжан и команда исследователей университета Бингемтон разработали StoArranger – уникальный сервис для перехвата, координации и оптимизации запросов, производимых мобильными приложениями и сервисами облачных систем хранения данных. StoArranger работает как «посредник», который никоим образом не вмешивается в собственно сферу работы мобильных приложений, с одной стороны, и облачных сервисов – с другой. При этом «посредник» существенно повышает производительность мобильного устройства и сотовой сети в целом. По сути дела, StoArranger принимает запросы от облачных систем хранения данных и определяет, как наилучшим образом их обработать на мобильном девайсе, чтобы свести к минимуму объем данных, используемых для завершения задачи.
Этот инновационный сервис может заметно повлиять на работу миллионов мобильных устройств и пользователей по всему миру. Microsoft, например, хранит в своей облачной системе Azure более 10 трлн объектов (по состоянию на январь 2015 г.). Правда, StoArranger пока еще не является коммерчески доступным продуктом. Исследовательская группа Йефина Чжана планирует в ближайшие месяцы сделать свой сервис доступным для публичного использования: «Наш продукт не должен требовать внесения каких-либо изменений в используемые сейчас операционные системы и существующие на рынке приложения – только такой подход сделает наше решение максимально практичным и легко масштабируемым для существующих пользователей смартфонов».
Работа по созданию сервиса StoArranger получила поддержку со стороны Национального научного фонда (National Science Foundation) – независимого агентства при правительстве США, отвечающего за развитие науки и технологий. В частности, было отмечено, что данная разработка демонстрирует, как простым и практичным способом нейтрализовать некоторые негативные последствия, связанные с облачным хранением данных.
СХД на атомах хлора
Принято считать, что сегодня наше мировое сообщество ежедневно создает более одного миллиарда гигабайт новых данных. Правда, эта числовая эквилибристика зачастую просто не успевает соответствовать реальной скорости происходящих в этой области процессов –пока мы пишем данную заметку, уже можно говорить о том, что указанная выше цифра устарела. Понятно, что такие скорости увеличения объемов хранимых данных порождают колоссальные проблемы, поскольку даже самые ультрасовременные СХД, строительство которых обходится в миллиарды долларов, имеют свои пределы. Так что ученые по всему миру находятся в непрекращающемся ни на секунду поиске новых способов хранения информации.
Как в связи с этим не вспомнить, что в далеком (по нашим меркам) 1959 г. американский нобелевский лауреат Ричард Фейнман прочитал знаменитую лекцию под названием Plenty of Room at the Bottom («На дне места достаточно»), в которой он обозначил проблему компактного хранения информации. Фейнман предположил, что при наличии платформы, которая позволит организовать отдельные атомы в строгом порядке, каждый из них сможет служить единицей информации. Он был уверен, что устройства, в основе работы которых будет лежать этот принцип, станут невероятно компактными и емкими. Именно эта идея легла в основу разработки команды голландских исследователей из Kavli Institute of Nanoscience (Института нанонаук Кавли) в Делфте, и их коллеги из INL (International Iberian Nanotechnology Laboratory – Португалия, Международная иберийская лаборатория нанотехнологий).
В настоящее время для записи и последующего хранения информации используются носители, в которых на подложках располагаются или зерна магнитного материала, или отверстия. Из сего факта логично следует вывод, что для создания более компактных носителей информации необходимо уменьшить до предела эти структурные элементы. А как это сделать на практике?
Для решения данной задачи голландские исследователи предложили выстроить килобайт памяти из атомов хлора на медной подложке размером всего 96 на 126 нанометров, что примерно в 800 раз меньше, чем толщина человеческого волоса! Эта уникальная работа была выполнена с помощью сканирующего туннельного микроскопа с тончайшей иглой, способной производить подобного рода манипуляции.
Смысл данного построения был следующий. Каждый атом хлора имеет две возможные позиции – одна под другой. Собственно говоря, здесь мы и получаем своего рода аналог бита – простейшей единицы хранения информации. Атом хлора можно переместить из одного положения в другое. При этом, если он находится в верхнем положении, то под ним имеется пустота, и бит принимается равным единице, а в обратной ситуации, когда отверстие расположено сверху, мы получаем ноль. Таким образом, с помощью довольно необычной атомной структуры можно получить вполне привычную двоичную систему кодирования – только, в отличие от существующих систем, очень плотно упакованную. Разработчикам удалось достичь плотности хранения в 500 Тбит на квадратный дюйм (это примерно 6,5 квадратных сантиметра), что приблизительно в 500 раз больше, чем у самого лучшего на сегодняшний день жесткого диска.
Память на атомах хлора организована блоками из восьми байтов, в каждом из которых по 64 бита. Каждый из этих блоков содержит своеобразный маркер (узор) из атомов хлора. Блоки внешне напоминают двухмерные штрих-коды (QR-коды). Эти миниатюрные QR-коды несут информацию о точном местонахождении каждого блока на слое меди. По рисунку маркеров можно понять, был ли какой-либо из блоков поврежден, скажем, в случае локального загрязнения или ошибки записи.
Теоретически, предлагаемый подход открывает прекрасные перспективы для уплотнения хранения информации, однако до его практического применения еще далеко. К сожалению, такая память может работать только в стерильно чистых лабораторных условиях – в вакууме и при температуре жидкого азота (−195,75 °C, 77,4 K).
Стоит также отметить, что для своей первой записи на атомный носитель голландские исследователи выбрали текст той самой памятной лекции Ричарда Фейнмана как дань его вкладу в разработку этого научного направления.
Закон Мура отменяется
Похоже, что знаменитый закон Мура скоро придется отложить в сторонку, поскольку он уже не в состоянии отражать рекордные скорости современного компьютерного мира. Только в этот раз речь идет не о скорости работы процессора, а о новых возможностях хранения данных. Интересно, что для непосвященного само словосочетание «хранение данных» всегда ассоциируется с некими твердыми предметами – металлическими или, в лучшем случае, кристаллическими. Однако для исследователей давно уже стало понятно, что перспективные системы хранения данных недалекого будущего будут создаваться на базе органических материалов. Как тут не вспомнить, например, что в известном научно-фантастическом сериале Star Trek нередко в качестве компактных (и, что не менее важно, защищенных от взлома) систем хранения применяются клетки человеческого организма.
А теперь перейдем непосредственно к делу. Согласно сообщению, появившемуся в блоге корпорации Microsoft, американским ученым из Вашингтонского университета удалось записать в ДНК наибольшее на сегодняшний день количество данных – 200 мегабайт. В эту запись вошли, в частности, оцифрованные произведения искусства: 100 величайших литературных произведений из известного интернет-проекта «Гуттенберг», всеобщая Декларация прав человека ООН более чем на 100 языках, огромная база данных семян некоей некоммерческой организации Crop Trust и клип This Too Shall Pass группы OK Go! в высоком разрешении, хотя относительно культурной и общечеловеческой ценности последнего элемента у меня, честно говоря, имеются большие сомнения.
Что же касается самой методики хранения данных, то она выглядит в данном проекте следующим образом. В ходе записи исследователи конвертировали нули и единицы цифровой информации в четыре буквы азотистых оснований: A – аденин, C – цитозин, G – гуанин, N – тимин. Далее, на основании электронной версии, получившейся в ходе этого эксперимента последовательности, компания-подрядчик Twist Bioscience синтезировала фрагменты ДНК длиной 150 нуклеотидов каждый. В сообщении утверждается, что для тестовой записи понадобилось всего около 1,5 млрд азотистых оснований.
Как отметил доцент Луис Энрике Сиза, возглавляющий данный проект со стороны Вашингтонского университета, этот эксперимент стал возможен благодаря последним достижениям биотехнологической индустрии в области синтеза (собственно «записи») и секвенирования («считывания») нуклеиновых кислот. Однако победные марши нам пока играть рано, поскольку для широкого использования ДНК в качестве архивного носителя информации ученым и инженерам предстоит преодолеть множество технологических и, что не менее важно, экономических сложностей.
По мнению американских исследователей, в будущем ДНК сможет стать «основным материалом для архивирования информации» и предотвратить кризис хранения данных, поскольку она позволит легко аккумулировать гигантские массивы информации в сравнительно небольшом объеме. По словам Кэрин Стросс (руководитель проекта со стороны корпорации Microsoft), хранилище размером с обычную обувную коробку сможет заменить около 100 крупных современных дата-центров. Исследователи также утверждают, что при соблюдении правильных условий хранения ДНК сохраняет свои свойства на протяжении сотен и тысяч лет, что на порядки превосходит возможности современных носителей информации.
Использованные источники
Discover Magazine
http://discovermagazine.com/tags/computers
The Official Microsoft Blog
http://blogs.microsoft.com/
Popular Science (PopSci)
http://www.popsci.com/technology
Science Daily
https://www.sciencedaily.com/news/computers_math/
Scientific American (SciAm)
http://www.scientificamerican.com/computing/