Technology

Коли у нас закінчиться місце для зберігання цифрових даних, ми будемо використовувати ДНК

У світі спостерігається дефіцит вільного місця длязберігання цифрових даних. Ця проблема існує декількох років, проте звичайні люди навряд чи про неї коли-небудь замислювалися. Не так давно був час, коли вільне місце для запису цифрових даних обмежувалося об'ємом жорсткого диска вашого комп'ютера. При досягненні межі ми або йшли за новим жорстким диском, або записували все на оптичні носії. Коли закінчувалися і вони, ми просто видаляли старі дані і записували нові. Але є ті, хто ніколи не видаляє дані.

Наприклад, цього не роблять багато компаній,особливо ті, чия сфера діяльності і цінність Завіт від тієї цифрової інформації, якою вони володіють. Часи змінюються. Технології розвиваються. Зараз інформація не видаляється, вона переноситься в «хмару». До речі, сам термін «хмара» вельми ефемерний і зовсім не відображає реальний фізичний природне явище. Просто він видався дуже зручним і красивим, його і залишили. Де зберігаються дані? Це зовсім неважливо, по крайней мере, до тих пір, поки ми можемо в будь-який момент до них звернутися. Чи висока ймовірність того, що у нас в кінці кінців закінчується місце в хмарному сховище? Про це ніхто не замислюється. Поки оплачуєш підписку - все нормально. Мало місця? Вибираєш новий тарифний план і отримуєш ще більше місця для своєї інформації.

Така разбалованность привела до того, що людямстало складно навіть уявити, що одного разу у нас може закінчитися вільне місце для зберігання цифрових даних. Як раніше було складно уявити, що на Землі рано чи пізно може закінчиться прісна вода, запаси якої заповнюються завдяки її круговороту в природі. Але ось вам реальність. У 2018 році запаси води в Кейптауні (Південна Африка) стрімко наблизилися до свого повного виснаження. А ми, люди, не замислюються про це, стрімко наближаємося до нестачі вільного місця для зберігання цифрових даних.

Дані, дані, навколо одні дані

Основна причина цього виснаження вільного місцязвичайно ж пов'язана з тими темпами, з якими ми виробляємо нові дані. Кожен день в світі завдяки 3,7 мільярда користувачів Інтернету генерується близько 2,5 квінтильйони байтів інформації. Серед всіх наявних сьогодні цифрових даних 90 відсотків було створено лише за останні два роки. А з ростом числа використовуваних розумних пристроїв, що підключаються до Всесвітньої павутини (той самий «Інтернет речей»), ці цифри найближчим часом виростуть ще сильніше.

«Говорячи про хмарному сховище, люди частомають на увазі наявність якогось нескінченного вільного місця для зберігання інформації », - коментує порталу Digital Trends Хьюн Джун Парк, голова і співзасновник Catalog, компанії зі зберігання даних.

«Однак хмара - це такий же комп'ютер, наякому зберігаються ваші дані. Люди просто не усвідомлюють того, що в світі генеруються настільки багато цифрових даних, що темп, з яким вони виробляються істотно випереджає наші можливості все це зберігати. У самому найближчому майбутньому ми отримаємо величезний розрив між обсягом корисних даних і нашою здатністю зберігати їх з використанням традиційних носіїв ».

Оскільки компанії, що займаються хмарнимзберіганням даних постійно зайняті будівництвом нових дата-центрів або розширенням вже існуючих, досить складно спрогнозувати, коли ми реально втратимо всього вільного місця. Проте за словами того ж Парку, вже до 2025 року людство в сукупності може згенерувати понад 160 зеттабайт цифрової інформації (зеттабайт, для тих, хто не знає, це трильйон гігабайтів). Як багато з цього обсяги ми зможемо реально зберегти? Близько 12,5 відсотка, говорить Парк.

Це питання виразно вимагає рішення.

Може цією відповіддю є ДНК?

Так вважають Парк, Натаніель Рокет, а також їхколеги з Массачусетського технологічного інституту. Разом вони заснували компанію Catalog, в стінах якої була розроблена технологія, здатна на думку її творців змінити наше уявлення про те, як в найближчому майбутньому будуть зберігатися всі наші цифрові дані. На їхню думку, точніше заявою, незабаром цифрові дані з усього світу можна буде вмістити на площі не більше шафи для одягу.

Компанія Catalog пропонує в якостівідповідного рішення кодувати дані в ДНК. Звучить все це як один із сюжетів американського письменника-фантаста Майкла Крайтона, але пропоноване ними масштабування доступне рішення цілком реалістично і навіть привернуло 9 мільйонів доларів венчурного фінансування, а також підтримку провідних професорів зі Стенфордського і Гарвардського університетів.

«Мені часто задають питання: чию ДНК ми використовуємо? Люди ніби вважають, що ми беремо ДНК якоїсь людини і перетворюємо їх в мутантів або типо того », - сміється Парк.

Але це зовсім не те, чим займається компаніяCatalog. ДНК яке використовує Catalog для кодування даних являє собою синтетичний полімер. Вона не біологічного походження і не створена на парах азотистих основ, в які записується інформація. Серія з нулів і одиниць, яка записується в полімер так само не може бути кодом чого живого. Проте на виході отримується продукт біологічно практично не відрізнити від того, що ми звикли зустрічати в живій клітині.

Ідея про те, що ДНК можна розглядати вяк альтернативний засіб для зберігання цифрової інформації зародилася ще кілька десятиліть тому. Фактично, коли Джеймс Уотсон і Френсіс Крік тільки прийшли до моделі структури ДНК в 1953 році. Однак до сьогоднішнього часу ряд істотних обмежень не дозволяв побачити величезний потенціал використання ДНК в якості засобу зберігання цифрової інформації, не кажучи вже про те, як все це втілити в реальності.

У звичайному поданні метод зберігання інформаціїза допомогою ДНК зосереджений навколо синтезу нових молекул ДНК; зіставленні послідовностей бітів інформації з послідовностями чотирьох пар ДНК, а також виробництвом достатньої кількості молекул, які представлятимуть всі числа, які ви хочете зберегти. Проблема такого методу полягає в дорожнечі і повільності процесу. Крім того, тут є багато обмежень, пов'язаних власне з зберіганням самих даних.

Підхід компанії Catalog пропонує відключенняпроцесу синтезу молекул від процесу їх кодування. Якщо говорити по суті, компанія спочатку виробляє величезну кількість лише певних молекул (що істотно здешевлює виробництво), а потім кодує в них інформацію за допомогою використання різноманітності вже готових молекул.

Як аналогію Catalog порівнює попереднійпідхід з виробництвом користувальницьких жорстких дисків з уже заздалегідь записаної на неї інформацією. Запис нової інформації в такому випадку має на увазі необхідність створення нового жорсткого диска з нуля. Новий підхід, запропонований Catalog, можна порівняти з масовим виробництвом порожніх жорстких дисків і запису на них у міру необхідності нової закодованої інформації.

Вся справа в способі зберігання

Принадність всього цього полягає в тому, наскількивеличезний обсяг даних можна зберігати на вельми компактною площі. В якості демонстрації Catalog використовувала свою технологію для кодування в ДНК різних фантастичних книг. Наприклад, весь цикл романів «Автостопом по галактиці». Але це все дрібниці перед можливостями, що відкриваються.

«Якщо порівнювати порівнянні величини, токількість бітів, які ви зможете зберегти за допомогою ДНК буде в мільйон разів вище того, що пропонується тими ж твердотільними накопичувачами. Наприклад, візьмемо розміри звичайної флешки. При використанні ДНК-методу збереження інформації ви зможете записати на пристрій розміром з цю флешку в мільйон разів більше інформації, ніж на звичайний флеш-накопичувач ».

Порівняння з твердотільними накопичувачами, відзначаютьрозробники, все-таки не зовсім точне. ДНК дозволяє зберігати в порівнянному обсязі набагато більше інформації, однак технологія не дозволяє надавати до неї миттєвий доступ, як наприклад, у випадку з тими ж USB-накопичувачами. Технологія Catalog трансформує інформацію в твердий фізичний пелет (гранулу) з синтетичного полімеру.

Для доступу до цієї інформації необхідно взятизакодований синтетичний полімерний пелет, регідратованих його за допомогою води, а потім «прочитати» за допомогою секвенатор ДНК. В рамках процесу можна буде виділити базові пари ДНК, який потім можна використовувати для розрахунку числа нулів і одиниць, що утворюють інформацію. Від початку і до кінця на цей процес може піти мінімум декількох годин.

З цієї причини така технологія в першу чергуорієнтована на ринок архівування, де не потрібно швидкий доступ до інформації. Зазвичай в цьому випадку маються на увазі дані, які не використовуються або дуже рідко використовуються після запису, але при цьому вкрай важливі для збереження. Скажімо, як ваша гарантія на холодильник, тільки в масштабі корпоративної значущості.

На яку користь все це принесе звичайнимкористувачам? На початку статті ми говорили про те, що більшість з нас не замислюється про те, що відбувається і де зберігається наша інформація. На твердотільних носіях? Так нехай хоч на магнітній плівці. Нам це не цікаво до тих пір, поки у нас є до неї доступ в будь-який час.

Через тривалості процесу відновленняінформації ми навряд чи коли-небудь досягнемо рівня, коли який-небудь Google Cloud або Яндекс.Діск зберігатимуть нашу інформацію в гігантських чанах з ДНК. Якщо та ж технологія Catalog підтвердить свою ефективність, то, швидше за все, вона знайде свою нішу в сферах, де застосовується підхід довгострокового зберігання інформації. Що ж стосується короткострокового методу зберігання інформації, де в даний момент застосовуються як жорсткі диски, так і твердотільні накопичувачі, то нам доведеться покладатися на інші методи.

представляючи перспективи

У цій пробірці містяться мільйони копій даних, закодованих в ДНК

Проте і тут можна угледіти практично науково-фантастичні можливості.

«Уявіть собі, що в імплантованою вам підшкіру гранулі міститься вся інформація про ваше здоров'я: дані про вашу магнітно-резонансної ангіографії, інформація про вашу групу крові, рентгенографія для вашого стоматолога », - каже Парк.

«Ви напевно захочете, щоб всі ці дані булизавжди для вас доступні, але при цьому не хочете зберігати їх десь в «хмарі» або на якомусь незахищеному лікарняному сервері. Маючи завжди при собі ці дані в формі ДНК, ви зможете фізично ними управляти, отримувати при необхідності доступ, обмежувати його всім іншим і відкривати його безпосередньо Вашим лікуючим лікарям ».

«Практично в кожній сучасній лікарніє секвенатор ДНК. Я не кажу, що ми переслідуємо зараз саме таку мету використання даної технології, але в майбутньому все це може стати цілком можливим », - говорить розробник.

В даний час Catalog займається експериментальними проектами, спрямованими на демонстрацію ефективності розробленої ними технології.

«Якихось нерозв'язних наукових труднощів перед нами не стоїть, мова зараз скоріше йде про завдання щодо оптимізації механічних процесів», - зазначив Парк.

За власним визнанням Парку, він вирішивпідключитися зайнятися дослідженням способів зберігання даних за допомогою ДНК просто тому, що йому здалося це дуже крутим і інноваційним технологічним підходом до вирішення існуючої великої проблеми. Зараз же на думку фахівця, ця технологія може стати однією з найважливіших технологій нашого часу.