Томские ученые планируют к 2017 году разработать систему
хранения больших объемов информации, которую опробуют в экспериментах
Европейского центра ядерных исследований (ЦЕРН, Швейцария). Такая система
позволит за секунды получать информацию, на получение которой сейчас уходят
часы, сообщает пресс-служба вуза.
Работы будут проходить в Томском политехническом университете (ТПУ) на базе
открывшейся лаборатории обработки и анализа больших данных. Протестируют новую
технологию в проектах ЦЕРНа, в частности, в эксперименте «Атлас».
«"АТЛАС" — один из четырех основных экспериментов на Большом адронном
коллайдере в ЦЕРНе. Эксперимент предназначен для исследований в области физики
элементарных частиц. Это один из двух экспериментов, где был открыт бозон
Хиггса. В эксперименте "АТЛАС" уже есть большой объем данных, и на
нем мы можем показать эффективность новой системы», — сказал куратор новой
лаборатории Алексей Климентов.
По словам Климентова, наука и различные области производства остро нуждаются в
новой системе, архитектуре хранения больших объемов информации.
«Только представьте, над экспериментом "АТЛАС" работают три тысячи
ученых. Это огромный эксперимент. Мы работаем со 160 петабайтами данных,
Google, например, со 180 петабайтами. И существующие подходы к хранению
информации уже не могут нам предложить подходящего варианта. Поэтому возникла
идея создать на базе ТПУ лабораторию, ученые которой разработают новую
технологию хранения больших объемов данных», — отметил ученый.
СОЕДИНИТЬ ПОДХОДЫ
Прежде чем создать лабораторию, ученые ТПУ уже успешно выполнили пилотный
проект. Им удалось соединить классический подход к хранению информации и опыт
социальных сетей.
«При классическом подходе данные хранятся табличным способом. Такая база
данных не может масштабироваться: она создается на определенный объем данных. Иную
масштабируемую технологию разработали для социальных сетей. Соцсети хранят
данные как будто это лежат отдельные файлы. Соединением этих двух подходов и
занимались ученые ТПУ, решение уже найдено», — пояснил Климентов.
Политехники предложили хранить информацию «горизонтально», на двух
иерархических уровнях. Один уровень содержит данные, которые уже нет
необходимости изменять, другой хранит динамические данные. Как отмечают ученые,
система будет универсальной, и ее можно будет применять в различных областях.