Использование открытой системы OpenStack позволит CERN справиться с потоком данных от БАК, который составит 400 Пб в год

Большой Адронный Коллайдер


В настоящее время IT-инфраструктура Европейской организации ядерных исследований CERN состоит из четырех облачных сервисов на базе системы с открытым кодом OpenStack, в серверах которых в сумме насчитывается 11 тысяч вычислительных узлов. Такая мощь используется для хранения и обработки архива данных, собранных за все время проведения экспериментов на Большом Адроном Коллайдере (БАК), размер архива сейчас составляет около 100 Пб и он растет темпами 25-27 Пб в год. Но, начиная с 2017 года, когда на модернизированном коллайдере начнутся новые эксперименты, в которых будут производится столкновения более высокоэнергетических частиц, поток данных, генерируемых датчиками коллайдера, увеличится во много раз и составит порядка 400 Пб в год. И, естественно, справится с таким наплывом данных сможет лишь новая, более масштабная и мощная IT-инфраструктура, работы по созданию которой уже ведутся в настоящее время.

"В настоящее время в распоряжении CERN имеются четыре облака на базе OpenStack. В серверах самого большого насчитывается порядка 7 тысяч ядер, а самого маленького - 3 тысячи" - рассказал Тим Белл (Tim Bell), менеджер IT-инфраструктуры CERN в выступлении на саммите OpenStack, который проходил недавно в Париже, - "Но к концу первого квартала 2015 года количество вычислительных ядер в наших облачных сервисах увеличится до 150 тысяч. И это станет лишь первым шагом на пути развертывания инфраструктуры, которая будет готова к 2023 году и которая сможет справиться с 400 Пб данных в год. Правда и бюджет этой инфраструктуры будет в 50 раз больше бюджета нынешней инфраструктуры".

К сожалению, существующий информационный центр CERN, располагающийся неподалеку от коллайдера, физически не сможет принять в свои стены большое количество новых серверов. С таким увеличением нагрузки не справится ни энергетическая сеть, ни системы охлаждения датацентра. Решение этой проблемы заключается в использовании возможностей и мощностей существующих удаленных датацентров, находящихся в близлежащих странах. Одним из таких датацентров станет центр в Будапеште, у которого имеются необходимые быстродействующие коммуникационные каналы, связывающие его с Женевой.

Датацентр CERN


Однако, создавая систему из нескольких облачных систем, разбросанных по различным датацентрам, CERN столкнется с некоторыми затруднениями, связанными с обработкой данных, физически хранящихся в различных местах. Решением этой проблемы станет технология под названием Cells, которая позволяет объединять вычислительные узлы в своеобразные ячейки, которые станут базовыми "строительными кирпичиками" создаваемой инфраструктуры распределенных вычислений.

Все работы по созданию новой вычислительной инфраструктуры CERN ведутся при непосредственном участии компании Rackspace. "У нас уже имеется богатый опыт сотрудничества с компанией Rackspace" - рассказывает Тим Белл, - "В прошлом году нашими совместными усилиями были соединены воедино все лаборатории CERN, и было развернуто несколько облаков OpenStack. И теперь, приобретя опыт в этом деле, мы вместе со специалистами Rackspace с легкостью займемся развертыванием новой масштабной архитектуры".

И в заключение стоит заметить, что группа Тима Белла из CERN была признана фондом OpenStack Foundation в качестве победителя конкурса OpenStack Superuser Awards, чем было отмечено их участие в деле совершенствования программного обеспечения с открытым исходным кодом и способствования расширения областей его использования.

Вернуться назад