Дата-центричная архитектура

Данные являются ценным корпоративным ресурсом. В качестве одного из перспективных подходов к управлению данными современные IT-специалисты рассматривают построение дата-центричной архитектуры – системы, в центре которой находятся бизнес-данные компании, а не используемые ею приложения. Эта концепция радикально отличается от сложившейся на практике ситуации, когда наличие собственной базы данных у каждого бизнес-приложения порождает необходимость в сложных интеграционных решениях.

Дата-центричная архитектура

Пожалуй, главным популяризатором этой концепции можно назвать Дэйва Маккомба. Маккомб возглавляет агентство Semantic Arts, более 20 лет курирующее построение IT-архитектур для крупных организаций. Также Маккомб известен своими научными и публицистическими трудами. Каждый, кто задействован в работе с бизнес-данными, должен быть знаком с его Манифестом дата-центричности (The Data-Centric Manifesto).

Это далеко не первый текст о дата-центричных архитектурах. И он не задумывался как исследовательский труд - у того же Маккомба есть более глубокие работы, например, Software Wastelands или книга The Data-Centric Revolution: Restoring Sanity to Enterprise Information Systems. Предназначение Манифеста – дать огласку проблеме неэффективного распоряжения данными и наметить путь к её решению.

Проблематика Манифеста

В Манифесте Маккомб заявляет о зависимости многих организаций от приложений. Годами компании «вырабатывали привычку» хранить информацию в базах данных бизнес-приложений. Как итог, компании имеют разрозненные массивы информации, и реализация интеграционных решений в этой ситуации требует огромных усилий и финансовых вложений.

Поставив в центр системы корпоративные данные, компании перестанут быть зависимыми от прикладного ПО и его разработчиков. Появится возможность включать в систему предприятия любые новые приложения и исключать старые.

Из Манифеста

Мы раскрыли основную причину беспорядка в информационных системах крупных учреждений. Это ориентация на приложения, которая придает ПО приоритет над данными. Выход состоит в том, чтобы перевернуть ситуацию с ног на голову. Данные – это центр вселенной, приложения эфемерны.

Ведь все и так работает… (Почему зависимость от приложений существует?)

В интервью изданию InfoQ Дэйв Маккомб рассказал о нескольких причинах ориентации на приложения. Во-первых, это привычно. Когда-то давно условная компания начала решать бизнес-задачи с помощью приложений, не учитывая при этом истинную значимость данных, и спустя годы преобразование системы либо вызывает страх своей кардинальностью, либо попросту кажется ненужным, ведь все и так работает.

Из Манифеста

Мы также считаем, что основным препятствием для изменения этой парадигмы являются не технические, а ментальные факторы.

Вопрос о том, требуется ли предприятию новая IT-архитектура, каждый руководитель решает исходя из условий, в которых находится его бизнес. Однако не все, отказываясь от изменений, обращают внимание на объективные преимущества дата-центричного подхода. Точнее, на объективные недостатки ориентации на приложения.

Из Манифеста

Ориентация на приложенияОриентация на данные
Непомерно высокие затраты на изменения в бизнес-приложенияхРазумная стоимость изменений
Данные привязаны к приложениям, потому что приложения владеют даннымиДанные - это открытый ресурс, который переживает любое приложение
Каждый новый проект сопровождается большими усилиями по преобразованию данныхКаждый новый проект использует существующие хранилища данных
Данные существуют в широком разнообразии разнородных форматов, структур, значений и терминологииДанные глобально интегрированы, имеют общее значение и экспортируются из общего источника в любой необходимый формат
Интеграция данных потребляет 35-65% IT-бюджетаИнтеграция данных всегда будет бесплатной
Трудно или невозможно интегрировать внешние данные с внутренними даннымиВнутренние и внешние данные легко интегрируются

Отметим, что переход к дата-центричной архитектуре можно провести практически незаметно, и бояться изменений не стоит. Ряд IT-компаний предлагают такие решения для перехода, которые не тормозят деятельность заказчика. Более того, обновление быстро окупается (экономия на интеграции; хранении данных; сотрудниках, обслуживающих прежнюю систему и пр.). И зависимости от тех, кто помог провести изменения, не возникает. Само ПО для виртуализации корпоративных данных, наравне с любым другим, может быть при необходимости заменено, и это не повлияет на сами данные.

Вторая причина, по которой ориентация на данные пока не имеет широкого распространения – незнание. Не всем известно, что такой путь существует. Манифест призван побороть это незнание. Он помогает популяризировать дата-центричность за счет того, что в нем сжато и ясно изложена суть концепции. Более того, на сайте The Data-Centric Manifesto формируется комьюнити, к которому присоединяются люди со всего мира. Среди участников сообщества множество представителей крупнейших компаний, таких как Johnson&Johnson и IBM. Комментарии специалистов, убедившихся в потенциале дата-центричности, привлекают новых сторонников.

Из раздела «Подписавшиеся» сайта The Data-Centric Manifesto

«Я лично испытал на предыдущем месте работы разрушительные последствия архитектуры, ориентированной на приложения. Команды разработчиков отвергли решения на основе SQL, которые работали в от 10 до 100 раз лучше с меньшим количеством кода и меньшими ресурсами, и все это из-за догмы ориентации на приложения», – Стив Эштон, IT-архитектор.

Также фактором сохранения доминирующего статуса приложений в IT-ландшафте Дэйв Маккомб считает стремление заработать. Маккомб заявляет, что подход, при котором приложения принимаются в качестве важнейшей части корпоративной системы, выгоден для крупных разработчиков ПО и компаний, обслуживающих такие архитектуры.

Звучит достаточно конспирологически, но Маккомб подкрепляет свои заявления фактами.

«Существует огромное количество случаев, когда системы стоят более чем в 1000 раз дороже, чем должны. Большинство людей слышали о Healthcare.gov (Healthcare.gov – масштабный проект правительства США, направленный на оптимизацию оформления медстраховки. Траты на разработку системы проекта стали причиной скандала. – прим. авт.). Некоторые знают, что на сегодняшний день это обошлось в 2,1 миллиарда долларов (против первоначального бюджета в 93,7 миллиона долларов). Еще меньше людей понимают, что его можно было бы построить (гораздо лучше) менее чем за 1 миллион долларов, что именно и сделала HealthSherpa (HealthSherpa – стартап независимых разработчиков, запущенный как ответ Healthcare.gov – прим. авт.). Healthcare.gov в итоге были приняты многие элементы дизайна, разработанные в HealthSherpa», – Дэйв Маккомб в интервью для InfoQ.

Из Манифеста

Мы понимаем, что на создании, внедрении и интеграции приложений зарабатываются огромные деньги, и именно это поддерживает ориентацию на приложения.

Ключевые принципы Манифеста

В Манифесте не представлено конкретных решений по преобразованию IT-ландшафта. Каждая компания выбирает свой путь перехода к дата-центричной архитектуре. Тем не менее, в Манифесте представлены принципы, которые позволят встать на путь извлечения выгоды из корпоративных данных. Это не технические советы, но основы нового мышления.

Из Манифеста

  • Данные являются важнейшим активом любой организации
  • Большинство современных систем ориентировано на приложения
  • Хранение данных в проприетарном ПО – это ошибка
  • Дороговизна и сложность корпоративных систем связана с отношением приложений к данным
  • Мы понимаем, что ориентация на приложения приносит деньги
  • Но дата-центричный подход принесёт больше

Если вы хотите узнать больше о дата-центричном подходе в управлении данными, начните изучение с трудов Дэйва Маккомба The Data-Centric Revolution: Restoring Sanity to Enterprise Information Systems и Software Wasteland: How the Application-Centric Mindset is Hobbling our Enterprises.

И конечно, познакомьтесь с The Data-Centric Manifesto.

Подробнее о требованиях к платформе для реализации дата-центричной архитектуры, ее преимуществах, отличиях от концепций Data Lake и Corporate Data Cloud можно прочитать в нашей статье.

Платформа АрхиГраф предоставляет весь необходимый инструментарий и обладает всеми характеристиками, необходимыми для реализации дата-центричной ИТ-архитектуры предприятия. Создание такой архитектуры является решающим шагом на пути цифровизации предприятия, перехода к управлению, основанному на данных.