Участие в конференции «Управление данными — 2024»
29 сентября 2024
26 сентября эксперты компании ТриниДата приняли участие в конференции «Управление данными — 2024», организованной издательством «Открытые системы». Если сказать кратко, то по сравнению с прошлым годом стало больше отсылок к методологии управления данными и больше упоминаний про онтологии. Теперь подробнее.
В докладах спикерами выделяются основные сферы управления данными, которые необходимы для качественного их использования:
- Управление данными (Data Management): в этой связи говорят про методологии управления данными (чаще всего — DMBOK), возможности формирования отчётности и обеспечения инфраструктуры для работы с данными.
- Контроль данных (Data Governance): то, что обеспечивает возможность доверия к данным, в частности контроль качества, метаданные, происхождение и владельцы данных.
- Доступность данных (Data Accessibility): возможность использования данных, куда входит как поиск, архивирование и приобретение данных, так и модель для управления данными.
Как отмечали коллеги, MDM-системы помогают контролировать данные и делать их доступными. Актуальные для спикеров аспекты функционирования MDM-систем можно представить в такой таблице:
Аспект | Функция MDM | Технологии |
Управление метаданными | Версионирование | Git |
История данных | Lineage graph | |
Метаданные | Теории и схемы метаданных | |
Контроль качества | Заявки на изменения | Маршруты согласования |
Дедубликация | Rule-based, ML-based | |
Нормализация | ||
Поддержка актуальности данных | Наполнение | Rule-based, ML-based, LLM-based, адаптеры |
Архивирование | Регламентное | |
Доступ к данным | Поиск | Полнотекстовый, нечёткий, сквозной |
Права пользователей | Реестр пользователей | |
Управление моделью данных | Целостность | Авто- и ручные проверки |
Согласованность | Автопроверки |
Применительно к платформе АрхиГраф можно говорить о следующем распределении функциональных блоков:
Большая часть этих блоков так или иначе представлена в платформе АрхиГраф каким-либо исполняемым кодом: адаптерами, сервисами, ядром платформы. При этом мы стремимся, чтобы функционированием всех блоков управляли онтологические модели: ими мы обеспечиваем и модели данных и метаданных, и часть настроек информационных систем, и — в перспективе — функционирование адаптеров для извлечения данных.