Принципы онтологического моделирования

Эта страница представляет собой главу из нашего методического пособия
"Введение в онтологическое моделирование" (нажмите для перехода к полной версии в формате PDF).

Как мы передаем и воспринимаем информацию

Ключевым для нашего рассказа термином является информация.

Информация – это сведения о чем-либо, имеющие определенное физическое представление. Физическое представление – это способ хранения информации на определенном носителе: она может быть записана на бумаге, храниться в клетках человеческого мозга, или представлена в электронном виде. Средствами физического представления информации являются определенные последовательности объектов или сигналов. Набор таких объектов или сигналов образует информационное сообщение.

Ценность информации заключается в возможности ее передачи. В процессе обработки информации участвуют:

  • Источник – объект или субъект, создающий информационное сообщение;
  • Носитель – физическая среда, хранящая и/или переносящая сообщение;
  • Приемник – объект или субъект, воспринимающий сообщение.

Для того, чтобы информационное сообщение обрело практическую ценность (прагматику), источнику и приемнику нужно согласовать между собой:

  • Физическую форму представления информации;
  • Правила формирования внутренней структуры сообщения (синтаксис);
  • Способы выражения смысла сообщения (семантику).

Понятие "смысл сообщения" обретает значение только относительно живого существа, которое формирует или воспринимает информационное сообщение. Для электронно-вычислительных машин никакого "смысла" сообщения не несут, даже если нам кажется, что компьютер осуществляет "сознательные" действия. Однако компьютеры могут помочь живым существам в обработке и восприятии смысла информации, в том числе – в получении логических выводов, то есть продуцировании одной информации из другой.

Информация, имеющая смысл, образует знания живого существа. Знания – это та практически полезная информация, которую мы можем использовать в своей деятельности.

Информация поступает в наш мозг от органов чувств. При этом происходит многоступенчатый процесс интерпретации, в ходе которого мозг выражает поступившую информацию при помощи совокупности понятий. Понятия представляют собой более или менее устойчивые структуры мышления, используемые для объединения родственных явлений, придания им тех или иных свойств, выражения закономерностей, получения логических выводов на их основе. Понятия могут характеризоваться большим или меньшим уровнем абстрактности (сложности связи понятия с объектами или явлениями реального мира), эмоциональной или ценностной оценки, и т.д. Для нас важно то, что в процессе интерпретации информации мозг конструирует многослойную структуру, которая представляет собой набор понятий и связей между ними (кстати, такая структура, в свою очередь, является информационным сообщением, которое мозг создал для себя самого, но может, при необходимости, транслировать наружу). Этот процесс и приводит к преобразованию информации в знания.

Принципы построения информационных моделей

В этом разделе и далее мы сосредоточимся на процессе создания информационных моделей. Под информационной моделью будем понимать концептуализированное представление информации о какой-либо области реальности, представленное в электронном виде. Таким образом, мы будем одновременно рассматривать процессы построения мысленной (концептуальной) модели, и ее воплощения в электронной форме в соответствии с методикой онтологического моделирования. Словом «концептуальный» мы хотим подчеркнуть тот факт, что модель строится при помощи понятийного аппарата.

Проследим процесс формирования подобных структур на примере. Пусть человек смотрит на следующую картинку:

Пример информационного сообщения
Рис. 1. Пример информационного сообщения

Первым делом человек выделяет основные объекты, представленные на изображении, и дает определения каждому из них: человек, собака, человек. Этот процесс можно назвать концептуализацией: для каждого объекта мы подобрали концепт (понятие), который соответствует ему в нашей картине мира. Таким образом, мы установили соответствие между уже имевшимся у нас понятием, и мысленным образом конкретного предмета, возникшего у нас при восприятии изображения.

Понятия используются для группировки сущностей, однородных в определенном отношении, например – обладающих некоторым набором признаков. Так, собака для нас – четвероногое животное, имеющее определенную форму и пропорции тела, морды, ушей и т.д. Таким образом, можно сказать, что концепт «собака» соответствует классу объектов реального мира. Принадлежность конкретного объекта к классу позволяет нам автоматически наделить объект некоторыми свойствами, которые могут явно не содержаться в интерпретируемом сообщении: так, мы знаем, что собака может укусить, бегает быстрее человека, и т.д. Таким образом, в процессе восприятия ситуации человек использует уже имеющиеся у него знания для того, чтобы вписать смысл нового информационного сообщения в общую структуру имеющихся знаний. Благодаря этому, сообщение обретает субъективный (прошедший сквозь призму личного опыта) смысл, и образует новые знания субъекта.

Вернемся к процессу восприятия. Выделив и классифицировав объекты, человек оценивает отношения, в которых они находятся. Очевидно, что собака сторожит человека, изображенного слева: если он попробует сбежать, собака его задержит. На основании внешнего вида собаки мы отнесли ее к классу служебных собак, которые, как нам известно, способны на такие действия. Человек слева кажется нам похожим на подозреваемого в преступлении, а поза собаки, и держащий ее на поводке кинолог, подкрепляют сделанный вывод. На этом шаге мы перешли к более высокому уровню концептуализации: от предметных понятий (человек, собака) мы перешли к функциональным (служебная собака, подозреваемый). Развивая рассуждение, мы перейдем к еще более сложным понятиям, подразумевающим более высокий уровень абстракции (то есть сложности связей с объектами и событиями реального мира), таким как «преступник», «закон», «наказание». Особенность человеческого мышления состоит в том, что, используя подобные понятия, мы вешаем на объекты и явления определенные ярлыки, теряем непредвзятость и способность оценивать воспринимаемую картину в целом. Это может показаться печальным, но такая особенность является одним из приемов адаптации к окружающей среде – без этого человек просто утонул бы в бесконечном осознании множества воспринимаемых образов.

Вся воспринимаемая информация проходит также сквозь призму эмоциональной сферы человека, на состояние которой влияют как физиологические, так и психические факторы. В результате мысленная модель, сложившаяся у случайного наблюдателя при восприятии сцены, изображенной на рис. 1, может получиться примерно такой:

Результат интерпретации информационного сообщения
Рис. 2. Результат интерпретации информационного сообщения

Очевидно, однако, что на приведенном на рис. 1 изображении никаких сведений о "преступниках" и "подозреваемых" не содержится. Просто в процессе интерпретации изображения мы задействовали уже существовавшие в нашей голове понятийные структуры и правила построения логических выводов, применив их для описания наблюдаемой ситуации.

В результате мы построили мысленную модель этой ситуации. Модель – это информационное представление какой-либо совокупности объектов и явлений реального мира, характеризующееся:

  • Упрощением – в модели представлена информация не обо всех чертах рассматриваемого фрагмента реальности, а только о тех, которые существенны с прагматической точки зрения;
  • Концептуализированностью – каждый объект, явление, свойство классифицированы при помощи абстрактных понятий;
  • Взаимосвязанностью – все элементы модели связаны между собой;
  • Наличием логических правил взаимодействия элементов;
  • Прогностическим потенциалом – мы можем выполнить мысленный эксперимент, внеся в модель те или иные параметры или события, и при помощи указанных выше логических правил сделать вывод о том, что произойдет в том или ином случае (например, если человек попытается сбежать – кинолог спустит собаку, и собака задержит подозреваемого).

Прогностический потенциал и обеспечивает прагматику (практический смысл) создания модели. Однако очевидно, что степень достоверности выводов, которые мы можем получить в ходе мысленного эксперимента на модели, напрямую зависит от того, насколько качественной будет эта модель. «Качество» модели – многогранное понятие, включающее как степень достоверности и правомерности допущений, сделанных нами при построении модели, так и корректность самого понятийного аппарата. Для глубокого знакомства с этой темой рекомендуем следующие книги:
1. Sowa J. F. Knowledge representation. Logical, philosophical and computational foundations. Brooks/Cole, 2000
2. Partridge, Chris. Business Objects: Re-Engineering for Re-Use [2nd Edition], BORO Centre, 2005
3. West Matthew. Developing High Quality Data Models. Elsevier, 2011
К сожалению, на русский язык ни одна из этих книг не переведена.

Отметим, что приводимые в классических учебниках подходы при практическом применении следует оценивать еще и с экономической точки зрения: более «правильная» информационная модель может потребовать слишком больших затрат на создание, поддержку, получение логических выводов. Задача оптимальной организации процесса моделирования состоит в том, чтобы обеспечить приемлемый уровень достоверности результата при минимальных затратах на его достижение.

Задача компьютерных технологий состоит в том, чтобы облегчить человеку процесс мышления. Значит, мы должны чуть более детально рассмотреть структуру таких процессов, чтобы понять, как можно их частично реализовать в электронном виде. Таким образом, мы перейдем от рассмотрения мысленного моделирования к моделированию средствами информационных технологий. При этом нас будет интересовать целенаправленное построение моделей, предназначенных для решения тех или иных практических задач, и одна конкретная методология формализации таких моделей, которую можно воплотить при помощи существующего сегодня стека семантических технологий.

Следующий раздел: Процесс онтологического моделирования