Зима и лето в европейских исследованиях правовых вычислительных онтологий
В период с середины 1990-ых и где-то по начало 2010-ых институты Европейского Союза финансировали несколько попыток формализовать законотворчество и обмен правовой информацией, включая проекты по созданию опорной онтологии права, как базиса для обмена правовой информацией на семантическом уровне.
Стандарты синтаксического уровня (как нарезать текст законов на блоки, связывать их квалифицированными ссылками, складировать всё это в XML и БД) разрабатывались параллельно, в разных странах и в ассортименте. MetaLex В Голландии, LexDania понятно откуда, CHLexML в Швейцарии, NormeinRete в Италии и пр. Голландская школа, наверно, наиболее сильная в Европе, потому не удивительно, что CEN MetaLex стал пан-Европейской инициативой, вкупе со стандартом XML4EP Европейского Парламента поддерживая проект по доступу к праву EUR-LEX . Всё это шло одновременно с американскими, австралийскими разработками и даже одном ООНовским-африканским проектом Akoma Ntoso Project — United Nations for Pan-African Parliaments. Одновременно, мировой консорциум открытых стандартов OASIS разработал LegalXML с ещё большим размахом и амбицией. Стандартизация синтаксического уровня проще в понимании, разработке и имплементации, потому эти стандарты были внедрены. Хотя сейчас сложно сказать как, где и какой стандарт используется во всём разнообразии активностей европейской бюрократии. Еврокомиссия использует CEN Metalex и менее специфичные стандарты вроде SKOS.
С семантикой (как узреть в отрывках текста нечто, имеющее отношение к миру) всё оказалось несколько сложнее, чем с синтаксическими структурами. Нулевые можно считать периодом расцвета онтологической работы в праве, её золотым веком или «онтологическим летом» AI & Law. Продвижение собственно онторазработок требовало более широкого видения и мышление выходило за рамки онтометодов права, с интересными результатами. Хукстра и Брюкер так заявляли в «Epistemology and ontology in core ontologies, exemplified by FOLaw and LRI-Core» от 2004: «However, this is not an ontology … This is an EPISTEMOLOGICAL FRAMEWORK».
Мегапроект нескольких европейских университетов под началом Leibniz Center for Law, собравший весь цвет европейских онтологов вычислительного права (Sartor, Hoekstra, Breuker, Boer, Palmirani etc) под названием Estrella Project длился с 2004-го по 2008-ой год и выдал на гора самый существенный на данный момент результат в этом поле — онтологию LKIF (Legal Knowledge Interchange Format). Один из ключевых разработчиков, Rinke Hoekstra, который сейчас занимает позицию с восхитительным наименованием Chief Scientist for Knowledge Representation в компании Elsevier, поддерживал репозитарий OWL-моделей LKIF-core вплоть до 2011 года.
Потом часть разработчиков LKIF-Core (Palmirani, Governatori) ушли в OASIS, стартовав и поныне здравствующий проект LegalRuleML, который в какой-то мере можно считать наследником первого. LegalRuleML (Palmirani et al. LegalRuleML Core Specifications. 2015) — это язык обмена правилами, который расширяет более общий язык разметки правил RuleML функциями, специфичными для юридической области. LegalRuleML не является правовой онтологией в чистом виде, но требует определённого вида онтологизации (предлагается верхняя онтология в виде групп Node elements, Edge elements) для исполнения правил. Ноды здесь не имеют самостоятельного смысла, как в «чистых» онтологиях, но нужны только для связывания групп правил. LegalRuleML ориентирован на нормативный вывод (normative reasoning) или reasoning about the law по определению Праккена и Сартора (Prakken H., Sartor G. — Law and Logic. a Review from an Argumentation Perspective. 2015), что противопоставляется каузальному выводу (causal reasoning) или reasoning with the law. Т.е. объектами вывода являются не сущности и отношения деятельного мира, а регулирующие деятельность правовые нормы и атрибуты контекста (юрисдикции, версии норм, изоморфизмы с формулами естественного языка и пр.) в аппарате defeasible logic.
Начало 2010-ых можно считать закатом онтологического лета. В 2011-ом Сартор & Co публикуют монументальный альманах «Approaches to Legal Ontologies», который можно считать подведением черты под всем периодом активных онтологических разработок в Европе. В более свежих статьях на близкие к правовым онтологиям темы все специфичные ссылки ведут к работам не позднее 2011-го года. Впрочем, нигде в остальном мире никаких иных разработок сравнимого характера не происходило вовсе. В программной статье альманаха авторы констатируют: «В настоящее время создано более шестидесяти юридических онтологий. … Однако немногие из этих онтологий вышли за пределы стадии усовершенствованных и улучшенных прототипов, даже из числа масштабируемых и готовых к повторному использованию.» (Casanovas et al, Theory and Methodology in Legal Ontology Engineering: Experiences and Future Directions). Я пока не встречал рефлексии от участников процесса на тему почему онтологическое лето закончилось и в чем состоят причины, которые привели к такой ситуации. Предположу, что оптимизм угас в момент, когда «усовершенствованные прототипы» столкнулись с ситуациями неакадемического, нелабораторного характера, обнажающие суммарную энергоэффективность метода. Это проблемы, общие для всех онтологий. Онтологическая инженерия в правовой сфере в первую очередь будет страдать от ограничений объективистского характера.
Интересно, как описывают свои проблемы разработчики LKIF (Breuker J. et al — OWL Ontology of Basic Legal Concepts (LKIF-Core) Deliverable 1.4. 2007):
В консорциум Estrella входили представители трех видов экспертов. Каждого партнера попросили представить «топ-20» юридических концепций. В сочетании с терминами, которые мы собрали из литературы (юриспруденция и юридические учебники), мы получили список из 250 терминов. Поскольку такое число является неуправляемым в качестве базового набора для моделирования, мы попросили партнеров оценить каждый термин из этого списка по ряду шкал. …
Эти 50 терминов плюс те, которые повторно используются в LRI-Core (см. Раздел 4.2), стали начальным набором для представления онтологии LKIF-Core.
Моё выделение показывает, что уже пара сотен терминов являются существенной проблемой для управляемости онтологии с точки зрения человека. Доступные данные по немногим другим проектам (Hafner’s «Semantic Network of Legal Concepts», Casellas et al «Ontology Of professional judicial knowledge», единичный эксперимент Ворониной и Пигалковой в моделировании российского права) показывают, две сотни классов — это некоторый предел в онтодизайне. Возможно, связан всё с тем же числом Данбара и является когнитивным ограничением. Несмотря на первоначальное урезание, LKIF-Core v.1.1, последняя на данный момент версия онтологии, датированная 2008-ым годом, содержит 209 классов и около 3.5 тысяч иных концептуальных объектов (свойства и аксиомы OWL).
Но очевидно, что для адекватного представления сколь-нибудь развитого правового и деятельностного поля в сколь-нибудь достаточной точности нужны онтологии с числом онтоконструктов, большим на порядки. Это не просто неуправляемая, это невозможная с практической точки зрения онтологическая модель, если мы остаёмся в традиционной эпистемологической канве, с объективистским взглядом на мир. Действие-центричные онтологии разрабатываются с учётом этой проблемы и с учётом коннекционистских архитектур и гибридных методов представления знания.