X2RL: попытка MIT создать новый стандарт представления регуляторных данных
Вышел очередной отчёт лаборатории вычислительного права MIT: Drafting X2RL: A Semantic Regulatory Machine-Readable Format. Исследователи MIT вводят новый формат представления регуляторных данных: X2RL (eXtensible Regulatory Reporting Language), с попыткой преодолеть ограничения существующих в Штатах и для американского контекста (в Европе иные) синтаксических форматов USLM и Akoma Ntoso.
Главные цели определены так:
- Богатые метаданные, касающиеся содержания, целей, сферы охвата и значения законодательных и нормативных документов.
- Глубина внешней структуры, связывающей документы.
- Эффективный формат обмена данными для снижения затрат на машинное чтение и потребление.
В отчёте выражается понимание, что чисто синтаксических форматов обмена данными для развития отрасли недостаточно. Нужны семантические расширения (в целях это фигурирует как «внешняя структура» в отличии от «синтаксической» внутренней.) Для этого разработчики X2RL прорабатывают активное использование мета-информации: атрибутов юридических положений-формул (provisions) и их связности. Для этого созданы средства их объектной фиксации, в качестве формата текстовой репрезентации выбран XML.
Развивать средства представления — дело хорошее. Но данный формат, при всех доброкачественных устремлениях, пока представляется очень промежуточным звеном, если рассматривать всю текущую и перспективную эволюцию в оптике моделе-ориентированного права.
Например, характеристический пассаж, где авторы в поисках формата представления критикуют JSON: «В JSON отсутствует встроенное понятие атрибутов, что затрудняет различение собственно контента от метаданных.» (И склоняются с старому недоброму XML) Чем больше я думаю над темой представления данных, тем больше вижу, что данное различение на синтаксическом уровне как раз будет мешать. Различение эдо- (данного) и мета- (стоящего выше данного по уровню параметрического абстрагирования) уровней важно, но слишком динамично, чтобы загонять его в базовый синтаксис. По моим субъективным оценкам, основанным на опыте из инженерных практик, такой подход приведёт к потере гибкости и к увеличению стоимости масштабирования достаточно быстро.
В целом, хотя традиционный документо-основанный (document-based) подход всё равно остаётся нетронут — революции не предвидится и стандарт пытается не слишком нарушать текущий статус-кво. предлагаемые нововведения пытаются повысить гранулярность управляемого контента, переходя от документов к «положениям». Вводится ключевой синтаксический класс , вокруг чего строится граф связей.
Как часто или даже всегда бывает с объективистским подходом, нарезанию объектов до атомарного уровня уделяется всё время, тогда как связи остаются «гражданами второго сорта». А именно они и начинают составлять основную массу, тёмную материю онтологической вселенной, когда количество объектов растёт в геометрической прогрессии, а число взаимодействий между — экспоненциально. Для объективистского зрения эта главная масса остаётся по большей части слепой или плохоуправляемой зоной. X2RL этой ловушки не избежит.