Онтологизация, управляемая когнитивной архитектурой, и действие-центричные онтологии

Расшифровка выступления на семинаре AGI-Russia 20 марта 2025 г.

Связанные ссылки

Слайды

1 / 16

Доклад: проблема, протокол и опорная архитектура

Антон Колонин:
Коллеги, всем добрый вечер. Начинаем очередной семинар русскоязычного сообщества разработчиков общего, сильного, великого и могучего искусственного интеллекта. У нас в гостях Егор Чурилов. Он расскажет про онтологизацию, когнитивную архитектуру и действие-центричные онтологии. Егор, пожалуйста.

Егор Чурилов:
Спасибо. Всех приветствую. Меня зовут Егор Чурилов, я разработчик, архитектор программного обеспечения и инженерный менеджер, скажем так, в дневной жизни. В ночной жизни уже пару десятков лет провожу исследования в сфере, которую можно очертить как когнитивная архитектура, архитектура знания, ну и ещё масса синонимов, которые вы прекрасно знаете и которые здесь как-то пересекаются.

Сегодняшнее изложение буду строить по следующему плану. Постараюсь делать всё на доске, на холсте, который помогает с когнитивными архитектурами и с их конструированием. Тут могут быть некоторые заминки, потому что я только его осваиваю. Но структура изложения такова.

Я постараюсь быть очень кратким, потому что тема непростая. Лучше давать схематичные, быстрые прототипы, такие MVP в инженерном стиле, которые, может быть, где-то кривоваты, но более или менее целостно отражают целевую систему, о которой я хочу рассказать. Многих подробностей, конечно, сразу дать нельзя, и я их сознательно буду обходить. Все вопросы тоже невозможно осветить: что-то повиснет, что-то будет возмущать, что-то потребует объяснений. Я надеюсь, что со временем на эту структуру нарастёт мясо.

Не буду делать и длинного введения, потому что вся теория, которую я сейчас пытаюсь изложить, является частью более крупного теоретического фреймворка, который я называю управляемой эпистемологией. Собственно, это и есть предмет разработок. Это теоретическая база с претензией. В нашем замечательном сообществе теорией без претензий никого не удивишь, можно только зевоту вызвать, но тут из песни слова не выкинешь. Управляемая эпистемология тоже содержит фундаментальную претензию, только не на теорию всего, а на определённый протокол управления знанием.

Тем не менее из того, что будет изложено, хотя я постарался заузить тему, будут проглядывать более широкие следствия. Наверное, в конце затронем и какие-то фундаментальные проблемы, которые УЭ либо снимает, либо претендует снять, либо некоторым образом решает. На этом введение, пожалуй, закончу.

Первая глава — проблема и подход к решению. Я вижу здесь две задачи, как и следует из заглавия. Первая — представить метод онтологизации определённого характера, со специфическим заземлением. Вторая — показать, как этот метод может помочь управлять объектно-центричными и действие-центричными онтологиями: что это такое, как они работают и в чём польза по сравнению с современными подходами.

В рамках моего изложения я даю не то чтобы определение, я не хотел бы претендовать на энциклопедическую точность. Это локальная формула, которая позволит нам продвигаться дальше и некоторые узлы развязать. Онтологизация, как я её хочу здесь представить, — это метод снижения неопределённости при принятии решений посредством особых протоколов межагентской коммуникации. То есть у нас есть какой-то социум агентов, они между собой общаются, и у них есть задача снижать неопределённость при принятии решений и выполнении своих агентских практик.

Опять же, вопросы, откуда всё это взялось и куда везёт, несомненно, есть, но давайте двигаться дальше по схеме. Каким образом работает этот протокол онтологизации? Я вижу здесь два архитектурных слоя. Первый слой протокола — это обеспечение коммуникации, где содержится вся онтоконструктивная снасть: некоторые конструкты, например языковые метки или квадратики, стрелочки, какой-то синтаксис, позволяющий нам обмениваться онтологическим знанием. Второй слой — это обеспечение дисциплины этого протокола: как мы дисциплинируем все эти синтаксисы так, чтобы они хотя бы что-то значили и чтобы порядок их использования в рамках агентского социума был скоррелирован, то есть чтобы наши агентские практики, основанные на разделяемом знании, были устойчивы.

Сейчас распространённый стек OWL и вся масса мейнстримных онтологий строится как оснастка онтоконструктов, главным образом взятых из языка. Мы берём существительные, группы существительных, прилагательные, реже более сложные формулы. Во-первых, они берутся из исторически сложившегося языка — русского, английского, чаще всего английского. Во-вторых, они заземляются, потому что так эволюционно сложилось и так мы привыкли, в объектно-феноменологическом контенте, который является нашей главной эпистемической оснасткой. То есть как агенты и пользователи онтологии мы интерпретируем всё это именно в объектном ключе.

Дисциплина протокола, которую мы используем для онтологической работы, — это формализмы, основанные на низкоразмерных синтаксисах. Что я имею в виду? То, сколько модификаторов мы можем применить к отдельному символу, очень невелико. Наши синтаксисы, наши формулы ограничены некоторым пространством: линейностью построения, окололинейностью, полутора-мерностью, которые потом некоторым образом стыкуются и так далее.

Именно здесь я вижу две главные проблемы. Первая — ограничение языка и объективистской эпистемы. Я уже много раз в группе высказывался и некоторые статьи на эту тему писал. Наш человеческий разум вырос из животного выживания, из животных практик в саванне, где трёхмерный или четырёхмерный мир является основной схемой выживания. Но когда человек перешёл в более сложный социальный и социотехногенный мир, этот мир стал гораздо более высокоразмерным, а объектные схемы начали работать чрезвычайно плохо. Мы это видим во множестве эпизодов науки и социальной жизни: применение привычных объектных схем, попытки найти твёрдые объекты и твёрдые основания в распределённой, высокоскоростной, динамичной среде рушатся. Эти протоколы неустойчивы. И язык, который эту коммуникацию обслуживает, тоже оказывается бутылочным горлышком.

Вторая проблема связана с дисциплиной протокола — это ограничения метаформализма. Экзокортекс, то есть наша способность дисциплинировать протокол, вырос на основании записей на стенах пещеры. Мы берём плоскость, видим её глазами, наносим на неё знаки рукой. Этот цикл помогает нам обмениваться данными и фиксировать слепки нашего сознания, нашего состояния на внешнем носителе: расширять память, обмениваться, расширять память на группу. И вот этот полутора- или двумерный экзокортекс мы используем тысячи лет. Мы превратили его в электронные доски и электронную бумагу, но по-прежнему пишем строчки, по-прежнему пытаемся разворачивать их в двумерные рисунки, и не более того. Это серьёзное ограничение для репрезентации знания и принятия решений в многомерном мире, в котором мы существуем.

Собственно, с этим надо что-то делать. Мы, конечно, уже начали что-то делать как люди. То, что называется искусственным интеллектом, современные LLM, большие языковые модели с миллиардами параметров, — это определённый подход к этой проблеме. Но у них есть свои сложности, а мой подход в этом плане несколько иной: где-то дополняющий, где-то альтернативный.

Вкратце решение предлагается такое. Для структуры обеспечения вводятся синтаксисы — на данный момент не так важно, какие именно, это вариативная часть, — заземлённые в многомасштабных паттернах. Это специфическая структура, о которой я буду рассказывать. У нас сохраняется синтаксическая структура, возможно, какие-то метки, даже языковые метки, но они являются ссылками на многомасштабные паттерны, а не на физический мир в знаменитой схеме physical symbol system.

Симулятор межагентской коммуникации

Егор Чурилов:
Вторая архитектурная часть — это симулятор межагентской коммуникации, который, собственно, и предоставляет эти срезы, многомасштабные паттерны для заземления в синтаксисах. То есть частные состояния, многомасштабные паттерны для частного состояния группы когнитивных архитектур. Эти частные срезы заземляются в некотором синтаксисе. На этом первую главу можно завершить.

Дальше — самая интересная глава, наверное: опорная когнитивная архитектура и агентная модель. Здесь я попытаюсь в реальном времени сконструировать вместе с вами эту модель, отрисовать её и параллельно объяснить, как всё работает.

Начнём с простой, понятной и известной из очень разных дисциплин модели агента. Она простая: вход-выход, вход-выход. Здесь можно вспомнить теорию функциональных систем: процессор, сенсорный вход, сенсорный порт, моторный порт.

Это мой моторный порт. Это базовая модель, погружённая в среду. Наша когнитивная архитектура является особым случаем того, что называется embedded cognitive architectures, то есть архитектурой, воплощённой или размещённой в среде. Это существенный момент для эволюции. Можно вспомнить Варелу и Матура́ну с их аутопоэзисом.

Здесь есть какое-то обучение с подкреплением, которое выстраивает внутреннюю структуру. Концептуально у нас есть то, что я хочу определить как реактивную магистраль — направление прохождения сигнала от сенсорного порта к моторному, с некоторым преобразованием. И важно, что по направлению этой магистрали происходит снижение разнообразия.

Этот момент может вызывать частные споры, но в рамках подхода я бы хотел его зафиксировать. Разнообразие сенсора намного больше, чем разнообразие мотора. Да, возможны возражения, что один маленький сигнал может здесь породить огромное разнообразие. Эти вещи можно обсуждать, но не будем сейчас на них останавливаться: в модели они некоторым образом учтены. Важно, что здесь происходит искомое снижение разнообразия. Это одна из фундаментальных установок процессора. А можно и обобщить: любое существо, сознательное или, возможно, даже несознательное, — это аппарат для снижения разнообразия. Можно вспомнить древнегреческие представления о том, что мир — это превращение хаоса в космос, то есть в порядок. Это первая философская сущность, первое онтологическое следствие или предпосылка этого подхода.

То есть мы выполняем снижение разнообразия некоторым образом. Задача живого существа, которое мы моделируем, — выполнить полезную работу: действия, ведущие к выживанию, к опережению в социальной среде, к победе над другими особями, либо к какому-то ароморфозу, например к стыковке в социуме для создания суперструктур. Пока я не буду этого касаться. Это группа целей, которая в данный момент вне рассмотрения.

На самом деле у каждого агента, у каждой когнитивной архитектуры есть нормативное, ограниченное, пусть и большое, количество моторов, моторных портов. У них есть идентичность, они могут быть чётко идентифицированы. То же касается сенсоров. Мы можем их перечислить и более или менее детерминированно предсказать вход и выход.

Дальше погружаемся внутрь агента. Внутри него есть, схематично говоря, какие-то цепи снижения разнообразия — точнее, такие переходы, когда некоторая группа, некоторый фронт активации переходит в следующий фронт активации. Я назову это импульсной сетью. Возможно, это не вполне согласуется с классическим понятием импульсных нейросетей, но интуиция именно такая. У нас много фронтов активации, они активируются в определённой, детерминированной последовательности, и они квантованы. То есть это импульсная сеть с начала до конца. У каждого такого состояния есть координаты. У этих связей есть своя природа, зависящая от выбора когнитивной архитектуры. Но вообще, если говорить, что такое архитектура, это разведение постоянного и переменного, функционального и структурного, и всего, что необходимо. Эта когнитивная архитектура разводит фиксированные позиции, которые мы точно знаем как фиксированные в рамках данной архитектуры, и состояние этих позиций. Оно может быть бинарным — активировано или не активировано. Либо более сложным, например в виде какого-то числа. Это уже выбор инженеров в конкретной реализации. Но общая структура разведена именно таким образом.

Далее. Вся работа агента по выживанию в среде приводит к тому, что сеть усложняется. Как именно это происходит, я здесь конструктивно не учитываю. В ней появляется масса специфических направлений реактивной магистрали, отдельные схемы, которые можно назвать сценариями: моторными или реактивными сценариями.

Нейрофизиологи, как многие могут знать, ещё сто лет назад, изучая животных, изучали реакции и рефлексы. У них было понятие торможения: когда рефлекс проявляется не сразу, а происходит его торможение. Собственно, высшая нервная деятельность — это и есть такое торможение, способность управлять рефлексами. Возникает некоторое торможение, то есть усложнение поведения, и это усложнение поведения дифференцирует внутреннюю структуру. Мы можем выделять сегменты прохождения сигнала, которые отделяются от других. Происходит сегментация.

Дальше. Так как агент сразу находится в социуме, ему нужно каким-то образом коммуницировать. Коммуникация — это, по сути, такие же структуры импульсной сети, но более или менее специализированные. Я здесь рисую отдельный блок, хотя нужно понимать, что он нарастает над главной магистралью. Базис моторных портов в рамках текущей структуры воплощения не меняется, а вот коммуникативная среда возникает как надстройка. Для краткости, чтобы не рисовать каждый раз возврат вниз, к главной магистрали, я буду обозначать это упрощённо.

Что происходит? Например, на сенсорном входе идентифицируется медведь, и группа активации находит медведя, после чего существо кричит: «Медведь!» То есть отрабатывает некоторая практика коммуникации, некоторый сценарий. Эта практика опирается на доступные средства вывода: глотку, когти для царапанья, удар хвостом — что угодно. Это моторный сценарий, но он уже работает на коммуникацию. Пока я настоятельно рекомендую воздерживаться от попыток усмотреть здесь какие-то знаки или семантики. Здесь просто набор сигналов. Это абсолютно минималистичная архитектура, она для этого и нужна.

Дальше происходит специализация сценариев. Сценариев много, ими надо управлять, а вся эта импульсная работа энергозатратна. У неё есть экономика: затухание сигналов, расходы на поддержание, на выполнение каждого сценария, более или менее необходимые. Значит, нужно решать задачу экономии. В рамках этой задачи происходит генерализация некоторых сценариев. В архитектурном плане мы говорим, что какая-то успешная часть фиксируется и, например, становится неизменной. Какая-то часть должна меняться — на уровне сенсорного сегмента или моторного сегмента. Где-то посередине происходит некоторая сборка, некое планирование. То есть сборка моторных сценариев.

И всей этой группой сценариев нужно как-то управлять: чтобы они не конфликтовали, чтобы вели себя энергоэффективно и так далее. Что происходит? Выстраивается ещё один, здесь уже почти классический, слой управления. Вариативные структуры стыкуются с определёнными структурами следующего уровня. Происходит параметризация: эти сценарии начинают управлять параметрами на главной реактивной магистрали, модифицировать управление. Возникает то, что можно очень осторожно назвать рефлексией, рефлексией над рефлексией. Мы управляем группами моторных сценариев через специфические сценарии, работающие с параметрами.

Сложность коммуникации растёт. Количество сценариев на главной реактивной магистрали растёт. Количество параметрических, рефлексивных сценариев тоже растёт. И главное: они начинают в межагентской коммуникации требовать учёта контрагентов, таких же агентов в среде. Чтобы стыковать эти планирования в агентской среде, необходима идентификация. Нужна структура, я её здесь сбоку рисую как ID, которая выделяет или параметризует сценарии, связанные с реактивной магистралью, с блоком, погружённым в среду. Это можно очень аккуратно назвать я, прото-я. Ещё раз: крайне осторожно, без поспешных философских обобщений. Пока это просто набор сигналов. Но я даю здесь зацепку.

Эта ID-структура стыкует параметрические сценарии с воплощёнными сценариями. Как отличить себя от остальных? У меня есть прямой доступ к действию. Например, моторный сценарий «бежать за косулей» может выполняться и мною, и моим соседом. Как понять, когда бежать именно мне? Тогда, когда моторные параметры связаны с ID-активацией, то есть с параметрами, выделенными в отдельный модуль. Вот это я.

И здесь надо чуть-чуть вернуться назад и уточнить, что такое неопределённость и определённость. Чтобы какой-то моторный сценарий сработал, чтобы активировался некоторый моторный порт, нам нужна полная определённость. Например, некоторый набор активаций на предыдущем фронте должен сработать, чтобы этот порт отработал, чтобы сработало некоторое end. Определённость — это когда все необходимые структуры получили нужный импульс. Всё, мотор пошёл. Как только какой-то структуре импульса не хватило, паттерн не доработал и активационный фронт не проходит, у нас ситуация неопределённости.

Потом, когда мы будем переносить это на более общие понятия и даже на философские вещи, можно будет ссылаться именно на эту структуру. Определённость — это заполнение всех параметров активации для данного конкретного моторного импульса. А задача снижения неопределённости — это выйти из сенсорного хаоса к моторному порту. Как сделать то, что нужно сделать, если ещё непонятно, что именно нужно сделать? Это и есть общая неопределённость в рамках реактивной магистрали. ID, о котором я говорил, закрывает часть этой неопределённости: фиксирует определённость относительно некоторых параметров планирования и стыковки сценариев.

Дальше. Допустим, у нас есть замечательный котик. У него великолепные моторные сценарии: он ловит мышей, вылизывается, синхронизированно взаимодействует с кошечкой и с другими котами. Но можем ли мы сказать, что он сознателен? Если у него есть вот эта штука я, если эта ID-структура присутствует, если он связывает свою моторную структуру и выходы на мышцы со своими моторными сценариями, то да, в каком-то смысле он себя идентифицирует. Другое дело, что у него, возможно, нет рефлексии я. И вот сейчас мы к этому переходим.

По мере роста сложности коммуникации, роста сложности первого рефлексивного блока, всей этой инфраструктурой нужно управлять уже на следующем уровне. Коммуникация разрастается так, что ей нужно управлять уже коммуникативными структурами. Нарастает дополнительный блок. Я здесь пишу ещё один com, коммуникатор. Их можно было бы и объединить, я просто разношу их на картинке. И здесь та же самая схема, та же самая импульсная сеть. Это уже рефлексия 2. Она так же работает с параметрами, но уже с параметрами рефлексии 1.

Задача этого блока — обслуживание коммуникации. Можно очень аккуратно провести физиологическую симметрию: рептильный мозг, маммальный мозг, неокортекс. Но это очень осторожная симметрия. Наш человеческий мозг развился как структура, обслуживающая коммуникацию. И вся сложность этой архитектурной группы сценариев, всех локальных моторных сценариев, возникает в значительной степени из-за того, что мы очень активно коммуницируем. Наши социумы давно вышли за число Данбара, за число транзакций, которое имело любое существо до нас. И сложность коммуникации колоссальна. Для неё нужна особая инфраструктура. Вот она здесь и реализована.

Почему мы говорим про абстрактный разум, про чистый разум? Потому что он изолирован от реактивной магистрали слоем рефлексии 1. Он опосредован. В этом есть и сложность, и эволюционная ценность. Почему? Эти структуры верхнего уровня относительно хорошо переносимы. Нижние структуры переносятся главным образом генетически. То есть медленно. Можно учиться, конечно, но в целом это генетика и эволюция особей в рамках стаи. Это не оперативный уровень коммуникации. Верхний уровень, рефлексия 2, — уже тактический. Здесь работа идёт гораздо быстрее. По отношению к генетической трансляции это огромный выигрыш.

Плюс возникает особая коммуникативная структура, которая обслуживает передачу сложного знания через нечто, что можно уже осторожно назвать символами. Но, опять же, я их сюда не размещаю и не хочу размещать. Здесь нет знаков и символов в сильном смысле. Это наборы активации, группы сетки, всё те же импульсные сети. Как они структурируются — вопрос к инженеру. Здесь всё те же сценарии, просто определённым образом специализированные.

Почему нет четвёртого уровня? Потому что пока для него нет функционального места. Вся эта сложная штука рефлексии 2 обслуживает коммуникацию, и в функциональном смысле она достаточно регулярна и однородна. Хотя есть предположение, что там что-то ещё нарастает и, возможно, на это указывают рассуждения про чакры, связь с божественным и так далее. Но это я сейчас трогать не буду, чтобы не перегружать картину. Оставим это интригой.

На этом и эту главу можно завершить. У нас появляется опорная структура, к которой мы ещё вернёмся.

Онтологизация как работа с многомасштабными паттернами

Егор Чурилов:
У нас есть опорная архитектура агента. Есть социум агентов. Мы размещаем такие группы агентов в некоторой среде, потому что они нам нужны для реализации протокола. Мы же занимаемся онтологизацией, а онтологизация, как мы помним, — это метод снижения неопределённости при принятии решений. Сейчас мы строим протокол. Как он строится?

Первое: мы собираем достаточно способную когнитивную архитектуру. То, что я отрисовал, — очень обобщённая структура. Там ещё много вещей, которые либо разработаны у меня не до конца, либо являются вариативными: наверняка это можно делать по-разному, с разными эффектами. Но принцип именно такой.

Для этой когнитивной архитектуры и группы агентов необходимой конфигурации определяются нормативные многомасштабные паттерны. Что такое многомасштабный паттерн? Надо вернуться к нашей схеме. Каждая группа активации в каждый конкретный момент симуляции, то есть в момент прохождения сигнала от сенсорного к моторному порту, сложна, может быть разветвлённой, но она детерминирована. Мы наблюдаем систему и можем получить некоторый срез — срез паттернов, срез этих активаций или нескольких слоёв активации. Каждая такая группа — это набор элементов, у каждого из которых есть идентификатор, координата в рамках архитектуры. Мы можем идентифицировать каждую точку и контролировать переходы. Архитектура управляемая. Это и есть многомасштабный паттерн.

Каждая такая структура в рамках опорной когнитивной архитектуры может быть идентифицирована. В рамках онтологизации, в рамках нашей конкретной задачи, мы берём общую опорную КА, определяем нормативные многомасштабные паттерны, которые нам необходимы для решения этой задачи в любой предметной области, определяем кодификаторы и конфигурацию, а затем строим репрезентацию уже на логико-коммуникативном слое с опорой на эти паттерны. То есть наши онтоконструкции, какие-то символы, могут быть какими угодно, но их граундинг другой: они ссылаются на ММП, размещённые где-то в когнитивной архитектуре.

Дальше берём начальные условия, размещаем симулятор, задаём исходное онтологическое состояние. Сейчас что мы делаем в обычном инференсе? Формируем модель в виде вопроса или базы знаний, базы фактов. Здесь то же самое, только в терминах репрезентации ММП. Выполняем симуляции, потом делаем вывод. После симуляции получается другая структура активации, другие паттерны, которые мы можем снять.

Наш запрос, грубо говоря, спрашивает: какая определённость или неопределённость будет после такой-то симуляции? Показать на пальцах эмуляцию здесь сейчас сложно, но важно следующее. Мы можем в рамках симуляции фиксировать определённость и неопределённость на каждом этапе. Собственно, это соотношение неопределённости и определённости, моторные активации на каждом фронте, и является для нас ценностью: что мы знаем, чего не знаем и в каком виде.

Фиксируя в репрезентации некоторую структуру, некоторую динамику, мы потом можем её интерпретировать. Эти два слоя — репрезентация и симуляция — позволяют нам понять, почему мы не можем оперировать непосредственно многомасштабными паттернами. Потому что это очень высокоразнообразная, высокоразмерная и сложная структура. Для нашего человеческого сознания, для онтологизирующего сознания, она не помещается в фокус внимания. Поэтому мы и используем CTP и прочие формализмы: вот эта штука влезает в фокус внимания. В этом и состоит ограничение. Слой репрезентации даёт нам малое разнообразие, а под ним — большое. Граундинг между ними позволяет выполнять сложные вычисления, а затем выбрасывать результат обратно в относительно низкоразмерную репрезентацию, которая возвращается в язык или в другую коммуникацию.

И здесь есть существенный, один из самых сложных моментов, который я хотел затронуть: ввод и вывод. Это узкое место и для этого протокола, и тем более для существующих формализмов. Почему? Все прекрасно знают, что существует огромное количество прекрасных теорий, логик, формальных и вычислительных методов: эпистемические логики, дескриптивные логики и так далее. Они доказывают внутри себя теоремы, непротиворечивость, способность что-то фиксировать и обрабатывать. Но ввод в них чрезвычайно дорогой. Пара человек понимает, как это устроено, и может практически заложить это в структуру. Это очень дорогой процесс. Стоимость ввода нивелирует ценность модели, если она вообще есть.

Данный подход не избавлен от сложности ввода и вывода, но моя гипотеза состоит в том, что расходы будут как минимум не выше, а возможно, ниже. При этом мы можем выиграть в выразительности и управляемости моделей за счёт того, что не ограничены карандашно-бумажным синтаксисом. У нас уже есть более развитые экзокортексы, системы ввода, в том числе и LLM, которые избавляют нас от необходимости вручную печатать линейные строки, чтобы сообщить всю нужную информацию. Мы можем использовать экзокортексы другой размерности и другой способности. Тогда импеданс между репрезентацией, дисциплинирующей когнитивной архитектурой, и этим высокоразмерным экзокортексом будет меньше.

На этом третья глава тоже закончена.

Объектно-центричная и действие-центричная онтологизация

Егор Чурилов:
Если мы имеем эту архитектуру, где есть исключительно наборы сигналов, наборы импульсов и больше ничего, то дальше мы интерпретируем её определённым образом в рамках фреймворка управляемой эпистемологии. И сейчас я показываю, как в этой рамке собирается такая штука, как объект.

Сразу оговорюсь: здесь большая сложная омонимия. Слово объект я хочу брать в кавычки. В рамках этой структуры мы можем выделить класс многомасштабных паттернов и назвать его объектом. А другой класс назвать концептом. В чём разница и зачем она нужна?

Объект в рамках представлений УЭ — это некоторая структура с низкой моторной неопределённостью. У объектов координаты и их устойчивая переносимая структура имеют низкую неопределённость. Параметрические блоки, влияющие на моторный сценарий, фиксированы. Например, объект «кружка номер 115». Для интерпретирующего, то есть для пользователя соответствующей метки и ссылки на объект, некоторый протокол идентификации позволяет по этой метке найти эту кружку на складе. Конфигурация моторного действия здесь фиксирована и разрешена, поэтому мы можем выполнять моторный сценарий на основании этого конструкта.

Как используется понятие объекта вне управляемой эпистемологии — это отдельный вопрос: там огромное количество интерпретаций, омонимов, под объектом называют и классы, и кластеры, и что угодно. Я сейчас этого касаться не хочу. Для нашей модели важно лишь то, что всё это может быть представлено некоторой структурой, некоторым многомасштабным паттерном.

Концепт — это, наоборот, структура с высокой моторной неопределённостью, зато хорошо переносимая. Она абстрагирована: из неё удалена определённость, которая фиксирует нас на главной реактивной магистрали. Нам эта магистраль не нужна, когда мы обмениваемся концептуальным знанием. Почему? Потому что концептуальное знание специализируется уже в конкретной сенсомоторной ситуации. Мы опускаем его обратно в среду и там специализируем в объекты, то есть заполняем неопределённость уже конкретными параметрами текущей ситуации. Концепт — это переносимая модель. Она менее определена и менее привязана к моторике, хотя на самом деле процедуры стыковки спектров и паттернов там довольно сложны.

Теперь что такое объектно-центричная и действие-центричная онтологизация? Когда мы занимаемся общей онтологизацией, в некоторый момент вычисления нашего поведения мы говорим: это надо как-то концептуализировать. Мы делаем срез, и он улетает выше, в коммуникацию или во внутренний процессинг высших рефлексивных уровней. Эта структура — достаточно устойчивые паттерны, которые активируются, уходят и потом возвращаются обратно — выстраивается от сенсоров.

Если мы посмотрим с этой стороны, со стороны сенсорного входа, то увидим примерно то, как строятся фреймовые онтологии. Давайте соберём данные. Что такое данные? Это какой-то более или менее сырой сенсорный ввод. Какие-то свойства, характеристики. Потом мы упаковываем их в объект. То есть срабатывают паттерны объективации. Здесь сидит вопрос о цельности, эти многовековые страдания о целостности. На самом деле это вопрос о наличии паттернов объектной сборки. Когда их нет, у нас высокая неопределённость, структуры внимания не собираются. Нет редукции неопределённости, с которой удобно работать. Искомая целостность активации не возникает. Когда же она возникает, у нас происходит такой моторный инсайт, вспышка, которая доходит до моторного порта или следующего слоя.

Объектно-центричная онтологизация — это сборка сенсорного разнообразия, его сужение до компактной репрезентации того, что мы называем объектом или концептом, который затем переносим. Проблема в том, что эта редукция, во-первых, высоковариативна. Здесь огромное разнообразие. Как получить конкретную репрезентацию, ещё и упаковать её в маленькую компактную метку? Даже относительно стабильная штука вроде табуретки представлена в огромном количестве сенсорных паттернов в зависимости от ситуации. То, что мы эту неопределённость как-то разрешаем, — это уже наши навыки, наработанные за столетия и тысячелетия. Сборка объектно-центричных онтологий идёт отсюда, с сенсорной стороны.

Действие-центричная онтологизация предлагает другой путь. Она тоже пытается быстрее снижать неопределённость, необходимую для принятия решения, и при этом оставаться устойчивой. В этой схеме довольно очевидно, что можно идти с другой стороны — не от сенсорного базиса, а от моторного. Как мы помним из нашего постулата, моторное разнообразие гораздо меньше. Соответственно, проекция любого концепта — может быть, не любого объекта, но любого концепта, с которым мы в основном работаем, — на моторном базисе будет гораздо более компактной. Если идти отсюда, от вопроса «что делать?», то эта проекция будет гораздо компактнее и быстрее разрешаться в конкретной моторике.

На самом деле эта интуиция не так уж нова. Когда мы решаем какую-то задачу, практичный человек говорит: хватит мне рассказывать, что есть, скажи, что нужно делать. Мы пытаемся сразу зафиксировать определённость, максимально приближенную к моторному порту. Что нужно сделать? Первое, второе, третье. А дальше уже продвигаемся обратно. И затем на основании моторных параметров собираются и концепты, и далее объекты. Конечно, здесь есть обратная сложность. Собрать конкретные объекты сенсорно из моторного базиса так же сложно, как и в обратном направлении пройти от сенсорного поля к моторному концу. Но в конкретных случаях это может быть проще.

В моей практике это подход, который я уже довольно давно пытаюсь отрабатывать. У нас был проект по заказу Центрального банка Республики Беларусь. Мы делали исследование по цифровым валютам центральных банков. Была поставлена задача оценить, что для Республики Беларусь означает внедрение цифровой валюты центрального банка. Задача, мягко говоря, нетривиальная. И она была решена именно с помощью действие-центричной онтологизации.

Для меня это был великолепный опыт — в том числе и возможность сравнить этот подход с остальными не только по качеству модели как таковой, но прежде всего по её стоимости. Бюджет был чрезвычайно низкий, квалификация персонала — обычные люди с высшим образованием, не более того. И при этом мы сделали, на мой взгляд, очень полезную модель. Она есть в публичном доступе, её можно проанализировать. Метод там тоже описан, пусть довольно криво и коротко, но описан в записке отдельным образом.

Ещё раз подытожу. Действие-центричная онтологизация — это сборка концептной и объектной модели на основании моторного базиса когнитивной архитектуры, в отличие от объектно-центричной модели, где сборка идёт с сенсорного базиса. Эти два подхода могут и должны комбинироваться. Но в доменах с высоким разнообразием, там, где особенно выражена концептуальная составляющая, действие-центричная онтологизация, на мой взгляд, будет более эффективной.

Я пытался применять это и в области вычислительного права, в онтологизации права. Там, где традиционные объектно-центричные онтологии официально потерпели поражение. У меня есть статья на Anticomplexity про зиму и лето правовых онтологий. В 2011 году был выпущен альманах группы европейских товарищей, где они подытоживали более чем двадцатилетнюю работу в этой области, записали туда всё, что могли, и сказали: больше ничего не можем. И по сути работа там остановилась. Сейчас всё, что я вижу, — это надежда на большие языковые модели. Но тут свои нюансы, о которых мы все прекрасно знаем.

На мой взгляд, относительно компактные модели могут позволить собирать управляемые, компактные, детерминированные онтологии и выполнять детерминированный вывод гораздо дешевле.

Глава четвёртая тоже на этом закончена. И, наверное, это всё, что я хотел сказать в рамках этой итерации. Спасибо. Можем переходить к вопросам, если таковые есть.

Вопросы о рефлексии, знании и интерпретации

Антон Колонин:
Почему вы про рефлексию с осторожностью готовы говорить?

Егор Чурилов:
Я всё тренировался сказать это в первых строках, но забыл. Все термины здесь расположены именно в пространстве управляемой эпистемологии. Я не хочу сильно оригинальничать, чтобы быть понятным, но интерпретация таких понятий, как знание и собственно эпистемология, отличается от общепринятой. И рефлексия интерпретируется несколько иначе, чем, например, в психологии или в каких-то областях когнитивистики. Посыл здесь в том, чтобы осторожно относиться к этим семантикам и пытаться извлекать смысл из текущего контекста, а не привлекать привычные традиционные значения. Хотя, опять же, я стараюсь быть понятным.

Насчёт знания. Стоит, наверное, упомянуть знаменитый треугольник: субъект, объект и knowledge, где где-то расположены эпистемология, гносеология, психология и так далее. Моя интерпретация знания совершенно не про это. Я этот треугольник полностью отбрасываю, он мне неинтересен. Знание для меня — это частное состояние когнитивной архитектуры. Конкретная конфигурация состояния, либо некоторый срез, либо то, что влияет на поведение именно как параметризация моторных сценариев. В этом особенность и сложность интерпретации этих терминов.

Антон Колонин:
Да, пожалуйста. Теперь Алексей Незнанов, вам слово.

Алексей Незнанов:
Добрый день ещё раз. Сначала должен сказать, что Егор молодец, и мне очень нравится сам заход к онтологизации от эпистемологии, причём эпистемологии действия. Почему? Потому что это важно, нужно и так далее. Но здесь у Егора явное моноупрямство, хотя это тоже нужно, чтобы продвигать. Кто мне скажет, какой ещё со школы в задачах по физике, математике и так далее самый сложный этап, на котором чаще всего понижается оценка и который, к сожалению, не сводится к вычислениям? У него очень красивое название: уяснение.

И как только мы упираемся в уяснение, а это происходит везде, где нужна либо интерпретация, либо сенсорика, мы хлоп — и всё, что касается потом моторики, вынуждены оставить в стороне и уяснять. Поэтому все варианты подобной онтологизации, как рассказывает Егор, я видел либо проваленными, либо как часть более глубокой онтологизации, где сенсорика играла очень существенную роль. Но я не устаю повторять мой главный поинт: знания без данных слепы, а данные без знаний тупы, подражая великим.

И в результате как раз граундинг здесь всё решает. Я хотел спросить у Егора: та интерпретация, о которой ты несколько раз говорил, — я у тебя насчитал три разных интерпретации, потому что у тебя есть вход, выход и рефлексия, и на всех трёх кусках разная интерпретация, — как ты думаешь, будет ли она проще или сложнее соответствующего входа, который автоматически строился бы по сенсорике данного субъекта для какой-нибудь сложной, например причинно-следственной динамической логики? То есть что проще, а что сложнее с точки зрения репрезентации и вычислений?

Егор Чурилов:
Если я правильно понял, это вопрос относительно ввода и вывода?

Алексей Незнанов:
Да, и рефлексии тоже. На рефлексию же тоже отдельная интерпретация нужна.

Егор Чурилов:
Слово интерпретация меня в рамках этой модели несколько озадачивает. Я не хочу сейчас говорить, что здесь где-то именно интерпретация. Я говорю, что определённая связь составляет рефлексию, хотя это просто транспорт сигналов между уровнями активации.

Алексей Незнанов:
Давай скажем так: вычислительная процедура, которая преобразует эти сигналы на входе, на выходе и при рефлексии.

Егор Чурилов:
Если ты хочешь назвать интерпретатором это сигнальное безобразие, ты можешь интерпретировать часть этой конструкции как место, где происходит интерпретация. Но я сейчас отказываюсь это делать в рамках данного изложения. Я не знаю, где именно здесь интерпретация и зачем она мне здесь нужна. Если мы перейдём к более сложному сценарию и распишем его, тогда можно будет обсуждать, как усмотреть процесс интерпретации внутри этой схемы.

Алексей Незнанов:
Это самый простой процесс. Тебе подали паспорт, тебе нужно поставить штамп в нужном месте. Нужное место определяется подписью. Одно действие, один параметр, координаты.

Егор Чурилов:
Во-первых, здесь есть предобученная модель. У неё уже достаточно сложная внутренняя структура, чтобы в принципе выполнять такие вещи. Иначе ничего не сложится.

Алексей Незнанов:
Ну значит, ты просто переносишь всю сложность онтологии действий в сложность каких-то кусков, которыми занимаешься не ты.

Егор Чурилов:
Да, здесь есть инкапсуляция сложностей. Но первичная задача — построить минимально достаточную когнитивную архитектуру, которая позволила бы сделать какой-то онтологический вывод. С ростом сложности домена она будет приближаться к сильному ИИ по мере роста числа параметров. Но для простых доменов, моя гипотеза, она может быть относительно простой.

То, о чём ты говоришь, — это, собственно, и есть задача онтологизации. Мы берём некоторые онтоконструкты и говорим: вот у нас такая-то определённость на входе. А что будет потом, после того как что-то произошло? На выходе — вот такая определённость.

Алексей Незнанов:
Так вот, чтобы снять эту неопределённость, тебе нужен внешний распознаватель, у которого есть интерпретация выхода в онтологических терминах.

Егор Чурилов:
Если я правильно понимаю, внешний распознаватель — это как раз и есть когнитивная архитектура.

Алексей Незнанов:
Я рад, что ты признаёшь: чтобы твоя онтологизация сработала, нам нужны ноги. Собственно, на этом спасибо.

Егор Чурилов:
Не понял, о чём ты.

Алексей Незнанов:
Смотри. Если то же самое действие — поставить штемпель в паспорт по подписи — реализовать в рамках онтологии действия, что у тебя будет говорить о критериях того, что мы это действие выполнили правильно?

Егор Чурилов:
Погоди. Ты говоришь про моторные симуляции некоторого агента, который выполняет конкретные действия. Естественно. Но здесь есть нюанс: это всё-таки симуляция. Полномасштабный агент, который будет реально выполнять эти действия, требует более серьёзной оснастки. Мы её здесь симулируем.

Алексей Незнанов:
Ты признаёшь, что она сложнее и по оснастке, и по входу в эту оснастку для вычислительных процедур, чем вход, то есть репрезентация и сами процедуры объектных онтологий, на которые ты ругался?

Егор Чурилов:
Сложнее. Да, импульсная сеть сложнее, чем формализм.

Алексей Незнанов:
Вот это я и хотел услышать. Поэтому к базовому тезису: онтология без данных слепа. И у тебя как раз развязывание, которое мне нравится, состоит в том, что у тебя есть специфика граундинга, которая формализуется. Это круто. По сути она формализуется в технологических цепочках. Можно так говорить?

Егор Чурилов:
Возможно, да.

Алексей Незнанов:
То есть когда ты соединяешь моторные порты друг с другом в сложные действия, они становятся комплексными, и это можно считать технологическими цепочками?

Егор Чурилов:
Наверное, да, конечно.

Алексей Незнанов:
Вот это круто, это обязано быть. Я всегда за это. Но сенсорику отсюда в принципе нельзя убрать, и мы автоматом возвращаемся к тому, на что ты ругался. Я рад, что ты понимаешь, что для этого где-то в стороне нужен AGI. Спасибо.

Кот, сознание и коммуникация

Антон Колонин:
Коллеги, есть ещё вопросы? Дмитрий спрашивает: можно ссылку на проект 2021 года по Белоруссии и цифровой валюте? И ещё был вопрос про кота. Почему у кота нет рефлексии? Насколько это было серьёзное заявление?

Егор Чурилов:
Нет-нет. Что мы можем здесь назвать, как мы можем определить, есть ли она в конкретном случае? Кто хочет — может усмотреть, кто не хочет — может не усмотреть. Вопрос в связке ID с двумя этими блоками. Котик сидит, прекрасно может выделять себя из среды, чтобы обеспечивать собственное моторное движение. Он знает свою лапу, знает, что её нужно убрать, если на неё что-то падает, знает, куда есть и как уклониться. Но у него, например, — мы этого точно не знаем, но допустим, — нет средства рефлексии этого в коммуникации. Он не может рассказать об этом другой кошке.

И на самом деле всё наше удивление по поводу сознания и вопросы qualia появляются именно отсюда. Через кота можно прыгнуть к человеку, и надо прыгнуть. Сложность возникает тогда, когда мы начинаем пытаться рефлексировать сами эти структуры — своё ID, своё я. Они достаточно сложны. Когда мы этими же структурами пытаемся рефлексировать эти же структуры, возникает разделение. Мы уже достаточно прокачаны, чтобы внутри себя выстраивать сложные группы сценариев, которые параметризуют друг друга, отражают друг друга, рефлексируют друг друга. И когда мы пытаемся зафиксировать в имеющихся у нас терминах эти высокоабстрактные, высокорефлексивные структуры, у нас начинается неуправляемое переключение внимания. Нет дисциплины внутренней интроспекции. У кого-то больше, у кого-то меньше. И поэтому у нас начинается хаотизация.

Я эти вещи очень чётко отследил. Это реально головные боли, когда начинаешь пытаться фиксировать такую абстрактную интроспекцию, на краю. Но это только одна проблема, и она преодолима. Когда-то мы не умели жить в мультионтологическом мире. Не понимали, что такое две онтологии рядом. А сейчас уже легко это структурируем. Здесь то же самое, но на более абстрактном уровне. Может быть, нужна компетенция мультиэпистемологичности, рефлексии этих структур. Но это одно.

Второе: у нас нет средств выражения, средств коммуникации. Они недостаточны. Они обеспечивают недостаточно высокий рефлексивный протокол. Когда мы пытаемся вернуть наши паттерны внимания, которые фиксируем на высоких уровнях, обратно в коммуникацию, она распадается. Человек произносит слова, которые для кого-то ничего не значат. И управляемая эпистемология как раз претендует на протокол, позволяющий эти вещи делать управляемыми: делать управляемой высокоабстрактную коммуникацию. Поэтому здесь и исчезают проблемы сознания и qualia. Они либо просто показываются как конкретный механизм, либо исчезают как ненужные. С котиком — просто уровень ниже. Интересная проблема, но на уровне рефлексии 1.

О языке, семантике и автоматическом языке ИИ

Антон Колонин:
Окей. Коллеги, есть ещё вопросы? Алексей?

Алексей Незнанов:
Я бы продолжил. Ещё со времён знаменитого художественного произведения «Вавилон-17» известно, что идеальные лексемы должны быть полными определениями соответствующих понятий в рамках треугольников Фреге с точки зрения денотата. Когда ты говоришь о недостатках коммуникации, ты имеешь в виду именно семантический слой? Или говоришь, что у всех разная прагматика и её нужно согласовывать? Вот этот кусок я не понял.

Егор Чурилов:
Слушай, мы здесь эволюционировали долго. Наш социум зрелый, глубоко всё в себе настроил. Это наша сила, но и наша инерция, наша слабость. На самом деле, чтобы понять другого, нужна эволюция. Сейчас я пытаюсь передать некоторые структуры знания, которые считаю прогрессивными, и для того чтобы начать на них общаться, конечно же, нужно перестраивать и объектную схему.

Я, например, могу переключиться в действие-центричное видение, в котором мир — это действие, здесь нет объектов, здесь сплошное действие. Опять же, это не такая уж новость.

Алексей Незнанов:
А если исключить людей из рассмотрения как класс агентов, как ты думаешь, смогут ли достаточно серьёзные ИИ выработать автоматический язык, который как раз описан в «Вавилоне-17», или какой-то аналог?

Егор Чурилов:
По-моему, эта штука так и происходит более или менее. Если такие 7B-штуки запустить, они как-то начнут такое вырабатывать.

Алексей Незнанов:
Да нет, пока очень тяжко. Я смотрел LCM и последние постграфовые майкрософтовские вещи, видел очень свежий, январский проект. Там оно само так не вырабатывается. Может быть, потому что мы не даём соответствующего целеполагания, но пока всё печально. Хотя вольфрамовский язык они изучают, это подтверждаю. Wolfram Language реально учат. Но он и был сделан для человеческой коммуникации.

Егор Чурилов:
Да-да. Здесь опять же есть ссылка на embedded cognitive architectures, воплощённые архитектуры. Есть такое понятие, как emergent ontology. Честно говоря, когда я недавно это гуглил, обычно находил ссылки на социальные исследования, как онтология возникает из фолксономии. Мне это неинтересно. Я помню, были работы, где на воплощённых архитектурах пытались усмотреть, как возникает онтология в коннекционистских архитектурах. Но я, честно говоря, до них не докопался. По-моему, этому направлению просто пока не хватает фокуса.

Алексей Незнанов:
Согласен, фокус нужен. Теперь я понял, о чём речь. Спасибо.

О субъекте, чёрном ящике и истине

Антон Колонин:
Коллеги, ещё вопросы? Эльгизар, пожалуйста.

Эльгизар:
Добрый вечер, Егор. Спасибо, очень интересно. Эта схема мне близка, напоминает то, чем занимается кибернетика второго и третьего порядка. Но там базовым понятием является чёрный ящик. И вы пояснили, что без некоторых вещей можно обойтись, но я сомневаюсь. Незнанов сказал, что нужен какой-то узнаватель, носитель. Знание — это носитель состояний, носитель пониманий, место, куда происходит интернализация знаний и пониманий, где происходит рефлексия. Всё-таки я думаю, что без субъекта, или если более машинно выражаться, без агента, сомневаюсь, что это получится.

Егор Чурилов:
Вы сейчас вводите определённую модель. У вас есть узнаваемое представление, но это другая модель. Она отличается от данного подхода. Субъекта, конечно, можно определить некоторым образом, можно усмотреть здесь какую-то структуру и назвать её субъектом. Это, возможно, даже будет непротиворечиво: просто введём дополнительную метку, экзоним или что-то ещё.

Но когда я отбрасываю тот самый треугольник, я отбрасываю и всё, что с ним связано. Допустим, в традиционной аналитической философии есть интерпретация знания как justified true belief. Истина, истинность и так далее. Вот эти понятия мне здесь абсолютно не нужны. Истина просто выбрасывается, для неё здесь нет места. Здесь есть устойчивость структуры, устойчивость поведения, устойчивость коммуникаций и устойчивость структур принятия решений на основании тех или иных входных и внутренних состояний. Истина легко сводится к этим вещам и потому как отдельное понятие не нужна.

Антон Колонин:
Тогда можно ли из этого громкого, но в каком-то смысле понятного утверждения сделать вывод, что истина — это исключительно коммуникационное явление? Грубо говоря, если некоторое сообщение от одного агента к другому содержит информацию, противоречащую реальности, то это не истина. И опять-таки в онтологиях возможна ситуация, когда я получаю ложное сообщение только потому, что я его неверно интерпретировал. То есть мне послали сообщение из одной онтологии, я его читаю в другой онтологии, и оно получается ложным лишь потому, что наши онтологии не стыкуются. А если бы у меня была та же онтология, сообщение было бы истинным. Получается, истина и ложность — это чисто коммуникационная вещь, возникающая на уровне стыковки или нестыковки онтологий, либо информационных искажений. К реальности это отношения не имеет. То есть в физическом мире же нет истины и лжи, это исключительно понятия коммуникационные. Как вы считаете?

Егор Чурилов:
Вы сейчас сами чётко зафиксировали это: сказали, что истина — это сообщение. Наверное, этому вообще стоит посвятить отдельное выступление. Но если кратко, я вообще спрашиваю: где здесь истина? Зачем о ней говорить? Я её не ввожу, она мне не нужна. Я говорю так: у нас есть группа агентов, у них есть задачи по выживанию, опережению, ароморфозам. Троичная задача, три суперцели. Если они выполняются — с агентом всё хорошо.

Концепт реальности мне здесь тоже не нужен. Это не реальность, это среда. Если у меня всё хорошо с устойчивостью, всё. Дальше возникает коммуникация. Чтобы согласовывать поведение и обеспечивать устойчивость группы, либо свою устойчивость, либо устойчивость контрагента в группе, я посылаю некоторые сигналы. Если контрагент интерпретирует их некоторым образом и его практики устойчивости сохраняются, то он молодец. В нашей объектной парадигме мы такие моменты устойчивости называем истинными. Почему? Потому что мы привыкли говорить о соответствии реальности или о соответствии бытия и сознания. Но то, что называется бытием и сознанием, можно разложить на более низкоразмерные структуры и более высокорефлексивные структуры. Когда у нас получается стыковать их, когда мы можем выполнять некоторые моторные программы на основании этих концептных групп, мы называем ситуацию истинной.

Получая некоторое суждение, мы внутри себя выстраиваем концептуальную схему, структуру многомасштабных паттернов, пытаемся опускать её в некоторую сенсорную абстракцию — в некую конкретную ситуацию. Если она оказывается выводимой, если она в конце концов приводит к устойчивым моторным замыканиям, к устойчивому сенсомоторному контуру, тогда мы называем эту ситуацию истиной. А потом уже рефлексируем устойчивость как параметрическое состояние и называем это истиной. Или посылаем соответствующую метку по коммуникации. Контрагент, получая это подтверждение, строит свои сценарии: например, «в пещере медведь» — значит, не идти туда. Или наоборот, «в пещере медведь — пошли его возьмём». То есть эта метка параметризует сценарий. А потом ретроспективно, если мы действительно находим медведя или, наоборот, избегаем его, мы говорим: это было истинное положение дел. Это просто метка для устойчивой конфигурации.

Антон Колонин:
Можно я ещё усугублю ваш ответ? Если убрать моторный порт и коммуникацию и оставить только восприятие, не сохраняется ли всё то же самое, просто с меньшим числом переменных и портов? То есть, может быть, речь вообще идёт об устойчивости между некоторыми универсальными входами и универсальными выходами? В одном частном случае это просто предсказывающая система. Сидит, условно, буддийский монах на вершине горы и смотрит, как набегают облака. У него есть внешние входы и некоторые внутренние выходы, которые просто предсказывают, как будет меняться форма облаков. Он формирует внутри себя устойчивую картину без всяких моторных воздействий. И вот LLM, например, не этим ли занимаются? Они строят устойчивые предсказывающие модели. Без reinforcement learning от пользователя модель ведь просто предсказывает следующий токен, получает не то, что предсказала, корректируется и так далее. Не достаточно ли только ассоциативных портов для ограниченных форм построения устойчивых моделей?

Егор Чурилов:
Я здесь специально нарисовал агентскую границу. Эта граница в принципе произвольна. Мы можем провести её где угодно, ну или почти где угодно в рамках нашего коннектома. Поэтому когда вы говорите, что нет сенсорного входа или моторного выхода, я бы сказал иначе: левая и правая стороны всё равно есть.

Извиняюсь, если неправильно сказал. Тогда так: можем ли мы делать всё то же самое без моторного выхода?

Егор Чурилов:
Моторный центр и процессинг всё равно есть. Поэтому архитектура безмасштабная: она должна быть одной и той же везде. Каждый сценарий можно представить в виде такой модели, просто более или менее сложной. Где-то будут редуцированы уровни, но схема сохраняется.

Когда мы говорим, что у нас нет эмбеддинга, то имеем в виду, что у нас нет эмбеддинга в конкретную среду, где можно идентифицировать старшие моторные группы как физические. Тогда они становятся просто набором координат внутри когнитивной архитектуры. Тактильные, визуальные глаза и прочее. Когда у нас, например, галлюцинация, внутренний генератор из-за сложности системы продуцирует что-то, что потом следующими эшелонами интерпретируется как валидный сенсорный вход. На этом действительно могут возникать проблемы. Но всё равно это просто группа активации.

Когда мы берём этот хитрый, «чистый» разум и размещаем его отдельно, у него действительно может отсутствовать выход на нижнюю реактивную магистраль. И на этом как раз и основана ценность абстрактного прогнозирования или планирования. Мы можем проигрывать сценарии в голове и делиться ими через ссылки. Мы можем через значки и ссылки активировать сценарии друг у друга и стыковать их. Но и у LLM, и у всего подобного всё равно есть вход и выход — просто не в форме конкретного физического эмбеддинга. Граница агента всё равно есть. Архитектура остаётся безмасштабной.

Алексей Незнанов:
Но тебе же нужно целесообразно действовать в среде.

Егор Чурилов:
Да.

Егор Чурилов:
Но среда другая. И целесообразность другая. Где-то обратные связи просто сильно редуцированы.

Алексей Незнанов:
Настолько редуцированы, что уже не имеет смысла говорить о целесообразности, с моей точки зрения. Возможно, я не прав.

Егор Чурилов:
Смотри, даже в формализме мы вводим допущения. Понятие нуля нужно, чтобы синтаксически закрыть дырку. Какова скорость колеса, когда колесо стоит? Неизвестно. Назовём это нулём. Здесь то же самое. Какова обратная связь в сценарии, где обратной связи нет? Она есть, но нулевая. И всё. Зато у нас безмасштабная архитектура, нам не нужны особые случаи.

Алексей Незнанов:
Это как раз правильно. Более того, любая редукция, которая закрывает дырку в редуцированном пространстве сигналов, очень полезна для следующего уровня. Но я сейчас не про это. Возвращаясь к сложности чувствителей, которые здесь работают, мы должны как-то сказать, какова вообще сложность граундинга, какие у него накладные расходы. Да, мы можем построить такую песочницу, где граундинг почти нулевой, но имеет ли это смысл для развития AGI? Толку-то с почти не исследованного пространства?

Егор Чурилов:
Согласен, но у меня здесь пока нет ответов. Здесь нужна работа, которую я пока в одиночку потянуть не могу.

Алексей Незнанов:
Но у коллег, которые занимаются песочницами для искусственного интеллекта, уже сложились даже уровни сложности базового представления пространства в песочнице и задач в этой песочнице. И это, в принципе, разбивается на вполне здравые конструкции и уровни. Это, кстати, очень хорошо перекликается с тем, что ты называешь моторным имплементом, и с возможностью оценивать их точность и чёткость. Если воздействия требуют минимального отклонения, а малейшая ошибка дорого стоит, это одна история. Если можно допускать серьёзные погрешности, это совсем другая. И вычислительная сложность может резко варьироваться.

Универсальные входы и выходы, песочницы и уровни масштаба

Антон Колонин:
Раз уж мы заговорили о редукции, у меня вопрос и к Егору, и к Алексею. Может быть, сенсорный порт и моторный порт — это просто притянутая за уши терминология из сенсомоторных систем, а в общем случае у нас должна обеспечиваться устойчивая связь между некоторой системой универсальных входов и системой универсальных выходов? И одним частным случаем является просто предсказывающая система, как мы уже обсуждали.

Егор Чурилов:
Да, это то, что я и хотел сказать. Сенсорный порт и моторный порт здесь используются как симметричные термины для того, что вы называете обобщёнными входами и выходами. В этом смысле это синонимы.

Алексей Незнанов:
В тех же песочницах уже пробовали делать так, что не выделены отдельные эффекторы, а изменение состояния самого вычислителя, или искусственного интеллекта, может само по себе менять реальность. Ну как магия: что-то представил в голове — и оно свершилось. В реальной жизни у нас такого, к сожалению, нет, а в песочницах это уже можно пробовать. Кстати, там вылезают удивительные эффекты.

Антон Колонин:
Но ведь возможность построения моделей как раз и предполагает, что мы можем проигрывать некоторые ситуации в виртуальном мире, чтобы отбирать выигрышные и уже в реальном мире исполнять только их.

Алексей Незнанов:
Как говорил профессор Дубинский, представить в качестве модели можно что угодно, вопрос — какая от этой модели польза. В данном случае понятие эффекторов, в отличие от сенсоров, очень сильно упрощает модели и даёт нам возможность нормально обсчитывать чёрный ящик с точки зрения поведения, потому что поведение заключается в наборе сигналов эффекторов. Это очень круто. А вот никакая совокупность буддийских монахов своими мыслями мир вроде бы ещё не изменила. По крайней мере, они сами такого не заявляли.

Эльгизар:
Алексей, можно чуть возразить или направить мысль? Почему вы говорите, что то, что мы представляем, не меняет картину? Есть же известный психологический ход: если проблема не решается, нужно изменить отношение к проблеме. Меняешь отношение, меняется восприятие, а вместе с ним появляются другие возможности и перспективы. Разве это не означает, что, меняя отношение к происходящему, мы меняем саму картину происходящего?

Алексей Незнанов:
Внутри-то что угодно может меняться, а наружу ничего не меняется. Никакая совокупность эффекторов сама собой не возникает из изменения внутренней картины. Даже если ты решил, что теперь ты не пацифист, а милитарист, кулак у тебя был и до этого, ты просто им не пользовался.

Антон Колонин:
Я, на самом деле, не добрался до дна в своём редукционизме. Следующий вопрос такой: правомерно ли рассуждать в такой парадигме, опускаясь на уровень отдельного нейрона, который тоже обеспечивает некоторый свой внутренний гомеостаз, реагируя на правильные входные сигналы правильными выходными воздействиями? И если да, то не можем ли мы говорить, что любая живая клетка, поддерживая свой гомеостаз, просто перестраивает свои химические процессы и физические состояния под воздействием внешних факторов?

Алексей Незнанов:
Не могу пройти мимо Белоусова — Жаботинского. Спасибо.

Антон Колонин:
Егор, насколько это всё универсально, как вы считаете?

Егор Чурилов:
Я пытался сделать эту модель компактной, но в плане некоторой фрактальности она действительно должна быть безмасштабной и самоприменимой. Эту агентскую границу я не зря нарисовал: она может быть границей масштаба или подсистемы.

С другой стороны, если говорить о нейроне, то такую проекцию на данную когнитивную архитектуру, которая довольно общая, можно сделать для очень многих вещей. И такие проекции, вероятно, будут иметь смысл. В университете я два с половиной года изучал теорию автоматического управления. Там тоже есть общие модели, на которые можно натянуть что угодно: обратную связь, устойчивость, колебательные процессы и так далее. Всё это здесь вполне применимо — для клетки, для кибернетики разных порядков, для биологических и физических систем. Есть, конечно, вычислительные и концептуальные ограничения, но такая рекурсия возможна.

Другой вопрос, который уже прозвучал: будет ли это полезно. Можно использовать эту модель в биологическом дискурсе, но будет ли такая онтологизация продуктивнее существующих моделей — я не знаю. Может быть, специальные модели там будут эффективнее. А может быть, нет. Это вопрос развития и применения.

Антон Колонин:
И ещё вопрос, раз уж вы заговорили о ПИД-регуляторах. Насколько всё это пересекается или взаимодополняется с теорией функциональных систем и иерархией функциональных систем?

Егор Чурилов:
Интуиция здесь абсолютно похожая. Можно говорить, что функциональная система Анохина здесь некоторым образом представлена. Может быть, не все компоненты выражены явно, либо они симметрично представлены по-другому. Но да, интуиции те же. Думаю, они вообще общие для многих подходов. Наша интроспекция и наблюдение за внешним всё равно строятся на общечеловеческих паттернах различения. Поэтому мы и генерируем такие общие модели. Конечно, они стыкуются.

Хаос, порядок и внешний мир

Антон Колонин:
Коллеги, есть ещё вопросы?

Эльгизар:
Егор, можно ещё спросить? В модели «чёрные ящики» предполагается, что мир — это хаос, широкий шумящий входящий сенсорный поток, который потом надо фильтровать и обрабатывать. Не приходила ли мысль, что мир — это не хаос, а регулярность и воспроизводимость, то есть упорядоченность? Если так воспринимать, что мы живём в регулярностях, задача упрощается, модель становится проще. Получается, ящик уже не чёрный, а в какой-то степени ясный и понимающий: в определённом месте существует такая-то регулярность, и он в неё вписывается. Не приходила такая мысль?

Егор Чурилов:
Вы сейчас размышляете в рамках определённого философского протокола, на котором строится большое количество представлений. В этом протоколе есть мир, он соотносится с некоторым знанием, у него есть характеристики, свойства, структура, и это состояние можно характеризовать как хаос либо упорядоченность.

Для этой модели, для управляемой эпистемологии, всё это нерелевантно. Просто не так поставлен вопрос. Мы сейчас не размышляем в терминах божьей благодати, прощения грехов или влияния шайтана на души, потому что это для позитивистской науки нерелевантный дискурс. И здесь то же самое. Для управляемой эпистемологии мир, объективная реальность и всё подобное — это просто архаичные абстракции. Они не нужны. У нас есть действия и структуры репрезентации, фиксируемые как активации и переходы. Есть устойчивые паттерны, обеспеченные экономикой носителя и симуляции. Они устойчивы. Мы можем, уже абстрагируясь от конкретного агента, сказать, что некоторые состояния друг с другом коммуницируют посредством агентов. Они как-то меняются. И вот вокруг рефлексии этих состояний действительно построено огромное количество философской коммуникации, которая потребляет кучу энергии, а моторный выход при этом не очень высок.

Алексей Незнанов:
Ну ты согласен, что можно использовать принятые наименования когнитивных свойств человеческого мозга — память, язык и так далее — для описания этой коммуникации?

Егор Чурилов:
С осторожностью. Это уже следующая интерпретация. Внутри модели этого нет. Это интерпретация модели.

Алексей Незнанов:
Но в своём рассказе ты сам ими пользовался. Значит, будем считать это жаргоном, который в самой модели отсутствует, но удобен для краткого рассказа?

Егор Чурилов:
Да. Я использую русский язык и привычные понятия как bootstrap. Мне нужно с чего-то начинать. Я как бы пишу первый компилятор Python на C++, потому что у меня ещё нет Python. А следующий, может быть, уже напишу на Python и буду работать дальше.

Алексей Незнанов:
И даже компилятор C++ на Python?

Егор Чурилов:
Да. Мне нужно от чего-то оттолкнуться. Но я всё время оговариваю, что бытовые и общефилософские семантики здесь только временный bootstrap и в рамках УЭ не нормативны.

Алексей Незнанов:
Ну да. Я поэтому всех и пугаю вопросами про вычислимость, потому что вычислимость, с одной стороны, уходит в репрезентацию, то есть в язык описания процесса вычислений, код, а с другой — в физический вычислитель. И твой главный вопрос о том, почему только действия, я, кажется, хорошо понял. Мы опять к нему же вышли. И считать, что вокруг нас хаос или вокруг полный порядок, для модели, по-моему, без разницы.

Егор Чурилов:
А что такое хаос? Это тоже концепт. Где-то он представлен некоторыми многомасштабными паттернами у конкретных людей или конкретных агентов. Как мы идентифицируем хаос? Значит, у нас высокая степень неопределённости относительно некоторого сенсорного, обобщённого входа. Мы накапливаем определённые впечатления — ненормативное слово, но пусть — и говорим, что нам сложно их связать. Нет паттернов группировки, чтобы с ними что-то делать. Мы говорим: хаос.

Потом нам говорят: ага, эти три хаотичные линии — это не три линии, это буква, у которой есть некоторый смысл. Мы обучаемся этому смыслу. То есть хаос после обучения, после объектной сборки начинает стыковаться. Сначала простые синтаксисы простых элементов, потом мы связываем их с какими-то моторными программами: например, знак «не ехать».

Алексей Незнанов:
Это же только первый уровень, где ты говоришь о динамическом хаосе в том смысле, что в пространстве сенсорных, а потом и моторных воздействий существуют куски, где последствия наших моторных действий невозможно предсказать на каком-то горизонте. Или, точнее, можно предсказать, но с привлечением ресурсов не меньших, чем сам тот объём пространства, в котором это действие будет происходить.

То есть у тебя может быть вполне хорошая система дифференциальных уравнений, которая почти везде всё прекрасно и почти бесплатно предсказывает, а где-то есть фокус, гадкая точка бифуркации, и это имманентное свойство системы.

Егор Чурилов:
Если я правильно понимаю, ты уже говоришь о синтаксисах этих значков, которые помогают нам упаковывать некоторую определённость, а потом, выполняя вычисления, получать другую определённость или неопределённость в новых ситуациях. То есть все формализмы — это некоторая зафиксированная, доказанная определённость, которая потом при подстановке аргументов даёт конкретный моторный выход, например число из уравнения.

Алексей Незнанов:
Нет, этого недостаточно. Нужен и такой формализм, где те же циферки и буковки позволяют определить кусок пространства, или действительности, как ты хорошо сказал, не равной реальности, где у нас вообще невозможно будет предсказать, что мы сделаем моторной реакцией. Раздавим бабочку — будет ураган. И это не привнесённая сложность, это внутреннее свойство той самой действительности.

Егор Чурилов:
То есть потеря управления. Когда какой-то конкретный сценарий, опирающийся в том числе на формализм, начинает где-то терять управление.

Алексей Незнанов:
Именно. Нужно идентифицировать, в каких ситуациях мы теряем управление, а в каких всё нормально, и различать области неопределённости разного генезиса. Потому что у тебя может быть неопределённость, привнесённая моделью, а может быть неопределённость, привнесённая свойствами той самой действительности. И ты говоришь: да, у тебя там точка бифуркации. Это никак не зависит от твоих моделей.

Егор Чурилов:
Как это реализуется здесь — более сложный вопрос.

Алексей Незнанов:
Он намного глубже, чем эта картинка. Нужно понять, какое у тебя вообще математическое пространство эффекторов с точки зрения последствий. И вот как раз на рефлексии это проверяется. Это один из моих стандартных вопросов к LLM: как вы будете разбираться с точками бифуркации в дифференциальных уравнениях? Они, кстати, тупят очень качественно.

Антон Колонин:
Хорошо тупят, знатно.

Финальные комментарии

Антон Колонин:
Коллеги, может быть, уже надо завершаться. Есть какие-то заключительные комментарии?

Александр Балдачев:
Добрый день. Большое спасибо, Егор. Самой интересной мне показалась последняя часть доклада, потому что предыдущая была скорее подводкой, немного притянутой за уши. Но понятно, зачем она была и к чему вела. Хотя к тому же выводу можно подойти и с другой стороны.

Например, через семантический сахар. Я говорю, что есть акт, и все отношения, которые выстраиваются в некоторой системе, — это продукт этого акта. Акт один, а отношений выстраивается много. Акт рождения ребёнка выстраивает массу отношений: дядя, тётя, мама, дедушка, бабушка, папа. Если описывать что-то через акты, то мы существенно экономим ресурсы. Все свойства и отношения являются, как я это называю, семантическим сахаром, то есть продуктом актов.

И, кстати, сегодня поделюсь. Я помодернизировал язык и прогонял через Claude рассказик: он переводил его в семантику, потом отдавал ChatGPT-5, и тот выводил рассказ обратно практически идентично. И успех зависит именно от того, что было описано через акты, а не через отношения. Это довольно впечатляюще. Могу, наверное, сделать доклад на эту тему. В принципе, в любое время.

То, что я обещал на предыдущем докладе, я сделал: полную семантическую спецификацию языка, которая переводит техническую документацию в исполняемую модель бизнес-процесса. А второй вариант — это упрощённый язык, который не подразумевает машинного исполнения, но подразумевает исполнение LLM: LLM пишет, LLM расшифровывает, переводит обратно в текст.

Антон Колонин:
Александр, давайте так. У нас сейчас семинаров немного, сетка разрежена. На следующей неделе я хотел закончить многосерийный разговор про онтологию систем вывода. Информации у меня, наверное, будет немного, думаю, в час уложусь. Если у вас сообщение тоже не очень большое, может быть, мы это совместим. Подумайте, напишите, сколько у вас времени, и решим — либо отдельно планировать, либо совмещать.

Александр Балдачев:
Да, возможно. Но я сейчас просто хотел подтвердить, что направление, которым занимается Егор, правильное и продуктивное. Его только нужно довести до реализации.

Егор Чурилов:
Спасибо.

Антон Колонин:
Егор, желаем вам успехов в практической реализации. У нас тут есть горячие головы, которые считают, что выходить на семинары с теоретическими материалами — не комильфо, обязательно должен быть действующий прототип.

Хорошо. Всем коллегам спасибо. Спасибо Егору за доклад. Спасибо Алексею и другим участникам, Эльгизару, Александру — за обсуждение. Через две недели встретимся. Если ничего не поменяется, я закончу свой разговор по старым материалам, по системам вывода и нечёткой логике. Возможно, будет небольшое обсуждение темы, которая началась ещё после Нового года. И, может быть, совместим это с рассказом Александра о его последних достижениях. Так что до встречи через две недели. Всем спасибо, всего хорошего.

Александр Балдачев:
Всем спасибо, до свидания.