Проблема со статистической трактовкой смысла
«В определённой репрезентации внутри сети эти «словарные сегменты» соответствуют смыслам слов.»
А в определённых — не соответствует. «Смысл знака» в лингвистически замкнутых репрезентационных системах трактуется через другие знаки, или, как в данном случае, через принадлежность данной метки к кластеру меток со статистически близкими «семантическими» метриками.
Эпистемологическое вскрытие такой системы означает обращение к вопросам вида «почему мы имеем данные метки» и «почему эти метки собрались вместе». Ответ на такие вопросы лежит за рамками как статистической лингвистики с онтологической нормой, так и, возможно, за рамками неопозитивистского, аналитико-философского взгляда на мир, который является основной платформой мышления на Западе и в его культурных колониях.
Пока «смысл» трактуется лингвистически рекурсивно, технологии не выйдут за рамки ограничений языка, с его тысячелетней инерцией супраанималистических представлений, всё более теряющих актуальность в современном супрачеловеческом мире; с его инвентарным списком, неуправляемой объективацией, потерей означаемого и пр.
Выход — в трактовке «смысла» через интерпретативность в энактивных системах (enactive systems), через многомасштабные и холистичные функциональные системы — замкнутые не лингвистически, а сходимостью управления.
«Смысл» — это схема моторных интерпретаций метки, определяемых эпистемой агента, существующей до представления этой схемы в некой знаковой системы, в рамках которой можно сравнивать метки — например, статистически. Кластеризация меток, и корреляция кластеров из разных языков, появляется из наличия сходимости управления, множества пересекающихся интерпретационных моментов. Статистическая сходимость возможна только там, где наличествует сходимость прагматик И достаточное подобие репрезентационных систем, архитектур эпистем. В общем люди одинаковы и в простых случаях для множества этносов, погружённых в близкие практики и имеющих близкие языки, это прокатывает. Как только речь пойдёт о сильно удалённых языках, или о тонкостях, низких частотах и совсем уникальных прагматических ситуациях, статистика ожидаемо провалится.
GNTM — наверняка, хорошая прикладная штука для построения бизнес-решений. Никакого особого фундаментального прорыва, на котором можно строить «новый общечеловеческий язык» или сколь-нибудь сильный AI, тут нет.