"В определённой репрезентации внутри сети эти «словарные сегменты» соответствуют смыслам слов."
А в определённых - не соответствует. "Смысл знака" в лингвистически замкнутых репрезентационных системах трактуется через другие знаки, или, как в данном случае, через принадлежность данной метки к кластеру меток со статистически близкими "семантическими" метриками.
Эпистемологическое вскрытие такой системы означает обращение к вопросам вида "почему мы имеем данные метки" и "почему эти метки собрались вместе". Ответ на такие вопросы лежит за рамками как статистической лингвистики с онтологической нормой, так и, возможно, за рамками неопозитивистского, аналитико-философского взгляда на мир, который является основной платформой мышления на Западе и в его культурных колониях.
Пока "смысл" трактуется лингвистически рекурсивно, технологии не выйдут за рамки ограничений языка, с его тысячелетней инерцией супраанималистических представлений, всё более теряющих актуальность в современном супрачеловеческом мире; с его инвентарным списком, неуправляемой объективацией, потерей означаемого и пр.
Выход - в трактовке "смысла" через интерпретативность в энактивных системах (enactive systems), через многомасштабные и холистичные функциональные системы - замкнутые не лингвистически, а сходимостью управления.
"Смысл" - это схема моторных интерпретаций метки, определяемых эпистемой агента, существующей до представления этой схемы в некой знаковой системы, в рамках которой можно сравнивать метки - например, статистически. Кластеризация меток, и корреляция кластеров из разных языков, появляется из наличия сходимости управления, множества пересекающихся интерпретационных моментов. Статистическая сходимость возможна только там, где наличествует сходимость прагматик И достаточное подобие репрезентационных систем, архитектур эпистем. В общем люди одинаковы и в простых случаях для множества этносов, погружённых в близкие практики и имеющих близкие языки, это прокатывает. Как только речь пойдёт о сильно удалённых языках, или о тонкостях, низких частотах и совсем уникальных прагматических ситуациях, статистика ожидаемо провалится.
GNTM - наверняка, хорошая прикладная штука для построения бизнес-решений. Никакого особого фундаментального прорыва, на котором можно строить "новый общечеловеческий язык" или сколь-нибудь сильный AI, тут нет.