ИИ: момент истины для китайской цензуры

Автор: Стивен С. Роуч
преподаватель Йельского университета, экс-председатель Morgan Stanley Asia

В отличие от Запада, где всё что угодно попадает в сеть, цензоры Китая навязывают строгие политические правила распространения информации

В ставшей уже классической книге «Сверхдержавы искусственного интеллекта» (2018 год) Кай-Фу Ли бросил перчатку: он утверждал, что от Китая исходит нарастающая технологическая угроза для США. В конце 2019 года, когда Ли выступал с лекцией на моём семинаре «Будущий Китай» в Йельском университете, студенты были очарованы его провокационными аргументами: Америка вот-вот утратит своё преимущество первооткрывателя (экспертиза в алгоритмах искусственного интеллекта) из-за преимуществ Китая во внедрении (приложения на основе больших данных).

Увы, Ли проигнорировал одну ключевую тенденцию: расцвет больших языковых моделей и генеративного искусственного интеллекта. Хотя он намекал на массовую форму технологии общего назначения, возводя её ещё к временам промышленной революции, он был очень далёк от предсказания истерии вокруг ChatGPT, которая сейчас захлестнула дебаты по поводу искусственного интеллекта (сокращённо ИИ). Аргументы Ли содержали туманные упоминания «глубинного обучения» и нейронных сетей, однако они опирались скорее на рассуждения о потенциальной замене искусственным интеллектом людей в выполнении их задач, чем о возможностях «общего искусственного интеллекта», близкого к человеческому мышлению. А это трудно назвать чем-то маловажным, когда речь заходит о будущем Китая в качестве ИИ-сверхдержавы.

Причина в том, что в этом будущем возникает большое «если» из-за действующей в Китае цензуры. В недавней статье Генри Киссинджер, Эрик Шмидт и Дэниел Хаттенлокер (в их книге 2021 года содержались намёки на потенциал ИИ общего назначения) приводят сильные аргументы, доказывая, что сейчас мы оказались на пороге интеллектуальной революции, которая становится возможной благодаря ChatGPT. Они не только указывают на моральные и философские проблемы, создаваемые большими языковыми генеративными моделями, но и поднимают важные практические вопросы по поводу их внедрения, которые напрямую связаны с размерами корпуса знаний, имеющихся на обрабатываемом языке.

Именно здесь режим строгой цензуры в Китае начинает вызывать озабоченность. И на Востоке, и на Западе имеется долгая и богатая история цензуры, однако отдел пропаганды Коммунистической партии Китая особо выделяется своими стараниями контролировать любые формы высказываний в китайском обществе (газеты, фильмы, литература, медиа, образование), а также управлять культурой и ценностями, определяющими публичные дискуссии. 

В отличие от Запада, где всё что угодно попадает в сеть, цензоры Китая навязывают строгие политические правила распространения информации, которая должна соответствовать линии КПК. Пользователи интернета в Китае не могут загрузить ссылки на информацию о Культурной революции, длившейся десять лет, о трагедии июня 1989 года на площади Тяньаньмэнь, проблемах с правами человека в Тибете и Синьцзяне, трениях с Тайванем, демократических демонстрациях 2019 года в Гонконге, недовольстве политикой нулевого Covid и о многим другом.

Столь агрессивное редактирование информации становится большой проблемой для ChatGPT с китайской спецификой. Очистив историю от важных событий и связанном с ними человеческим опытом, китайская цензура сужает и искажает корпус информации, который будет использоваться для машинного обучения больших языковых моделей. А это означает, что способность Китая пожинать плоды интеллектуальной ИИ-революции в итоге уменьшится.

Количественно измерить эффект этой цензуры с точностью, конечно, невозможно. Качественные оценки можно найти в ежегодном опросе, проводимом организацией Freedom House, «Свобода в сети». В 2022 году Китай получил самый низкий балл в категории «Свобода интернета» среди 70 стран.

Данный показатель рассчитывается на основании ответов на 21 вопрос (и на почти 100 уточняющих вопросов), которые сгруппированы в три широкие категории: препятствия в доступе, нарушение прав пользователей, ограничения контента. Категория, касающаяся контента (фильтрация и блокирование веб-сайтов, юридические ограничения контента, живость и разнообразие информационной онлайн-сферы, использование цифровых инструментов для гражданской мобилизации), позволяет приблизительно измерить влияние цензуры на размеры доступной для поиска информации. Китай, согласно этим подсчётам, получил два балла из 35 возможных, в то время как средний балл равнялся 20.

В будущем мы можем ожидать продолжения прежнего. Китайское правительство уже поспешило выпустить проект новых правил о чатботах. 11 апреля Китайское управление киберпространства (CAC) постановило, что контент, создаваемый генеративным ИИ, должен «опираться на базовые социалистические ценности и не должен содержать какой-либо контент, подрывающий государственную власть, предлагающий свергнуть социалистическую систему, подстрекающий к расколу страны или подрывающий национальное единство».

И здесь появляется важнейшее различие между прежним режимом цензуры и новыми попытками надзора за ИИ. В первом случае применяется фильтрация контента по ключевым словам с целью заблокировать неприемлемую информацию, а во втором случае (и об этом говорилось на недавнем форуме DigiChina) используется подход из игры «Убей крота» для ограничения быстро меняющейся генеративной обработки подобной информации. В результате, чем жёстче САС будет стараться контролировать контент ChatGPT, тем меньше будет продукции у чатбот-генеративного искусственного китайского интеллекта. А это ещё одно препятствие на пути интеллектуальной ИИ-революции в Китае.

Неудивительно, что первые результаты работы генеративного ИИ в Китае вызвали разочарование. Одну из первых и самую известную на сегодня большую языковую модель Китая – программу Wenxin Yiyan компании Baidu (её называют «бот Эрни») – недавно раскритиковали в Wired за попытку работать в «интернете, закрытом файрволом и управляемом государственной цензурой». Столь же разочаровывающие результаты сообщаются и о других языковых ИИ-моделях в Китае, в числе которых Robot, Lily и Tongyi Qianwen компании Alibaba (переводится примерно как «правда из тысячи вопросов»).

Кроме того, недавний анализ, проведённый NewsGuard (это «инструмент доверия в интернете», созданный и поддерживаемый большой командой уважаемых западных журналистов), показал, что программа ChatGPT-3.5 компании OpenAI генерировала больше ложной информации (так называемые «галлюцинации») на китайском языке, чем на английском.

В замечательной книге филолога Цзин Цу «Царство иероглифов: Языковая революция, которая сделала Китай современным» подчёркивается критически важная роль, которую сыграл язык в эволюции Китая после 1900 года. В конечном итоге язык – это не более чем носитель информации, и в финальной главе своей книги Цу подчёркивает этот факт, утверждая, что «тот, кто контролирует информацию, контролирует мир».

В эпоху ИИ подобный вывод заставляет Китай задаться серьёзными вопросами. Информация – это топливо для больших языковых ИИ-моделей. А государственная цензура сжимает Китай до малых языковых моделей. Эта разница вполне может оказать решающее влияние на исход битвы за информационный контроль и глобальную власть.

© Project Syndicate 1995-2023 

: Если вы обнаружили ошибку или опечатку, выделите фрагмент текста с ошибкой и нажмите CTRL+Enter
54057 просмотров
Поделиться этой публикацией в соцсетях:
Forbes Video

Галим Хусаинов: санкции, Kaspi, исход российских банков, прощение кредитов

Орфографическая ошибка в тексте:

Отмена Отправить