Anthropic выпустила Claude Fable 5: сверхмощный ИИ с ограничителями или угроза для человечества?
Американская технологическая компания Anthropic, основанная в 2021 году бывшими сотрудниками OpenAI, девятого июня 2026 года представила публичную версию своей сверхмощной языковой модели Claude Fable 5, которая является урезанной копией ещё более продвинутой закрытой модели Mythos 5.
Последняя доступна лишь узкому кругу специалистов и уже продемонстрировала выдающиеся результаты в автономных научных исследованиях, включая многосуточный геномный анализ данных миллионов клеток, а также в обнаружении уязвимостей программного обеспечения. Однако в погоне за балансом между инновациями и безопасностью компания внедрила систему фильтров, автоматически переключающих пользователя на более старую версию при попытке коснуться тем кибербезопасности, биологии или химии, что вызвало неоднозначную реакцию в профессиональном сообществе.
Claude Fable 5 создавалась как публичный аналог закрытой модели Mythos 5, которая по своим возможностям находится на порядок выше всех предыдущих версий. В отличие от «игрушечных» чат-ботов, Mythos 5 способна автономно выполнять сложные многошаговые задачи без вмешательства человека. Во внутренних экспериментах компания предоставила модели доступ к данным геномных исследований, и та больше недели самостоятельно анализировала информацию о миллионах клеток ста тридцати восьми видов животных, параллельно обучая собственные вспомогательные модели машинного обучения.
В итоге она превзошла часть уже опубликованных научных решений, затратив при этом заметно меньше вычислительных ресурсов. Именно эта версия используется в сотрудничестве с правительством США в рамках проекта Glasswing, направленного на обеспечение кибербезопасности критической инфраструктуры. По понятным причинам доступ к Mythos 5 открывается только проверенным организациям и экспертам — например, специалистам по кибербезопасности или поставщикам критической инфраструктуры.
Однако общественность получила облегчённую версию, названную Fable 5, которая сохранила многие ключевые возможности, но обзавелась серьёзными программными ограничителями.
Во-первых, Fable 5 отлично справляется с программированием: она может писать и отлаживать код, проводить рефакторинг крупных кодовых баз, при этом её контекстное окно составляет один миллион токенов, что позволяет обрабатывать за раз более семисот страниц текста.
Во-вторых, она умеет анализировать любые данные: финансовые отчёты, таблицы, диаграммы, графики, а также извлекать точные сведения из сложных научных изображений или даже восстанавливать исходный код веб-приложения по его скриншоту.
В-третьих, модель способна генерировать научные гипотезы и выполнять длительные автономные цепочки действий. Цена за использование составляет десять долларов за один миллион входных токенов и пятьдесят долларов за миллион выходных токенов, а максимальный ответ может достигать ста двадцати восьми тысяч токенов. Но есть один нюанс: как только пользователь задаёт вопрос, связанный с кибербезопасностью, биологией, химией или пытается выполнить дистилляцию модели (то есть скопировать её возможности в другую нейросеть), система мгновенно переключается на более старую и безопасную версию — Claude Opus 4.8. По данным компании, такие переключения происходят менее чем в пяти процентах сессий, и для тестирования надёжности этой защиты
Anthropic привлекла независимых хакеров, которые не смогли найти универсального способа обойти фильтры. С одной стороны, это снижает риски использования мощного искусственного интеллекта во вредоносных целях, с другой — вызывает вопросы о том, насколько публичная модель является действительно «публичной». Многие разработчики и исследователи выражают недовольство тем, что они не могут проверить её реальную мощь в чувствительных, но легальных областях, например, при создании лекарств или анализе уязвимостей собственного кода. Тем не менее сама компания считает такой подход новой философией ответственного искусственного интеллекта: доступ к самым опасным возможностям должны иметь только проверенные организации, что в перспективе может стать отраслевым стандартом. Это создаёт серьёзное давление на конкурентов в лице OpenAI с их ChatGPT, Google с Gemini и других игроков, которые также развивают модели для программирования и анализа данных.
Если Anthropic сможет убедить крупный бизнес, что Fable 5 действительно лучше справляется с длинными и сложными сценариями, многие компании начнут мигрировать с привычных решений. Но есть и более глубокий подтекст. Anthropic одной из первых открыто говорит о риске рекурсивного самоулучшения — ситуации, когда системы искусственного интеллекта начинают самостоятельно совершенствовать собственные алгоритмы, и этот процесс выходит из-под контроля человека. Поэтому компания предлагает заранее создавать международные механизмы координации, которые в случае необходимости позволят замедлить или временно приостановить разработку наиболее передовых моделей.
Таким образом, история с Fable 5 и Mythos 5 — это не просто очередной релиз, а эксперимент по внедрению ограничений в саму архитектуру сверхмощного искусственного интеллекта. Удастся ли этот подход или пользователи найдут способы обойти фильтры, покажет время, но уже очевидно, что индустрия подошла к рубежу, где безопасность начинает значить не меньше, чем производительность.

