Anthropic представила Claude Opus 4.8, новую версию самой мощной модели компании. По словам разработчика, она выделяется более высокой честностью относительно своих ошибок при написании кода и большей производительностью.
Ключевые изменения
Напомним, Claude Opus 4.7 вышла в апреле 2026 года. Новая модель работает быстрее и эффективнее в сравнительных тестах, а также включает в себя набор новых функций. При этом Claude Opus 4.8 доступна по старой цене — $5 за 1 млн входящих токенов и $25 за 1 млн исходящих.
Сравнивая новую модель с предыдущей, а также основными конкурентами, компания заявила о значительном росте показателей. В бенчмарке SWE-Bench Pro, который оценивает способность исправлять реальные ошибки в коде, Claude Opus 4.8 набрала 69,2% против 64,3% у версии 4.7. У OpenAI GPT-5.5 — 58,6%.
В тесте OSWorld, который анализирует способность выполнять реальные задачи в рамках ОС, модель получила 83,4%. А в бенчмарке GDPval-AA, оценивающем сложные интеллектуальные задачи, результат составил 1890 баллов против 1753 у Claude Opus 4.7.
Вместе с тем модель по-прежнему уступает в GPT-5.5 в тесте Terminal-Bench 2.1. Он оценивает работу ИИ-агентов в реальных терминальных средах.
В бенчмарке Humanity’s Last Exam, который представляет собой набор из 2500 вопросов по различным наукам, модель получила отметку 49,8% без использования инструментов и 57,9% с ними, опередив всех трех конкурентов.
Среди отзывов на странице с анонсом компания Linkup заявила о том, что Claude Opus 4.8 стала единственной моделью, которой удалось пройти все кейсы от начала и до конца в рамках Super-Agent benchmark, сохраняя паритет по стоимости с предыдущей версией и GPT-5.5.
Одним из ключевых изменений, заявленных Anthropic, является якобы более высокая честность нового решения. Из релиза следует, что Claude Opus 4.8 в четыре раза реже допускает сокрытие ошибок в коде, а также менее склонна к неподтвержденным утверждениям.
Что касается сравнения с Claude Mythos Preview, потенциально лучшей, но закрытой моделью, то Anthropic подчеркнула, что Opus 4.8 «не расширяет границы возможностей» за ее пределы, в первую очередь в сфере кибербезопасности.
«Мы протестировали модель на наборе тестов по кибербезопасности, некоторые из которых мы использовали впервые в системной карте. При работе без мер безопасности Opus 4.8 демонстрирует несколько более высокие возможности, чем Claude Opus 4.7; с мерами безопасности его показатели сопоставимы. Он по-прежнему значительно отстает от Mythos Preview по кибервозможностям», — говорится в отчете по модели.
Также Claude Opus 4.8 якобы демонстрирует такие же показатели в разрезе обсуждения чувствительных тех, как и Opus 4.7, но при этом «чаще признает противоположные точки зрения во время политических дискуссий». При этом она «чуть менее довольна» своим положением в сравнении с предыдущей.
Новые функции
Вместе с Claude Opus 4.8 компания представила ряд нововведений. В первую очередь это Dynamic Workflows в Claude Code. Ее суть заключается в том, что модель использует субагентов для того, чтобы «раздробить» задачу в рамках одной сессии. Перед выдачей результаты будут верифицированы. Функция доступна пользователям тарифных планов Enterprise, Team и Max.
Кроме того, Anthropic добавила возможность выбора объемы вычислений, затрачиваемых на решение задачи. Функция доступна в селекторе модели. Выбор варьируется от Low до Max, по умолчанию установлен уровень High. Выбор влияет на глубину ответов и, как следствие, расход токенов. Функция доступна во всех тарифных планах.
Также, согласно заявлению Anthropic, режим Fast Mode стал дешевле, приблизительно в три раза по сравнению с предыдущей версией. Он позволяет ускорить выполнение запросов с сохранением производительности и точности выдачи.
Кроме того, компания указала, что теперь пользователи могут уточнять и дополнять запросы непосредственно при выполнении задач. При этом Claude не будет раз за разом считывать весь контекст.
Среди других изменений Anthropic отметила, что увеличила лимиты запросов в Claude Code и готовится к запуску семейства Mythos. Это произойдет в ближайшие недели. Ранее компания признала их «слишком опасными» для публичного релиза.
Подготовка к IPO и фон для запуска новых моделей
Релиз Claude Opus 4.8 и анонс публичного доступа к Mythos вышли на фоне подготовки Anthropic к первичному публичному размещению. Этому также предшествовали партнерские соглашения , в том числе для расширения доступных вычислительных мощностей.
Вместе с тем 28 мая 2026 года компания заявила об успешном закрытии раунда серии H на $65 млрд при оценке в $965 млрд. Это более чем вдвое больше по сравнению с показателем при предыдущем привлечении средств, в феврале. Также это превосходит подтвержденную оценку OpenAI .
Привлеченные средства компания намерена направить на масштабирование и расширение своих возможностей в сфере высокопроизводительных вычислений.
Новая оценка, выход Opus 4.8, анонс Mythos — все это ужесточает конкурентную борьбу между Anthropic и OpenAI. И это при том, что ни одна из компаний до сих пор не назвала временные рамки для проведения IPO.
Будь в курсе! Подписывайся на Телеграм.
Подписывайтесь на страницы новостей криптовалют -











