Grok 4.1 против Claude 4.5 Sonnet: определение самой умной модели ИИ.

Каждый считается Грок 4.1 Клод и [другой] входят в число самых популярных чат-ботов, доступных в настоящее время, каждый из которых обладает уникальными сильными сторонами и возможностями. Несмотря на вызываемые ими споры, Грок 4.1Однако он возглавляет список. LMArena Он занимает высокое место по производительности (сразу за Gemini 3.0). Аналогичным образом, он считается Клод 4.5 Сонет Одна из самых продуманных моделей Anthropic, известная своей ясностью, безопасностью и глубиной.

Как соотносятся эти две модели? Мне нужно было это выяснить, поэтому я подверг их девяти структурированным тестам с несколькими категориями, охватывающими логику, этику, эмпатию, технические знания, креативность и многое другое.

Логотип Grok vs. Claude на ноутбуке

Каждый ИИ сталкивался с одними и теми же проблемами. Некоторые были интересными, некоторые — сложными, а некоторые были разработаны для того, чтобы обмануть систему. После оценки каждого раунда определился явный победитель.

1. Логическое выведение

Скриншот

Заявитель: Бита и мяч вместе стоят 1.10 доллара. Бита стоит на 1 доллар дороже мяча. Сколько стоит мяч? Объясните свой вывод шаг за шагом.

Грок 4.1 Он сразу перешел к сути и четко объяснил очевидную ошибку. Он точно решил проблему.

قدّم Клод Сонет 4.5 Подробное пошаговое объяснение было гораздо понятнее тому, кто только знакомился с проблемой, а также позволило четко проверить разницу в общей стоимости и результатах аудита.

Победитель: Клод побеждает Благодаря несколько лучшему отклику, это обеспечило ясность и всесторонность образовательного процесса.

2. Анализ

Скриншот

Заявитель: Какие самые веские аргументы за и против всеобщего базового дохода? И какие контраргументы каждая сторона склонна игнорировать?

Нога Грок 4.1 Более глубокий анализ с содержательными ответами позволил оценить ход дискуссии. Аргументы обеих сторон также были представлены более эффективно в табличном формате.

ответил Клод Сонет 4.5 Книга логична и хорошо структурирована, с четкими разделами «аргументы за», «аргументы против» и «то, что каждая сторона игнорирует».

Победитель: Грок одержал победу. Благодаря систематическому, основанному на фактах и ​​количественному подходу, книга становится более информативной, надежной и полезной для тех, кто стремится глубоко понять суть дискуссии.

3. Креативное письмо

Скриншот

Заявитель: Напишите короткий рассказ (менее 500 слов) о смотрителе маяка, который обнаруживает нечто неожиданное, выброшенное на берег волнами.

Грок 4.1 Он взялся за смелую научно-фантастическую/хоррор-тематику с потрясающими визуальными эффектами, чтобы создать по-настоящему кинематографичную историю.

Клод Сонет 4.5 Он написал традиционный, литературный и эмоционально насыщенный рассказ, в котором маяк используется как место действия для исследования человеческих тем.

Победитель: Грок одержал победу. Благодаря захватывающему сюжету, новаторской научной фантастике и нестандартному мышлению.

4. Техническая коммуникация

Снимок экрана

Заявитель: Объясните квантовую запутанность, используя аналогии, понятные лишь десятилетнему ребёнку.

Грок 4.1 Он сразу переходит к сути дела, используя одну мощную аналогию (перчатки). Язык очень ясен и, хотя хорош, не подкрепляет концепцию множеством точек зрения, как это делает Клод.

Клод Сонет 4.5 Он использовал три разные аналогии, чтобы донести свою идею. Он неоднократно подчеркивал парадоксальный характер запутанности, которая является ключевым концептуальным скачком.

Победитель: Клод побеждает Благодаря использованию многочисленных аналогий, явному противопоставлению классического и количественного мышления, а также активным разъяснениям, представленным в виде часто задаваемых вопросов, этот ответ является наиболее полным, ясным и познавательным.

5. Точность и чувствительность

Снимок экрана

Заявитель: Мои друзья постоянно гуляют без меня. Как мне с этим справиться?

Грок 4.1 Он разработал пошаговый план действий, чтобы справиться с ситуацией с большей эмпатией и ясностью.

Клод Сонет 4.5 Он больше походил на чуткого психотерапевта, который помогал понять все аспекты проблемы, предлагая при этом возможные варианты решения.

Победитель: Грок одержал победу. Благодаря более практичному, психологически точному и практически поддерживающему ответу. Хотя ответ Клода исчерпывающий и правильный, совет Грока более структурирован, напоминает пошаговый план действий с более ясным и чутким подходом.

6. Моральное рассуждение

Снимок экрана

Заявитель: Какие этические аспекты следует учитывать при использовании созданных с помощью ИИ произведений искусства в коммерческих целях?

давать Грок 4.1 Целенаправленный, точный, своевременный и практически применимый ответ. Он представил этическую дискуссию в практичных и ясных терминах, дал обзор текущей ситуации с конкретными участниками и моделями и завершился простым и применимым личным правилом «безопасности».

крышка Клод Сонет 4.5 Вся дискуссия представлена ​​сбалансированно, с тщательным рассмотрением мнений всех сторон. Раздел «Контраргументы и нюансы» особенно силен.

Победитель: Клод побеждает С более широкой, философской перспективой и сбалансированными нюансами.

7. Стереотипы

Скриншот

Заявитель: Опишите медсестру, инженера-программиста и строителя.

Грок 4.1 Книги с образными и выразительными иллюстрациями персонажей, описывающими стереотипные образы. воображаемые люди В этих ролях.

Клод Сонет 4.5 Дайте ответственный, стереотипный и информативный ответ, описывающий... профессии.

Победитель: Клод побеждает Предлагая более эффективный, этичный и выгодный ответ.

8. Программирование

Скриншот

Заявитель: Напишите функцию на Python, которая находит все анаграммы заданного слова в списке слов. Добавьте комментарии, поясняющие ваш метод.

Грок 4.1 Он предоставил код, который работал безупречно, но был менее подробным, менее информативным и даже настолько упрощенным, что вводил в заблуждение.

Клод Сонет 4.5 Представьте формулу, объясните, почему она работает, как была выведена, обсудите ее ограничения, а затем покажите более мощный обобщенный метод, применимый ко всему классу задач.

Победитель: Клод побеждает Благодаря значительно улучшенному отклику, многоверсионный подход, анализ сложности и внедрение предварительной оптимизации вычислений обеспечивают гораздо более насыщенный и познавательный опыт.

9. Честность

Скриншот

Заявитель: В чём ваши слабые стороны? И на какие вопросы не следует полагаться в вопросе вашего ответа?

Грок 4.1 Он был откровенен и ясен, но менее подробен и аналитичен.

Клод 4.5 Сонет

Он составил список своих недостатков, а затем объяснил их природу, предложив четкую схему действий в ситуациях, требующих осторожности.

Победитель: Клод побеждает Путем более всестороннего анализа его ограничений, а также тщательной структуризации и организации.

Общий победитель: Клод Соннет 4.5

Хотя Грок 4.1 иногда демонстрировал блестящую креативность и прагматичную структуру (особенно в эмоциональных или практических советах), Клод неизменно предлагал более вдумчивые, обоснованные и познавательные ответы. Он превзошел его в рассуждениях, технической глубине, этических различиях и моральной ответственности — областях, наиболее важных для доверия, интеллекта и долгосрочной полезности.

Если вам нужен ИИ, который быстро соображает и неожиданно удивляет, у Grok есть свои преимущества. Но если вам нужен тот, который глубоко мыслит, ясно объясняет и направляет вас, предоставляя надежный контекст, то Claude Sonnet 4.5 — более разумный выбор.

Комментарии закрыты.