5 главных новостей об искусственном интеллекте, которые вы пропустили на этой неделе: обновления ChatGPT и последние шаги Google

На этой неделе компании, занимающиеся искусственным интеллектом, преподнесли несколько сюрпризов, которые ранее не были в центре внимания. Похоже, Близнецы от Google На пути к тому, чтобы стать любимцем публики, в то время как Grok Он возглавляет список самых эффективных чат-ботов. Также представлена новая модель медицинского ИИ, которая помогает врачам выявлять более 1000 заболеваний, включая рак.

Тем временем ChatGPT предпринимает активные шаги по повышению безопасности своих самых юных пользователей, вводя меры безопасности для пользователей младше 18 лет. Вот главные новости об искусственном интеллекте, которые вам нужно знать на этой неделе.

Gemini — фаворит публики среди 27 различных моделей ИИ.

В одном из крупнейших публичных опросов такого рода более 21 000 участников из США и Великобритании оценили 27 различных моделей искусственного интеллекта — и Близнецы 2.5 Про Возглавляет список. Исследование, проведенное с использованием системы Humaine компании Prolific, оценивало модели по таким критериям, как стиль общения, способность делать выводы, уровень доверия и общий пользовательский опыт.

Gemini превзошла своих конкурентов, включая ChatGPT и Claude, в большинстве подкатегорий, закрепив за собой статус самой передовой модели вывода Google на сегодняшний день. ChatGPT заняла восьмое место в общем рейтинге.

Ключевые моменты:

Gemini 2.5 Pro занимает первое место По результатам опроса общественного мнения, в котором приняли участие 27 моделей в США и Великобритании.
21,352 человек поделились Результаты получены из разных демографических групп.
Критерии оценки: Коммуникация, гибкость, рассуждение, доверие и общий пользовательский опыт.
ChatGPT занял восьмое место В целом релизы Клода заняли 11-е и 12-е места.

ChatGPT создает функции специально для подростков

Наконец, OpenAI запускает Новые правила безопасности для подростковОбновления включают в себя систему прогнозирования возраста для определения пользователей младше 18 лет, с применением превентивных мер безопасности, если возраст неизвестен. Среди обещаний — более строгие фильтры для деликатных тем (контент сексуального характера, самоповреждение и т. д.), а также родительский контроль, такой как блокировка по времени и возможность связывания аккаунтов.

Эти изменения — только начало, но они поднимают сложные вопросы о том, как будет определяться возраст, как часто ошибки будут влиять на доверие и будут ли подростки чувствовать себя в безопасности, открываясь другим, если они боятся, что их будут наблюдать или осуждать.

Что нужно знать

Новое правило определения возрастаOpenAI будет направлять пользователей, которым, по ее мнению, меньше 18 лет, к версии ChatGPT с более строгими правилами безопасности.
По умолчанию для несовершеннолетнихЕсли возраст невозможно подтвердить, система принимает меры предосторожности, в любом случае применяя незначительные ограничения.
Предоставление инструментов родительского контроляРодители могут подключиться к учетной записи своего подростка, отключать или ограничивать функции (например, память или историю), устанавливать безопасные часы (блокировать часы) и получать оповещения, если ИИ обнаруживает признаки беспокойства.
Ограничения чата для подростковЗапрещены откровенные сексуальные материалы, кокетливые разговоры и обсуждения самоповреждения. В крайних случаях, когда существует угроза причинения вреда здоровью, если с родителями невозможно связаться, могут быть вызваны правоохранительные органы.

Теперь вы можете поделиться своими индивидуальными творениями Gemini.

Google расширяет возможности Gemini, предоставляя пользователям возможность делиться своими персональными помощниками — Gems. Для тех, кто знаком с ChatGPT, это, по сути, Пользовательские модели GPTДо сих пор это было Драгоценные камни Близнецов Ограниченный рамками личного использования, он теперь может распространяться так же легко, как Google Docs, позволяя коллегам, студентам и всем остальным сотрудничать с индивидуально разработанным ИИ, без необходимости разрабатывать его с нуля.

Этот шаг подчеркивает стремление Google сделать Gemini более гибкой и удобной для пользователя платформой.

Что вам нужно знать:

Настраиваемые драгоценные камни Это помощники на базе искусственного интеллекта, которых можно создать для выполнения конкретных задач, таких как программирование, редактирование или мозговой штурм.
Драгоценные камни делятся Как и при обмене любым другим контентом на Google Диске, при совместной работе другие пользователи могут просматривать или редактировать ваш Gem.
Теперь доступно для подписчиков Gemini Advanced, Business и Enterprise в более чем 150 странах.

Grok возглавляет список ARC-AGI

Илон Маск и Grok 4, похоже, лидируют в гонке за ИИ, возглавив рейтинг ARC-AGI — бенчмарка, измеряющего количество задач, которые может решить ИИ, и эффективность модели. В недавних тестах Grok 4 превзошёл конкурентов, таких как ChatGPT и Gemini, по этому сложному показателю, продемонстрировав свою превосходную способность решать реальные задачи и высокую скорость.

Несмотря на скорость, использование живого веб-поиска и впечатляющую обработку сложных технических заявлений, пользователи по-прежнему обеспокоены точностью Grok, модерацией контента и предвзятостью.

Что вам нужно знать:

Лидер списка ARC-AGIGrok 4 претендует на первое место, поскольку решает больше стандартных задач ИИ на единицу ресурсов, чем конкуренты.
точка силы: Практически мгновенный поиск в Интернете, улучшенная обработка сложных геометрических и логических задач, а также повышение производительности по сравнению с предыдущими версиями Grok.
Слабости и страхи
: Проблемы с точностью контента (некоторые неверные утверждения), проблемы с предвзятостью и трудности с поддержанием умеренности и надежности при интенсивном использовании.
Заключение:Это демонстрирует, что эффективность и качество все чаще вознаграждаются в тестах ИИ.

Новая модель искусственного интеллекта прогнозирует риск развития более 1000 заболеваний, включая рак.

Новая модель искусственного интеллекта Delphi-2M представляет собой качественный скачок в развитии медицинского искусственного интеллекта. Обученная на анонимных данных о здоровье почти 2.3 миллиона человек из Великобритании и Дании, она способна прогнозировать риск развития более 1000 заболеваний и определять сроки их развития.

В отличие от других моделей искусственного интеллекта, Delphi-2M оценивает риск для 1000 случаев, используя историю болезни, факторы образа жизни, возраст и пол для моделирования динамики здоровья на протяжении десятилетий. Модель может предсказать не только само заболевание, но и время его возникновения.

В ходе экспериментов система достигла средней площади под кривой (AUC) 0.76 для сотен заболеваний в британских наборах данных, хотя точность снизилась в датских популяциях. Следует подчеркнуть, что эта модель не является диагностическим инструментом и не заменяет врачей-практиков.

Однако этот инструмент обещает стать прогностическим средством, полезным для мониторинга общих тенденций риска, планирования профилактических мер и демонстрации потенциала ИИ в сфере личного здоровья.

Ключевые моменты:

огромный набор данных:Обучено около 2.3 млн человек из Биобанка Великобритании и датских реестров.
Комплексное и временное моделированиеОн использует подробные входные данные (возраст, пол, образ жизни, предыдущие диагнозы) и прогнозирует как следующее заболевание, так и следующие: ومتى Это произойдет.
Прогнозирование, а не диагноз: Он призван служить профилактическим руководством, а не заменять медицинскую консультацию.

Заключение

Всего за одну неделю эти обновления подчеркивают явный сдвиг в сфере ИИ в сторону интеграции с реальным миром и более крупных прорывов.