Компания Google представила новое поколение своих нейросетей — Gemini 3. Её флагманская модель Gemini 3 Pro с первого дня стала доступна всем пользователям в приложении Gemini и в поисковике, сообщили в пресс-службе Google. Разработчики назвали её «самой умной» и «фактически точной» фирменной ИИ-системой.
Модель Gemini 3 Pro изначально мультимодальна: она может обрабатывать текст, изображения и звук одновременно, а не по отдельности. Это позволяет, например, перевести фотографии с рецептами и преобразовать их в целую кулинарную книгу или создать интерактивные карточки на основе серии видеолекций.
«Gemini 3 Pro обладает улучшенными аналитическими возможностями, в том числе в режиме агента, что позволяет выполнять более сложные задачи и планировать действия на более длительные периоды», — пояснили разработчики.
В поисковике модель работает в «Режиме ИИ». Она использует усовершенствованный «метод разветвления запросов», который теперь не только дробит вопросы на части, но и лучше распознаёт намерения пользователя. Также Google тестирует в Gemini Labs инструмент «генеративные интерфейсы», с помощью которого нейросеть может создавать визуальные макеты в журнальном стиле.
Тенденция к расширению мультимодальных функций у нейросетей набирает обороты. Ранее «Жуковский.Life» сообщал, что чат-бот GigaChat от Сбера также научился работать с новыми форматами: он получил функцию генерации подкастов. Нейросеть создаёт краткий аудиодиалог на основе заданного вопроса, загруженного документа или ссылки, сама выделяя ключевые идеи.
