Опубликовано 07 декабря 2024, 02:42
1 мин.

Google представила свою новейшую ИИ-модель: на что она способна

PaliGemma 2
Google представила PaliGemma 2, свою новейшую модель VLM, которая является обновлением первоначальной версии, выпущенной в начале этого года. Модель поддерживает такие задачи, как создание подписей к изображениям, распознавание текста, обнаружение объектов и визуальные ответы на вопросы.
Google представила свою новейшую ИИ-модель: на что она способна

© Google

В PaliGemma 2 появились «длинные подписи», которые обеспечивают подробное, контекстно-зависимое описание изображений, включая действия, эмоции и повествования. Кроме того, в модели улучшено оптическое распознавание символов, она может анализировать таблицы, химические формулы, интерпретировать музыкальные партитуры и генерировать медицинские отчеты, например, на основе рентгеновских снимков грудной клетки.

Модель выпускается с параметрами 3B, 10B и 28B и разрешением до 896px. Она призвана заменить оригинальную PaliGemma с минимальными усилиями у разработчиков — без существенных изменений в коде. Также упрощается тонкая настройка модели для конкретных задач.