Alibaba воспользовалась хайпом вокруг DeepSeek и выпустила свою новейшую ИИ-модель
Alibaba Cloud представляет модели для визуального понимания и работы с длинными документами/imgs/2025/01/29/15/6720224/04ff0c63912d2760c7b9ef92ba7cb9606c277d7f.jpeg)
Qwen2.5-VL, продвинутая визуально-языковая модель, может анализировать изображения, графики и видео длительностью более часа. Она также может определять точные моменты в видео и превращать отсканированные документы в структурированные данные. Модель выпускается в разных размерах, а самая мощная версия, Qwen2.5-VL-72B-Instruct, доступна в Qwen Chat, Hugging Face и на Model Scope.
Между тем Qwen2.5−1M специализируется на работе с длинными документами, обрабатывая до 1 миллиона лексем — намного больше, чем типичные модели ИИ. Это делает его идеальным для обобщения и анализа длинных текстов, таких как научные работы или отчеты. Alibaba также выпустила оптимизированный фреймворк на GitHub, чтобы помочь разработчикам запускать модель быстрее и с меньшими затратами.