Нашумевший стартап DeepSeek выпустил Janus Pro — мощный ИИ-генератор изображений, который потягается с OpenAI DALL-E 3
Релиз новой мультимодальной модели DeepSeek под названием Janus Pro ставит под сомнение не только техническое превосходство американских аналогов вроде DALL-E 3, но и саму структуру рынка полупроводников. Китайский стартап, уже успевший взбудоражить Уолл-стрит своим энергоэффективным чат-ботом, теперь предлагает open-source решение, которое, по заявлениям разработчиков, превосходит эталонные PixArt-alpha и Stable Diffusion XL. Однако главная интрига кроется не в бенчмарках, а в том, как это повлияет на цепочки поставок чипов и инвестиционные стратегии гигантов Кремниевой долины.
Архитектура Janus Pro: универсальность в ущерб разрешению
Семейство моделей Janus Pro, доступное под лицензией MIT, включает версии от 1 до 7 миллиардов параметров. Флагманская Janus Pro 7B, согласно внутренним тестам компании, демонстрирует лучшие показатели в бенчмарках GenEval и DPG-Bench, обходя узкоспециализированные решения конкурентов. Ключевое архитектурное отличие — совмещение функций генерации и анализа изображений в одной системе, что является редкостью для моделей такого масштаба.
«Janus Pro превосходит предыдущие универсальные модели и сопоставима, и даже превосходит узкоспециализированные решения других компаний. Простота, гибкость и эффективность делают нашу ИИ-модель кандидатом на новое поколение мультимодальных систем», — отмечают в пресс-релизе разработчики.
Текущие ограничения и производительность
Несмотря на заявленные успехи, текущая версия алгоритма имеет существенное аппаратное ограничение: генерируемые изображения имеют разрешение всего 384 × 384 пикселя. Это значительно уступает стандартам современных коммерческих моделей. Тем не менее, аналитики подчеркивают, что для компактных архитектур такие результаты выглядят впечатляюще, особенно с учетом открытого кода, который позволяет дорабатывать модель под конкретные задачи.
Успех DeepSeek, чей чат-бот ранее возглавил рейтинг приложений в App Store, заставил аналитиков с Уолл-стрит и ИТ-экспертов пересмотреть прогнозы по лидерству США в гонке искусственного интеллекта. Стартап, финансируемый хедж-фондом High-Flyer Capital Management, использует принципиально иные методы обучения, которые требуют меньше вычислительных ресурсов. Это ставит под вопрос текущий ажиотажный спрос на специализированные чипы для ИИ, такие как ускорители NVIDIA, и может изменить баланс сил на рынке.
Революционность Janus Pro заключается именно в его универсальности и открытости. Объединение анализа и генерации в одной модели редко встречается в системах такого размера. Хотя разрешение изображений пока не дотягивает до уровня DALL-E 3, открытая лицензия MIT и адаптивность могут кардинально ускорить внедрение Janus Pro в коммерческие проекты, от автоматизированного дизайна до систем компьютерного зрения.






