Теперь каждый может обучить себе рассуждающий ИИ всего за $450 — открыт исходный код Sky-T1

12 янв 2025, 22:48

Революция в мире искусственного интеллекта происходит не в тиши корпоративных лабораторий с многомиллионными бюджетами. Исследователи из Калифорнийского университета в Беркли представили модель Sky-T1-32B-Preview, которая бросает вызов устоявшимся представлениям о стоимости и доступности передовых нейросетей. Главный сюрприз: алгоритм, способный конкурировать с флагманскими решениями вроде OpenAI o1, обошелся создателям менее чем в 450 долларов.

Бюджетное рассуждение: как 450 долларов меняют правила игры

Демократизация технологий «рассуждающего» ИИ стала реальностью. Sky-T1 — первая модель с открытым исходным кодом, обладающая способностью к многоступенчатому анализу и проверке фактов. Разработчики не просто выложили код, но и опубликовали полный набор данных для обучения, что позволяет любому исследователю или компании воспроизвести результат с нуля. Ключевой фактор, сделавший это возможным, — использование синтетических данных, сгенерированных другими нейросетями, что радикально снизило затраты на разметку и подготовку информации.

Технология прорыва: от QwQ до H100 за 19 часов

Процесс создания Sky-T1 демонстрирует новый подход к разработке ИИ. Первоначальный набор данных был получен с помощью модели рассуждения Alibaba QwQ-32B-Preview. Затем эти данные были «отшлифованы» и приведены к более точному формату с использованием GPT-4o-mini от OpenAI. Само обучение 32-миллиардной модели заняло всего 19 часов на кластере из восьми ускорителей Nvidia H100. Для сравнения: еще недавно обучение сопоставимой по мощности модели обходилось в миллионы долларов, а недавний алгоритм Palmyra X 004 от компании Winter потребовал инвестиций в размере 700 тысяч долларов.

Способность к рассуждению, которой обладает Sky-T1, кардинально отличает её от обычных языковых моделей. Такие алгоритмы не просто генерируют правдоподобный текст — они проверяют логические цепочки, перепроверяют факты и тратят больше времени на формирование ответа. Это делает их значительно более надежными в критически важных областях: физике, математике, естественных науках и сложном анализе данных, где цена ошибки особенно высока.

Ранее разработка «рассуждающих» нейросетей была прерогативой гигантов индустрии с бездонными бюджетами. Основным барьером служила стоимость сбора и очистки данных высокого качества. Переход на синтетические данные, сгенерированные более мощными моделями, открыл путь для небольших лабораторий и стартапов. Этот шаг может привести к лавинообразному росту числа специализированных моделей, обученных под узкие задачи, что ускорит внедрение ИИ в науке и инженерии.

Снижение порога входа в создание мощных ИИ-моделей несет в себе двойственный эффект. С одной стороны, это ускоряет инновации и снижает монополию крупных корпораций на передовые технологии. С другой стороны, упрощение доступа к инструментам синтеза данных и обучения может привести к появлению некачественных или небезопасных моделей. Разработчики Sky-T1 уже заявили, что их следующая цель — создание еще более эффективных алгоритмов, сохраняющих высокую производительность при рассуждениях, что указывает на наметившуюся гонку за оптимизацию, а не только за сырой вычислительной мощностью.

Опубликовано: Мировое обозрение Источник

Песков: У ЕС почти не осталось санкций, которые не били бы по самой Европе

«Перебрал дозы на выходные»: В Госдуме высмеяли фантазии Зеленского о мобилизации в России

Захарова пообещала зеркальную реакцию на высылку российского дипломата из Румынии

Теперь каждый может обучить себе рассуждающий ИИ всего за $450 — открыт исходный код Sky-T1

Бюджетное рассуждение: как 450 долларов меняют правила игры

Технология прорыва: от QwQ до H100 за 19 часов

Подписывайтесь:

Топ за неделю

Украинские БПЛА снова долетели до Башкирии. На НПЗ в Туймазах пожар

Боевые мыши НАТО: этой чудо-армией Эстония, Латвия и Литва собрались воевать с Россией

ВСУ ракетой «Фламинго» атаковали завод «Авиатэк» в Кирове

БПЛА атаковали гражданские автомобили на пункте пропуска «Чонгар», есть жертвы

В Белгороде в результате атаки дрона по АЗС погиб секретарь местного горкома Александр Логвинов

Боевые мыши НАТО: этой чудо-армией Эстония, Латвия и Литва собрались воевать с Россией

Когда падёт Запад...

ВСУ ракетой «Фламинго» атаковали завод «Авиатэк» в Кирове

Три принципа перезагрузки стратегии СВО для убедительной победы

Почему корёжит бесов восстановление памятников советского прошлого

Теперь каждый может обучить себе рассуждающий ИИ всего за $450 — открыт исходный код Sky-T1

Бюджетное рассуждение: как 450 долларов меняют правила игры

Технология прорыва: от QwQ до H100 за 19 часов

Подписывайтесь:

Топ за неделю

Последние новости

Согласие на использование файлов cookie