Подписаться
Опубликовано

GPT-OSS-20B на H100: 156 млрд токенов/мес

Автор
  • Имя
    Новости нашего ИТ
    Telegram

GPT-OSS-20B, H100: выжимаем 156 миллиардов токенов в месяц #docker После релиза GPT-OSS-20B от OpenAI было много новостей, но конкретных бенчмарков с реальными цифрами я так и не нашел. Решил выжать из модели максимум на H100 PCIe 80GB. Что получилось: до 60K токенов/сек c 91% загрузка GPU. Внутри пишу, как я это сделал по шагам!

link

Новости нашего ИТ
14 подписчиков
5145 постов
Данный канал является агрегатором технических статей нашего любимого ИТ, так что кто устал листать тысячи сайтов в поиске технических статей присоеденяйтесь к каналу и наслаждайтесь #it_news

Свежие посты