Новости нашего ИТ логотип
Подписаться
Опубликовано

GPT-OSS-20B на H100: 156 млрд токенов/мес

Автор

GPT-OSS-20B, H100: выжимаем 156 миллиардов токенов в месяц #docker После релиза GPT-OSS-20B от OpenAI было много новостей, но конкретных бенчмарков с реальными цифрами я так и не нашел. Решил выжать из модели максимум на H100 PCIe 80GB. Что получилось: до 60K токенов/сек c 91% загрузка GPU. Внутри пишу, как я это сделал по шагам!

link

avatar
Новости нашего ИТ
12 подписчиков
4766 постов
Данный канал является агрегатором технических статей нашего любимого ИТ, так что кто устал листать тысячи сайтов в поиске технических статей присоеденяйтесь к каналу и наслаждайтесь #it_news

Свежие посты