Новости нашего ИТ

Подписаться

Опубликовано: четверг, 17 апреля 2025 г.

Настройка Triton Inference Server

Автор

Имя
Новости нашего ИТ
Telegram
telegram

Новости нашего ИТ

12 подписчиков

4804 поста

Данный канал является агрегатором технических статей нашего любимого ИТ, так что кто устал листать тысячи сайтов в поиске технических статей присоеденяйтесь к каналу и наслаждайтесь #it_news

Как готовить Triton: рецепты вашей собственной Inference-платформы #Kubernetes Привет, Хабр! Меня зовут Антон, я DevOps-инженер в команде Data/ML-продуктов Selectel. Если вам нужно запустить небольшой инференс одной ML-модели, можно взять команду бэкендеров, дать им эту модель, они обернут ее в эндпоинт — и готово. Достаточно короткого скрипта из нескольких строк на Python. Но что если нужно запускать несколько моделей, оптимизировать выполнение, работать с ансамблем моделей, задействовать CPU и GPU одновременно и т. д.? Все эти проблемы решает NVIDIA Triton Inference Server. Правда, он добавляет одну новую: разобраться с ним и его документацией — тот еще квест. В статье посмотрим, насколько сложной задачей может оказаться создание собственного инференса и какие аспекты нужно учитывать. Научимся запускать различные форматы моделей, посмотрим на основные фичи Inferenc

Обсудить в Telegram

Новости нашего ИТ

12 подписчиков

4804 поста

Данный канал является агрегатором технических статей нашего любимого ИТ, так что кто устал листать тысячи сайтов в поиске технических статей присоеденяйтесь к каналу и наслаждайтесь #it_news

Предыдущий пост

Опубликовано: 17 апр. 2025 г.

PVS-Studio 7.36: MISRA, Qt Creator 16, C#

PVS-Studio 7.36: новые возможности MISRA, плагин Qt Creator 16, поддержка аннотаций C#

Следующий пост

Опубликовано: 17 апр. 2025 г.

Мигрируем с Jira и Confluence на бесплатную версию конвейера EvaTeam

Мигрируем с Jira и Confluence на бесплатную версию конвейера EvaTeam #docker EvaTeam выпустила бесплатную версию EvaDev для IT-компаний, версия...

Из подборки #ai

Опубликовано: 16 янв. 2026 г.

+1

Хакатон Норникеля: YOLO, 2 место

Хакатон Норникеля YOLO 2 место как выиграть

Опубликовано: 15 янв. 2026 г.

+1

Spring AI Agentic Patterns Part 2 AskUserQuestion

Spring AI Agentic Patterns part 2: AskUserQuestionTool – agents clarify before acting

Опубликовано: 15 янв. 2026 г.

+1

Roo Code: как использовать DeepSeek для тестирования

Как использовать Roo Code с DeepSeek для тестирования Java приложений

Опубликовано: 14 янв. 2026 г.

+1

Нейросети для задач: сравнение Кэмп и ChatGPT

Как решить задачи программирования с помощью нейросетей: сравнение Кэмп, ChatGPT, Claude

Опубликовано: 14 янв. 2026 г.

+1

Я год не пишу код вручную и не вернусь

AI-driven инструменты разработки без написания кода вручную

Опубликовано: 14 янв. 2026 г.

+1

ИИ-статьи: спасение автора или смерть интернета

ИИ-статьи спасение автора или смерть интернета

Все посты из подборки →

Свежие посты

Опубликовано: 16 янв. 2026 г.

+1

Удобная синхронизация настроек Kafka

Удобная синхронизация настроек Kafka в кластере

Опубликовано: 16 янв. 2026 г.

+1

Spring Data 2025.1.2 и 2025.0.8 released

Spring Data 2025.1.2 и 2025.0.8: релиз и новые возможности

Опубликовано: 16 янв. 2026 г.

+1

How Ansible does the real work in hyperautomation

Как Ansible реализует реальную работу в гиперавтоматизации?

Опубликовано: 16 янв. 2026 г.

+1

OpenMedata в облаке: DataGovernance обзор Collate 1

OpenMedata в облаке Data Governance обзор Collate часть 1

Опубликовано: 16 янв. 2026 г.

+1

Python без Python: как запускать код где угодно

как запускать Python код где угодно без установки

Опубликовано: 16 янв. 2026 г.

+1

Хакатон Норникеля: YOLO, 2 место

Хакатон Норникеля YOLO 2 место как выиграть

Опубликовано: 16 янв. 2026 г.

+1

Nginx с человеческим лицом: обзор Nginx Proxy Manager

обзор Nginx Proxy Manager для новичков DevOps

Опубликовано: 16 янв. 2026 г.

От поэзии к нейробиологии: проверка метафор любви

Научная проверка метафор любви в поэзии и нейробиологии

Следующие посты →