- Опубликовано
RAG‑системы: 10 стратегий оптимизации чанкинга
- Автор

- Имя
- Новости нашего ИТ
- Telegram
Новости нашего ИТ12 подписчиков4790 постовДанный канал является агрегатором технических статей нашего любимого ИТ, так что кто устал листать тысячи сайтов в поиске технических статей присоеденяйтесь к каналу и наслаждайтесь #it_news
Архитектура высоконагруженных RAG-систем: 10 стратегий оптимизации чанкинга и интеграция с Weaviate, Qwen / Llama /Gemma
#docker
Привет, Хабр! Это Андрей Носов, AI-архитектор в компании Raft, проектирую и внедряю высоконагруженные RAG-системы на предприятиях. Сегодня я расскажу о вызовах, которые мы преодолеваем каждый день, создавая такие системы, и сделаю акцент на чанкинге. Обозначим направления, в которых мы будем работать. Сегодня поговорим только о двух возможностях применения больших языковых моделей — это MedTech и LegalTech. Они наиболее востребованные на рынке в текущий момент в плане систем поиска. Такой выбор направлений связан с глобальным трендом на работу с профессиональными знаниями, о котором говорят Gartner и OpenAI.
Новости нашего ИТ
12 подписчиков
4790 постов
Данный канал является агрегатором технических статей нашего любимого ИТ, так что кто устал листать тысячи сайтов в поиске технических статей присоеденяйтесь к каналу и наслаждайтесь #it_news
Предыдущий пост
- Опубликовано
Реверс-инжиниринг Android с Frida
Как использовать Frida для динамического реверс-инжиниринга Android приложений
Следующий пост
- Опубликовано
Веб уязвимости осени
веб уязвимости осени тестирование проникновение свежие уязвимости
Из подборки #ai
- Опубликовано
#docker
+1
Хакатон Норникеля: YOLO, 2 место
Хакатон Норникеля YOLO 2 место как выиграть
- Опубликовано
#ai
+1
Spring AI Agentic Patterns Part 2 AskUserQuestion
Spring AI Agentic Patterns part 2: AskUserQuestionTool – agents clarify before acting
- Опубликовано
#java
+1
Roo Code: как использовать DeepSeek для тестирования
Как использовать Roo Code с DeepSeek для тестирования Java приложений
- Опубликовано
#java
+1
Нейросети для задач: сравнение Кэмп и ChatGPT
Как решить задачи программирования с помощью нейросетей: сравнение Кэмп, ChatGPT, Claude
- Опубликовано
Я год не пишу код вручную и не вернусь
AI-driven инструменты разработки без написания кода вручную
- Опубликовано
ИИ-статьи: спасение автора или смерть интернета
ИИ-статьи спасение автора или смерть интернета
Свежие посты
- Опубликовано
Kafka
+1
Удобная синхронизация настроек Kafka
Удобная синхронизация настроек Kafka в кластере
- Опубликовано
#java
+1
Spring Data 2025.1.2 и 2025.0.8 released
Spring Data 2025.1.2 и 2025.0.8: релиз и новые возможности
- Опубликовано
#devops
+1
How Ansible does the real work in hyperautomation
Как Ansible реализует реальную работу в гиперавтоматизации?
- Опубликовано
OpenMedata в облаке: DataGovernance обзор Collate 1
OpenMedata в облаке Data Governance обзор Collate часть 1
- Опубликовано
#docker
+1
Python без Python: как запускать код где угодно
как запускать Python код где угодно без установки
- Опубликовано
#docker
+1
Хакатон Норникеля: YOLO, 2 место
Хакатон Норникеля YOLO 2 место как выиграть
- Опубликовано
#devops
+1
Nginx с человеческим лицом: обзор Nginx Proxy Manager
обзор Nginx Proxy Manager для новичков DevOps
- Опубликовано
От поэзии к нейробиологии: проверка метафор любви
Научная проверка метафор любви в поэзии и нейробиологии