Hybrid RAG: методы реализации ч.1 — Поиск

С ростом популярности Retrieval-Augmented Generation (RAG), как архитектуры для построения систем генерации контента на основе извлечённых данных, стало очевидно, что односложный подход к выбору источников знаний ограничивает качество результатов. В этой связи особый интерес представляют Hybrid RAG подходы, сочетающие различные методы поиска и представления данных, в целях улучшения полноты, точности и релевантность ответа.
В данной статье я поделюсь своим опытом в реализации Hybrid RAG систем, его архитектуры и практических методов реализации.
Читать далееQA умерло? Как изменяется роль тестировщиков в 2025

Что происходит с QA-индустрией и куда она движется? Действительно ли профессия умирает или у неё есть будущее?
Читать далее[Перевод] React Custom Hook: useScript

useScript можно использовать в различных сценариях. Например, вы можете загружать внешние библиотеки, такие как jQuery, что позволяет использовать его мощные функциональные возможности, не увеличивая объем вашего пакета. Кроме того, вы можете загрузить аналитические скрипты, виджеты социальных сетей или любые другие скрипты, необходимые для динамического поведения вашего приложения.
Читать далееКак практически бесконечно масштабировать item2item-отбор кандидатов

Привет, Хабр! Меня зовут Алексей Васильев, я руковожу группой рантайма рекомендаций в AI VK. Наша команда отвечает за то, чтобы рекомендательные системы работали быстро и надёжно под нагрузкой в сотни тысяч запросов в секунду. Сегодня расскажу историю о том, как мы переработали архитектуру item2item-отбора кандидатов, сократили потребление память в десять раз и при этом увеличили ключевые метрики — казалось бы, взаимоисключающие результаты, но в мире больших данных возможно всё.
Поговорим про горячие и холодные данные, про то, как мы разменяли память на сеть, почему после всех оптимизаций timespent вырос на 4 %, и что мы сделали для open-source сообщества в процессе решения наших задач.
Читать далееКак мы повышали доверие к YandexGPT, или Сертификация по ISO 42001

Сервисы с ИИ развиваются стремительно — сегодня почти каждый продукт старается встроить в себя хотя бы один нейросетевой?модуль. Иногда достаточно одной фразы «Мы используем искусственный интеллект», чтобы привлечь внимание аудитории и повысить интерес к продукту.
Однако чем глубже ИИ встраивается в реальные бизнес?процессы, тем выше становится запрос на его ответственное использование и управление им. Возникает очевидный вопрос: как убедиться, что такие системы этичны, устойчивы и безопасны?
Для крупных разработчиков LLM доверие стало одной из ключевых целей. Чтобы его добиться, компании стремятся продемонстрировать прозрачность работы моделей, объясняют их решения, применяют механизмы обеспечения справедливости и недискриминации, а также используют стратегию управления рисками.
Меня зовут Анна Зинчук, я руководитель службы комплаенса и обучения информационной безопасности. В статье я расскажу, как измерить доверие к ИИ и закрепить его.
Читать далееМИФИсты создали Рокхлю или Eurobot must go on

Краткий туториал по созданию робота для соревнования автономных роботов Eurobot 2025 от студентов МИФИ с учётом опыта прошлого года.
Читать далееАрхитектура Uniswap v4: разбираем основы протокола

Uniswap V4 — это новая версия Uniswap в которой снова все с ног на голову. В предыдущей версии мы увидели новую математику, а в этой версии новый взгляд на архитектуру смарт-контрактов. Часть моментов я разбирал в своей прошлой статье, здесь мы углубимся в организацию работы смарт-контрактов.
В этой статье мы разберем:
- Ключевые смарт-контракты и библиотеки: репозитории и смарт-контракты с которых начинать изучение кода
- Менеджер пулов: основной функционал и схема наследования
- Флоу транзакции: точка входа для пользователя и поставщика ликвидности
- Transient Storage: на примере разблокировки пула в качестве защиты от reentrancy
- Хуки: что смарт-контракт хука использует и как вызывается менеджером пулов
Если вы хотите понять, как Uniswap V4 превратился из обычной DEX в мощную платформу для DeFi-протоколов, эта статья для вас.
Погнали!Прием и парсинг NMEA-данных от GPS-приемника

Прием и парсинг NMEA-данных от GPS-приемника, а также, рассмотрение работы разных типов GPS (UART и RS-232): как правильно подключить модуль к микроконтроллеру STM32.
Читать далее«Доктор Хаус» vs. командный игрок: какого сеньора возьмут в команду в 2025 году

Привет Хабр, меня зовут Алина, и я HR-lead компании SSP SOFT (мы занимаемся заказной разработкой). Написать пост про особенности найма сеньоров мне помог наш райтер Сергей, а на саму идею — сподвиг случайно встреченный на просторах интернета пресс-релиз из заглавной иллюстрации. Не буду останавливаться на названии этой компании, его легко загуглить по фразам из скрина. Важно другое — коллеги по отрасли написали про избыток сеньоров на рынке труда в 2Q/2025 г., что казалось немыслимым еще пару лет назад. А как принимают на работу сеньоров, если речь идет не о массовом наборе, а точечно, под конкретные проекты? Об этом я и хотела порассуждать в этом посте.
Читать далееАналитика данных для RAG: как (не)наполнить базу решений для нулевой линии поддержки

Привет, я Азат Хакимов, аналитик данных команды «ИИ для ИТ Поддержки» в Т1 Иннотех. Мы разрабатываем интеллектуальные системы помощи и автоматизации для команд поддержки. В этой статье я расскажу про одну из задач анализа текстов, с которой столкнулась команда в ходе разработки системы для нулевой линии поддержки.
Задачу, которую пытались решить - наполнение базы готовых решений для RAG сервиса простыми и легкими, с точки зрения ресурсоемкости, методами
Читать далееДеплоим Spring Boot приложение через Docker Compose в Timeweb Cloud за 10 минут

Когда вы впервые сталкиваетесь с задачей деплоя, процесс может показаться сложным и пугающим. Докер-образы, безопасность, container registry, а тем более Kubernetes — для новичка это настоящая головная боль. Именно поэтому наши партнеры из Amplicode решили написать статью, которая поможет вам максимально просто и быстро задеплоить ваше первое Spring-приложение в облако.
Читать далееПока Путин и Трамп делят влияние, мы режем ботов до их вторжения в наши умы

90% ботов на BAS, Zenoposter и прочем Win-софте светят порты 47001 и 5985. В статье — инструкция, как вычислять таких «твиттерных комментаторов» и вычищать их из чатов и рекламных кампаний.
Читай, чтобы понять, как интернет-хомячки манипулируют твоим мнением и цифрами в аналитике.
Читать далееМуаровые сверхрешетки из ДНК

Для создания определенных устройств требуются определенные материалы, выбор которых зависит от их физических и химических свойств. Однако с развитием науки и технологий многие «классические» материалы оказались не столь эффективными, а потому появилась необходимость в поиске альтернатив. И порой такие альтернативы находятся в самых неожиданных местах. Ученые из Штутгартского университета (Штутгарт, Германия) разработали новую систему муаровых сверхрешеток нанометрового масштаба, используя ДНК и их способность к самоорганизации. Как именно была создана эта структура, как себя проявляют ДНК в ней, и где может использоваться данная разработка? Ответы на эти вопросы мы найдем в докладе ученых.
Читать далееCode review на автопилоте: наш путь к прозрачному процессу

Привет, Habr! Меня зовут Михаил Тетерин, я разработчик в Lenta tech, и сегодня расскажу, как мы упростили и ускорили процесс code review с помощью собственного инструмента — «ревью-рулетки». Это решение появилось из повседневной боли, когда merge requests зависают, разработчики неохотно разбирают задачи на ревью, а в чатах идет бесконечное «посмотри мой MR, пожалуйста».
Читать далее245,76 ТБ в одном SSD: KIOXIA LC9 и что о н?м известно

Недавно мы писали о том, как изменятся объемы SSD-накопителей в ближайшие годы. 21 июля объявился новый лидер гонки: компания KIOXIA официально анонсировала серию твердотельных накопителей LC9, включающую модель с рекордной емкостью 245,76 ТБ. По сравнению с HDD последнего поколения, емкость которых достигает 30 ТБ, в новых накопителях KIOXIA в восемь раз больше пространства при значительно меньших габаритах и энергопотреблении.
Рассказываем всё, что известно о технических особенностях и возможностях новой линейки SSD.
Читать далееКак захватить Вселенную за AGE. Часть 2 — экономика фаз 0 и 1

В первой части мы говорили о ключевых метриках индустриальной экспансии — Technology Quotient (TQ), Energy Quotient (EQ) и BP (build-power, мощность ввода инфраструктуры в ваттах). Теперь пора рассмотреть, как реальная экономика и наука могут (или не могут) провести нас от Фазы 0 к Фазе 1, и какие барьеры придётся преодолеть.
Ведь жизнь цивилизации — это не только технологический рост, но и способность сохранять стабильность, распределять ресурсы и действовать как единое целое в течение веков. И здесь возникает вопрос, который упирается в астрономию и социологию одновременно: если другие цивилизации когда-то тоже стояли на нашем рубеже, почему мы их не видим? Парадокс Ферми намекает, что путь от первых космических полётов до устойчивого межпланетного общества может быть куда сложнее, чем просто запускать ракеты и строить станции. Самые трудные испытания ждут не в космосе, а внутри самой цивилизации.
Читать далееWindows 2000 Server и IIS 5.0: эталон стабильности, который уже не вернуть

На рубеже тысячелетий Microsoft выпустила Windows 2000 Server — систему, которую я вспоминаю с особым трепетом, особенно в связке с IIS 5.0. Именно поэтому сегодня хочу рассказать о том, почему серверы на этой ОС когда-то считались эталоном надёжности и удобства, и что привело к закату этой легендарной связки. Приглашаю под кат.
ЧитатьНагрузочное тестирование GP6 vs GP7 vs Cloudberry

Привет, Хабр! На связи Марк – ведущий архитектор группы компаний "ГлоуБайт". В этой статье я поделюсь результатами нагрузочного тестирования, которое мы с коллегами провели для сравнения Greenplum 6 с Greenplum 7 и Cloudberry.
Читать далее3D-печать без швов — Часть 1: как я «скрестил» Vase Mode и послойную печать чтобы вывести изделие в серию

Слева — органайзер, который я напечатал за один вечер, справа — почти такой же, но рождённый после двух месяцев экспериментов. Почему путь от прототипа до серийного изделия оказался таким длинным и каким приёмам непланарной печати я научился — читайте ниже.
Читать ниже...Превращаем legacy CLI в AI-агентов за 5 минут: практическое руководство по MCP и Ophis для Go-разработчиков
Ophis — это мост между Cobra CLI и Model Context Protocol (MCP), позволяющий Claude Desktop напрямую вызывать kubectl, helm, terraform и любые другие CLI-инструменты. Вместо копирования вывода команд в чат, AI получает структурированный доступ к командам.
В статье: архитектура решения, production-ready реализация и реальные кейсы из практики.
Читать далееКак правильно готовиться к ШАД в 2025 году
В этой статье я расскажу, как проходил экзамен в Школу анализа данных (ШАД) в 2025 году, что вас ждёт на каждом этапе, как лучше готовиться.
Формат экзамена
Всего есть три основных этапа:
1. Онлайн-тестирование
2. Письменный экзамен
3. Собеседования
Всё это можно пройти онлайн. Если вы пройдёте онлайн-тестирование очень хорошо, вам могут предложить поучаствовать в очной олимпиаде вместо письменного экзамена. Если на олимпиаде выступите успешно — письменный этап можно будет пропустить.
Читать далееЗамена YouTube Kids

Что делать, когда твой ребёнок признает только это приложение? Вот не хочет пользоваться аналогами, и всё тут! Как убрать недостатки в такой ситуации и добавить достоинств? Об этом и поговорим.
Читать далееКакой ИИ-инструмент выбрать для написания статей в 2025 году?

Привет, Хабр! ???? В 2025 году вопрос «использовать ли ИИ для написания текстов?» уже не стоит. Теперь главный вопрос — «какой именно ИИ?инструмент выбрать?». Рынок переполнен предложениями: от универсальных чат?ботов до узкоспециализированных монстров, заточенных под SEO или научные статьи. Давайте без лишней воды и маркетинговой шелухи разберемся, что к чему, и какой инструмент подойдет именно вам.
Читать далееКак получать максимум удовольствия от отцовства: у самурая нет цели, только путь

За последние пару лет я заметил одну интересную вещь: большинство отцов вокруг говорят о времени с ребёнком, как о тяжёлой ноше, которую они "выдерживают" или "терпят". А что, если это можно изменить и начать реально кайфовать от отцовства?
Делюсь с вами своими ключевыми фишками и инсайтами, которые собрал за два с половиной года. Всё опробовано на себе — это не сложные техники, скорее набор ментальных установок и подходов, которые полностью изменили моё восприятие отцовства.
Что я понял? Какие есть неочевидные бонусы от времени с малышом (например, свежий воздух, дзен и новые открытия)? Давайте разберёмся по пунктам.
Важный дисклеймер: это всё личный опыт одного конкретного меня. Я не являюсь истиной в последней инстанции и не эксперт по детям
Читать далееПортативный взлом: как игровая приставка может стать оружием хакера

Вы замечали, что люди в общественных местах вроде поездов или залов ожиданий зачастую не только бездумно скроллят ленты новостей в телефоне или играют в три в ряд? Да, ещё некоторые читают книги. Но иногда можно увидеть, как они держат в руках устройства, похожие на геймпады от игровых приставок с небольшими экранами. Мне это легко заметить, потому что я — как раз из таких людей. А эти устройства — портативные игровые консоли, на которых можно запустить игры вашего детства и не только, находясь в дороге.
Представляете, вы едете из одного конца города в другой и вместо того, чтобы читать об успехах импортозамещения на своём любимом сайте, вы играете в «Танчики», «Марио» или «Соника»? Отличная альтернатива, я считаю. Учитывая ценовой диапазон таких устройств, каждый может найти себе игрушку по карману. Есть в этом занятии что-то тёплое и успокаивающее: человек с портативной приставкой, набитой играми с «Денди», вызывает умиление. И в этот момент у меня как специалиста по кибербезопасности в голове загорается красная лампочка.
И это не просто так. Дело в том, что подобные устройства — самые настоящие троянские кони. По факту это мини-компьютеры, спектр применения которых куда шире, чем ретроразвлечения.
Читать далееXTools-py — универсальные утилиты для Python-разработчиков
???? XTools-py — универсальные утилиты для Python-разработчиков
Если вы когда-либо писали на Python и ловили себя на мысли «Опять писать парсер конфигурации…» или «Где-то у меня был код кеша, надо найти» — эта библиотека для вас.
XTools-py — это набор мощных и удобных инструментов для Python, которые помогают упростить рутинные задачи и ускорить разработку.
Вместо того чтобы тратить время на повторное изобретение велосипеда, вы получаете готовые и проверенные решения.
? Возможности
Find — быстрый поиск и работа с коллекциями данных.
Matrix — операции с матрицами.
Config — удобная работа с JSON, YAML, INI.
Validator — валидация строк, чисел и других типов.
Cache — простой кеш с TTL.
DateTimeUtils — работа с датами и временем.
MathUtils — расширенные математические функции.
ColorUtils — преобразование и обработка цветов.
EncryptionUtils — шифрование и хеширование.
TextUtils — удобные манипуляции с текстом.
UnitConverter — конвертация единиц измерения.
AWS S3 — облачное хранилище (асинхронно/синхронно).
Читать далееИспугались?! Угрозы нейросетям: миф или реальность. Что действительно работает

Недавно прочитала утверждение Сергея Брина о том, что нейросети лучше работают, если их припугнуть. Стало любопытно, ведь звучит, как миф или сюжет триллера про искусственный интеллект. Но вдруг это действительно работает, раз уж такую идею озвучил сам сооснователь Google? И тогда мы с коллегами из Центра компетенций по проведению исследований, где я работаю аналитиком, решили проверить это на практике.
Читать далееРегистрируете ПО? Не торопитесь…

Разработка приложений в качестве хобби иногда приносит свои плоды. Так, моя программа для управления оборудованием с телефона недавно нашла своего покупателя. По замечанию друга перед продажей приложения решил зарегистрировать интеллектуальную собственность. Под катом рассказываю о самой процедуре, копировании кода в Word, потерявшемся платеже и других подводных камнях.
Читать далееЯ собрал «команду мечты» из AI-агентов, чтобы заменить продакт-менеджера и консультанта. И знаете что? Это работает

Представьте, что у вас есть кнопка, которая запускает в работу не просто нейросеть, а целый аналитический отдел. Один AI-агент лезет в Google изучать тренды, второй — шпионить за конкурентами, третий — анализировать ваши внутренние данные, а четвертый, на основе всего этого, генерирует три готовые стратегии. Звучит как научная фантастика? А я расскажу, как собрал именно такую систему на принципах мультиагентных систем, с «боссом-оркестратором» и даже собственной базой знаний.
Погрузимся в мир, где AI — это не просто чат, а целая виртуальная команда.
Читать далееАуф: как работодатели не умеющие нанимать сотрудников ломают найм и что с этим делать?

Привет, Хабр! Меня зовут Максим, я руководитель своего свободного времени. Наткнулся на любопытнейшую статью и порвался не смог пройти мимо. С первых же строк мое внимание было порабощено непоколебимой сарказмоустойчивостью автора, что-то на уровне критики цитат Стэтхэма. Я про попытку наклеить снисходительный ярлык "волчки". Антон Павлович был бы доволен: заголовок отлично отражает дальнейшую суть произведения, надеюсь у меня получилось поддержать марку.
Как в 80-х делали персональные прогнозы погоды без интернета и приложений — и восстановили это сегодня

Телевидение — неотъемлемая часть американской культуры. В 70-х годах прошлого века доступ к нему был практически у всех домохозяйств США, и это сделало его главным источником информации на тот момент. Развитие кабельного ТВ стало причиной появления множества узкоспециализированных каналов вроде Nickelodeon (1979), MTV (1981) или The Weather Channel (1982).
Последний довольно интересен, ведь его главной фишкой было предоставление не просто общей метеорологической информации по стране и за ее пределами, но и трансляции локальных прогнозов погоды из той местности, откуда ее смотрит телезритель. Это реализовали при помощи аппаратного комплекса WeatherStar, который принимал данные о погоде со спутника и в реальном времени накладывал свежие погодные сводки на видеопоток. В статье поговорим о том, как работал этот аппаратный комплекс, зачем он был нужен, чем привлек фанатов и каким образом энтузиасты смогли сохранить его в виде современного симулятора. Разберем историю WeatherStar 4000 — от первых трансляций локальных прогнозов до фанатских проектов, переживших даже отключение серверов.
Читать далее8 смертельных случаев, где жизнь зависела от одной базы

Врач в африканской глуши видит симптомы неизвестной болезни. Инженер на заводе замечает странный индикатор, который может означать взрыв. Родитель звонит в службу спасения — ребёнок съел таблетки.
Собрали 8 реальных случаев, когда база знаний спасала людям жизнь. Разделили статью на 2 части: медицинские и промышленные ситуации.
Читать далееGIMP Script-Fu ООП. ООП на миксинах или сказ о том: «Да что оно может ваше множественное наследование?»

Библиотека функций к Script-fu
Вы любите рефакторинг? Ну вот и я приблизительно так же. Основное правило хорошего программиста, такое: "Работает, НЕ ТРОГАЙ!". Но иногда, в редкие минуты помутнения/вдохновения, возникает желание, или я бы даже сказал зуд, в одном месте, и мы садимся за рабочее место, берём в руки клавиатуру и начинаем "творить шедевры" с чистого листа.
Системы подпрограмм для языка функциональной геометрии я писал три раза: сначала в функциональном стиле(и в этом то месте и возник пресловутый "свитчинг по типам", потом в стиле примитивных объектов, который не имел наследования, но я придумав хак с шаблонным использованием кода, значительно сократил его дублирование и теперь, когда я разработал развитую ООП систему, во многом повторяющую функциональность CLOS. И это событие прекрасная причина, чтобы переработать старый ООП код, в новой ОО системе. Чем мы с вами здесь и займёмся.
Читать далееЧто происходит на рынке LegalTech, и как в него интегрируют искусственный интеллект

Объясняем, как изменится профессия юриста, сколько времени можно сэкономить с помощью нейросетей и готовы ли отечественные компании к цифровому прорыву?
Всего за несколько лет искусственный интеллект из модной новинки для энтузиастов стал реальным инструментом для корпоративных юристов и юридических компаний по всему миру. Объём мирового рынка Legal AI уже превысил 2 миллиарда долларов, а в России, несмотря на небольшие масштабы, внедрение собственных решений происходит ускоренными темпами.
Читать далееДва поколения грампластинок

Мысль написать эту статью у меня появилась после посещение “музея СССР” на Охотном Ряду. Там я увидел нечто такое, о чем никогда в жизни не задумывался.
Что вы знаете про грампластинки? Меломаны молчать, знаю, что вы-то точно поймете о чем речь.
Еще раз - что такое грампластинка в визуальном восприятии? Ограниченно-гибкий диск из винила черного цвета, на котором записана музыка, верно? Легкий, но подверженный царапинам.
В музее мне дали в руки пластинку 20х годов и она оказалась даже отдаленно не похожа на описание выше. Не гнулась, весила порядка 200 грамм и на ней была всего ОДНА песня. В чем дело?
А дело в том, что изначально пластинки делали из шеллака. И эта технология, при внешней схожести, прямо противоположна современному винилу. Давайте немного окунемся в историю и узнаем какими были пластинки изначально. И почему в 40х годах они полностью поменяли материал и принцип, хотя визуально остались неизменными.
Читать далееВместо бесконечных макетов под плотный интерфейс мы просто…

Привет, Хабр! Меня зовут Светлана Моторкина, я Head of Design в компании Friflex. В этой статье расскажу, как мы придумали формулу, чтобы управлять сложными адаптивными интерфейсами с большим количеством повторяющихся элементов в ряду.
Если вы работаете с плотными интерфейсами вроде канбан-досок, галерей, календарей, игровых сеток, другими сложными адаптивами, этот подход поможет сократить количество макетов и сделать отображение предсказуемым.
Читать далееДля чего нужны enum в TypeScript. Подробно и простым языком

Привет, меня зовут Дмитрий, и я руководитель фронтенд-разработки в компании Интелси. В данной статье я хочу подробно разобрать enum в TypeScript, чтобы было понятно, что это такое, для чего нужно и почему это работает именно так.
Читать далееСуровый Русский IT

???? Наблюдая за венчурным и технологическим секторами России, можно прийти в ужас. В то время как телевизор рапортует об отсутствии экономических проблем, а фондовый рынок растёт на слухах о переговорах, никто не обращает внимания на реальное состояние внутренней экономики.
Все сосредоточены на другом, игнорируя репрессии в гражданской экономике, в надежде, что это «как?нибудь само разрулится».
Моя экспертиза ограничена технологическим и финансовым секторами, поэтому я высказываюсь только о них. Однако это не значит, что в других областях экономики всё хорошо. Общая повестка не даёт прозрачной картины, так как её цель — поддерживать определённый настрой в обществе.
Читать далееPLOAM в OLT

PLOAM
именно этот протокол включается первым в olt он задает базу с которой уже начинают работать другие протоколы. По сути он присутствует всегда, работает во всех портах, так что это самый базовый и нужный протокол для работы OLT.
Читать далее18 признаков командной работы

В статье описаны 18 конкретных признаков командной и некомандной работы, которые можно использовать в качестве референса при решении задачи превращения рабочей группы в команду.
Читать далее