Проект поддержан Фондом содействия инновациям — государственным фондом, который финансирует научно-технические разработки.
Один из крупнейших государственных фондов поддержки научно-технических проектов. Программа «Старт» — для проектов с высоким инновационным потенциалом.
Автоматический анализ положений о закупках на соответствие законодательству. Десятки документов, сотни страниц, тысячи пунктов — вручную невозможно.
Не один промпт в ChatGPT. Шесть специализированных моделей, каждая делает своё дело.
Документ разбивается на смысловые фрагменты: статьи, пункты, абзацы. ruBERT определяет границы.
ruBERT #1Каждый фрагмент получает тему из 30 категорий: ценообразование, комиссии, сроки, единственный поставщик...
ruBERT #2NLI-модель сравнивает фрагмент документа с нормой закона: соответствует, частично, не соответствует.
ruBERT #3 (NLI)Извлечение юридических терминов и ссылок на статьи закона для навигации.
NLPВекторный поиск по базе законодательства. Находит релевантные нормы для каждого фрагмента.
LLM генерирует человекочитаемое резюме: что не так, где именно, что говорит закон.
ruBERT фильтрует — LLM объясняет.
Без ruBERT пришлось бы отправлять каждый фрагмент в LLM — тысячи запросов, огромные затраты. ruBERT отсеивает «всё ОК» и передаёт в LLM только проблемные места.
AI не заменяет юриста. AI делает черновую работу — юрист проверяет и принимает решение.
Юрист видит полный текст документа, выделяет фрагменты мышкой, привязывает темы. Несколько меток на один фрагмент. Как Label Studio, но для юридических документов.
Каждая разметка сохраняется с версией. Можно откатить, сравнить, посмотреть историю. Юрист не боится ошибиться — всё обратимо.
Дашборд: сколько документов обработано, сколько фрагментов размечено, распределение по темам. Руководитель видит прогресс команды.
Юрист загружает .docx через веб-интерфейс. Документ автоматически разбивается на параграфы, сохраняет структуру и нумерацию.
Документы, классификация, анализ текстов — расскажите задачу, предложу архитектуру.