← Все кейсы
04

Система агрегации и анализа данных о юридических лицах

Превращаем хаос из 8+ источников в единую базу знаний для банков, инвесторов и регуляторов.

Система агрегации и анализа данных о юридических лицах

Проблема, которую мы решаем

Работа с открытыми данными о компаниях — это вызов: источники противоречат друг другу, информация устаревает, а ошибки в данных приводят к финансовым и репутационным рискам.

Наша система превращает хаос из 8+ разрозненных источников (XML, JSON, CSV) в структурированную базу знаний.

Это инструмент для банков, инвесторов и регуляторов, где каждая выписка — это точные данные о компании, ее финансах, учредителях и брендах.

Как это работает

Для проекта национального масштаба мы реализовали:

Импорт данных

Автоматическая загрузка из источников с разными форматами и API, включая обработку слабоструктурированных файлов.

Очистку и объединение данных

Алгоритмы исправления ошибок (дубликаты, опечатки, некорректные даты и данные) на основе правил и классических ML-моделей. Сложное объединение данных: сопоставление записей из разных источников даже при противоречивой информации (например, «свежие» устаревшие данные).

Формирование выписок

Единые досье компаний с актуальной информацией о финансах, учредителях, брендах и исторических изменениях.

Расширенные аналитические возможности

Находите компании с помощью гибкой системы фильтров, комбинируя более 50 различных параметров (отрасль, регион, финансовые показатели, структура собственности и др.). Система также позволяет находить похожие компании по заданному набору характеристик, предоставляя мощный инструмент для анализа рынка и конкурентов.

Технологии

LaravelOctanePostgreSQLRedisElasticSearchVue 3Nuxt3PythonMongoDBApache SupersetDocker-кластеры с резервированиемGitLab CI/CDGrafanaSentry

Преимущества

Достоверность

Данные очищаются и проверяются перед попаданием в систему — вы принимаете решения на основе фактов, а не предположений.

Скорость

Поиск по 28 млн+ компаний занимает менее 1 секунды благодаря ElasticSearch.

Глубину анализа

Выявляйте связи между компаниями, отслеживайте динамику финансовых показателей, стройте прогнозы.

Надежность

Резервирование и автоматическая адаптация ресурсов под текущую нагрузку гарантируют работу 24/7 даже при пиковых нагрузках.