Олимпиада по исследованию баз данных
На заключительном этапе олимпиады участники самостоятельно формируют команды, основываясь на интересах по исследованию той или иной базы данных. Перечень баз данных, доступных для исследования, представлен на этой странице.
Обратите внимание: некоторые базы оказались достаточно объемными, поэтому мы подготовили их сокращенные версии. При исследовании можно использовать как полную, так и сокращенную версию (на усмотрение команды). Если вы используете мини-версию базы, учитывайте её особенности (в приложенных к базам файлах указано, как именно были получены такие версии).
Предстоящие мероприятия
Апрель 2024 – Проектно-аналитическая сессия для вузов Северо-Кавказского федерального округа. Ежегодно с 2022 г. организуется для решения приоритетных исследовательских и прикладных задач развития региона, подготовки кадров и развития инфраструктуры данных. К участию приглашаются все университеты региона и участники Консорциума.
Май 2024 – Премия в области ИИ и больших данных Гравитация и научный Конгресс Консорциума. Крупнейшее в России ежегодное мероприятие, посвящённое популяризации наиболее значимых университетских проектов в области искусственного интеллекта, больших данных и внедрению прорывных технологий в ведущие отрасли экономики РФ. Во второй день вручения Премии состоится ежегодный научный Конгресс Консорциума, где участники смогут ознакомиться с номинированными на Премию проектами и представить исследовательские и прикладные проекты в области анализа данных и ИИ.
Июль 2024 – Проектно-аналитическая сессия для вузов Дальневосточного федерального округа.
Октябрь 2024 – Форум Открытые данные. Ключевое всероссийское ежегодное мероприятие Консорциума. Проводится с 2019 и посвящено вопросам поиска и сбора открытых данных, а также внедрения инструментов и технологий на их основе в разных отраслях: общество, экономика, управление, образование, наука.
Планируемые мероприятия
Разместите информацию о Ваших профильных мероприятиях на сайте Консорциума в календаре мероприятий.
Программа на ближайшие события:
| Дата | Мероприятие |
|---|---|
| апрель 2024 | Проектно-аналитическая сессия |
| май 2024 | Премия в области ИИ и больших данных |
| июль 2024 | Проектно-аналитическая сессия |
| октябрь 2024 | Форум Открытые данные |
Открытые данные: путь к цифровой экономике
В фокусе дисциплины — изучение концепции открытые данные (Open Data) и практика работы с данными. Целью освоения дисциплины является теоретическая и практическая подготовка студентов для квалифицированного использования открытых данных в профессиональной деятельности.
Курс включает изучение основ концепции открытых данных, знакомство с ландшафтом и источниками открытых данных, а также освоение методов работы с данными, включая обработку, анализ и публикацию данных. По итогам курса студенты будут способны самостоятельно выполнять практические задания, связанные с анализом данных, а также публиковать и делиться собственными наборами данных.
Цель освоения дисциплины
Достоверные данные – надежная платформа цифровой экономики
Единственная в России конференция, посвященная решениям обеспечения гарантированного качества данных в условиях динамичных изменений и экономической неопределенности.
Программный директор серии практических конференций издательства Открытые системы отмечает: В условиях динамичных изменений в экономике и коррекции политической повестки недостаточно лишь оптимально хранить и вовремя доставлять потребителям массивы нулей и единиц — для экономики данных буквально жизненно необходимо уметь в разных контекстах повторно использовать все доступные сведения, обогащать их, обеспечивая качество и связанность, преобразуя сырые данные в знания. Поэтому неудивительно, что растет актуальность вопросов обеспечения качества данных и, как следствие, крепнет интерес к нашей конференции, посвященной обсуждению стратегий, методов и опыта построения, а также эксплуатации надежной цепочки контроля качества данных.
Стратегии управления качеством данных
- Как построить стратегию устойчивого управления качеством данных?
- Опыт развертывания и эксплуатации систем управления качеством данных: от корпораций до SMB
- Как защитить компании от ввода заведомо некорректных данных?
- Очистка данных: устранение дублирования и неопределенностей, контроль происхождения и зависимостей
Аспекты управления качеством данных
- Управление метаданными и затратами на обеспечение качества данных
- Как обеспечить доверие к данным?
- Опыт миграции систем управления качеством данных: новые задачи, сохранение качества данных при переносе, обеспечение надежности
- Выбор инструментов управления качеством данных
- Системы самообслуживания управления качеством данных
Бизнес-аспекты качества данных
- Влияние качества данных на бизнес-результаты: метрики, аудит, мониторинг, управление затратами
- Архитектура данных: потоки и модели, анализ происхождения и зависимостей
- Консолидация данных: очистка, обогащение, устранение дублирования, управление изменениями
- Качество реестровой и справочной информации, устранение неопределенностей
Управление данными
- Data Governance: стратегия, стандарты, политики, процедуры, процессы, владельцы и кураторы данных
- Конвейер обеспечения качества данных: методология и подходы с учетом особенностей конкретной организации
- Безопасная работа с персональными данными
Материалы конференции открывают множество перспектив и практических советов по обеспечению качества данных в условиях современной цифровой экономики.
Критерии выбора универсальных отечественных платформ управления качеством данных
Важность управления качеством данных для бизнес-аналитики и искусственного интеллекта (ИИ) становится все более актуальной. Однако, выбор подходящей платформы для этой цели может быть сложным.
Целевая аудитория
- Топ-менеджмент российских и международных компаний
- Руководители функциональных подразделений и направлений
- Ведущие специалисты и аналитики
- Директора по развитию бизнеса
- Руководители проектов и продуктов
- Эксперты по качеству данных
- Представители органов власти и профильных ассоциаций
Примеры успешных решений
- Сибур Диджитал: вершина в организации процессов управления инженерными данными.
- Газпромбанк: развернул систему управления данными на базе стека Open Source.
Вызовы и возможности
Данные – важный актив в цифровой экономике. Однако, как измерить эффект от улучшения качества данных и обосновать это перед руководством? Важно понимать, что проблема передачи точной информации о состоянии пациента становится все более актуальной.
Успешные кейсы
- Альфа-Банк: использовал технологии машинного обучения для оптимизации работы с отзывами клиентов.
- Российские компании: переходят к дата-центричной ИТ-архитектуре, выделяя ключ к успеху – качественные данные и правильные инструменты анализа.
Заключение
Данные сегодня – ценный актив. Однако, успешная монетизация зависит от правильной реализации инициатив по аналитике и доступности данных.

Очередная конференция Открытых систем собрала руководителей и экспертов, заинтересованных в повышении доверия бизнеса к данным в организациях. 14 февраля 2024 года прошла Пятая ежегодная конференция Качество данных, организованная издательством Открытые системы при поддержке Министерства цифрового развития, связи и массовых коммуникаций РФ.
Конференция Качество данных — 2024
Это единственная в России конференция, посвященная стратегии и практике обеспечения качества данных для коммерческих предприятий и государственных органов. В этом году конференция собрала 500 экспертов, менеджеров и специалистов, заинтересованных в высококачественных данных.
Участники конференции
Эксперты и докладчики представляли крупные банки, операторов связи, розничные сети, интернет-ретейлеров и промышленные предприятия. Среди участников были топ-менеджеры, руководители подразделений, специалисты, аналитики и представители органов власти.
Тематика конференции
В ходе 16 пленарных и 18 тематических выступлений, эксперты обсудили факторы, влияющие на качество данных и доверие к ним со стороны бизнеса. Были изучены различные подходы и инструменты для безопасной миграции данных, их сбора, хранения и анализа.
Важные аспекты
Конференция также обрисовала передовой опыт в проектировании процессов получения данных высокого качества, внедрении систем управления качеством данных и интеграции с существующими ИТ-ландшафтами. Регуляторные аспекты управления качеством данных и безопасность данных также получили внимание участников.
«Качество данных — это ключевой аспект, определяющий доверие к ним со стороны бизнеса. Высокое качество данных сегодня особенно востребовано, поскольку оно является необходимым компонентом успешных цифровых преобразований и залогом дальнейшей интеллектуализации бизнеса. Что важно, значимость обеспечения качества данных неуклонно растет по мере увеличения объемов информационных активов и разнообразия источников данных. Яркой демонстрацией этих тенденций стал высокий интерес к конференции со стороны не только ведущих экспертов и специалистов в области работы с данными, но и руководителей и бизнес-пользователей, заинтересованных в том, чтобы вывести управление качеством данных в своих организациях на высокий уровень», — подчеркнул Дмитрий Волков, программный директор конференции «Качество данных — 2024».
Подробности: https://www.osp.ru/lp/dataquality2024 Telegram-чат конференции: t.me/dataquality20xx
Об издательстве «Открытые системы» Издательство «Открытые системы» (https://www.osp.ru), основанное в 1993 году, — ведущее российское издательство, выпускающее широкий спектр изданий для профессионалов и активных пользователей в сфере ИТ, цифровых устройств, телекоммуникаций, медицины и полиграфии, а также журналы для детей — «Понимашка» и «Классный журнал». Издательство — организатор крупных деловых и профессиональных форумов и конференций по ИТ-тематике: «Инфраструктура экономики данных», «Интеллектуальная автоматизация», BIG DATA & AI, «Флагманы цифровизации», «Управление данными», «Качество данных», «Гиперавтоматизация» и других. Издательство является учредителем первой в России премии для дата-проектов и директоров по данным Data Award. Издательство «Открытые системы» – лауреат премии Правительства РФ за 2023 год в области СМИ. «Открытые системы» в соцсетях: «ВКонтакте», Telegram, «Одноклассники», «Я.Дзен».
Доступные базы данных
СПАРК информационной группы Интерфакс — лидер на рынке информационно-аналитических систем о компаниях. По данным опроса Deloitte, его используют для проверки благонадежности партнеров 71,5% компаний крупного и среднего бизнеса. Спарк предоставляет качественные и полные данные о компаниях, а также сервисы и аналитику для оценки контрагентов.
Представленный датасет — это выборка из системы СПАРК за период с 2017 по 2018 годы, которая включает в себя данные о компаниях с наиболее полной информацией (с наибольшим количеством доступных переменных)
Всероссийское обследование домохозяйств по потребительским финансам
В датасете представлены данные по пятой волне (2022 год) Всероссийского обследования домохозяйств по потребительским финансам, опрос был проведен Банком России.
Благодаря обследованию удается получить уникальную информацию о финансах и финансовом поведении на уровне домохозяйства (семьи). Значительная часть домохозяйств принимала участие в нескольких раундах обследования. Это позволяет измерять изменения у одних и тех же респондентов во времени, что расширяет возможности для анализа и исследований. Выборка является репрезентативной для России.
№12 Российский рынок труда в период самоизоляции
В датасете представлены агрегированные на уровне регионов данные о заявках граждан на пособие по безработице в период пандемии Covid-19 в 2020 году, а также об ограничительных мерах в регионах и о показателях заболеваемости COVID-19. Данные приводятся к еженедельной периодичности с 6 апреля по 26 октября 2020 года.
Датасет собран из открытых источников
Свежее по теме
Тематики: CIO/Управление ИТ
Ключевые слова: управление бизнес-процессами