Мероприятия

Приглашаем на конференцию «Региональные данные»

8 октября 2021 года состоится онлайн-конференция о доступности региональных данных и их роли в территориальном развитии России.  Организаторами мероприятия выступают Ассоциация участников рынка данных и компания Digital Twin. В России доступно большое количество данных, отражающих состояние экономики и социальной политики на федеральном уровне. При этом в открытом доступе крайне мало хорошо структурированных данных, прежде всего, данных о качестве жизни в хорошей муниципальной детализации, привязке к отраслевым, территориальным схемам и программам развития. Еще сложнее с данными по прогнозам и планам развития. Хотя на эти данные есть запрос со стороны бизнеса, который на их основе может создавать различные сервисы и аналитические инструменты,…

Итоги пресс-конференции «Открытые данные в России. Новые вызовы и задачи»

13 июля в ходе пресс-конференции Минэкономразвития России представило рейтинг дата-зрелости госорганов. В мероприятии принял участие директор и учредитель Ассоциации участников рынка данных Иван Бегтин. Были продемонстрированы результаты анализа 25,5 тыс. наборов данных (датасетов) по направлениям образования, здравоохранения, культуры, транспорта, строительства, экологии и др. Лидерами по размещению открытых данных среди федеральных ведомств стали: Минкультуры России, Казначейство России, Росстат, Минпросвещения России, Роспатент, Минобрнауки России, Минцифры России, Росздравнадзор, Росстандарт, Минэкономразвития России, Росводресурсы; среди регионов: Москва, Сахалинская, Орловская, Тюменская, Ленинградская области и Республика Крым. По состоянию на июль 2021 года наиболее актуальные открытые данные зафиксированы у Росстата, Казначейства России, Минэкономразвития России, Минцифры России, Минкультуры…

ОГФ: «Закрытые открытые данные. Должны ли граждане иметь свободный доступ к данным государственных информационных систем?»

Открытые данные — один из инструментов подотчетности государства перед обществом. Несмотря на открытость данных о культуре, госфинансах, деятельности бюджетных учреждений, данные о качестве жизни населения, такие как экология, образование, здравоохранение, криминальная статистика, остаются крайне закрытыми и недоступными. Мы пригласили представителей НКО, медиа и науки, чтобы обсудить, какие данные должны быть открыты по умолчанию. Что необходимо сделать сейчас, чтобы данные, касающиеся качества и безопасности жизни, стали общедоступными? Как обеспечить качество государственных данных и доверие к ним общества? Своими знаниями и мнением поделятся: Дада Линделл, дата-журналистка РБК, расскажет об исследовании о смертности от ВИЧ в России. Чтобы раскрыть данные о регионах-лидерах по…

Имеет ли робот те же права на информацию, что и человек?

Публикуем видео-запись дата-среды «Сбор данных и методология парирования блокировки роботов» из цикла «Большие данные в экономике». Спикер Сергей Бершадский работал в качестве backend-разработчика и системного архитектора с такими проектами, как медицинский портал ЕМИАС.инфо, Play2Live, toptal и др. Выступление посвящено особенностям извлечения данных из сайтов, их очистке и структуризации. Сергей поделился собственным опытом веб-скрейпинга с использованием библиотек python scrapy, beautiful soup, asyncio. Сергей также разобрал методы break-the-wall на примере запросов в Yandex и Google. Это подходы, которые позволяют имитировать браузер и автоматически его использовать. Презентация опубликована по ссылке. Смотрите запись дата-среды: Организаторами дата-среды выступили АНО «Инфокультура», Ассоциация участников рынка данных и РАНХиГС. Всем тем,…

«Цифровой рост»: как прошел хакатон для будущих магистрантов РАНХиГС

16-22 июня 2019 года состоялся хакатон «Цифровой рост», организованный РАНХиГС, АНО «Информационная культура» и Ассоциацией участников рынка данных. В хакатоне принимали участие выпускники бакалавриата ИТ-специальностей, а также начинающие специалисты, которые хотят продолжить свое обучение, повысить квалификацию и получить востребованное образование. Участники  соревновались в решении задач на машинное обучение и текстовый анализ, а также в создании различных проектов на основе открытых финансовых данных. На открытии хакатона Олег Сенько, ведущий научный сотрудник Федерального исследовательского центра «Информатика и управление» РАН, доктор физико-математических наук, прочитал участникам лекцию об анализе данных и машинном обучении. После чего эксперты и менторы хакатона рассказали подробнее о задачах и…

Приглашаем на хакатон «Цифровой рост»

16 и 22 июня 2019 года  АНО «Информационная культура», Ассоциация участников рынка данных и РАНХиГС проведут хакатон «Цифровой рост». Приглашаем к участию выпускников бакалавриата ИТ-специальностей, а также начинающих специалистов, которые хотят продолжить свое обучение, повысить квалификацию и получить востребованное образование. Участники будут соревноваться в решении задач на машинное обучение,  текстовый анализ, маркетинговую аналитику, а также в создании различных типов проектов на основе данных:  расширения для веб-браузеров, инфографику, прототипы интернет-сервисов и мобильных приложений, боты. Участники могут решить одну из предложенных задач или разработать свой проект на основе предложенных данных. Хакатон пройдет в несколько этапов: 16 июня состоится распределение задач по командам, лекции…

Дата-среда: «Как извлекать полезную информацию из текста – система PolyAnalyst»

29 мая приглашаем на четвертую дата-среду из цикла «Большие данные в экономике». Тема встречи — «Как извлекать полезную информацию из текста – система PolyAnalyst». Дата-среду проведет Сергей Ананян, генеральный директор компании Мегапьютер (www.megaputer.com), кандидат физмат наук, специалист по решению прикладных задач анализа данных. Надежное извлечение полезной информации из текстовых документов открывает путь к решению многих важнейших бизнес-задач в самых разных областях деятельности. Учитывая сложности, с которыми сталкиваются при попытке извлечения информации системы, основанные только на машинном обучении, мы представим альтернативный подход: использование специального языка запросов, базирующегося на результатах углубленного лингвистического и семантического анализа текста. Мы продемонстрируем практическую реализацию этого подхода…

Дата-среда: «Сбор данных и методология парирования блокировки роботов»

22 мая приглашаем на третью дата-среду из цикла «Большие данные в экономике». Тема встречи — «Сбор данных и методология парирования блокировки роботов». Проведет дата-среду Сергей Бершадский, ведущий backend-разработчик и системный архитектор, работал с различными проектами, среди которых медицинский портал ЕМИАС.инфо, Play2Live, toptal.com и др. Эксперт расскажет об особенностях извлечения данных из сайтов, их очистки и структуризации. Во время встречи будет рассмотрен весь процесс извлечения данных: веб-скрейпинг, обработка данных, очистка данных, а также способы break-the-wall на примере Yandex и Google. Предложенные кейсы основаны на использовании библиотек python scrapy, beautiful soup, asyncio. Будут рассмотрены подходы, позволяющие имитировать браузер, автоматическое использование имеющегося браузера,…

Дата-среда: «Семантический анализ текста в неевклидовой геометрии»

24 апреля 2019 приглашаем на дата-среду из цикла «Большие данные в экономике». Тема второй встречи цикла — «Преимущества векторных представлений слов в неевклидовых геометриях». Как аналитики в сфере бизнеса, так и академические исследователи зачастую сталкиваются с необходимостью семантического анализа текста. Он может быть применен в таких задачах, как определение тематики и тональности новостных сообщений или предсказание размера заработной платы по описанию вакансии. На дата-среде Артур Федоров, специалист по машинному анализу естественного языка в группе операционного моделирования Yandex.Market, расскажет о модели Пуанкаре — гиперболического пространства для текстового анализа, которая сохраняет скрытую иерархическую структуру текста. Лектор сравнит стандартные методы нахождения векторных представлений…

Интерактивный data mining: возможности Orange — продукта с открытым исходным кодом

3 апреля 2019 состоялась дата-среда из цикла «Большие данные в экономике», который совместно организуют АНО «Инфокультура», Ассоциация участников рынка данных и РАНХиГС. Об основах интерактивного data mining рассказал Дмитрий Стефановский, директор «Центра компетенций по цифровой прослеживаемости и консалтингу» РАНХиГС, кандидат технических наук, специалист в области прикладных исследований по цифровой трансформации. Data mining – интеллектуальный анализ данных, совокупность методов обнаружения в данных ранее неизвестных, нетривиальных и практически полезных знаний. Сегодня результаты анализа данных позволяют по-новому взглянуть на процессы, происходящие на предприятии. При этом на практике академический подход часто не может быть внедрен в бизнес-процессы, потому что организации не могут себе позволить,…