Анонсы

Приглашаем на хакатон «Цифровой рост»

16 и 22 июня 2019 года  АНО «Информационная культура», Ассоциация участников рынка данных и РАНХиГС проведут хакатон «Цифровой рост». Приглашаем к участию выпускников бакалавриата ИТ-специальностей, а также начинающих специалистов, которые хотят продолжить свое обучение, повысить квалификацию и получить востребованное образование. Участники будут соревноваться в решении задач на машинное обучение,  текстовый анализ, маркетинговую аналитику, а также в создании различных типов проектов на основе данных:  расширения для веб-браузеров, инфографику, прототипы интернет-сервисов и мобильных приложений, боты. Участники могут решить одну из предложенных задач или разработать свой проект на основе предложенных данных. Хакатон пройдет в несколько этапов: 16 июня состоится распределение задач по командам, лекции…

Дата-среда: «Как извлекать полезную информацию из текста – система PolyAnalyst»

29 мая приглашаем на четвертую дата-среду из цикла «Большие данные в экономике». Тема встречи — «Как извлекать полезную информацию из текста – система PolyAnalyst». Дата-среду проведет Сергей Ананян, генеральный директор компании Мегапьютер (www.megaputer.com), кандидат физмат наук, специалист по решению прикладных задач анализа данных. Надежное извлечение полезной информации из текстовых документов открывает путь к решению многих важнейших бизнес-задач в самых разных областях деятельности. Учитывая сложности, с которыми сталкиваются при попытке извлечения информации системы, основанные только на машинном обучении, мы представим альтернативный подход: использование специального языка запросов, базирующегося на результатах углубленного лингвистического и семантического анализа текста. Мы продемонстрируем практическую реализацию этого подхода…

Дата-среда: «Сбор данных и методология парирования блокировки роботов»

22 мая приглашаем на третью дата-среду из цикла «Большие данные в экономике». Тема встречи — «Сбор данных и методология парирования блокировки роботов». Проведет дата-среду Сергей Бершадский, ведущий backend-разработчик и системный архитектор, работал с различными проектами, среди которых медицинский портал ЕМИАС.инфо, Play2Live, toptal.com и др. Эксперт расскажет об особенностях извлечения данных из сайтов, их очистки и структуризации. Во время встречи будет рассмотрен весь процесс извлечения данных: веб-скрейпинг, обработка данных, очистка данных, а также способы break-the-wall на примере Yandex и Google. Предложенные кейсы основаны на использовании библиотек python scrapy, beautiful soup, asyncio. Будут рассмотрены подходы, позволяющие имитировать браузер, автоматическое использование имеющегося браузера,…

Дата-среда: «Семантический анализ текста в неевклидовой геометрии»

24 апреля 2019 приглашаем на дата-среду из цикла «Большие данные в экономике». Тема второй встречи цикла — «Преимущества векторных представлений слов в неевклидовых геометриях». Как аналитики в сфере бизнеса, так и академические исследователи зачастую сталкиваются с необходимостью семантического анализа текста. Он может быть применен в таких задачах, как определение тематики и тональности новостных сообщений или предсказание размера заработной платы по описанию вакансии. На дата-среде Артур Федоров, специалист по машинному анализу естественного языка в группе операционного моделирования Yandex.Market, расскажет о модели Пуанкаре — гиперболического пространства для текстового анализа, которая сохраняет скрытую иерархическую структуру текста. Лектор сравнит стандартные методы нахождения векторных представлений…

Нерешенный вопрос: право на данные

27 марта состоится Форум BIG DATA 2019. В рамках события пройдет дискуссия «Нерешенный вопрос: право на данные», в которой примет участие Иван Бегтин, генеральный директор АУРД. В очередной раз эксперты обсудят, как найти баланс между всеми участниками рынка: пользователями, бизнесом и государством, — и урегулировать оборот данных. Спикеры: — Светлана Белова, директор IDX; — Борис Зингерман, директор Ассоциации разработчиков и пользователей искусственного интеллекта «Национальная база медицинских знаний»; — Екатерина Калугина, главный юрист IT Legal Consulting; — Александра Орехович, директор по правовым инициативам ФРИИ — Дженифер Трелевич, исполнительный директор TGPO consult; — Иван Фост, руководитель направления в Аналитическом центре при Правительстве…

День открытых данных в Москве

  2-3 марта 2019 года состоится пятый ежегодный День открытых данных в Москве. Организаторами события выступят АНО “Информационная культура”, Фонд развития интернет инициатив и Ассоциация участников рынка данных. День открытых данных (Open Data Day) — международный проект, организованный Фондом открытых знаний (Open Knowledge International) при поддержке разных межгосударственных и международных организаций. Эта инициатива помогает продвигать концепцию информационной открытости и прозрачности. Ежегодно с 2015 года Инфокультура проводит День открытых данных в Москве, а также оказывает информационную поддержку мероприятиям, проходящим в различных городах России. От небольшого хакатона единомышленников за пять лет мероприятие выросло до масштабной конференции, которая в 2018 году объединила 70…

Вторая рабочая встреча Ассоциации участников рынка данных

Вторая рабочая встреча Ассоциации участников рынка данных состоится 31 октября 2018 года в 10.30 во ФРИИ по адресу г. Москва, ул. Мясницкая, дом 13, стр. 18. Основной темой встречи будет обсуждение Национальной системы управления данными (НСУД). НСУД: что бизнес ждет от государства в части управления данными В каких данных нуждается бизнес, для каких целей он его использует. Как сейчас бизнес решает проблемы доступа к данным, проверки их качества. Какие сложности возникают при работе с ГИСами, какие есть решения. Готовность бизнеса передать данные государству для управления через НСУД, какие и на каких условиях. Аспекты работы с данными, которые требуют регулирования. Какое…