Мероприятия

Имеет ли робот те же права на информацию, что и человек?

Публикуем видео-запись дата-среды «Сбор данных и методология парирования блокировки роботов» из цикла «Большие данные в экономике». Спикер Сергей Бершадский работал в качестве backend-разработчика и системного архитектора с такими проектами, как медицинский портал ЕМИАС.инфо, Play2Live, toptal и др. Выступление посвящено особенностям извлечения данных из сайтов, их очистке и структуризации. Сергей поделился собственным опытом веб-скрейпинга с использованием библиотек python scrapy, beautiful soup, asyncio. Сергей также разобрал методы break-the-wall на примере запросов в Yandex и Google. Это подходы, которые позволяют имитировать браузер и автоматически его использовать. Презентация опубликована по ссылке. Смотрите запись дата-среды: Организаторами дата-среды выступили АНО «Инфокультура», Ассоциация участников рынка данных и РАНХиГС. Всем тем,…

«Цифровой рост»: как прошел хакатон для будущих магистрантов РАНХиГС

16-22 июня 2019 года состоялся хакатон «Цифровой рост», организованный РАНХиГС, АНО «Информационная культура» и Ассоциацией участников рынка данных. В хакатоне принимали участие выпускники бакалавриата ИТ-специальностей, а также начинающие специалисты, которые хотят продолжить свое обучение, повысить квалификацию и получить востребованное образование. Участники  соревновались в решении задач на машинное обучение и текстовый анализ, а также в создании различных проектов на основе открытых финансовых данных. На открытии хакатона Олег Сенько, ведущий научный сотрудник Федерального исследовательского центра «Информатика и управление» РАН, доктор физико-математических наук, прочитал участникам лекцию об анализе данных и машинном обучении. После чего эксперты и менторы хакатона рассказали подробнее о задачах и…

Приглашаем на хакатон «Цифровой рост»

16 и 22 июня 2019 года  АНО «Информационная культура», Ассоциация участников рынка данных и РАНХиГС проведут хакатон «Цифровой рост». Приглашаем к участию выпускников бакалавриата ИТ-специальностей, а также начинающих специалистов, которые хотят продолжить свое обучение, повысить квалификацию и получить востребованное образование. Участники будут соревноваться в решении задач на машинное обучение,  текстовый анализ, маркетинговую аналитику, а также в создании различных типов проектов на основе данных:  расширения для веб-браузеров, инфографику, прототипы интернет-сервисов и мобильных приложений, боты. Участники могут решить одну из предложенных задач или разработать свой проект на основе предложенных данных. Хакатон пройдет в несколько этапов: 16 июня состоится распределение задач по командам, лекции…

Дата-среда: «Как извлекать полезную информацию из текста – система PolyAnalyst»

29 мая приглашаем на четвертую дата-среду из цикла «Большие данные в экономике». Тема встречи — «Как извлекать полезную информацию из текста – система PolyAnalyst». Дата-среду проведет Сергей Ананян, генеральный директор компании Мегапьютер (www.megaputer.com), кандидат физмат наук, специалист по решению прикладных задач анализа данных. Надежное извлечение полезной информации из текстовых документов открывает путь к решению многих важнейших бизнес-задач в самых разных областях деятельности. Учитывая сложности, с которыми сталкиваются при попытке извлечения информации системы, основанные только на машинном обучении, мы представим альтернативный подход: использование специального языка запросов, базирующегося на результатах углубленного лингвистического и семантического анализа текста. Мы продемонстрируем практическую реализацию этого подхода…

Дата-среда: «Сбор данных и методология парирования блокировки роботов»

22 мая приглашаем на третью дата-среду из цикла «Большие данные в экономике». Тема встречи — «Сбор данных и методология парирования блокировки роботов». Проведет дата-среду Сергей Бершадский, ведущий backend-разработчик и системный архитектор, работал с различными проектами, среди которых медицинский портал ЕМИАС.инфо, Play2Live, toptal.com и др. Эксперт расскажет об особенностях извлечения данных из сайтов, их очистки и структуризации. Во время встречи будет рассмотрен весь процесс извлечения данных: веб-скрейпинг, обработка данных, очистка данных, а также способы break-the-wall на примере Yandex и Google. Предложенные кейсы основаны на использовании библиотек python scrapy, beautiful soup, asyncio. Будут рассмотрены подходы, позволяющие имитировать браузер, автоматическое использование имеющегося браузера,…

Дата-среда: «Семантический анализ текста в неевклидовой геометрии»

24 апреля 2019 приглашаем на дата-среду из цикла «Большие данные в экономике». Тема второй встречи цикла — «Преимущества векторных представлений слов в неевклидовых геометриях». Как аналитики в сфере бизнеса, так и академические исследователи зачастую сталкиваются с необходимостью семантического анализа текста. Он может быть применен в таких задачах, как определение тематики и тональности новостных сообщений или предсказание размера заработной платы по описанию вакансии. На дата-среде Артур Федоров, специалист по машинному анализу естественного языка в группе операционного моделирования Yandex.Market, расскажет о модели Пуанкаре — гиперболического пространства для текстового анализа, которая сохраняет скрытую иерархическую структуру текста. Лектор сравнит стандартные методы нахождения векторных представлений…

Интерактивный data mining: возможности Orange — продукта с открытым исходным кодом

3 апреля 2019 состоялась дата-среда из цикла «Большие данные в экономике», который совместно организуют АНО «Инфокультура», Ассоциация участников рынка данных и РАНХиГС. Об основах интерактивного data mining рассказал Дмитрий Стефановский, директор «Центра компетенций по цифровой прослеживаемости и консалтингу» РАНХиГС, кандидат технических наук, специалист в области прикладных исследований по цифровой трансформации. Data mining – интеллектуальный анализ данных, совокупность методов обнаружения в данных ранее неизвестных, нетривиальных и практически полезных знаний. Сегодня результаты анализа данных позволяют по-новому взглянуть на процессы, происходящие на предприятии. При этом на практике академический подход часто не может быть внедрен в бизнес-процессы, потому что организации не могут себе позволить,…

Нерешенный вопрос: право на данные

27 марта состоится Форум BIG DATA 2019. В рамках события пройдет дискуссия «Нерешенный вопрос: право на данные», в которой примет участие Иван Бегтин, генеральный директор АУРД. В очередной раз эксперты обсудят, как найти баланс между всеми участниками рынка: пользователями, бизнесом и государством, — и урегулировать оборот данных. Спикеры: — Светлана Белова, директор IDX; — Борис Зингерман, директор Ассоциации разработчиков и пользователей искусственного интеллекта «Национальная база медицинских знаний»; — Екатерина Калугина, главный юрист IT Legal Consulting; — Александра Орехович, директор по правовым инициативам ФРИИ — Дженифер Трелевич, исполнительный директор TGPO consult; — Иван Фост, руководитель направления в Аналитическом центре при Правительстве…

День открытых данных в Москве

  2-3 марта 2019 года состоится пятый ежегодный День открытых данных в Москве. Организаторами события выступят АНО “Информационная культура”, Фонд развития интернет инициатив и Ассоциация участников рынка данных. День открытых данных (Open Data Day) — международный проект, организованный Фондом открытых знаний (Open Knowledge International) при поддержке разных межгосударственных и международных организаций. Эта инициатива помогает продвигать концепцию информационной открытости и прозрачности. Ежегодно с 2015 года Инфокультура проводит День открытых данных в Москве, а также оказывает информационную поддержку мероприятиям, проходящим в различных городах России. От небольшого хакатона единомышленников за пять лет мероприятие выросло до масштабной конференции, которая в 2018 году объединила 70…

АУРД на Форуме перспективных технологий

Ассоциация участников рынка данных (АУРД) провела тематическую сессию и закрытый круглый стол в рамках совместного с ФРИИ, Ассоциацией Ассоциация интернета вещей и ООО ТехЦентр мероприятия «Форум перспективных технологий», состоявшегося 18 декабря 2018 года. Генеральный директор Ассоциации участников рынка данных Бегтин Иван рассказал участникам круглого стола о планах АУРД на 2019 год. Среди наиболее актуальных задач Ассоциации в 2019 году, поддержанных всеми участниками закрытого круглого стола, было создание на базе АУРД площадки для взаимодействия, кооперации и обмена данными, площадки для согласования интересов заказчиков, разработчиков и потребителей ФГИС. Ассоциация в новом году будет разрабатывать и активно продвигать стандарты обмена данными между участниками…