ОНЛАЙН-ИНТЕНСИВ ПО ЦИФРОВОЙ ГУМАНИТАРИСТИКЕ ДЛЯ СТАРШЕКЛАССНИКОВ
Дата-Кампус.Медиа
16–24 июня 2021 г, онлайн
Заполнить заявку на участие
"Дата-Кампус" – это интенсивы и тематические смены по основам анализа данных и машинного обучения для старшеклассников. С 2019 г. около 1.5 тысяч человек из 15 городов России прошли обучение в Дата-Кампусе.

"Дата-кампус.Медиа" продолжает серию интенсивов по Data Science, в этот раз – с фокусом на анализе текстовых данных и методов обработки естественного языка.

Цифровая гуманитаристика – быстроразвивающееся направление, объединяющее применение информационных технологий и математических методов в различных гуманитарных науках. Это направление отражает цифровой поворот и запросы науки, образования и общества в современных условиях. Знание подходов и методов Digital Humanities важно с точки зрения понимания современных возможностей обработки и визуализации данных гуманитарных наук и историко-культурных источников.
Для кого эта программа?

Для учащихся в возрасте от 14 до 18 лет (9-11 классы), которые хотят получить представление об области цифровой гуманитаристики (Digital Humanities), обработке естественного языка (natural language processing) и научиться решать этими методами практические исследовательские задачи. Участники с базовыми навыками программирования на языке Python имеют преимущество при наборе в программу.
Что значит «медиа»?

«Дата-Кампус. Медиа» посвящен изучению методов анализа текстовых данных в самых разных медийных каналах: новостных лентах, электронных книгах, сайтах онлайн-кинотеатров и стриминговых музыкальных сервисов. Для участников у нас есть несколько гигабайт региональных новостей, дневниковые записи за три последних столетия, несколько тысяч аннотаций художественных текстов всех жанров, тексты песен с середины прошлого века до наших дней, описания кинофильмов и целое море метаданных.
Чему научимся?

— Использовать для решения гуманитарных задач цифровые инструменты и методы Data Science.
– Количественно анализировать текстовые данные на языке Python, применять инструменты обработки естественного языка (Natural Language Processing).
– Работать в географически распределенной команде.
– Пользоваться облачными сервисами и средствами вычислений, работая над реальным исследовательским проектом.
Как проходит?

Занятия проходят онлайн на нашей платформе. Это будут лекции, мастер-классы, командная работа, консультации по командным проектам ежедневно онлайн с 09:00 до 17:00 по московскому времени с перерывами.
Программа курса
I. Данные в социальных и гуманитарных исследованиях
Методы компьютерной обработки данных в социальных и гуманитарных исследованиях. Какие могут быть исследовательские проекты с применением NLP и как их делать.
II. Подходы к анализу текстовых данных
Извлечение информации из текстов. Специфика задач, подходы к решению, извлекаемая информация. Предобработка данных. Анализ частотности и значимости слов. Тематическое моделирование и анализ тональности.
III. Обработка естественного языка
Введение в методы автоматической обработки текстов с использованием Python. Прикладные пакеты для автоматической обработки и анализа текстов.
IV. Визуализация данных
Графическое представление результатов исследования. Визуализация данных с помощью пакетов Matplotlib и Seaborn.
Командный исследовательский дата-проект
Все участники выполняют учебный исследовательский дата-проект в составе команд. Тематические направления командных проектов:
  • Исследование новостных сообщений
  • Исследование дневниковых записей
  • Исследование художественного текста
  • Исследование музыкальных текстов
  • Исследование метаданных кинофильмов
Преподаватели курса

Илья Эдуардович Бойцов
Руководитель группы машинного обучения в Rambler & Co, аспирант НИУ ВШЭ, спикер различных конференций по машинному обучению.
Вячеслав Викторович Бакулин
Дата-аналитик, руководитель команды машинного обучения в Центре прикладного анализа больших данных Томского государственного университета. Победитель в 3 треках Data Science-соревнования Econophysica, Газпромнефть и Heriot Watt. 1 место в data-соревновании Сибур.
Павел Павлович Глухов
Научный сотрудник научно-исследовательского сектора «Открытое образование» научно-исследовательского центра социализации и персонализации образования детей Федерального института развития образования РАНХиГС, эксперт лаборатории компетентностных практик образования МГПУ
Андрей Александрович Дерябин
Научный сотрудник Федерального института развития образования РАНХиГС, MSc Social Psychology (London School of Economics), медиа-аналитик, certified Data Science professional.

Попов Александр Анатольевич
доктор философских наук
Генеральный директор АНО ДПО «Открытое образование»
Заведующий научно-исследовательским сектором «Открытое образование» Федерального института развития образования РАНХиГС
Заведующий лабораторией компетентностных практик образования Института системных проектов МГПУ
Участие бесплатно. Количество мест ограничено.

Участники с базовыми навыками программирования на языке Python имеют преимущество при наборе в программу; знание основ Python тестируется при регистрации.

Заполнить заявку на участие
АНО ДПО "Открытое образование"