Варианты зачисления на курс

Извлечение и интеграция информации из больших данных (Брюхов Д.О.)

Часы: 36 Практикум: нет 0 часов
Преподаватель: Брюхов Д.О.
Описание
В настоящем курсе изучаются методы и инструменты извлечения (mining) и интеграции информации изразличных источников больших данных (в масштабе Веба, социальных сред (Twitter, Linkedin, …), блогов,публикаций в средствах массовой информации, машинных логов, сенсорных данных, и пр. Большие данныеобычно являются неструктурированными (чаще всего текстовыми), слабоструктурированными (например, ввиде XML, JSON, баз данных NoSQL). Вместе с тем, образуются также и структурированные большие данныекак, например, результат наблюдений (измерений) современными инструментами, накоплениямногочисленных таблиц в Вебе. Современные ИТ платформы включают распределенные инфраструктурытипа Hadoop, обеспечивающие параллельную обработку и анализ таких разноструктурированных большихданных на основе парадигмы Map/Reduce. Практическая часть предлагаемого курса ориентирована наподобную платформу на базе IBMBigInsights
Преподаватель: Дмитрий Брюхов
Самостоятельная запись