课程

Выпускная работа

课程类别Машинное обучение и управление большими данными

ВВЕДЕНИЕ В CUDA

课程类别Машинное обучение и управление большими данными

Цель программы: качественное изменение профессиональных компетенций, направленных на повышение профессионального уровня в рамках имеющейся у слушателей квалификации в области параллельного программирования. под архитектуру графических процессоров (GPU) с применением технологии CUDA, ознакомление с практикой разработки прикладных программ различного назначения (программирование в среде Nsight под операционной системой Linux с использованием разносторонних параллельных библиотек) и способами их оптимизации. Основное внимание уделяется изучению принципов разработки параллельных программ под архитектуру графических процессоров, соответствующим современным алгоритмам, методам программирования и способам повышения эффективности параллельных программ.. Результатом обучения является приобретение знаний и умений по: базовым принципам параллельного программирования под архитектуру графических процессоров; среде программирования Nsight; основным API CUDA; базовым библиотекам, которые используют графические процессоры; фундаментальным параллельным алгоритмам; оптимизации параллельных программ.

ОСНОВЫ ЯЗЫКА И ПЛАТФОРМЫ JAVA ДЛЯ АНАЛИЗА ДАННЫХ

课程类别Машинное обучение и управление большими данными

Цель программы: качественное изменение профессиональных компетенций, направленных на повышение профессионального уровня в рамках имеющейся у слушателей квалификации в области языка программирования и платформы Java. Особое внимание уделяется практическим задачам, работе с данными. Результатом обучения является приобретение знаний и умений по: основам программирования на языке Java; работе с библиотекой коллекций Java; потоковой обработке данных (Stream API), чтение и запись данных из внешних файлов; разработке модульных (Unit) тестов; основы работы с базами данных из Java

ХРАНЕНИЕ И ОБРАБОТКА БОЛЬШИХ ДАННЫХ НА ПЛАТФОРМЕ HADOOP И APACHE SPARK

课程类别Машинное обучение и управление большими данными

Цель программы: качественное изменение профессиональных компетенций, направленных на повышение профессионального уровня в рамках имеющейся у слушателей квалификации в области работы с большими данными и распараллеливанию обработки данных с помощью современных технологий. Результатом обучения является приобретение знаний и умений по: работе с данными в распределенных отказоустойчивых системах на примере дистрибутива Cloudera Hadoop; применимости технологий больших данных в реальных проектах; основам настройки и администрирования кластера Cloudera Hadoop; работе с распределенной файловой системой HDFS, загрузке данных из внешних файлов и баз данных; трансформации и анализу данных с помощью SQL-интерфейса Apache Hive; обзору фреймворков MapReduce, Apache Spark, Apache Kafka, Apache AirFlow и других популярных компонентов современных архитектур для работы с большими данными