Курс познакомит вас с технологиями Big Data на примере Apache Hadoop. Также учебная программа включает в себя изучение основ технологий HDFS, YARN, Hive, Flume, Solr.
В ходе обучения вы будете выполнять большое практическое задание, в рамках которого вы под руководством преподавателей получите реальную информацию из Twitter, структурируете и визуализируете данные для дальнейшего анализа.
Вам подойдет этот курс, если вы:
- знакомы с основами SQL;
- учитесь на технической специальности;
- работаете разработчиком ПО;
- планируете в дальнейшем углубиться в тематику «Большие данные».
Ключевые навыки, которые вы освоите на этом курсе:
- будете знать компоненты Apache Hadoop;
- опыт работы с HDFS и MapReduce;
- познакомитесь с главными определениями и параметрами Big Data;
- разработка уникальных алгоритмов и программ с применением современных технологий;
- научитесь использовать исследовательские методы на практике.
Учебная программа:
- введение и объяснение термина «Большие данные»;
- экосистема Apache Hadoop;
- распределенные вычисления;
- Apache Spark;
- получение данных;
- SQL в Hadoop;
- визуализация;
- другие компоненты экосистемы Hadoop.
Процесс обучения сопровождается большим количеством практических занятий. Студентам предстоит решать задачи разной сложности. В сообществе курса вы сможете поучаствовать в обсуждении дискуссионных вопросов с другими обучающимися, а также при необходимости попросить помощь у преподавателей.