Курс «Наука о данных» от платформы Coursera поможет вам освоить знания и навыки, необходимые для работы специалистом в области Data Science.
Вы научитесь анализировать, обрабатывать и визуализировать данные с помощью языка R, работать с GitHub и использовать регрессионные модели.
Учебная программа состоит из десяти отдельных курсов. В третьем курсе «Сбор и сортировка данных» видеолекции имеют русские субтитры, остальные курсы не переведены.
Вам подойдет этот курс, если вы:
- имеете базовые знания математики и алгебры;
- имеете опыт программирования на любом языке (желательно).
Ключевые навыки, которые вы освоите на этом курсе:
- машинное обучение;
- регрессионный анализ;
- программирование на языке R;
- работа с GitHub;
- обработка ошибок;
- манипуляции с данными;
- использование регулярных выражений;
- кластерный анализ.
Учебная программа:
- инструменты для анализа данных: понятия науки о данных, R и RStudio, GitHub, Git, R Markdown, Big Data;
- язык R: установка, типы данных, структуры, функции, обработка ошибок, циклы, моделирование, профилирование;
- сбор и сортировка: манипуляции с данными с использованием R, MySQL;
- EDA: аналитические графики, ggplot2, Lattice, кластеризация;
- воспроизводимое исследование: Knitr с R Markdown, структура, концепты;
- статистический вывод: вариация, асимптотический анализ, доверительные интервалы, тестирование, p-критерий, бутстрап;
- регрессионные модели: линейная регрессия, метод наименьших квадратов, пуассоновская и логистическая регрессия;
- компьютерное обучение: предсказание, ошибки, кросс-проверка, пакет CARET, случайный лес, регуляризация;
- разработка продуктов: Shiny, R Markdown, пакеты R, GoogleVis, Plotly;
- итоговый проект: повторение изученного на практике.
Программа разработана Университетом Джонса Хопкинса. По окончании обучения выдается сертификат.