Наука о данных (eng)

Курс «Наука о данных» от платформы Coursera поможет вам освоить знания и навыки, необходимые для работы специалистом в области Data Science.

Вы научитесь анализировать, обрабатывать и визуализировать данные с помощью языка R, работать с GitHub и использовать регрессионные модели.

Учебная программа состоит из десяти отдельных курсов. В третьем курсе «Сбор и сортировка данных» видеолекции имеют русские субтитры, остальные курсы не переведены.

Вам подойдет этот курс, если вы:

  • имеете базовые знания математики и алгебры;
  • имеете опыт программирования на любом языке (желательно).

Ключевые навыки, которые вы освоите на этом курсе:

  • машинное обучение;
  • регрессионный анализ;
  • программирование на языке R;
  • работа с GitHub;
  • обработка ошибок;
  • манипуляции с данными;
  • использование регулярных выражений;
  • кластерный анализ.

Учебная программа:

  • инструменты для анализа данных: понятия науки о данных, R и RStudio, GitHub, Git, R Markdown, Big Data;
  • язык R: установка, типы данных, структуры, функции, обработка ошибок, циклы, моделирование, профилирование;
  • сбор и сортировка: манипуляции с данными с использованием R, MySQL;
  • EDA: аналитические графики, ggplot2, Lattice, кластеризация;
  • воспроизводимое исследование: Knitr с R Markdown, структура, концепты;
  • статистический вывод: вариация, асимптотический анализ, доверительные интервалы, тестирование, p-критерий, бутстрап;
  • регрессионные модели: линейная регрессия, метод наименьших квадратов, пуассоновская и логистическая регрессия;
  • компьютерное обучение: предсказание, ошибки, кросс-проверка, пакет CARET, случайный лес, регуляризация;
  • разработка продуктов: Shiny, R Markdown, пакеты R, GoogleVis, Plotly;
  • итоговый проект: повторение изученного на практике.

Программа разработана Университетом Джонса Хопкинса. По окончании обучения выдается сертификат.

Оцените курс
ОтвратительноПлохоУдовлетворительноХорошоОтлично! (0)
Загрузка...

Добавить комментарий