R применяется там, где нужна работа с большими данными. Для этого отлично подходит программа RStudio, отличающаяся удобством и постоянно расширяющимися функциональными возможностями. Несмотря на высокую гибкость, RStudio продолжает медленно выполнять команды и выводить повторяющиеся сообщения об ошибках. Можно ли это исправить?
data.table — один из пакетов R, специально созданных для работы с большими наборами данных без ущерба для скорости выполнения.
Данное руководство представляет собой введение в синтаксис data.table. Автор начинает с несложных основ — что такое пакет data.table, его общий вид, способы выделения поднаборов строк, выбор и вычисление колонок, затем переходит к более сложной задаче — выполнению агрегирования данных по группам.
Автор также предоставляет множество рекомендаций, использование которых поможет вам улучшить кодирование на R. Пришло время писать коды, которые будут быстрыми и короткими, и проводить анализ больших данных с минимальными тратами времени.
data.table обеспечивает улучшенную версию таблиц данных data.frames, поэтому руководство лучше всего подойдет для новичков в науке о данных, использующих R, которые в основном работают с наборами данных с помощью data.frame.