Разворачиваем вложенные столбцы — списки с помощью языка R (пакет tidyr и функции семейства unnest)

В большинстве случаев при работе с ответом полученным от API, или с любыми другими данными которые имеют сложную древовидную структуру, вы сталкиваетесь с форматами JSON и XML.

Эти форматы имеют множество преимуществ: они достаточно компактно хранят данные и позволяют избежать излишнего дублирования информации.

Минусом данных форматов является сложность их обработки и анализа. Неструктурированные данные невозможно использовать в вычислениях и нельзя строить на их основе визуализацию.

Продолжить чтение «Разворачиваем вложенные столбцы — списки с помощью языка R (пакет tidyr и функции семейства unnest)»

Какой язык выбрать для работы с данными — R или Python? Оба! Мигрируем с pandas на tidyverse и data.table и обратно

По запросу R или Python в интернете вы найдёте миллионы статей и километровых обсуждений по теме какой из них лучше, быстрее и удобнее для работы с данными. Но к сожалению особой пользы все эти статьи и споры не несут.

Продолжить чтение «Какой язык выбрать для работы с данными — R или Python? Оба! Мигрируем с pandas на tidyverse и data.table и обратно»

Видео запись R meetup: Чем нас порадует dplyr 1.0.0

Данный митап был организован Европейским Университетом в Спб.

Посвящён митап новым возможностям популярного R пакета dplyr версии 1.0.0.

В ходе митапа я провёл обзор 4 статей автора dplyr, Хедли Викхема, в которых он рассказывал о грядущих изменениях.

Продолжить чтение «Видео запись R meetup: Чем нас порадует dplyr 1.0.0»

Видео обзор: Пре релиз dplyr 1.0.0 — функция across()

Данное видео представляет собой обзор пре релиза пакета dplyr версии 1.0.0.

В видео продемонстрирована работа с новой функцией across(), которая упрощает обращение к столбцам внутри таких функций как mutate() и summarise().

Продолжить чтение «Видео обзор: Пре релиз dplyr 1.0.0 — функция across()»

R пакет tidyr и его новые функции pivot_longer и pivot_wider

Пакет tidyr входит в ядро одной из наиболее популярных библиотек на языке R — tidyverse.
Основное назначение пакета — приведение данных к аккуратному виду.

На Хабре уже есть публикация посвящённая данному пакету, но датируюется она 2015 годом. А я хочу рассказать, о наиболее актуальных изменениях, о которых несколько дней назад сообщил его автор Хедли Викхем.

Продолжить чтение «R пакет tidyr и его новые функции pivot_longer и pivot_wider»

Создайте бесплатный сайт или блог на WordPress.com. Тема: Baskerville 2, автор: Anders Noren.

Вверх ↑