Разворачиваем вложенные столбцы — списки с помощью языка R (пакет tidyr и функции семейства unnest)

В большинстве случаев при работе с ответом полученным от API, или с любыми другими данными которые имеют сложную древовидную структуру, вы сталкиваетесь с форматами JSON и XML.

Эти форматы имеют множество преимуществ: они достаточно компактно хранят данные и позволяют избежать излишнего дублирования информации.

Минусом данных форматов является сложность их обработки и анализа. Неструктурированные данные невозможно использовать в вычислениях и нельзя строить на их основе визуализацию.

Продолжить чтение «Разворачиваем вложенные столбцы — списки с помощью языка R (пакет tidyr и функции семейства unnest)»

R пакет tidyr и его новые функции pivot_longer и pivot_wider

Пакет tidyr входит в ядро одной из наиболее популярных библиотек на языке R — tidyverse.
Основное назначение пакета — приведение данных к аккуратному виду.

На Хабре уже есть публикация посвящённая данному пакету, но датируюется она 2015 годом. А я хочу рассказать, о наиболее актуальных изменениях, о которых несколько дней назад сообщил его автор Хедли Викхем.

Продолжить чтение «R пакет tidyr и его новые функции pivot_longer и pivot_wider»

Блог на WordPress.com. Тема: Baskerville 2, автор: Anders Noren.

Вверх ↑