Как загрузить данные из API Google Analytics в R: часть 2

Несколько лет назад я уже рассказывал о том как работать с API Google Analytics на языке R с помощью пакета RGA. Пакет RGA всем хорош, но он работает только с Google Analytics Core Reporting API v3, а уже давно вышла четвертая версия, у которой функционал намного шире.

Мы рассмотрим новый пакет googleAnalyticsR, написанный Марком Эдмондсом. Марк ведет личный блог и сайт с документацией к пакету, о котором сегодня пойдет речь.

В этой статье много примеров кода взято с официального сайта пакета googleAnalyticsR.

Продолжить чтение «Как загрузить данные из API Google Analytics в R: часть 2»

Вебинар: Основы Python. Библиотека Pandas (29.07.2020)

Провели совместный с Productstar вебинар «Основы Python. Библиотека Pandas.».

Тезисы:

  • Установим дистрибутив Anaconda
  • Разберёмся с основными структурами данных в библиотеке Pandas
  • Научимся загружать данные с помощью библиотеки Pandas
  • Выполним основные операции по преобразованию данных и эквивалентные сводным таблицам в Excel
Продолжить чтение «Вебинар: Основы Python. Библиотека Pandas (29.07.2020)»

Какой язык выбрать для работы с данными — R или Python? Оба! Мигрируем с pandas на tidyverse и data.table и обратно

По запросу R или Python в интернете вы найдёте миллионы статей и километровых обсуждений по теме какой из них лучше, быстрее и удобнее для работы с данными. Но к сожалению особой пользы все эти статьи и споры не несут.

Продолжить чтение «Какой язык выбрать для работы с данными — R или Python? Оба! Мигрируем с pandas на tidyverse и data.table и обратно»

Работа с датами на языке R (базовые возможности, а также пакеты lubridate и timeperiodsR)

Получить текущую дату в любом языке программирования, операция эквивалентная «Hello world!». Язык R не является исключением.

В этой статье мы разберёмся с тем, как устроена работа с датами в базовом синтаксисе языка R, а также рассмотрим несколько полезных пакетов, расширяющих его возможности при работе с датами:

  • lubridate — пакет позволяющий производить арифметические вычисления между датами;
  • timeperiodsR — пакет для работы с временными интервалами и их компонентами.
Продолжить чтение «Работа с датами на языке R (базовые возможности, а также пакеты lubridate и timeperiodsR)»

Построение поведенческих воронок на языке R, на основе данных полученных из Logs API Яндекс.Метрики

Анализ воронки продаж — типичная задача для интернет маркетинга, и в частности электронной коммерции. С её помощью вы можете:

  • Выяснить на каком из шагов к покупке вы теряете потенциальных клиентов.
  • Моделировать объём дополнительного притока выручки, в случае расширения каждого шага на пути к покупке.
  • Оценить качество трафика закупаемого на различных рекламных платформах.
  • Оценить качество обработки входящих заявок по каждому из менеджеров.

В этой статье я расскажу о том, как на языке R запрашивать данные из Logs API Яндекс Метрики, строить и визуализировать на их основе воронку.

Продолжить чтение «Построение поведенческих воронок на языке R, на основе данных полученных из Logs API Яндекс.Метрики»

Видео запись R meetup: Чем нас порадует dplyr 1.0.0

Данный митап был организован Европейским Университетом в Спб.

Посвящён митап новым возможностям популярного R пакета dplyr версии 1.0.0.

В ходе митапа я провёл обзор 4 статей автора dplyr, Хедли Викхема, в которых он рассказывал о грядущих изменениях.

Продолжить чтение «Видео запись R meetup: Чем нас порадует dplyr 1.0.0»

Python: Как создать оформленную HTML таблицу из pandas DataFrame

Мы в Netpeak довольно активно используем дайджесты, это такие небольшие, информационные письма с таблицами и графиками которые помогают нам в общей массе информации контролировать основные показатели бизнеса, а каждому сотруднику выполнение его KPI.

Более подробно о том, что такое дайжесты и как мы их используем я уже рассказывал на GoAnalytics в 2019 году. Кому это интересно по ссылке доступна запись доклада.

В этой статье речь пойдёт о технической реализации таких писем на Python, а не о самих дайджестах.

Продолжить чтение «Python: Как создать оформленную HTML таблицу из pandas DataFrame»

Взаимодействие R с базами данных на примере Microsoft SQL Server и других СУБД

Поскольку львиная доля бизнес информации храниться в базах данных. На каком бы языке программирования вы не писали, вам придётся производить различные действия с ними.

В этой статье я расскажу о двух интерфейса для работы с базами данных в R. Большая часть примеров демонстрируют работу с Microsoft SQL Server, тем не менее все примеры кода будут работать и с другими базами данных, такими как: MySQL, PostgreSQL, SQLite, ClickHouse, Google BigQuery и др.

Продолжить чтение «Взаимодействие R с базами данных на примере Microsoft SQL Server и других СУБД»

Видео обзор: Пре релиз dplyr 1.0.0 — функция across()

Данное видео представляет собой обзор пре релиза пакета dplyr версии 1.0.0.

В видео продемонстрирована работа с новой функцией across(), которая упрощает обращение к столбцам внутри таких функций как mutate() и summarise().

Продолжить чтение «Видео обзор: Пре релиз dplyr 1.0.0 — функция across()»

Создайте бесплатный сайт или блог на WordPress.com. Тема: Baskerville 2, автор: Anders Noren.

Вверх ↑