Google BigQuery: Динамический UPSERT с помощью EXECUTE IMMEDIATE

Обычный паттерн обновления данных в BigQuery — добавление новых записей, даже если это означает дублирование данных. А затем обрабатывать дубликаты при чтении с помощью группировки или оконных функций, или удаление записей, и последующая повторная запись одних и тех же данных, но уже с новыми значениями. В любом случае все эти варианты не являются лучшей практикой.

Иногда вам нужно выполнить UPSERT операцию (обновление или вставку) данных одним запросом. Возможно вы хотите «исправить» некоторые записи, или внести какие-то обновления в них (например обновить статусы транзакций), либо хотите сохранить чистую таблицу без дубликатов для своего коллеги-аналитика или специалиста по данным.

Продолжить чтение «Google BigQuery: Динамический UPSERT с помощью EXECUTE IMMEDIATE»

Как в Google Таблицу загрузить данные из Google BigQuery (видео урок)

Недавно в интерфейс Googlе Таблиц добавили меню «Коннекторы данных». Пока там доступен только один нативный коннектор, к облачной базе данных Google BigQuery.

Опубликовал видео обзор этой функции, в котором продемонстрировал все возможности коннектора к Google BigQuery.

Продолжить чтение «Как в Google Таблицу загрузить данные из Google BigQuery (видео урок)»

Партиционирование таблиц в Google BigQuery — понятная инструкция

Знаете, как максимально продуктивно и экономно работать с данными в Google BigQuery с помощью разделения больших таблиц на партиции? В этой статье я расскажу, как создавать партиции и обращаться к конкретной партиции на обоих SQL-диалектах BigQuery.

Google BigQuery — это облачная база данных для хранения и быстрой обработки больших объемов информации. Как правило, стоимость использования облачной базы данных не превышает $5 в месяц даже при хранении и обработке достаточно больших объемов данных. Но при неправильном и неэффективном использовании инструментария оплата обходится в сумму в десять раз большую, чем вы ожидали.

Продолжить чтение «Партиционирование таблиц в Google BigQuery — понятная инструкция»

Как начать работать с Google BigQuery

Ранее я публиковал цикл материалов о работе с Google BigQuery. В этой статье расскажу о преимуществах и особенностях сервиса, а также о дополнительных инструментах для BigQuery.

Google BigQuery — это облачная база данных с высочайшей скоростью обработки огромных массивов данных.

Продолжить чтение «Как начать работать с Google BigQuery»

Как загружать данные в Google BigQuery.

Все говорят о BigData, необходимости анализировать большие объемы информации, но при этом не знают, как обрабатывать данные, и не решаются сделать первые шаги. В этом посте мы расскажем о том, как начать работу с облачным сервисом Google BigQuery, если у вас уже есть данные в CSV, JSON или Google Spreadsheets.

Продолжить чтение «Как загружать данные в Google BigQuery.»

Как работать с оконными функциями в Google BigQuery — подробное руководство

Количество данных стремительно растет. Растет и интерес к сервисам для их хранения и обработки. Один из сравнительно новых и качественных инструментов в области хранения и обработки больших массивов информации — облачная база данных Google BigQuery. Инструмент способен обрабатывать сотни тысяч строк в секунду. Если верить открытым источникам, среди множества инструментов, направленных на обработку Big Data, Google BigQuery предпочитают «М.Видео», «Юлмарт», «Связной», Ozon.Travel, «Эльдорадо», Onlinetours, Anywayanyday и «Вымпелком».

Продолжить чтение «Как работать с оконными функциями в Google BigQuery — подробное руководство»

Создайте бесплатный сайт или блог на WordPress.com.

Вверх ↑