Перейти к содержанию

Работа с датасетами

Датасеты в Р13.Орбита - это сохраненные результаты запросов, которые можно переиспользовать для дальнейшего анализа и визуализации. Это мощный инструмент для организации работы с данными.

Что такое датасет

Датасет - это именованный снимок данных, полученных в результате выполнения запроса. После сохранения вы можете:

  • Быстро открыть данные без повторного запроса к БД
  • Создавать визуализации на основе сохраненных данных
  • Делиться результатами с коллегами
  • Сравнивать данные за разные периоды

Пример

Вы выполнили запрос "покажи топ-20 товаров по продажам за февраль". Результат можно сохранить как датасет топ_февраль и потом быстро открывать или строить по нему графики.


Зачем нужны датасеты

1. Экономия времени

Вместо повторного выполнения сложного запроса просто откройте сохраненный датасет.

Без датасета:

> покажи топ-20 товаров по продажам с детализацией по категориям и брендам за февраль с учетом скидок
[Ждем 5-10 секунд]

С датасетом:

> открой датасет топ_февраль
[Мгновенно]


2. Организация работы

Группируйте связанные данные по проектам или задачам:

анализ_q1_2024
топ_клиенты_март
проблемные_заказы_февраль

3. Сравнение периодов

Сохраните данные за разные периоды и сравнивайте:

продажи_январь
продажи_февраль
продажи_март

4. Визуализация

Создавайте графики на основе готовых данных:

> открой датасет продажи_по_месяцам
> построй график

Как сохранить датасет

Способ 1: В запросе (рекомендуется)

Добавьте инструкцию сохранения прямо в запрос:

> покажи топ-20 товаров по продажам за февраль и сохрани как топ_февраль

Система: 1. Выполнит запрос 2. Покажет результат 3. Сохранит данные под именем топ_февраль


Способ 2: После выполнения запроса

Если забыли сохранить, используйте команду:

> покажи продажи по категориям за квартал

[Результаты...]

> сохрани последний результат как продажи_q1

Правила именования

Хорошие имена

топ_товаров_февраль
клиенты_москва_2024
заказы_отмененные_март

Плохие имена

dataset1
temp
данные

Рекомендации:

  • Используйте понятные описательные имена
  • Включайте период времени если релевантно
  • Используйте подчеркивания вместо пробелов
  • Избегайте специальных символов

Как просмотреть список датасетов

Команда /datasets

> /datasets

Выведет список всех сохраненных датасетов:

Сохраненные датасеты:

1. топ_февраль
   Создан: 2024-03-15 14:30
   Строк: 20
   Описание: топ-20 товаров по продажам за февраль

2. клиенты_москва
   Создан: 2024-03-14 10:15
   Строк: 1247
   Описание: клиенты из Москвы

3. продажи_q1
   Создан: 2024-03-10 16:45
   Строк: 150
   Описание: продажи по категориям за квартал

В запросе

> покажи список датасетов
> покажи мои датасеты
> список сохраненных датасетов

Как открыть датасет

Способ 1: Командой

> /load топ_февраль

Способ 2: В запросе

> открой датасет топ_февраль
> покажи датасет топ_февраль
> загрузи датасет топ_февраль

Р13.Орбита загрузит данные и покажет их в виде таблицы:

Датасет: топ_февраль
Создан: 2024-03-15 14:30
Строк: 20

┌────────────────────────┬──────────────┐
│ Товар                  │ Продажи (₽)  │
├────────────────────────┼──────────────┤
│ Смартфон Galaxy S23    │ 15 234 500   │
│ Ноутбук MacBook Pro    │ 12 890 300   │
│ ...                    │ ...          │
└────────────────────────┴──────────────┘

Как удалить датасет

> удали датасет старые_данные
> /delete старые_данные

Внимание

Удаление датасета необратимо. Убедитесь, что данные вам больше не нужны.


Использование датасетов для визуализации

Один из самых мощных сценариев - создание графиков на основе датасетов.

Быстрый способ

> построй график по датасету продажи_по_месяцам

С уточнением типа

> построй линейный график по датасету динамика_продаж
> построй столбчатую диаграмму по датасету топ_категорий
> построй круговую диаграмму по датасету доля_по_городам

Типичные сценарии использования

Сценарий 1: Ежемесячный анализ

Задача: Каждый месяц анализировать топ товаров.

Решение:

# Январь
> покажи топ-20 товаров по продажам за январь и сохрани как топ_январь

# Февраль
> покажи топ-20 товаров по продажам за февраль и сохрани как топ_февраль

# Сравнение
> открой датасет топ_январь
> открой датасет топ_февраль

Сценарий 2: Подготовка отчета

Задача: Собрать данные для отчета руководству.

Решение:

# Соберите данные
> покажи общую выручку по категориям за квартал и сохрани как выручка_q1
> покажи топ-10 клиентов по сумме заказов и сохрани как топ_клиенты_q1
> покажи динамику продаж по месяцам и сохрани как динамика_q1

# Создайте визуализации
> построй график по датасету динамика_q1
> построй диаграмму по датасету выручка_q1

# Теперь у вас есть все данные и графики для отчета

Сценарий 3: Анализ проблем

Задача: Разобраться с отмененными заказами.

Решение:

# Сохраните проблемные данные
> покажи заказы со статусом Отменен за последний месяц и сохрани как отмены_март

# Анализируйте
> открой датасет отмены_март
> покажи количество отмен по причинам
> покажи в каких городах больше всего отмен

Сценарий 4: Работа с большими данными

Задача: Нужно несколько раз обращаться к большому набору данных.

Решение:

# Один раз выполните тяжелый запрос и сохраните
> покажи все заказы с детализацией за 2024 год и сохрани как заказы_2024

# Теперь работайте с датасетом
> открой датасет заказы_2024
> построй график динамики по месяцам
> покажи статистику по статусам

Метаданные датасетов

Каждый датасет содержит метаинформацию:

  • Название - имя датасета
  • Дата создания - когда был сохранен
  • Количество строк - объем данных
  • Описание - оригинальный запрос
  • Автор - кто создал (в мультипользовательском режиме)
  • Схема - структура полей и типов данных

Просмотр метаданных:

> покажи информацию о датасете топ_февраль

Ограничения датасетов

Важно знать

  1. Размер: Датасеты ограничены 10 000 строк по умолчанию
  2. Актуальность: Данные сохраняются на момент создания датасета
  3. Хранение: Датасеты хранятся в метаданных БД
  4. Доступ: В локальном режиме - только ваши датасеты

Обновление датасета

Датасеты не обновляются автоматически. Чтобы получить свежие данные:

# Удалите старый
> удали датасет топ_февраль

# Создайте новый с тем же именем
> покажи топ-20 товаров по продажам за февраль и сохрани как топ_февраль

Экспорт датасетов

Хотите сохранить данные локально?

# Экспорт в CSV
> экспортируй датасет топ_февраль в CSV

# Экспорт в Excel
> экспортируй датасет топ_февраль в Excel

# Экспорт в JSON
> экспортируй датасет топ_февраль в JSON

Файл будет сохранен в директорию ~/orbita/exports/.


Советы по работе с датасетами

Совет 1: Называйте датасеты осмысленно

Через месяц вы забудете, что такое dataset1. Используйте описательные имена.

Совет 2: Удаляйте неактуальные датасеты

Регулярно чистите список датасетов, удаляя устаревшие данные.

Совет 3: Группируйте по проектам

Используйте префиксы:

проект_x_клиенты
проект_x_продажи
проект_y_аналитика

Совет 4: Сохраняйте промежуточные результаты

При сложном анализе сохраняйте промежуточные шаги как датасеты.

Совет 5: Документируйте

В описании датасета укажите контекст:

> сохрани как топ_товары_фев_для_презентации_CEO


Команды для работы с датасетами

Команда Описание Пример
сохрани как [имя] Сохранить результат запроса ... и сохрани как мой_датасет
/datasets Список всех датасетов /datasets
открой датасет [имя] Открыть датасет открой датасет топ_февраль
/load [имя] Загрузить датасет /load топ_февраль
удали датасет [имя] Удалить датасет удали датасет старые_данные
/delete [имя] Удалить датасет /delete старые_данные
информация о датасете [имя] Метаданные датасета информация о датасете топ_февраль
экспортируй датасет [имя] Экспорт в файл экспортируй датасет топ_февраль в CSV

Следующие шаги

Теперь вы умеете работать с датасетами! Переходите к:

Эффективной работы с данными! 💾