Top.Mail.Ru
Меню
Урок 3: Датасет — как описать данные для DataLens
Курс по Yandex DataLens · Урок 3 из 10

Датасет: как описать
данные для DataLens

Разбираем измерения и показатели, типы данных, агрегации и переименование полей — на примерах из маркетинга

⏱ Время чтения: ~18 минут
📊 Уровень: Новичок
🛠 Практика: Нужен аккаунт DataLens

Зачем нужен датасет и чем он отличается от таблицы

После того как в прошлом уроке мы создали подключение к источнику данных, DataLens «видит» вашу таблицу. Но видеть таблицу и уметь строить по ней чарты — разные вещи. Именно датасет становится связующим звеном.

Датасет — это не копия данных. Это описание того, как DataLens должен работать с данными из вашего источника: какие поля использовать, как их называть, что с ними считать. Сами данные по-прежнему живут у вас в Google Sheets или CSV-файле.

Аналогия из жизни

Представьте, что у вас есть склад с товарами (это источник данных). Подключение — это ключ от склада. А датасет — это каталог склада: какой товар как называется, в каких единицах измеряется, что нужно суммировать, а что просто перечислять. Без каталога на складе не разберёшься.

Когда вы будете строить чарт в Wizard (следующий урок), DataLens покажет вам именно поля датасета — с теми именами и типами, которые вы задали. Поэтому хорошо настроенный датасет = приятная работа с Wizard.

Важное ограничение из документации

Максимальное количество полей в одном датасете — 1200. Для большинства задач это более чем достаточно, но знать об этом нужно. Модель данных в документации ↗

Поля и типы данных

Каждая колонка вашей таблицы становится полем датасета. У каждого поля есть тип данных — DataLens пытается определить его автоматически при создании датасета, но иногда нужна ручная правка.

По данным официальной документации DataLens, сервис работает со следующими основными типами:

📋 Типы данных в DataLens
Тип
Что хранит
Иконка
Пример
🔤 Строка
Текст, названия
ABC
«Поиск_Москва»
🔢 Целое число
Числа без запятой
123
14 200 (показы)
💧 Дробное число
Числа с запятой
1.23
0.042 (CTR)
📅 Дата
Только дата
DATE
2026-05-01
🕐 Дата и время
Дата + время
DATETIME
2026-05-01 14:32
Логический
Да / Нет
T/F
true / false
📍 Геоточка
Координаты точки
GEO
[55.75, 37.61]
Автоопределение типов при CSV

При загрузке CSV-файла DataLens пытается автоматически определить тип данных полей. Если определить не удалось — DataLens задаёт полю тип «Строка». Если число попало в строку, его нельзя будет суммировать — исправьте тип вручную в интерфейсе датасета.

Как изменить тип поля

В интерфейсе датасета на вкладке «Поля» нажмите на иконку типа данных слева от названия колонки — откроется выпадающий список со всеми доступными типами. Изменение применится ко всем чартам, построенным на этом датасете.

Измерения и показатели: зелёное и синее

Это ключевое разделение в DataLens — оно влияет на то, как поля ведут себя в чартах. В документации написано чётко: поля бывают двух типов.

Измерение

Качественные характеристики, по которым вы группируете данные. Агрегация не применяется. В интерфейсе — зелёного цвета.

Кампания Дата Город Канал Менеджер Категория

Правило: если вы смотрите на что — это измерение

Показатель

Количественные данные, которые вы считаете и суммируете. К ним применяется агрегация (SUM, AVG и др.). В интерфейсе — синего цвета.

Расходы Клики CTR Конверсии Выручка CPC

Правило: если вы что-то считаете — это показатель

Из официальной документации

«Измерение — содержит значения, которые определяют характеристику данных. К полю с измерением не применяется функция агрегации, в противном случае поле становится показателем. Показатель — содержит числовые значения, к которым применяются функции агрегации. Если снять с такого поля функцию агрегации, оно станет измерением.»

Тренажёр: измерение или показатель?

Нажмите на поле из рекламного отчёта — узнайте, чем оно является в DataLens и почему.

🎯 Определите тип поля
Нажмите на любое поле из отчёта по рекламным кампаниям
← Нажмите на поле выше, чтобы узнать его тип

Как DataLens отображает их в Wizard

Когда вы откроете Wizard для создания чарта, в левой панели будут все поля датасета — зелёные (измерения) и синие (показатели). Wizard сам подсказывает: зелёные поля хорошо идут на ось X или как цвет, синие — на ось Y как значения графика.

🎨 Wizard → Панель полей датасета
Измерения (зелёные)
ДатаДата
Название кампанииСтрока
РегионСтрока
ИсточникСтрока
Показатели (синие)
Расходы, ₽ДробноеSUM
КликиЦелоеSUM
ПоказыЦелоеSUM
CTRДробноеAVG
CPCДробноеAVG

Агрегации: SUM, AVG, COUNT и другие

Агрегация — это способ свернуть множество строк в одно число. Например, у вас 30 строк с расходами за каждый день мая. Агрегация SUM превратит их в одну цифру — общие расходы за май.

Именно агрегация делает поле показателем. Без неё — это просто набор строк. Вот полная таблица агрегаций из документации DataLens:

Функция Что считает Типы данных Когда применять в маркетинге
SUM Сумма всех значений Числа Расходы, клики, показы, выручка
AVG Среднее арифметическое Числа Средний CTR, средний CPC, средний чек
COUNT Количество записей Все типы Количество кампаний, количество заявок
COUNTD Количество уникальных значений Все типы Уникальные источники, уникальные регионы
MAX Максимальное значение Числа, Даты Максимальный CPC, последняя дата в данных
MIN Минимальное значение Числа, Даты Минимальный CPC, первая дата в данных
Нет Без агрегации Все типы Поле становится измерением (зелёным)
Типичная ошибка с CTR

CTR нельзя суммировать (SUM). Если у вас две кампании с CTR 4% и 6%, суммарный CTR не равен 10% — он равен среднему. Поэтому для CTR и CPC всегда выбирайте агрегацию AVG, а не SUM.

Интерактивный пример: как работает агрегация

Допустим, у нас есть такая таблица — расходы по кампаниям за три дня:

📄 Исходные данные (6 строк)
Дата
Кампания
Клики
Расходы, ₽
01.05
Поиск_МСК
312
8 450
01.05
РСЯ_общий
128
3 200
02.05
Поиск_МСК
289
7 920
02.05
РСЯ_общий
104
2 800
03.05
Поиск_МСК
341
9 100
03.05
РСЯ_общий
155
3 750

Если построить чарт «Расходы по кампаниям» (измерение: Кампания, показатель: Расходы SUM), DataLens сгруппирует строки по кампании и просуммирует расходы:

📊 После агрегации SUM по полю «Кампания»
Кампания (измерение)
Клики SUM
Расходы SUM, ₽
Поиск_МСК
942
25 470
РСЯ_общий
387
9 750

Переименование и скрытие полей

Данные из рекламных систем часто приходят с техническими названиями колонок вроде campaign_spend_rub_vat или clicks_total. В датасете их стоит переименовать в человекочитаемые — это сразу же отразится в Wizard и в подписях осей чартов.

Тренажёр: переименуйте поля

Введите понятные названия для технических колонок из выгрузки Яндекс Директа. Это именно то, что вы делаете в интерфейсе DataLens — вкладка «Поля», колонка «Название».

✏️ Вкладка «Поля» в датасете
Отредактируйте колонку «Новое название» — впишите понятные имена
Исходное название Тип Новое название
date Измерение
campaign_name Измерение
impressions Показатель
clicks Показатель
cost_rub Показатель
ctr Показатель
avg_cpc_rub Показатель
✓ Хорошо! Названия полей сразу отразятся в Wizard и подписях осей на чартах. Рекомендуем добавлять единицы измерения: «Расходы, ₽» вместо просто «Расходы».
Совет по именованию

Добавляйте единицы измерения прямо в название: «Расходы, ₽» вместо «Расходы», «CTR, %» вместо «CTR». Тогда на осях чартов сразу будет ясно, в чём измеряется показатель — без дополнительных подписей.

Скрытие технических полей

Если в источнике есть служебные колонки (ID, хэши, технические метки), которые не нужны в чартах — скройте их в датасете. Они останутся в источнике, но не будут загромождать список полей в Wizard. Скрытое поле можно по-прежнему использовать в вычисляемых полях.

Создание датасета: пошаговый порядок действий

Вот последовательность, которую вы будете повторять каждый раз при работе с новым источником данных.

1
Создайте датасет на основе подключения

В воркбуке нажмите «Создать» → «Датасет». Выберите подключение, которое создали в уроке 2. DataLens покажет список доступных таблиц из источника.

2
Выберите таблицу на вкладке «Источники»

Перетащите нужную таблицу в рабочую область или кликните на неё. Если источник — CSV или Google Sheets, таблица там обычно одна. Если база данных — выбирайте из списка.

3
Проверьте поля на вкладке «Поля»

Перейдите на вкладку «Поля». Проверьте, что типы данных определились правильно — особенно даты и числа. Если что-то не так — кликните на иконку типа и смените его вручную.

4
Переименуйте технические названия

Кликните по названию поля в колонке «Название» и введите понятное имя. Помните про единицы измерения в названии — «Расходы, ₽», «CTR, %».

5
Проверьте агрегации для числовых полей

Убедитесь, что числовые поля получили правильную агрегацию: расходы и клики — SUM, CTR и CPC — AVG. Скройте технические поля, которые не нужны в чартах.

6
Сохраните датасет

Нажмите «Сохранить». Назовите датасет понятно: «Данные по кампаниям — Директ, май 2026». Теперь на основе этого датасета можно строить сколько угодно чартов.

Один датасет — много чартов

После создания датасета вы можете строить на его основе неограниченное количество чартов: динамику расходов, сравнение кампаний, структуру трафика по источникам, карту по регионам. Всё это — из одного датасета, настроенного один раз.

Проверьте себя

Вопрос 1 из 5
Правильных ответов: 0

Что мы разобрали

  • Датасет — это не копия данных, а описание того, как с ними работать
  • Измерения (зелёные) — характеристики для группировки: дата, кампания, регион
  • Показатели (синие) — числа с агрегацией: расходы SUM, CTR AVG, клики SUM
  • Не суммируйте CTR и CPC — для них нужна агрегация AVG
  • Переименовывайте поля с единицами измерения: «Расходы, ₽», «CTR, %»
  • Один датасет = сколько угодно чартов на его основе
В следующем уроке

Урок 4: Первый чарт в Wizard без кода. Берём настроенный датасет и строим столбчатую диаграмму и линейный график. Вы увидите, как измерения и показатели, которые мы разобрали сегодня, раскладываются по осям чарта буквально перетаскиванием мышкой.