Зачем нужен датасет и чем он отличается от таблицы
После того как в прошлом уроке мы создали подключение к источнику данных, DataLens «видит» вашу таблицу. Но видеть таблицу и уметь строить по ней чарты — разные вещи. Именно датасет становится связующим звеном.
Датасет — это не копия данных. Это описание того, как DataLens должен работать с данными из вашего источника: какие поля использовать, как их называть, что с ними считать. Сами данные по-прежнему живут у вас в Google Sheets или CSV-файле.
Представьте, что у вас есть склад с товарами (это источник данных). Подключение — это ключ от склада. А датасет — это каталог склада: какой товар как называется, в каких единицах измеряется, что нужно суммировать, а что просто перечислять. Без каталога на складе не разберёшься.
Когда вы будете строить чарт в Wizard (следующий урок), DataLens покажет вам именно поля датасета — с теми именами и типами, которые вы задали. Поэтому хорошо настроенный датасет = приятная работа с Wizard.
Максимальное количество полей в одном датасете — 1200. Для большинства задач это более чем достаточно, но знать об этом нужно. Модель данных в документации ↗
Поля и типы данных
Каждая колонка вашей таблицы становится полем датасета. У каждого поля есть тип данных — DataLens пытается определить его автоматически при создании датасета, но иногда нужна ручная правка.
По данным официальной документации DataLens, сервис работает со следующими основными типами:
При загрузке CSV-файла DataLens пытается автоматически определить тип данных полей. Если определить не удалось — DataLens задаёт полю тип «Строка». Если число попало в строку, его нельзя будет суммировать — исправьте тип вручную в интерфейсе датасета.
Как изменить тип поля
В интерфейсе датасета на вкладке «Поля» нажмите на иконку типа данных слева от названия колонки — откроется выпадающий список со всеми доступными типами. Изменение применится ко всем чартам, построенным на этом датасете.
Измерения и показатели: зелёное и синее
Это ключевое разделение в DataLens — оно влияет на то, как поля ведут себя в чартах. В документации написано чётко: поля бывают двух типов.
Качественные характеристики, по которым вы группируете данные. Агрегация не применяется. В интерфейсе — зелёного цвета.
Правило: если вы смотрите на что — это измерение
Количественные данные, которые вы считаете и суммируете. К ним применяется агрегация (SUM, AVG и др.). В интерфейсе — синего цвета.
Правило: если вы что-то считаете — это показатель
«Измерение — содержит значения, которые определяют характеристику данных. К полю с измерением не применяется функция агрегации, в противном случае поле становится показателем. Показатель — содержит числовые значения, к которым применяются функции агрегации. Если снять с такого поля функцию агрегации, оно станет измерением.»
Тренажёр: измерение или показатель?
Нажмите на поле из рекламного отчёта — узнайте, чем оно является в DataLens и почему.
Как DataLens отображает их в Wizard
Когда вы откроете Wizard для создания чарта, в левой панели будут все поля датасета — зелёные (измерения) и синие (показатели). Wizard сам подсказывает: зелёные поля хорошо идут на ось X или как цвет, синие — на ось Y как значения графика.
Агрегации: SUM, AVG, COUNT и другие
Агрегация — это способ свернуть множество строк в одно число. Например, у вас 30 строк с расходами за каждый день мая. Агрегация SUM превратит их в одну цифру — общие расходы за май.
Именно агрегация делает поле показателем. Без неё — это просто набор строк. Вот полная таблица агрегаций из документации DataLens:
| Функция | Что считает | Типы данных | Когда применять в маркетинге |
|---|---|---|---|
| SUM | Сумма всех значений | Числа | Расходы, клики, показы, выручка |
| AVG | Среднее арифметическое | Числа | Средний CTR, средний CPC, средний чек |
| COUNT | Количество записей | Все типы | Количество кампаний, количество заявок |
| COUNTD | Количество уникальных значений | Все типы | Уникальные источники, уникальные регионы |
| MAX | Максимальное значение | Числа, Даты | Максимальный CPC, последняя дата в данных |
| MIN | Минимальное значение | Числа, Даты | Минимальный CPC, первая дата в данных |
| Нет | Без агрегации | Все типы | Поле становится измерением (зелёным) |
CTR нельзя суммировать (SUM). Если у вас две кампании с CTR 4% и 6%, суммарный CTR не равен 10% — он равен среднему. Поэтому для CTR и CPC всегда выбирайте агрегацию AVG, а не SUM.
Интерактивный пример: как работает агрегация
Допустим, у нас есть такая таблица — расходы по кампаниям за три дня:
Если построить чарт «Расходы по кампаниям» (измерение: Кампания, показатель: Расходы SUM), DataLens сгруппирует строки по кампании и просуммирует расходы:
Переименование и скрытие полей
Данные из рекламных систем часто приходят с техническими названиями колонок вроде campaign_spend_rub_vat или clicks_total. В датасете их стоит переименовать в человекочитаемые — это сразу же отразится в Wizard и в подписях осей чартов.
Тренажёр: переименуйте поля
Введите понятные названия для технических колонок из выгрузки Яндекс Директа. Это именно то, что вы делаете в интерфейсе DataLens — вкладка «Поля», колонка «Название».
| Исходное название | Тип | Новое название |
|---|---|---|
| date | Измерение | |
| campaign_name | Измерение | |
| impressions | Показатель | |
| clicks | Показатель | |
| cost_rub | Показатель | |
| ctr | Показатель | |
| avg_cpc_rub | Показатель |
Добавляйте единицы измерения прямо в название: «Расходы, ₽» вместо «Расходы», «CTR, %» вместо «CTR». Тогда на осях чартов сразу будет ясно, в чём измеряется показатель — без дополнительных подписей.
Скрытие технических полей
Если в источнике есть служебные колонки (ID, хэши, технические метки), которые не нужны в чартах — скройте их в датасете. Они останутся в источнике, но не будут загромождать список полей в Wizard. Скрытое поле можно по-прежнему использовать в вычисляемых полях.
Создание датасета: пошаговый порядок действий
Вот последовательность, которую вы будете повторять каждый раз при работе с новым источником данных.
В воркбуке нажмите «Создать» → «Датасет». Выберите подключение, которое создали в уроке 2. DataLens покажет список доступных таблиц из источника.
Перетащите нужную таблицу в рабочую область или кликните на неё. Если источник — CSV или Google Sheets, таблица там обычно одна. Если база данных — выбирайте из списка.
Перейдите на вкладку «Поля». Проверьте, что типы данных определились правильно — особенно даты и числа. Если что-то не так — кликните на иконку типа и смените его вручную.
Кликните по названию поля в колонке «Название» и введите понятное имя. Помните про единицы измерения в названии — «Расходы, ₽», «CTR, %».
Убедитесь, что числовые поля получили правильную агрегацию: расходы и клики — SUM, CTR и CPC — AVG. Скройте технические поля, которые не нужны в чартах.
Нажмите «Сохранить». Назовите датасет понятно: «Данные по кампаниям — Директ, май 2026». Теперь на основе этого датасета можно строить сколько угодно чартов.
После создания датасета вы можете строить на его основе неограниченное количество чартов: динамику расходов, сравнение кампаний, структуру трафика по источникам, карту по регионам. Всё это — из одного датасета, настроенного один раз.
Проверьте себя
Что мы разобрали
- Датасет — это не копия данных, а описание того, как с ними работать
- Измерения (зелёные) — характеристики для группировки: дата, кампания, регион
- Показатели (синие) — числа с агрегацией: расходы SUM, CTR AVG, клики SUM
- Не суммируйте CTR и CPC — для них нужна агрегация AVG
- Переименовывайте поля с единицами измерения: «Расходы, ₽», «CTR, %»
- Один датасет = сколько угодно чартов на его основе
Урок 4: Первый чарт в Wizard без кода. Берём настроенный датасет и строим столбчатую диаграмму и линейный график. Вы увидите, как измерения и показатели, которые мы разобрали сегодня, раскладываются по осям чарта буквально перетаскиванием мышкой.