Обзор возможностей Yandex DataLens от Дмитрия Шевченко

Многие сервисы визуализации сейчас могут быть не доступны, а также возможны проблемы с оплатой из России. Наши специалисты всегда в поиске альтернативных решений, сравнивают сервисы и инструменты.

Сегодня в статье, специалист по бизнес-приложениям компании DBI, Дмитрий Шевченко расскажет про BI-инструмент от компании Яндекс. С его помощью можно не только настроить визуализацию данных, построить диаграммы и графики, но также строить пользовательские дашборды и объединять данные из других источников. Мы подготовили обзор объектов, с которыми предстоит познакомиться каждому пользователю и проанализировали плюсы и минусы инструмента.

Итак, рассмотрим:

Yandex DataLens (сокращенно YD) – бесплатный облачный инструмент для бизнес-аналитики, который можно использовать для решения задач различной сложности:

  • Построение бизнес-аналитики, особенно, если данные поступают из других яндекс-сервисов;
  • Выгрузка данных в xls-csv форматы (принимая во внимание ограничения по количеству данных);
  • Построение отчетности из нескольких источников данных, например, плоские файлы и SQL-базы, для которых не нужно применять расширенные ETL-процедуры.

Основной интерфейс приложения доступен по ссылке: https://datalens.yandex.ru/

Все скриншоты далее, сделаны на основе дашборда «Коронавирус», который можно бесплатно скачать из Яндекс Marketplace в интерфейсе YD:

В Yandex DataLens существует четыре типа объектов, с которыми нам предстоит работать:

  • Подключение — хранит данные о подключениях к источникам данных. Поддерживается довольно ограниченный набор источников данных – это наиболее распространенные РСУБД — MySQL, Postgresql, GreenPlum, Oracle, MS SQL + «фирменный» Clickhouse. Также можно создать подключение к локальному файлу либо гугл-таблице.

Так выглядит окно подключения к PostgreSQL:

Отметим внизу пункт «Уровень доступа SQL-запросов», который позволяет указать SQL-запрос для формирования данных из источника и избежать лишней работы на этапе формирования датасета.

  • Датасет – создается на основе подключения и представляет ограниченный ETL функционал: extract, transform, load. Для преобразования данных в нужный нам вид можно связать источники данных в модель, преобразовать типы данных, добавить метрики, используя специальный язык формул и настроить агрегации.

Так выглядит датасет «Маркеры»:

Основное здесь — четыре вкладки вверху слева:

  • Источники — для работы с моделью датасета. Здесь можно связать таблицы между собой на основе sql join-ов, в том числе, сразу задать для связи несколько столбцов.
  • Поля — возможность менять тип данных и агрегации, добавлять новые метрики и оставлять комментарии. Справа вверху видно кнопку «добавить поле», нажав на которую нам предложат богатый справочник функций, а также встроенная документация с примерами значительно удобнее, чем создавать необходимые конструкции в чистом SQL.
  • Параметры — созданные параметры можно использовать при работе с объектами как обычные поля.
  • Фильтрация — позволяет установить фильтр на поле, чтобы ограничить время загрузки данных в отчетах.
  • Чарт — создан на основе датасета и представляет собой один визуальный элемент для аналитики: таблица, график, карта, показатель.

 

На примере чарт: «линейная диаграмма». При нажатии на один из показателей можно оставить только его, а зажав ctrl – несколько:

На графике видно, что запросы на покупку масок более актуальны, чем на антисептики.

В настройках чарта есть несколько полей — основные это оси, цвета, сортировка и фильтры. Так выглядит меню по настройке оси Х:

Всё функционально — настройки отступов, тултипа, подписи — присутствуют.

  • Дашборд — набор элементов, собранных в один отчет — сюда входят чарты, а также элементы, существующие на уровне дашборда: селектор или фильтр, вкладки, текст и заголовок.

Помимо чартов, здесь можно добавить и фильтры:

Добавление и редактирование элементов на дашборде происходит через drag n drop функционал. Все элементы привязаны к позициям существующих. На мой взгляд — сильно не хватает кнопки «назад» — в случае неудачного нажатия приходится отменять все изменения и начинать заново. Зато можно гибко настроить фильтры, какие элементы они фильтруют, — это плюс.

Также отметим, что элемент «текст» в дашбордах поддерживает синтаксис Markdown – язык разметки, позволяющий форматировать текст, вставлять в него ссылки и изображения, например:

превращается в текст + ссылку:

Управление доступом в Yandex Datalens реализовано на уровне RLS (разграничение по видимости данных) и на уровне разрешений для объектов. Права на объект бывают четырех типов:

  • Исполнение — только для подключений и датасетов — позволяет выполнять запросы к объекту
  • Просмотр
  • Редактирование
  • Администрирование — позволяет изменять объект и права доступа к ним

Такая модель позволяет гибко настроить права, создавая необходимые комбинации «пользователь-объект». Также стоит упомянуть, что при настройке прав на верхнеуровневый объект, например дашборд, можно сразу настроить права для всех связанных с ним объектов, скажем датасетов, на основе которых в дашборде строятся графики:

Итак, подведем итоги:

Плюсы:

  • Простой и функциональный интерфейс
  • Бесплатный, хотя набор подключений и документация намекают, что использовать YD лучше вместе с другими cloud-решениями Яндекс, вроде Яндекс CLI
  • Расширенный язык формул для преобразования данных
  • Облачное решение, не нужно отдельно разворачивать приложение
  • Есть экспорт данных из чартов в xlsx
  • Полностью русскоязычный интерфейс, а также есть документация на русском языке с примерами

Минусы:

  • Ограниченный набор подключений
  • Небольшой набор чартов и их кастомизаций, например, условного форматирования
  • Быстродействие в облаке может проседать при больших объемах данных
  • Отсутствие расширяемости функционала, в отличии, например от Apache Superset – если Yandex DataLens что-то не умеет, добавить это не получится
  • Ограничения на объем данных: размер CSV-файла, количество строк для чарта типа «таблица»

Yandex DataLens – развивающийся BI-инструмент, и в условиях активного импортозамещения программного обеспечения стоит обратить на него внимание. Компания Яндекс активно занимается разработкой собственных сервисов, поэтому стоит ожидать дальнейшей поддержки и развития для DataLens, что сделает его на российском рынке перспективной альтернативой устоявшимся зарубежным аналогам, таким как: Oracle Analytics или Power BI App. Если у вас возникли вопросы по настройке Yandex DataLens, наши специалисты готовы помочь и проконсультировать. Напишите или позвоните нам!