Почему сеансов меньше чем пользователей google analytics
Перейти к содержимому

Почему сеансов меньше чем пользователей google analytics

  • автор:

Почему клики и сеансы никогда не совпадут

Во время работы с рекламными кампаниями у наших клиентов часто возникают вопросы: почему клики и сеансы расходятся. Часто эти вопросы сопровождаются нагрузкой на отдел веб-аналитики в поиске проблем с счетчиком Goolge Analytics и Яндекс.Метрикой. В этой статье мы расскажем, почему могут возникать такие ситуации.

Сеансов больше, чем кликов

При работе в Google Analytics и анализе рекламных кампаний Google AdWords мы можем заметить, что количество сеансов не совпадает с количеством кликов. Почему же так просиходит?

k&s.png

Настройки сеанса

Клиент на пути к покупке изучает очень большое количество информации на сайте, особенно это касается ресурсов с широким ассортиментом. Таким образом он может провести на сайте довольно много времени.

Если мы зайдем в отчет «Поведение > Контент сайта > Все страницы», то мы увидим, что средняя продолжительность сеанса 1 минута 11 секунд, но применив сортировку к этой метрике, обнаружим, что присутствуют сеансы с длительностью около 30 минут. Поэтому если пользователь находится на вашем сайте более 30 минут, то его сеанс может начаться заново, а мы получим 2 сеанса на 1 клик.

k&s2.png

Подсказка: в Google Analytics длительность сеанса по стандарту указано 30 минут, но вы можете изменить время в окне «Администратор > Код отслеживания > Настройки сеанса».

k&s3.png

Недействительные клики

Другая причина, почему кликов может быть меньше, чем сеансов – недействительные клики. Google AdWords фильтрует в своих отчетах «плохие» клики, но сеанс уже никуда не денется.

k&s4.png

Кликов больше, чем сеансов

Бывает и противоположная ситуация, когда кликов больше, чем сеансов. Чаще всего это касается торговых рекламных кампаний.

k&s5.png

Сравнение при покупке

Мы можем наблюдать ситуацию —кликов больше, чем сеансов — когда пользователь изучает рынок и сравнивает цены. Здесь становится понятно, почему это актуально для торговых рекламных кампаний. Представим ситуацию, что пользователь вводит в строку поиска какой-то товар, например, диван «Амстердам». Он видит выдачу Google Shopping и начинает сравнивать цены: переходит по объявлению, потом возвращается через нажатие кнопки «Назад» в браузере, а потом снова кликает по объявлению. В данном случае AdWords засчитает 2 клика, а Google Analytics объединит эти клики в один сеанс.

k&s6.png

Отмена загрузки страницы

Еще одной причиной может служить отмены загрузки страницы в браузере. В таком случае Google AdWords засчитает клик, но счетчик Google Analytics не успеет загрузиться и не посчитает сеанс.

Заключение

К сожалению, эти метрики никогда не будут совпадать, но понимание этих процессов поможет вам избежать лишних вопросов и задач по поиску ошибок в настройках счетчиков.

Как отличить клики, сеансы и пользователей в GA4

Новые пользователи, Вернувшиеся пользователи, Пользователи, Клики, Сеансы в Google Analytics. А есть ли разница? Есть! И существенная. Попробуем разобраться в этом материале.

Если вашего бизнеса нет в интернете, значит, вас нет в бизнесе (с).

Трафик — нефть 21 века. Причем этот трафик можно добывать по-разному.

Например, пользователи могут переходить к вам на сайт через прямые заходы, платную рекламу, органический поиск, посты в социальных сетях, по e-mail рассылкам и др. И чтобы иметь возможность отслеживать ключевые показатели эффективности проекта необходимо, как минимум, установить счетчики веб-аналитики на все отслеживаемые страницы сайта. Стандартный отчет Google Analytics по источникам трафикаСтандартный отчет Google Analytics по источникам трафика Благодаря информации, которую они собирают, вы будете иметь представление о том, откуда пришел пользователь, из какого города, источника, сколько времени человек провел на сайте, какие страницы он просмотрел, с какими формами на сайте взаимодействовал, какие товары купил и по какой цене.

Вся эта статистика будет доступна в большом количестве отчетов Яндекс.Метрики и Google Analytics и может использоваться для выявления возможности роста, улучшения сайта, оптимизации рекламных кампаний, перераспределения бюджетов на различные каналы трафика, увеличения прибыли кампании и снижения стоимости привлечения одного клиента.

Но все это полезно только в том случае, если вы понимаете природу тех метрик, которые заложены в счетчики веб-аналитики. На текущий момент только в Google Analytics содержится более 500 параметров и показателей. Поскольку интернет-маркетологи и веб-аналитики работают с трафиком (одни приводят на сайт новых посетителей, другие анализируют статистику по переходам), то наиболее верным решением будет начать с разбора ключевых и связанных между собой показателей в Google Analytics, коими являются пользователи, клики и сеансы.

Итак, давайте разберем каждый показатель максимально подробно.

Сеансы (Sessions)

  • Тип данных: string (строка)
  • API Google Analtics: ga:sessions
  • Группа в Dimensions & Metrics Explorer: Session
  • Область действия: Сеанс

Сеанс (сессия, session, визит) — последовательность действий (хитов, обращений), которые выполнил пользователь на вашем сайте за определенный промежуток времени. Примеры трех сеансов, в которых были совершены разные хиты (действия пользователей)Примеры трех сеансов, в которых были совершены разные хиты (действия пользователей) К сеансу привязываются все данные об использовании: просмотры экрана, события, транзакции электронной торговли и т. д. Присутствует практически во всех отчетах, поскольку является фундаментальной метрикой, на основе которой строятся все дальнейшие вычисления и отслеживания в Google Analytics. Показатель Сеансы в отчетеПоказатель «Сеансы» в отчете Для наглядности разберем конкретную последовательность действий:

  1. Просмотр каталога сайта
  2. Переход в корзину для оформления заказа
  3. Переход на форму заполнения контактных данных
  4. Покупка, совершение транзакции

ПримерПример 1. Все действия пользователя совершены в рамках одной сессии ПримерПример 2. Действия пользователя записались как два сеанса В примере 1 пользователь просматривал каталог сайта 10 минут, потом перешел в корзину товаров. Через 29 минут он переходит на страницу для оформления заказа, а через 5 минут на последний этап завершения заказа. Оформление заказа происходит в рамках одной сессии, поскольку еще не прошло 30 минут. Все время не суммируется (10 + 29 + 5 = 44 минуты), а при каждом взаимодействии оно сдвигается. То есть теперь 30 минут фиксируются не с момента, как он оказался в каталоге, а с момента, как он перешел в корзину товаров.

В примере 2 пользователь все сделал так же, за исключением шага 2–3. В этот раз ему потребовалась 31 минута на переход с корзины товаров на страницу оформления заказа. Это действие будет зафиксировано уже в рамках нового сеанса, потому что через 30 минут после просмотра корзины товаров сеанс закроется, а переход на следующую страницу приведет к новому сеансу.

При создании нового счетчика для сайта по умолчанию время ожидания сеанса составляет 30 минут. При желании его можно изменить. Настройки сеанса - Время ожидания сеансаНастройки сеанса — Время ожидания сеанса Например, когда вы смотрите фильм на сайте или обучающий онлайн-семинар длиной 3 часа, при такой настройке сеанса он закрывался бы каждые 30 минут и в Google Analytics мы увидели бы 6 сеансов (180 минут / 30 минут = 6). Хотя уникальный пользователь всего 1. В данном случае время ожидания сеанса можно увеличить. Диапазон изменений времени — от 1 минуты до 4 часов 59 минут. Но ситуаций, при которых пользователи проводят довольно длительное время на сайте, — немного. В большинстве своем 30 минут достаточно для корректного сбора информации о посетителях сайта, поэтому стандартную настройку в GA нет необходимости менять.

Однако существует еще несколько случаев окончания сеанса без учета 30 минут.

  • Сеанс закрывается в полночь. Если вы загрузили страницу в 23:50, а на следующую перешли в 00:02, то будет создано два сеанса. Один зафиксируется с 23:50 до 23:59, а второй с 00:00 следующего дня).
  • Автоматическая пометка тегами glid. При использовании этой настройки в Google Рекламе при каждом переходе по рекламному объявлению создается новое значение glid, каждый клик рассматривается в отдельности и всегда создается новый сеанс.
  • Рефералы. Новый сеанс создается всегда, когда пользователь переходит по ссылке на ваш сайт с другого сайта (так называемый «реферальный трафик»).

Google Аналитика сохраняет информацию об источнике кампании. При каждом обновлении значения кампании регистрируется новый сеанс. Например, пользователь сначала перешел на сайт по органическому поиск (organic) по ключевому слову «настройка веб-аналитики», а позже вернулся по платному трафику (cpc) и ключевому слову «настройка google analytics». В результате будет зафиксировано 2 сеанса, поскольку каждый поисковый запрос обновляет кампанию и каждому ключевому слову соответствует свой сеанс.

Кампания обновляется каждый раз, когда пользователь переходит на ваш сайт из поиска по ссылке с другого ресурса (реферальный трафик) или по ссылкам с utm_метками. Прямой трафик никогда не заменяет существующие сведения об источнике и не разрывает сеанс. Если вы переходите на сайт через поисковую выдачу, а потом в течение 30 минут возвращаетесь по прямому заходу, набрав url сайта в адресной строке браузера, то такие действия будут отмечены как один активный сеанс.

Пользователи (Users)

  • Тип данных: string (строка)
  • API Google Analytics: ga:users
  • Группа в Dimensions & Metrics Explorer: User
  • Область действия: Пользователь

Чтобы определить, с каким пользователем связана та или иная статистика (доля трафика, события, конверсии и др.), в Google Analytics для каждого посетителя создается уникальный идентификатор. Им может быть:

  • функция User ID, которая позволяет отслеживать действия пользователей на различных устройствах.
  • собственный файл cookie с названием _ga

Файл cookie с названием _gaФайл cookie с названием _ga Пользователь (посетитель, user) — совокупность сеансов, которые совершаются с одного и того же браузера и имеют один файл cookie. Пользователь — это уникальный куки файл и уникальный идентификатор отслеживания (он же Client ID) за определенный период времени. Пользователь, который совершил три сеанса, в которых он совершил различные хиты (действия)Пользователь, который совершил три сеанса, в которых он совершил различные хиты (действия)

Статистика по пользователямСтатистика по пользователям Количество пользователей за каждый отдельно взятый период суммарно не равно количеству пользователей за весь период в целом. Подсчет количества пользователейПодсчет количества пользователей Например. 14 июля на сайт по поисковой системе Google зашло 204 пользователя, и они совершили 248 сеансов. 15 июля – 132 пользователя и 152 сеанса. 16 июля – 107 и 119. Google Analytics фиксирует активность по файлам cookie в конкретный промежуток времени.

Во все эти три дня на сайт мог заходить один пользователь с уникальным cookie. И система 14, 15, 16 июля запишет нам его по одному разу. Но этого не произойдет, если мы построим сводный отчет сразу же по всем трем дням. Количество сеансов останется неизменным, тогда как показатель Пользователи не будет равен сумме трех дней, построенных в отдельности (204+132+107 = 443).

Чтобы Google Analytics быстро загружался при изменении дат таблицы и стандартные отчеты сразу перестраивались, Google Analytics использует так называемую выборку данных (data smapling).

Другими словами, Google из общего количества данных, которые есть у него по вашему проекту, берет некоторую выборку, например, 10%, умножает ее на 10 и говорит нам, что так вели бы себя все 100% пользователей. При построении отчета Google Analytics находит в этих таблицах все данные по каждому показателю и включает их в ваши отчеты. Например, если вы вместо периода 1 октября — 31 октября выберете период 1 октября — 1 ноября, то система найдет в таблице данные по каждому показателю за 1 ноября и добавит их к имеющимся результатам предыдущего месяца. Такой подход работает хорошо, когда просто нужно просуммировать данные за различные диапазоны дат.

Данные показателей: просмотры страниц, просмотры экрана, обращения и т.д. просто складываются. Однако показатель Пользователи, как вы уже знаете, определяется сложнее — он пересчитывается всякий раз, когда запрашивается в отчетах, а не просто складывается (или вычитается) из данных таблиц (см. скриншот и пример выше). В связи с этим скорость загрузки и построения отчетов существенно увеличивается.

Для решения этой проблемы в Google Analytics предусмотрено два метода расчета показателя Пользователи:

  1. Предварительный расчет данных
  2. Оперативный расчет данных

Оптимальный метод автоматически определяется в зависимости от просматриваемого отчета. Оба они описаны в официальной справке Google. Однако для начинающего интернет-маркетолога методы могут показаться сложными для понимания. Давайте разберем принцип их работы.

Метод расчета №1. Предварительный расчет данных (Pre-calculated data)

Данный метод учитывает только количество сеансов за указанный диапазон дат и время каждого сеанса. Поскольку результаты этого расчета добавляются в таблицы данных, Google Analytics может обратиться к таблицам, быстро получить эти данные и включить их в отчет, в том числе после изменения диапазона дат. Предварительный расчет данных используется только в том случае, если единственным параметром в отчете является период времени (день, неделя или месяц), и применяется в отчетах:

  • Аудитория — обзор (без сегментов)
  • Специальные отчеты

У такого метода есть недостаток, поскольку расчет статистики основан на количестве сеансов и времени на стороне клиента. Чтобы избежать различия в данных вы можете создать специальный отчет с любым параметром, кроме времени. Например, Браузер, Страна, Операционная система и т.д., который будет неизменным для всех сеансов пользователя. Это обеспечит применение второго метода расчета.

Метод расчета 2. Оперативный расчет данных (Data calculated on the fly)

Data calculated on the fly можно перевести как «Данные, расcчитываемые на лету». Однако «на лету» в данном контексте не означает быстро, а предполагает, что вычисления осуществляются всякий раз, когда вы делаете запрос к данным Google. Данный метод расчета зависит от способа назначения, сбора и хранения постоянных данных о трафике с использованием файлов cookie.

Расчет всегда выполняется по таблицам с необработанными (неагрегированными) данными, так как использование этого метода предполагает очень большой объем вычислений. В связи с этим время обработки данных и их включение в отчеты увеличивается. Метод применяется в специальных отчетах и позволяет рассчитывать показатель Пользователи по любому параметру, например, браузеру, городу или источнику трафика.

Переключение между двумя методами подсчета

Новый метод расчета (№2) активен по умолчанию. Для его изменения перейдите в Администратор — Ресурс — Настройки ресурса. В разделе Анализ данных о пользователях измените ползунок на нужный в Добавление показателя «Пользователи» в отчеты: Анализ данных о пользователяхАнализ данных о пользователях Когда функция включена, используется новый метод подсчета, когда выключена — старый. При переключении между разными методами вычисления изменяется лишь способ создания отчетов на основе первичных данных. Сами данные остаются неизменны.

Чтобы проверить данную настройку, проведем простой эксперимент. Создадим несколько специальных отчетов со следующими конфигурациями:

Метод расчета №1 (функция выключена):

  • Параметр — Дата; Показатель: Пользователи
  • Параметр — Дата; Показатель: Пользователи, Сеансы
  • Параметр — Страна; Показатель: Пользователи, Сеансы

Метод расчета №2 (функция включена):

  • Параметр — Дата; Показатель: Пользователи
  • Параметр — Дата; Показатель: Пользователи, Сеансы
  • Параметр — Страна; Показатель: Пользователи, Сеансы

В результате получим такое сравнение (диапазон дат везде одинаковый): Сравнение методов расчета (Сверху - выкл/№1, Снизу - вкл./№2)Сравнение методов расчета (Сверху — выкл/№1, Снизу — вкл./№2) Из скриншота видно, что при методе расчета №1 значение пользователей 4962 только в том случае, если в качестве основного параметра используется Дата. Когда мы изменяем на другой (например, Страна), то количество пользователей изменяется на 4620 (применяется оперативный расчет данных).

При методе №2 количество пользователей одинаково вне зависимости от использования основного параметра (и Дата, и Страна), и равно 4638. Сам отчет формировался дольше, поскольку статистика рассчитывалась в момент запроса к данным.

Новый метод подсчета применяется для пользовательских данных с сентября 2016 г. Если на диапазон дат отчета приходятся данные, собранные до сентября 2016 г., будет применена выборка. А с августа 2017 г. новый метод подсчета применяется для данных в специальных таблицах (доступна только в Аналитике 360).

Вернувшиеся пользователи (Returning Visitor)

В Google Analytics нет отдельной метрики, которая показывала бы количество вернувшихся пользователей. Такое понятие встречается только в отчете Аудитория — Поведение — Новые и вернувшиеся и относится к параметру Тип пользователя (User Type):

Новые и вернувшиеся пользователиНовые и вернувшиеся пользователи И вот здесь возникает путаница: если вы посмотрите на цифры в отчете, то заметите, что количество новых и вернувшихся пользователей суммарно не дает итоговое значение 222 663, которое написано сверху (221 326 + 59 548 ≠ 222 663).

Это происходит потому, что один пользователь может посетить ваш сайт несколько раз в течение отчетного периода, что делает его одновременно и новым (при первом посещении, когда Client ID только создался), и вернувшимся (при любом следующем посещении).

Такое может произойти, например, если между двумя сеансами пользователя прошло более 30 минут, и он в течение одного дня заходил на ваш сайт несколько раз, посетив первый раз и повторно. В этом случае он будет записан и в новых, и в вернувшихся (пример запроса в Query Explorer): Пользователь с Client ID 1967819514.1572117974 как новый пользователь и как вернувшийсяПользователь с Client ID 1967819514.1572117974 как новый пользователь и как вернувшийся

Новые пользователи (New Users)

  • Тип данных: string (строка)
  • API Google Analytics: ga:newUsers
  • Группа в Dimensions & Metrics Explorer: User

Пользователи и Новые пользователиПользователи и Новые пользователи Пользователь является новым для Google Analytics, пока он не совершил повторного сеанса. Добавив параметры и показатели в Query Explorer, связанные с пользователями, сеансами и номером сеанса, получим такой запрос: Показатель Новые пользователиПоказатель Новые пользователи Показатель Новые пользователи (New Users) со значением 1 добавлен только в первый сеанс, который имеет тип New Visitor. Все последующие сеансы (Count of Sessions — 2 и 3) имеют значение 0, поскольку данный пользователь для Google Analytics уже является вернувшимся.

Есть одна маленькая деталь, которая способна смутить начинающего маркетолога:

Это происходит потому, что показатель Сеансы не увеличивается если сеанс состоит только из событий без взаимодействия (последний необязательный компонент события — nonInteraction). А показатель Новые пользователи, наоборот, увеличивается с каждым сеансом, который инициирует новый пользователь, даже если сеанс состоит только из событий без взаимодействия. Другими словами, показатель Новые пользователи увеличивается, а показатель Сеансы нет. Новых пользователей больше, чем пользователейНовых пользователей больше, чем пользователей Например, пользователь с мобильного телефона быстро зашел и вышел с сайта, оставив вкладку в фоновом режиме браузера. По этому пользователю отправилось событие без взаимодействия. Согласно принципам работы Google Analytics, сеанс в этом случае не начинается, но показатель Новые пользователи зачтется, а Пользователи не изменится, поскольку не было сеанса, в котором были бы зафиксированы события с взаимодействиями.

Клики (Clicks)

  • Тип данных: string (строка)
  • API Google Analytics: ga:adClicks
  • Группа в Dimensions & Metrics Explorer: Adwords
  • Область действия: Hit

Каждый клик по рекламному объявлению засчитывается как отдельный сеанс независимо от времени. В этом очень легко убедиться, открыв отчет Статистика по пользователям конкретного пользователя. Каждый клик по рекламному объявлению засчитывается как отдельный сеансКаждый клик по рекламному объявлению засчитывается как отдельный сеанс На скриншоте выше видно, как один пользователь совершил 3 сеанса 24 октября 2020 г. в течение 20 минут по источнику yandex / cpc. Причем первый клик по рекламному объявлению был в 11:28, а два других в одно и то же время — 11:48 (с разницей в несколько секунд). И тем не менее, Google Analytics зафиксировал их как 3 разных сеанса.

Клики — это показатель области действия Hit (Обращение). Применяется в связке с другими показателями для отчетов категории Google Реклама (Показы, Стоимость, CTR, CPC и т.д.). Если у вас связаны аккаунты Google Analytics и Google Ads, то данные отчетов по Google Рекламе вы будете видеть в Аналитике. Статистика в двух системах одинакова, но иногда может различаться:

  • если вы выбираете в Google Analytics диапазон дат, когда аккаунты не были связаны между собой
  • если вы используете фильтры в представлении, которые могут влиять на статистику рекламных кампаний
  • данные Google Рекламы импортируются в Аналитику непосредственно во время просмотра отчета, поэтому содержат информацию за период вплоть до текущего часа

А теперь пришло время поговорить о разнице между пользователями, кликами и сеансами в Google Analytics.

Разница между кликами и сеансами

Клики и сеансы — это два разных показателя в Google Analytics. По этой причине расхождения в статистике совершенно нормальная вещь. Исходя из вышеописанного, можно выделить следующие причины: Кликов больше, чем сеансов, и наоборотКликов больше, чем сеансов, и наоборот

    Google Реклама = Клики, а Google Analytics = Сеансы
    В Google Analytics отчеты строятся на основе сеансов и тому, что в них происходило. Расчет коэффициента конверсии/транзакции также происходит на основе сеансов. Сеансы — ключевой показатель в Google Analytics (как Визит в Яндекс.Метрике). Однако это и создает большое количество проблем, с которыми сложно бороться по причине ограничений системы, и забывчивости принципов работы интернет-маркетологов.

Google Реклама работает с кликами.
Например, если пользователь нажмет на рекламное объявление, затем нажмет кнопку Назад, а потом снова нажмет на объявление, в Google Ads будет зарегистрировано два клика, а в Аналитике — один сеанс. Повторные клики возникают и тогда, когда пользователь сравнивает несколько товаров в поисковой выдаче, последовательно переходя по разным рекламным объявлениям торговых кампаний (Google Shopping).

Разница между кликами и пользователями

Клики и пользователи — это два разных показателя в Google Analytics. Один фиксирует число переходов по рекламным объявлениям, а другой — количество уникальных пользователей, нажавших на объявление. В связи с этим число кликов и пользователей может не совпадать. Причины те же самые, что и в кликах/сеансах:

  • Google Реклама отфильтровывает недействительные клики из отчетов, а Google Аналитика отображает все данные.
  • Долгая загрузка кода Google Analytics (прерывание) или счетчик установлен не на всех страницах.
  • Несколько кликов по рекламе, но один зафиксированный пользователь в Google Analytics.

Разница между сеансами и пользователями

Сеансы и пользователи — также разных метрики в Google Analytics. Самое важное, что необходимо запомнить о сеансах и пользователях: если период бездействия пользователя на сайте продолжается более 30 минут, будет создан новый сеанс. Если прошло менее 30 минут, сеанс не прерывается.

Первый заход пользователя на сайт создает уникальный идентификатор пользователя (файл cookie, cid, Client ID), а показатели Пользователи и Новые пользователи принимает значение 1. Также создается сеанс, и он учитывается как новый. Новые сеансы, %Новые сеансы, % Затем система запоминает пользователя и регистрирует для него только сеансы.

Таким образом, метрики Новые пользователи, Вернувшиеся пользователи, Пользователи, Клики, Сеансы в Google Analytics имеют существенные различия в работе и свои подводные камни. Это порождает неточность данных и ошибки в последующих выводах.

С появлением нового типа ресурса Google Analytics 4 (GA4) в 2020 году (в 2019 он назывался Web + App) произошел переход от традиционной модели Сеансы/Просмотры страниц, которую я описал в этой статье и которую использовали интернет-маркетологи и веб-аналитики более 10 лет, к модели Событие/Параметр, где концепция просмотров страниц и сеансов перестала иметь фундаментальное значение.

Сеансов меньше, чем пользователей. Кейс по устранению

Кейс по устранению проблемы, приводившей к серьезному искажению данных в отчетах Universal Analytics. Подробное описание диагностики и устранения неполадок.

В моем блоге большинство статей посвящено разбору технических настроек аналитических инструментов, среди которых — Google Analytics, Google Tag Manager и Яндекс.Метрика. Про практические примеры анализа данных с помощью отчетов, из которых делались невероятные выводы, кардинально влияющие на показатели бизнеса, написано не так много. С одной стороны, это связано с тем, что интересные задачи встречаются крайне редко (если делать по инструкции и чек-листам, то количество ошибок и вариаций сводится к минимуму), с другой — работа со статистикой подразумевает нахождение трендов/аномалий, определение причинно-следственных связей, построение логических цепочек, предположений и выводов. А это достаточно сложно и всегда индивидуально, поскольку процессы человеческого мышления (то, как ты думал во время решения задачи) содержат в себе элементы творчества и креатива, тяжело поддающиеся систематизации и формализации на бумаге. Еще встречается и NDA (соглашение о неразглашении).

Но этот материал не из таких. Уверен, он будет интересен многим пользователям, кто работает с счетчиком Google Analytics (GA3) и настраивает его, потому что описанное ниже в какой-то момент может коснуться и вас. Кому-то нравится читать про положительный опыт, но куда интереснее изучать чужие ошибки, чтобы в будущем стараться не совершать их самому. А если этого не избежать, то быть максимально готовым к любому развитию событий. Одна из таких нетривиальных задач попалась у одного из слушателей на моем онлайн-курсе по веб-аналитике.

Проблема сеансов меньше, чем пользователей в Google Analytics не такое уж редкое явление. Количество пользователей часто отличается от количества сеансов. И в этом нет ничего необычного, поскольку пользователь может посещать ваш сайт более одного раза, что приводит к большему количеству сеансов на пользователя.

Отчет по источникам трафика — Сеансов больше, чем пользователей

Но когда мне написал слушатель, в его основном счетчике Universal Analytics картина была другой:

Отчет по источникам трафика — Сеансов меньше, чем пользователей

Диапазон дат выставлен одинаковый (январь 2022), никаких фильтров и других ограничений в представлении Universal Analytics нет. Оба счетчика установлены через Google Tag Manager. Почему же в одном случае он показывает общее количество пользователей 12 299, а сеансов 20 061, а в другом — 26 700 пользователей и только 20 417 сеансов? Проблема с пользователями, сеансами? Что на них так влияет? К сожалению, техническая поддержка Google дала поверхностный комментарий, сославшись на то, что разница в отчетах заключается в том, что у нас на одном сайте было установлено сразу несколько счетчиков Google Analytics, что крайне не рекомендуется.

Я согласен с тем, что одинаковых цифр в отчетах двух разных счетчиков Google Analytics мы никогда не получим, даже если они стоят на одном сайте. Банально и потому, что код — это скрипт, который в одном случае может быть загружен, а в другом нет. В один счетчик информация передастся, а в другой нет. Речь идет не об абсолютных значениях, а об аномалии, которая видна невооруженным взглядом даже из одного стандартного отчета по источникам трафика. Пришлось копать самостоятельно.

Вместе со слушателем было принято решение поставить второй счетчик Google Analytics, параллельно «проблемному», без каких-либо настроенных целей, событий, электронной торговли, наложенных фильтров, дополнительных представлений и т.д. Чтобы в процессе накопления статистики в обоих счетчиках можно было бы сравнить итоговые значения и увидеть расхождения в данных. Собственно, на двух скриншотах выше — это результат данного действия. Новый «чистый» Google Analytics собирает данные так, как обычно — сеансов больше, чем пользователей, а второй наоборот. Значит проблема в старом счетчике слушателя. Начинаем расследование!

Первое, что бросается в глаза в том же отчете по источникам трафика — статистика по прямым заходам:

Сравнение данных по источникам

В обоих случаях количество сеансов для (direct) / (none) схоже, по крайне мере порядок (1 202 и 1 220). А вот количество пользователей отличается очень сильно — 11 861 vs 844. Есть еще определенные отличия в данных по платному трафику google / cpc и yandex / cpc, но об этом чуть позже.

Следующий шаг, который логичен — это проверить страницы, на которые попадали пользователи из данного источника трафика сразу же после перехода на сайт. Создав сегмент на прямые заходы, перейдем в отчет по страницам входа в разделе Поведение — Контент сайта. Просмотрев весь список страниц входа, мы находим целевую страницу (Landing Page) с именем (not set), которая имеет такие показатели:

  • Сеансы — 3
  • Новые сеансы — 366 500%
  • Новые пользователи — 10 995
  • Показатель отказов — 0%
  • Страниц/сеанс — 0%

Целевая страница (not set)

В новом «здоровом» счетчике Google Analytics страницы с названием (not set) нет. Явно что-то не то! Откуда взялся (not set)? В официальной документации Google разобрано несколько примеров появления такого значения в отчетах Google Analytics, а также дается следующее определение:

(not set) — значение, которое Google Analytics подставляет, если для выбранного параметра отсутствуют данные. Оно может появляться по разным причинам. Для целевой страницы значение (not set) используется в том случае, когда в рамках сеанса не зарегистрировано ни одного просмотра страниц или экранов.

Что это значит? Как вы уже знаете из моих других публикаций в блоге, в основе принципа работы счетчика Universal Analytics лежат области действия (Scope). Они разделены на 4 типа:

  1. пользователь (user);
  2. сеанс (session);
  3. хит (hit);
  4. товар (product) — для электронной торговли.

Хит (обращение, hit) – любое отдельное взаимодействие пользователя с сайтом, в результате которого данные отправляются в Google Analytics. Хитами могут быть: просмотр страницы/экрана, транзакция, просмотр видео, скачивание файла, скроллинг или любое другое событие. При заходе посетителя на сайт сразу отправляется первый хит – просмотр страницы (pageview).

Сеанс (сессия, session, визит) – последовательность хитов, которую выполнил пользователь на вашем сайте за определенный промежуток времени. По умолчанию длительность сеанса (время ожидания сеанса) составляет 30 минут.

Примеры трех сеансов, в которых были совершены разные хиты

Пользователь (посетитель, user) – совокупность сеансов, которые совершаются с одного и того же браузера и имеют один файл cookie. Пользователь – это уникальный куки файл и уникальный идентификатор отслеживания (он же Client ID) за определенный период времени.

Пользователь, который совершил три сеанса, в которых он совершил различные хиты

Таким образом, хиты происходят в сеансах, которые привязываются к определенному пользователю, который имеет свою куку и Client ID. 1 пользователь может совершить 5 сеансов и в них 25 обращений. Именно так данные в Google Analytics объединяются и привязываются к конкретному пользователю. Поэтому в отчетах Google Analytics мы видим, что сеансов больше, чем пользователей. Но у нас наоборот.

Если в рамках сеанса не зарегистрировано ни одного просмотра страниц или экранов, то в отчете по целевым страницам будет (not set). Но просмотр страницы (pageview) или экрана (screenview) — это лишь один из типов обращения Google Analytics. Есть еще событие (event), транзакция (transaction), социальное взаимодействие (social), пользовательское время (timing), исключение (exception).

Значит может быть зарегистрировано какое-то другое взаимодействие в рамках сеанса пользователя, которое попадет в Google Analytics, и искажает статистику, но не просмотр страницы (pageview)? Проще всего это проверить через специальный отчет, построив его с использованием только нужных метрик. Добавим:

Параметры

  • Целевая страница
  • Категория событий

Показатели

  • Пользователи
  • Сеансы
  • Всего событий

Находим новую улику — событие расширенной электронной торговли Enhanced Ecommerce имеет целевую страницу (not set) и генерирует большое количество пользователей (14 851!):

События расширенной электронной торговли влияют на (not set)

В остальных случаях целевая страница ведет на реальный URL-адрес, а соотношение пользователей и сеансов сохранено (сеансов больше, чем пользователей). Сделав простой фильтр над таблицей по целевой страницей (not set), а также добавив еще один параметр Действие по событию, получим таблицу с такими данными:

События расширенной электронной торговли с (not set) и аномальными данными по пользователям

Получается, что события Enhanced Ecommerce как-то влияют на показатель Пользователи в отчетах Google Analytics.

Кстати, если в специальный отчет добавить еще параметр Источник или канал, то увидим, что помимо прямых заходов аномальные значения представлены в платном трафике google / cpc и yandex / cpc, о которых я упомянул чуть ранее, а также в ряде других источников.

Высокие значения пользователей и у других источников трафика

На данном этапе диагностики это не имеет особого значения, поскольку проблема обнаружена на более высоком уровне. Устранив ее, она должна повлиять на все источники, включая прямые заходы и платный трафик. Если нет, то с ними необходимо будет разбираться отдельно.

Создав еще один сегмент по прямым заходам и с условием целевой страницы, равной (not set), вернемся в отчет по источникам трафика. Поскольку в «больном» счетчике настроены события расширенной электронной торговли, мы можем посмотреть, были ли какие-нибудь транзакции по данному срезу. И если да, то какие у них идентификаторы транзакций и суммы покупок. Это даст нам возможность проанализировать данные по заказам в администраторской панели сайта OpenCart (реальные ли они?), а также посмотреть историю всех посещений, сеансов и обращений (хитов) по уникальному идентификатору пользователя в Google Analytics, которые совершали покупатели на сайте, через отчет Статистика пользователей в разделе Аудитория.

Отчет по источникам трафика с примененным сегментов отобразил следующую статистику:

Данные по транзакциям и доходу (сегмент)

За весь январь 2022 года было совершено 8 транзакций на сумму 573,29$ по прямым заходам (direct / none) со значением целевой страницы входа (not set). Добавив дополнительный параметр Идентификатор транзакции к отчету, можно сопоставить эти заказы с реальными данными.

Например, возьмем транзакцию 4603 на сумму 71,85$ и в отчете Конверсии — Электронная торговля — Эффективность продаж посмотрим, какие продукты были куплены и на какую сумму:

Товары в транзакции (данные в Universal Analytics)

Тоже самое сделаем, перейдя в админку сайта:

Товары в транзакции (данные интернет-магазина)

Товары в заказе сходятся, а вот их сумма нет. Сайт слушателя имеет валюту рубли (белорусские), а представление в Universal Analytics — доллары. По какому принципу данные с сайта конвертируются в статистику Google Analytics я так и не понял. Это еще одно подтверждение того, что вероятная причина расхождения данных и увеличение счетчика пользователей лежит в плоскости отслеживания событий расширенной электронной торговли.

Теперь имеет смысл перейти в отчет Статистика пользователей, чтобы проанализировать действия каждого конкретного пользователя и постараться между ними найти закономерности. Оставив тот же самый сегмент и диапазон дат, увидим следующую картину:

Отчет «Статистика пользователей»

Смущает две вещи:

  1. измененные идентификаторы клиентов;
  2. меньшее количество транзакций, чем в отчете по источникам;

Идентификатор клиента (Client ID, уникальные идентификатор пользователя) — это метка, состояющая из случайного числа и даты первого посещения пользователем сайта в Unix формате, которая сохраняется в основном файле cookie (_ga) в течение 2 лет. Она создается сразу же после того, как посетитель впервые зайдет к вам на сайт.

Пример основного файла cookie (_ga) для моего сайта

Поэтому когда вы заходите в этот отчет Статистика пользователей, вы должны увидеть такие же значения, если конечно они как-то не переопределяются. Вот пример идентификаторов клиентов в этом же счетчике, но для других пользователей (без применения сегментации):

Классические идентифкаторы клиентов (Client ID)

Судя по всему, это так и есть. Еще один звоночек в пользу стороннего вмешательства и некорректной настройки электронной торговли. Сопоставление количества транзакций не дало должного результата — все они являются реальными заказами, которые есть в администраторской панели сайта. Однако если убрать сегментацию и добавить в отчет всех пользователей, эти транзакции будут отображены. Правда, у кого-то идентификаторы клиента будут иметь «классический вид», а у кого-то модифицированный:

Классические и модифицированные идентификаторы клиентов

Ответ от разработчика плагина: модифицированный идентификатор клиента в отчетах появляется тогда, когда у пользователя стоит ограничение (например, AdBlock) на запись файлов cookie и нет возможности извлечь это значение.

Сегмент с «нулевыми сеансами» выдал следующие результаты:

Сегмент с «нулевыми сеансами»

46,9% от всех пользователей за отчетный период составляют «нулевые сеансы». Причем все идентификаторы клиентов изменены, а 12 099 пользователей сгенерированы этими четырьмя Client ID. Кликнув на модицифированный идентификатор клиента, попадаем в карточку данного пользователя. И там нас ждет очередное удивление:

Карточка пользователя с модифицированным Client ID

Первое и единственное для данного пользователя событие было Покупка — Purchase (Enhanced Ecommerce). Вы когда-нибудь видели, чтобы пользователь, перейдя на сайт, сразу же совершал покупку, без просмотра карточек товара, без добавления товаров в корзину, без ввода контактной информации, без перехода со страницы на страницу и т.д.? Да еще и с нулевым сеансом? Я нет. Но именно такое поведение может происходить в том случае, если данные события отправляются извне с помощью Measurement Protocol, без фактического перехода пользователя на сайт.

Анализ отчетов оставшихся пользователей показал то же самое — первым и единственным событием была Покупка — Purchase. Значит помимо того, что у слушателя некорректно настроена электронная торговля, так еще и активирована опция отправки офлайн-событий в Universal Analytics. Этот вопрос я задал человеку напрямую, на что получил положительный ответ. На сайте на OpenCart был установлен модуль SP SEO Remarketing All In One Pro и включена функция Ecommerce — Measurement Protocol:

Ecommerce — Measurement Protocol

Хорошо, что у данного плагина есть логирование (запись) отправленных событий Measurement Protocol. Включив ее, можно узнать о том, какие события передаются в счетчик Google Analytics, когда и с какими параметрами запроса:

Лог показал, что в одно и то же время для одного и того же пользователя с модифицированным Client ID отправляется несколько одинаковых событий. На примере ниже, таким событием является Product Clicks:

Дубли событий, которые передаются через Measurement Protocol в течение нескольких секунд

Подтверждение того, что какие-то дополнительное события Enhanced Ecommerce отправляются извне без переходов пользователей на сайт, было обнаружено и в отчетах В режиме реального времени. Если посмотреть вкладку событий, которые произошли за последние 30 минут и сравнить со вкладкой активных пользователей, то можно увидеть существенные отличия:

События активных пользователей и всего зафиксированных событий за последние 30 минут

Количество пользователей, которые заходили на сайт в течение последних 30 минут, несопоставимо с количество хитов (событий), которые они совершали. Еще одно подтверждение, что дело в настройке модуля.

Настроив специальный параметр Client ID, можно посмотреть какое кол-во событий передается для конкретного пользователя.

События Enhanced Ecommerce отдельно взятого пользователя

Как видно из скриншота выше, один конкретно взятый пользователь за один день совершил 470 событий Product Clicks. Все те же клики по товарам, что были отправлены через MP и записаны в логе. Странно ли это? Да, потому что в отчете Статистика пользователей по данному пользователю эти события были совершены за 1 сеанс в интервале 29 минут, о чем свидетельствует поминутное логирование:

События клика по товарам передаются с космической скоростью

Использование Measurement Protocol целесообразно в тех случаях, когда человек хочет фиксировать факт реальной отгрузки товара клиенту, его покупки и оплаты, а не просто как заказ (транзакцию) на сайте, которая может быть отменена. Именно поэтому современные модули настройки электронной торговли для разных CMS-систем предлагают дополнительный функционал в виде передачи данных по протоколу измерения, который позволяет отправлять дополнительное событие в Google Analytics после обновления статуса заказа — Отменено, В обработке, Отправлено, Завершено и т.д.

При его использовании важно правильно настроить запрос, который будет отправляться в Google Analytics и связываться с хитами, сессиями и пользователем. Ключевым параметром для связки транзакции с конкретным пользователем в Google Analytics является уникальный идентификатор клиента (Client ID, cid), о котором шла речь выше. Для каждой транзакции, пересылаемой по Measurement Protocol, Client ID должен соответствовать пользователю, совершившему этот заказ на сайте. Иначе многие ваши заказы будут иметь неправильно определенный источник трафика direct / none. Что у нас и произошло. Идет классический разрыв сеанса, когда пользователь, перешедший на сайт, получил определенный Client ID, а транзакция была привязана к совершенно другому идентификатору клиента. Тем самым происходит разрыв данных.

Поскольку модуль электронной торговли отправляет данные Enhanced Ecommerce через Measurement Protocol как события, самое время вспомнить, как они работают в Universal Analytics и из чего состоят. В моей другой статье эта тема разбирается очень подробно. Для нас важно то, как в Google Analytics отправляются события, посредством каких запросов и компонент.

В зависимости от библиотеки, конструкция отслеживания какого-либо события может иметь вид:

Какие метрики Google Analytics провоцируют неверные решения

Google Analytics и Яндекс.Метрика — большие системы. Их интерфейсы изменяются медленно. И за время работы систем аналитики накопились инструменты, которыми сейчас пользоваться нельзя. Команда rick.ai коллекционирует ошибки аналитики и рассказывает, как легко настроить аналитику против себя.

Почему круговую диаграмму «Новые и вернувшиеся» интерпретируют неправильно?

Команды оценивают долю вернувшихся пользователей по диаграмме «Новые и вернувшиеся». Если вернувшихся пользователей много, не нужно усиливать или запускать ремаркетинг и ретаргетинг, оптимизировать email-рассылки.

/>

Глядя на диаграмму, маркетинг и продакты видят, что 42,2% пользователей возвращаются повторно. А значит, переключать силы команды на работу над возвращением на сайт не надо. Простой понятный вывод.

На диаграме написано new visitors — новые посетители/пользователи. На самом деле, это не пользователи. Этот график построен по сессиям.

Google Analytics считает сессии, а не пользователей

Пользователи систем аналитики, ожидают, что системы умеют все на свете. Это не так.
Я.Метрика и Google Analytics активно развиваются и изменяются. Посмотрите, например, API ChangeLog. Многие вещи, от которых ожидают корректной работы, морально устарели хотя не будут убраны из интерфейса еще пару лет.

У GA есть стандартный инструмент — GA dev tools Query Explorer. Весь интерфейс GA работает поверх их API. Мы можем формировать запросы и они будут показывать те же самые цифры, которые показываются в интерфейсе.

Посмотрим на поведение пользователя с идентификатором 1000046758.1506757751.
Эти двадцать цифр — ga_clientID, уникальный идентификатор пользователя. Запись этого идентификатора в одну из переменных пользователя custom dimension позволяет посмотреть, что происходит внутри гугла, и работать с raw data. Без доступа к raw data понять, что происходит, практически невозможно.

image

30 сентября у пользователя 100…751 было 2 сессии: одна записалась в New visitors, другая — в Returning visitors. В первую сессию пользователь — новый. Во вторую — вернувшийся.

Когда ga запускает новые сессии, можно прочитать в справке:

Один пользователь может выполнить несколько сеансов [сессий], которые могут произойти за один день, неделю, месяц или год. Новый сеанс может начаться только после того, как будет закончен предыдущий, а заканчивается он в следующих случаях:

По времени:
· через 30 минут бездействия
· в полночь.

В случае смены кампании:
· если пользователь перешел на сайт по объявлению одной кампании, покинул его, а затем снова посетил, но уже по объявлению другой кампании.

image

Посмотрим в GA dev tools Query Explorer, что произошло с пользователем 100…751.

В 10:49 человек зашел с гугл-органики, в 10:50 сделал какое-то действие, 10:50 вернулся из канала cardstandart.ru. Платежный шлюз переопределился, как реферральная ссылка. Источник изменился. И запустилась новая сессия.

Число сессий на пользователя — случайная величина.
И это от вас не зависит

Разработчики подключат новый шлюз, нужно будет строить автолинковщик, делать кроссдоменное отслеживание. Но все равно ошибки останутся. К тому же пользователь может отвлечься на письмо или на звонок. Может возникнуть ошибка хрома и так далее.

Реальную картинку возвращаемости можно посмотреть в графике, который называется Когортный анализ. На самом деле, это не когортный анализ, а как раз retention.

image

В этом графике мы видим, что за неделю на сайт вернулись 6,27% пользователей.

image

За месяц на сайт вернулись только 8,99% пользователей. А не 42,2%, как показывает диаграмма Новые и вернувшиеся. Выводы маркетолога и продакта меняются на противоположные: «На сайт возвращается мало пользователей, необходимо оптимизировать email-рассылки, активнее работать с ремаркетингом и ретаргетингом.»

Расчет аналитики по сессиям неизбежно влечет ошибки в выводах, и в конечном счете, — в решениях. Потому что на сайте покупают, регистрируются и платят не сессии, а пользователи. Чтобы считать реальных пользователей и делать правильные выводы, используйте user-based аналитику.

Добавить комментарий

Ваш адрес email не будет опубликован.