Когда маркетологи работают в Google Analytics и в Яндекс. Метрике, они замечают, что при анализе используется не 100% данных, а только часть. Это действительно возможно: такой метод составления отчетности существует и получил название сэмплирования.
В этой статье мы рассматриваем, что из себя представляет сэмплирование, в чем его опасность и как его избежать в практике.
Содержание
Что такое сэмплирование
Термин «сэмплирование» пришел в маркетинг из математики, где под ним подразумевается выбор подмножества некоторых величин из определенного множества с целью выявления значимых характеристик.
В аналитике сэмплирование представляет собой такой процесс обработки данных, при котором общее представление об информации выстраивается на основе некоторой ее части — из небольшой выборки.
К примеру, Google Analytics может взять определенное количество данных, скажем, 10%, умножить их на 10 и отчитаться о том, что эти данные характерны для всех 100% выборки.
Классические Приемы по Работе с Сэмплами
Google и Яндекс используют методику сэмплирования при анализе большого массива данных. Так, Google Analytics переходит к сэмплированию при достижении лимита в 500 тысяч сеансов на один ресурс за конкретный период. В Яндексе сэмплинг данных применяется при анализе более полутора миллионов визитов на страницы ресурса за период.
Сэмплинг технически снижает нагрузку на серверы. Он помогает сбалансировать скорость загрузки отчета, но цена тут — снижение точности данных.
Источник: andata.ru
Семплирование данных: что это и как с этим бороться
Когда нужно проанализировать большой объем данных в аналитических системах, нередко можно столкнуться с семплированием. О том, что это такое, расскажет младший веб-аналитик агентства icontext, входящего в iConText Group, Валерия Андреева.
В этой статье рассмотрим:
- Что такое семплирование данных
- Как понять в системах веб-аналитики, что данные семплированы
- Когда возникает семплирование
- Чем может быть опасно семплирование
- Как избежать семплирования
Что такое семплирование данных
Семплирование — это статистический способ обработки данных, при котором общее представление о данных строится на основе определенной части всех данных, называемой выборкой.
Допустим, у вас есть мешок с тысячью шариков, и вы хотите узнать, сколько из них синего цвета. Вместо того, чтобы тратить долгое время на пересчет всех шариков, вы можете случайным образом вынуть несколько и проверить, сколько из них синего цвета. Основываясь на этом образце, вы можете сделать вывод о количестве шариков нужного цвета в мешке.
Это грубый пример выборки данных. Но он отражает главную пользу данного метода — семплирование позволяет быстро предоставить данные и сделать вывод о чем-то, игнорируя возможные недостающие данные. Однако отсюда вытекает и главный минус — мы получаем не точные, а приблизительные данные, поэтому есть риск получить искаженный результат.
Настройка параметров звука в телевизорах LG
В системах аналитики данный метод применяется для оптимального соотношения скорости загрузки отчета и точности представления данных.
Как понять в системах веб-аналитики, что данные семплированы
В Google Analytics точность представленных данных обозначается значком щита рядом с названием отчета.
Если щит зеленого цвета, значит семплирование не применялось. Если желтого — отчет создан на основе выборки, при этом процент выборки можно увидеть, наведя курсор на значок.
В Яндекс.Метрике процент семплирования указывается в элементе «Точность».
Пример из отчета «Источники, сводка»:
Яндекс.Метрика имеет преимущество в управлении семплированием — точность данных всегда можно настроить. В то время как в Google Analytics часто нет доступа к управлению процентом выборки, если применено семплирование.
Когда возникает семплирование
Google Analytics для создания отчетов сначала собирает необработанные данные, затем он агрегирует их и сохраняет в отчетах по умолчанию (стандартных).
Пять групп отчетов по умолчанию:
- В реальном времени;
- Аудитория;
- Источник трафика;
- Поведение;
- Конверсии.
Все отчеты из этих групп по умолчанию не являются семплированными.
Но иногда требуется изменить отчеты по умолчанию, чтобы получить больше информации. Может появиться необходимость добавить новый фильтр, дополнительную метрику, новый сегмент или создать собственный (специальный) отчет. При каждой такой настройке, Google Analytics сначала проверяет отчет по умолчанию, чтобы узнать, доступны ли запрашиваемые вами данные.
Если соответствующие данные недоступны, Google Analytics проверяет количество сеансов. Если их слишком много, тогда Google Analytics берет выборочные данные для предоставления отчета.
Поэтому можно выделить следующие основные причины семплирования:
- превышение порога обрабатываемых данных (ниже мы описали лимиты для разных версий Google Analytics);
- создание пользовательского отчета;
- применение сегмента;
- добавление в отчет дополнительных параметров;
- превышение лимита количества строк в выведенном отчете (1 млн строк).
Также стоит отметить, что у каждой версии Google Analytics различаются ограничения по количеству сеансов, при которых применяется семплирование данных.
В Universal Analytics семплирование возникает в специальных отчетах, когда в них собираются данные по более чем 500 тысяч сеансов на уровне ресурса для любого выбранного диапазона дат. В отчетах-картах («Пути пользователей», «Карта поведения», «Карта событий», «Карта целей») обрабатывается не более 100 000 сеансов.
В Google Analytics 360 этот порог выше — 100 миллионов сеансов для любого выбранного диапазона дат на уровне ресурса.
В Google Analytics 4 семплирование обычно применяется в категории «Исследование», когда запрашиваются данные о событиях, количество которых более 10 миллионов.
Что касается Яндекс.Метрики, то здесь похожие причины получения семплированных данных:
- если данные предоставляются по визитам, количество которых более 1,5 млн;
- если количество элементов в отчете на странице выдачи превышает 100 000.
Чем может быть опасно семплирование
Как уже разобрано выше, выборка данных показывает приблизительный результат. Поэтому, если нужно провести оценку точных показателей, например, узнать точный коэффициент конверсии, то семплированный результат может сильно отличаться от точного.
Предположим, процент выборки — 85%. На основе таких данных можно сделать вывод — скорее всего, он будет обоснованным и позволит получить корректное представление.
Но чем ниже этот процент, тем, соответственно, больше искажение. Если в отчете представлено 1000 сеансов, и при этом доля выборки 1%, то это будет означать, что результаты данных приводятся на основе 10 сеансов, а данные по оставшимся 99% останутся нетронутыми.
Это риск упустить ценную информацию и потерять деньги, если, к примеру, на основе семплированных данных вы строите вывод об эффективности рекламной кампании.
Также из-за семплирования вы упускаете возможности, которые можно было бы заметить, если бы данные были точными. Например, увидеть закономерность и построить прогноз.
Как избежать семплирования
- Самый очевидный способ получить полные данные — сократить выбранный период представления данных. При этом можно экспортировать данные за каждый период в Excel или Google Sheets и провести анализ в этих системах, объединив данные по выгруженным периодам. В этом случае, возможно, придется многократно извлекать данные и это займет немало времени, при этом нет гарантии, что даже за самый маленький промежуток — один день — полученные данные не будут семплированы. Так что и в этом случае не всегда возможно избежать полного отсутствия выборки.
- Настройка фильтра данных в представлении также может помочь избежать семплирования. Но это подойдет в том случае, если требуется периодически проводить анализ какого-то заданного сегмента, а не просмотреть определенные данные разово. Например, если периодически возникает необходимость анализировать данные только по органическому трафику, можно создать новое представление и в нем отсечь всё лишнее, оставив только органический трафик.
- Если вы пользуетесь Google Sheets, можно использовать расширение Google Analytics для ручного извлечения данных GA в отдельные временные диапазоны, а затем использовать формулы или сводные таблицы, чтобы снова собрать все это вместе. Загляните в руководство от Google по настройке выгрузки.
- Можно воспользоваться специальными платными софтами, которые работают по аналогии с третьим пунктом. Они разбивают данные на более мелкие временные рамки, а затем объединяют их обратно в один диапазон, в основном избегая выборки (смотрите примечание ниже о данных на уровне пользователя).
- Если вы используете обычный Google Analytics, то, может быть, вам подойдет способ перейти на платную версию — GA 360, где пороговые значения получения точных данных выше. Даже если будет превышен порог, то отчет без выборки все равно можно запросить. Однако, когда вывод данных превысит три миллиона строк, Google объединит эти строки под одной — other. Но переход на данную версию стоит рассматривать, если вы часто сталкиваетесь с семплированными данными, на вашем сайте более 10 млн хитов в месяц, и годовая доходность может обеспечить вложение в лицензию.
- И еще один способ — использование хранилищ данных. С помощью автоматизации хранилища данных, можно существенно сокращать время, необходимое для извлечения, передачи и загрузки данных, чтобы составить отчет и проанализировать его. Одно из самых популярных хранилищ — Google BigQuery, и, если вы используете GA 360 или GA4, то связать их с BigQuery можно, используя бесплатный функционал для связывания в интерфейсе GA 360 или GA4. Для выгрузки данных о поведении пользователей в BigQuery можно также использовать сторонние инструменты, которые помогут собрать данные в несемплированном виде напрямую с сайта в BigQuery.
Примечание. Процесс сбора данных по API затруднителен для случаев, когда нужно выполнить анализ метрик на уровне пользователя. Показатели на уровне пользователя при извлечении данных из API не могут быть точными, так как для анализа поведения пользователей необходимо просматривать данные за период времени. Это означает, что вы не можете извлекать небольшие диапазоны дат, а затем объединять их вместе, если вы собираете пользовательские параметры/показатели.
Источник: ppc.world
Сэмплинг
Сэмплинг — это бесплатная раздача образцов товара (сэмплов) в интернете или офлайн-магазинах, а также распространение пробников в качестве бонуса при покупке другой продукции.
Чаще всего этим занимаются производители относительно недорогих товаров массового потребления: косметики, парфюмерии, бижутерии, бытовой химии, гигиенических средств, продуктов питания и напитков. Таким способом компании знакомят клиентов с продукцией, мотивируют их к дальнейшим покупкам, укрепляют доверие к бренду и повышают его узнаваемость.
Задачи сэмплинга
Сэмплинг играет важную роль в развитии бизнеса и помогает решить маркетинговые задачи:
Привлечь целевую аудиторию. Метод позволяет быстро привлечь внимание потенциальных клиентов и вызвать у них интерес к продукции.
Увеличить продажи и прибыль. Бесплатная раздача товара мотивирует клиентов к покупке: например, если девушке понравится пробник духов, она наверняка захочет купить флакон.
Так бизнес наращивает продажи и получает больше прибыли. Это подтверждают результаты исследования компании NewBeautyBox :
Повысить доверие к компании. Люди видят продукт своими глазами, могут его попробовать, проверить функциональность и лично убедиться в качестве. Это вызывает доверие к товару и его производителю.
Повысить узнаваемость бренда. В рамках сэмплинга бизнес запускает рекламу в интернете, привлекает блогеров, проводит мероприятия и промоакции в местах большого скопления людей (торговые центры, открытые уличные площадки, собственные магазины компании). Всё это положительно отражается на узнаваемости компании.
Получить обратную связь. Клиенты охотно обсуждают бесплатный товар, делятся своим мнением с продавцами, пишут отзывы в интернете. Это позволяет выявить достоинства и недостатки продукции, проанализировать их и исправить возможные недочеты.
Интернет-отзывы сильно влияют на продажи: исследование Aliexpress Россия и агентства Data Insight показало, что 9 из 10 пользователей читают отзывы перед онлайн-покупкой, а для каждого пятого они имеют решающее значение.
Виды сэмплинга
Классический сэмплинг различают по способам раздачи продукции.
Wet-sampling («влажный» сэмплинг). Клиенты « дегустируют » товар прямо в точке продажи: наносят на кожу тестер помады или пробуют еду на вкус. Они знакомятся с продуктом, изучают его и тестируют в месте реализации.
Дегустация позволяет сразу узнать мнение клиента о продукции, а также повышает вероятность спонтанной покупки
Horeca-sampling. Используют в сфере HoReCa — в точках общепита, отелях и развлекательных заведениях. Клиентам предлагают попробовать напитки или табачные изделия как комплимент от заведения либо в качестве презента при покупке другой продукции.
Подобные акции улучшают репутацию компании и повышают продажи
Dry-sampling («сухой» сэмплинг). Клиентам раздают пробники товара, которые можно протестировать дома. Раздачу проводят на улице, тематических мероприятиях или в формате прямой рассылки (например вкладывают упаковку с образцом шампуня в женский журнал).
Минус этого способа — отсутствие гарантии, что человек воспользуется пробником. Такой сэмплинг направлен скорее на повышение репутации, чем на стимуляцию продаж
Pack swap или switch-sampling (обмен товара). Потребителям предлагают обменять уже использованный товар конкурента на новый товар бренда. Это работает с сигаретами, зажигалками, помадами и другими изделиями, которые люди обычно носят с собой.
Благодаря подобным акциям клиенты могут сравнить продукцию разных брендов и оценить преимущества вашего товара
House – to – house-sampling (домашний сэмплинг). Примеры товара рассылают клиентам по почте: подвешивают на дверные ручки, вкладывают в почтовые ящики или в газеты и журналы, добавляют к другому товару, отправленному на домашний адрес.
Таким способом компании повышают доверие к бренду и лояльность потребителей.
Онлайн-сэмплинг
С развитием онлайн-продаж маркетинговые инструменты пополнились новыми видами сэмплинга. Сейчас всё чаще встречается раздача бесплатных продуктов через интернет.
Сэмплинг в интернет-магазинах. Компании распространяют пробники несколькими способами: например, добавляют образец при онлайн-заказе другого товара или предлагают получить подарок в обмен на контактные данные клиента.
Компания Estée Lauder предлагает всем желающим получить бесплатный пробник нового аромата. Для этого нужно оставить свои контакты, получить уникальный код и показать его консультанту в магазине
Бесплатные образцы для блогеров. Производитель отправляет пробники блогерам и медийным личностям, а они делают обзоры для широкой аудитории.
Реклама от лидеров мнений положительно влияет на продажи: блогер тестирует товар и делится с подписчиками своим мнением. Так как пользователи доверяют инфлюенсеру и прислушиваются к его словам, вероятность покупки увеличивается. При этом важно, чтобы товар был хорошего качества. Иначе можно получить от блогера совсем не тот отзыв, на который вы рассчитывали.
Бьюти-блогер Maria Way с аудиторией 4,2 миллиона подписчиков тестирует косметику по мотивам сериала «Игра престолов»
Следует отличать такой вид сэмплинга от амбассадорства. Амбассадоры всегда нативно рекламируют бренд и получают за это бонусы на постоянной основе.
Сэмплинг услуг. Сюда входят бесплатные уроки в онлайн-школах, консультации специалистов (например психологов), марафоны по саморазвитию и другие виртуальные мероприятия. Часто к работе привлекают менеджеров по продажам: они помогают довести клиента до покупки платных услуг.
Онлайн-школа английского языка Skyeng предлагает всем желающим пройти бесплатный вводный урок. Благодаря ему клиент оценит качество услуги и, возможно, купит полный курс
Сэмплинг услуг существует и в офлайне. В основном его применяют в сфере красоты: компании устраивают бьюти-дни и делают тестовый макияж всем желающим. Визажисты наносят косметику на лицо, и клиент наглядно видит достоинства средств и уровень профессионализма мастеров. Это повышает вероятность покупки.
Коробочные сервисы. Многие компании раздают клиентам целые наборы пробников: косметики, алкогольных напитков, детских товаров. Покупатели получают сразу несколько разных товаров бренда, а производители знакомят аудиторию с ассортиментом и повышают лояльность клиентов.
Особенно актуально это стало для косметических компаний после пандемии Covid-19. Покупатели не хотели использовать общие пробники в магазинах. Продавцы нашли решение: они распространяют бьюти-боксы с миниатюрами продукции.
Как организовать эффективный сэмплинг
Рассмотрим основные рекомендации, которые помогут сделать раздачу пробников полезной и выгодной для вашей компании.
- Поставьте цель и составьте план.
Подумайте, каких именно результатов вы хотите добиться: привлечь тысячу новых клиентов, нарастить объем спонтанных покупок, улучшить репутацию компании или анонсировать новый продукт.
Составьте план действий, посчитайте бюджет и определите показатели эффективности (например, расширение клиентской базы до 500 человек). После акции это позволит понять, насколько удачно прошел сэмплинг.
- Изучите целевую аудиторию.
Сформулируйте портрет аудитории. Кому именно вы будете раздавать пробники: кто эти люди, что им нужно, какие у них желания, предпочтения и финансовые возможности. Так вы поймете, как лучше преподнести товар и удовлетворить потребности клиентов.
Если вы раздаете женскую косметику, она должна быть красиво упакована, а девушки должны ощутить практическую пользу от использования. Если же вы проводите онлайн-уроки и готовите школьников к ЕГЭ — после пробного занятия ученик должен убедиться, что обучение действительно поможет подготовиться к экзамену.
- Выберите продукцию.
При выборе сэмпла тоже учитывайте целевую аудиторию — товар должен быть интересен и доступен потенциальным клиентам. Пускайте в ход самую популярную продукцию вашего бренда, которая пользуется большим спросом. Если вы хотите познакомить аудиторию с новинками, их лучше бесплатно раздавать при стабильном спросе на основной товар или вместе с покупкой другой продукции.
Определите объем сэмплов: будет неприятно, если посреди бьюти-дня у визажиста вдруг закончится косметика, а в очереди останется ещё много девушек. Клиентки останутся недовольными и вряд ли захотят купить вашу продукцию.
Раздавать чересчур много товара тоже невыгодно: выберите оптимальное количество продукции, которое не ударит по бюджету компании.
- Уточните место и время.
Подумайте, где и когда вы сможете охватить больше всего потенциальных покупателей. Раздачу бижутерии можно устроить в выходной день в торговом центре, а выпечку лучше раздавать в продуктовых супермаркетах утром, когда продукция максимально свежая.
Для онлайн-сэмплинга подойдет сайт вашей компании, лендинг или маркетплейс.
- Подберите промоутеров.
Важно, чтобы промоутер был приветливым и общительным, хорошо разбирался в товаре, уважительно относился к клиентам и вызывал у них доверие. Обычно компании отдают предпочтение молодым людям в возрасте 18-30 лет.
Пол промоутера и характеристика продукции тоже имеют значение: при раздаче косметики мужчине будут доверять меньше, чем девушке. А женщины не слишком подходят для распространения рыболовных и охотничьих товаров.
Недостатки сэмплинга
Несмотря на большую пользу для развития бизнеса, у сэмплинга есть несколько важных минусов:
Акция требует серьезных денежных вложений. Сюда входят затраты на изготовление пробников, привлечение промоутеров, логистику и многое другое.
Организовать раздачу достаточно сложно . У компаний уходит много времени и сил на производство сэмплов, изучение целевой аудитории, подбор персонала и остальную подготовку.
Трудно оценить эффективность акции. Брендам сложно определить, как раздача повлияла, например, на престиж и репутацию компании.
Источник: www.unisender.com