Проведение тестирования можно разделить на несколько шагов:
- Постановка цели.
- Выбор метрики.
- Определение гипотез.
- Определение дизайна.
- Проведение тестирования.
- Анализ результатов.
Рассмотрим каждый шаг подробнее.
Шаг 1. Поставить цель Цель тестирования
должна совпадать с глобальной целью компании. Продолжим рассматривать пример из начала статьи про компанию, занимающуюся производством и продажей пластиковых окон. Основная цель — увеличение объема продаж с лендинга, на который «льется» трафик с контекстной рекламы.
Следовательно, рассматривайте тестирования, которые гипотетически повлияют на увеличение заказов с лендинга. В нашем случае — замена прямоугольных кнопок на круглые.
Не занимайтесь проверкой гипотез, которые изначально не согласуются с глобальной целью компании. АБ тест — работа команды, она
занимает время и ресурсы. И если неправильно установить ориентир, потратите средства впустую.
Шаг 2. Выбрать метрику Выбор метрики очень важен для успешного проведения A/B теста. Под ней понимают ключевые показатели бизнеса: объем продаж, выручка, чистая прибыль, количество посетителей, конверсия, число отказов и т.п. Часто метрику сравнивают с термометром — она показывает, как хорошо нашим пользователям, как много мы зарабатываем и т.п.
Для нашего тестирования ключевая метрика — количество заказов с лендинга, то есть мы будем считать оплаченные заказы клиентов, пришедших с сайта.
Желательно выбирать одну метрику, но в некоторых случаях допускается рассматривать несколько показателей в качестве дополнительных.
Главное — не переборщить! Если отслеживать в рамках одного теста десяток метрик, его эффективность существенно снизится. В рамках примера с пластиковыми окнами в качестве дополнительных показателей допустимо отслеживать средний чек и чистую прибыль.
Шаг 3. Определиться с гипотезамиВыбираем гипотезу по схеме «если что-то, то что-то».
Вторая часть должна совпадать с основной метрикой, выбранной в рамках тестирования. Например, «если заменить прямоугольные кнопки на круглые, то конверсия лендинга увеличится с 3-5% до 8-10%».
Для правильной оценки результатов выделяют два типа гипотез:
- Нулевая. Изменения ни к чему не приведут, конверсия остается прежней (задача — опровергнуть гипотезу).
- Альтернативная. Изменения приведут к повышению конверсии до 8-10%.
Соответственно, если изменений нет, значит, сработала нулевая гипотеза и внесение изменений не имеет смысла. Если конверсия повысилась, значит, сработала альтернативная гипотеза и следует масштабировать правки на всю аудиторию. И конечно, при негативном эффекте
мы откатываем все изменения и думаем дальше, как повысить ключевую метрику.
Шаг 4. Определиться с дизайном Четвертый шаг — один из самых важных. Когда-то он больше технический, когда-то нет, все зависит от текущей команды и возможностей для проведения тестирования.
Например, в Яндексе работает автоматическая система, которая перед проведением А/Б-тестирования разбирает пользователей на группы и определяет объем выборки. Выборка — количество людей в каждой группе, необходимое для получение данных в нужном объеме для принятия объективного решения.
Перед проектированием дизайна теста ответьте на 4 вопроса:
- какие пользователи участвуют — новые, старые, все, какой-то конкретный сегмент и т.п.;
- как разбиваем на группы (например, по городам или районам);
- объем выборки;
- продолжительность тестирования;
- допустимый уровень значимости (как правило, 90-95%).
Не все понимают, как определить объем выборки. В этом случае руководствуются собственным опытом: задают себе вопрос «мы хотим увидеть такое-то изменение такого-то размера» и на основе этого понимают минимально необходимую аудиторию для проверки гипотезы.
Вернемся к примеру лендинга по продаже пластиковых окон. Так как мы льем трафик с контекстной рекламы, будем рассматривать новых пользователей (10% от общего объема) и не станем разбивать их на группы. В среднем за сутки лендинг посещает 100 человек, проводить тестирование будем 1 месяц и тогда новую версию сайта посмотрят 300 потенциальных клиентов (10%). Такого объема выборки хватит для принятия объективного решения.
Шаг 5. Провести эксперимент Запустите тестирование и… ждите! Расслабьтесь и наблюдайте за текущими результатами, особенно на начальном этапе. Проверяйте, чтобы ничего не сломалось и обе группы «чувствовали себя хорошо».
Иногда на начальных этапах можно увидеть подтверждение альтернативной гипотезы. И в этом случае новички допускают ошибку: прекращают тестирование раньше намеченного срока. Да, сначала изменения могут положительно повлиять на ключевую метрику, но уже в конце эксперимента может быть выявлено реальное отсутствие эффекта (если вообще не отрицательный результат).
Поэтому ждите строго до конца запланированного периода. Шаг 6. Проанализировать результаты Тестирование окончено, данные получены. Их анализируют для понимания, есть разница и не случайна ли она. На основе анализа принимается решение: зафиксировать внесенные правки на всю аудиторию или откатить все к первоначальной версии.
В нашем примере получили 27 заказов с лендинга с круглыми кнопками. То есть показатель конверсии достиг 9%.