Как валидировать продуктовые гипотезы

В этой статье вы узнаете, как сформировать и провалидировать гипотезы, создать культуру экспериментов внутри компании и как балансировать между данными и интуицией на примерах продуктового менеджмента в MacPaw и SendPulse.

Почему важно иметь гипотезу

Типичный подход представителей бизнеса — «Let’s build 10 things and find out what will work» — почти всегда ни к чему хорошему не приводит. И почти всегда приходится объяснять, что необходимо избегать крупных финансовых вливаний и максимально быстро проверять гипотезы. В ответ такому клиенту всегда следует фраза: «Why don’t we experiment 10 things and build the 3 that worked?».

Но даже при втором подходе можно потратить тысячи долларов и сотни часов, валидируя что-то, что вообще не даст никакого результата, либо даст, но он будет несоизмерим с потраченными средствами. Помните случай, когда в Google тестировали 41 оттенок голубого? Они использовали 2 разных оттенка голубого. Один на домашней странице поисковика, а другой — на странице Gmail. Чтобы узнать, какой цвет самый эффективный, они начали тестировать оттенки, чтобы в итоге стандартизировать цвет на всей платформе. В 2009-м это послужило причиной ухода Lead Desiner’а Douglas Bowman, который заявил:

«Yes, it’s true that a team at Google couldn’t decide between two blues, so they’re testing 41 shades between each blue to see which one performs better. I had a recent debate over whether a border should be 3, 4 or 5 pixels wide, and was asked to prove my case. I can’t operate in an environment like that. I’ve grown tired of debating such miniscule design decisions. There are more exciting design problems in this world to tackle».

Какая была проблема у Гугла? Какая была гипотеза? Стоило ли тратить время на столь незначительное дизайн-решение? Я согласен с Дугласом: порой чрезмерная зависимость от данных и over-analytical mindset мешают принимать хорошие решения. Похожая история была и в Yahoo, когда они тестировали 30 новых логотипов. Я думаю, что четко сформулированная гипотеза и рациональная приоритизация, на тот момент, привела бы команду Гугла к более значащим результатам. Именно поэтому формировать гипотезы чрезвычайно важно. Об этом писали еще до того, как методология Lean Startup стала популярной:

Как формировать гипотезу

Teresa Torres, создатель блога Producttalk предлагает следующий подход:

1. Know what you want to learn

Первое, с чего необходимо начать — четко сформулировать, что мы хотим изучить, провалидировав гипотезу. Нужно прекрасно осознавать проблему, которую мы пытаемся решить.

2. Understand what level you are testing

Нужно понять, какой уровень продукта мы собираемся провалидировать.

Представьте, что вы работаете над Sign Up flow своего Landing Page. Ваш дизайнер предлагает 2 варианта, вы делаете сплит-тест и выбираете победителя. Проблема в том, какое заключение можно сделать, если один дизайн оказался хуже второго? Можно ли сделать вывод, что он действительно хуже? В данном случае будет полезным понять, какой продуктовый уровень вы валидируете.

Выделяют следующие уровни:

Value level — на этом уровне мы можем провалидировать проблему, которую будет решать продукт, и понять, стоит ли вообще эту проблему решать.

Feature level — это сам функционал, который отражает ценность продукта.

Design level — это то, как именно функционал будет работать с точки зрения UX.

Feasibility level — это всё, что касается технической реализации функционала.

Возвращаясь к примеру с Landing Page. Мы можем сделать заключение, что Sign Up форма не была юзабельна, только если это была валидация дизайн-уровня.

Может оказаться, что текст на лендинге, который объясняет преимущество нашего продукта, не резонирует с проблемой пользователей, и именно поэтому первый Landing был хуже. В таком случае это будет валидация уровня Value.

Или может оказаться, что Landing был сделан криво и страница загружалась 10 секунд, что будет относиться к уровню feasibility.

Прежде чем проводить любую валидацию, нужно спросить себя: «Уверен ли я в своём value proposition? Уверен ли я, что это правильная фича? Уверен ли я, что это тот дизайн? Уверен ли я, что это вообще возможно? И что из всего этого я хочу валидировать?».

3. Build hypothesis right

Хорошая гипотеза состоит из ответов на 5 вопросов:

Какое изменение?
Какой результат?
Для кого?
На сколько?
Как долго?

Самым сложным в формировании гипотезы по такому шаблону является ответ на вопрос «На сколько»? Ответ на этот вопрос даёт понять, какую отдачу ты ожидаешь получить после валидации.

Подробнее прочитать о том, как следует формулировать гипотезы, можно на Product Talk.

Какие подходы валидации гипотез бывают

A/B testing

Это сравнение двух вариантов друг с другом, чтобы понять, какой сильнее повлияет на вашу целевую метрику. Сплит-тестирование позволяет увидеть причинно-следственную связь изменений в продукте.

В A/B тестировании самое важное — определить размер выборки для того, чтобы результаты были статистически значимыми. Также, определив размер выборки, мы можем приблизительно понять, сколько будет длиться сплит-тест.

Steve Wu, Senior Product Manager at Ever’s, отлично объясняет весь процесс сплит-тестирования в своей лекции.

Jon Noronha, продуктовый менеджер Optimizely, советует задуматься о сплит-тестировании, только если у вас есть как минимум 10 000 monthly active users. Но что делать, если вы только начали, и у вас нет такого трафика? К вашим услугам другие способы валидации гипотез.

User interview

Пользовательское интервью даёт отличную возможность получить качественные данные от существующих либо потенциальных пользователей. Выделяют две группы пользовательских интервью: Usability и Discovery.

Usability помогает понять, смогут ли вообще юзеры использовать продукт и достичь своей цели. Discovery-интервью позволяет детальнее вникнуть в самого пользователя и ответить на вопросы: «Кто? Где? Зачем? Как?».

Главный вопрос — «Сколько интервью нужно провести, чтобы подтвердить или опровергнуть гипотезу?».

Gaskin, Griffin и Hauser советуют 10-30 интервью;
Daniel Bertaux в своём социологическом исследовании 1981 года сказал, что 15 — это наименьшая допустимая выборка;
Greg Guest сделал заключение в своем этнографическом исследовании, что ему хватило 12 интервью;
Jakob Nielsen говорит, что в большинстве случаев 5 достаточно.

На самом деле нет правильной цифры, ведь нам приходится делать разные интервью в разных доменах с разными группами населения.

Мне кажется разумным начать с 5 и интервьюировать до тех пор, пока респонденты перестанут давать новую информацию. Для небольших изменений в продукте 5-7 интервью может хватить. Для запуска нового продукта может понадобиться 50-70.

В своей статье Michael Margolis, UX Research at GV, part дает отличные советы по проведению пользовательских интервью.

Card Sorting

Card sorting — это метод для структурирования информации, построения лучшей навигации и создания информационной архитектуры.

Давайте представим, что вы разрабатываете сайт для аренды машин. Ваша компания предлагает более 60 моделей. Как бы вы раскидали эти машины по категориям, которые позволят людям быстро найти свой идеальный транспорт? К примеру, можно создать следующие категории: семейные машины, машины класса люкс, представительские машины. Но пользователи могут не иметь ни малейшего понятия, в чем разница. Тут может помочь card sorting. Вы просите своих пользователей раскидать транспорт по категориям, которые им понятны, а затем наблюдаете за паттернами, которые возникают.

Детальнее с этим методом и его видами можно ознакомиться на nngroup.com.

Survey

Относительно простой способ проверить свои гипотезы, но для того, чтобы получить хорошие результаты, нужно задавать правильные вопросы в нужной последовательности.

Как правильно составлять вопросы для своего опросника, можно прочитать в блоге Neil Patel.

На SurveyMonkey описывают, как посчитать количество респондентов для опроса.

Как валидируют гипотезы в MacPaw и SendPulse

Ярослав Степаненко, Product Marketing Manager в MacPaw

— Когда приходиться принимать data-driven решение всегда есть шанс, что данные не отражают полной картины. Как ты балансируешь между данными и интуицией?

Балансирование между данными и интуицией? Не рекомендую балансировать между ними 🙂

Баланс между данными и качественными показателями + хорошее понимание контекста анализируемой ситуации/фичи/поведения пользователя — это среда, в которой зачастую оказывается продуктовый маркетолог.

Почему так? Сами по себе данные не помогают принять решение, нужно понимать почему тот или иной показатель растет или падает, чем конкретно это может быть обусловлено, как на это можно повлиять и стоит ли.

— Как выглядит хорошая гипотеза и какой подход к приоритизации ты используешь?

Хорошая продуктовая гипотеза всегда основана на качественных и количественных данных. Опять таки, одних данных не будет достаточно, ровно как и только контекстом невозможно ограничиться при формировании гипотезы.

Порядок этих двух аспектов при формировании гипотезы:

Данные.
Контекст.

— Что ты бы посоветовал компаниям, которые хотят построить experimentation culture?

Мне кажется, что один из тех аспектов, которые замедляют скорость экспериментов — это поиск инструментов с ожиданием от них эффекта серебряной пули. В итоге, работа с инструментами для экспериментов занимает больше времени и сил, чем сами эксперименты.

Имею хороший пример: 25 октября мы организовывали конференцию Growth Marketing Stage, одним из докладчиков на которой был David Ly Khim. Senior Growth Marketing Manager в HubSpot. Он очень детально рассказал о том, как его команда формирует гипотезы и проводит эксперименты. Ни слова про инструменты. Упор на качественно собранные данные и синки команд, которые работают над разными экспериментами одновременно.

Дмитрий Горин, Product Manager в SendPulse

Тут приходит на помощь здравый смысл и желание решить конкретную проблему пользователя. Нельзя быть ведомым только интуицией или тупо следовать данным. Здравый смысл — то, что не дает заменить людей на скрипт принятия решений.

Из-за того, что ты зачастую профдеформирован и варишься в контексте — полезно привлекать коллег и использовать коллективный разум как источник разносторонних мнений «здесь и сейчас».

— Как выглядит хорошая гипотеза и какой подход приоритизации ты используешь?

Наличие гипотезы — уже хорошо 🙂 Какой-то одной техники приоритизации, которую использую, — нет. Все зависит от множества факторов в определенный момент. Чаще всего — Story Mapping, MoSCoW, метод Джиро Кавакита и относительное взвешивание (нравятся своей легковесностью и возможностью их миксовать). Из тех, что хотел бы попробовать на практике — модель Кано и Qualitative Cost of Delay.

— Что ты бы посоветовал компаниям, которые хотят построить experimentation culture?

Перестаньте бросаться на любую «прорывную» идею или новое направление, насчет которого вы уверены, что по-любому выстрелит. Я в это попросту не верю и включаю трушного PdM, который во всем сомневается. Критическое мышление — наше все.
Делайте MVP, пилоты, прототипы, даже макраме (если надо), но покажите это реальным пользователям. Готовы ли они голосовать кошельком за вашу идею? Зачастую — нет. А вы уже потратили месяцы на разработку…

Используйте CustDev, будьте открыты к своим потенциальным пользователям и задавайте правильные вопросы (это хорошо описано в книге «The mom test» Rob Fitzpatrick). Проводите интервью до того момента, пока не закончатся инсайты или вы уже чувствуете, что нащупали основную волну. Не рвите связи со своими пользователями, они будут классными первопроходцами решения.