Самый распространенный тест статистической значимости был разработан пивоварней Guinness.
Один из клиентов заказывает бокал Guinness, и бармен начинает сложный процесс наливания, который длится ровно 119,5 секунд. Это, возможно, маркетинговый ход, но этот ритуал стал любимым в ирландских пабах по всему миру, завершаясь бокалом густого стаута с идеальной пенкой.
Пивоварня Guinness известна своими инновациями с тех пор, как основатель Артур Гиннесс подписал аренду на 9 000 лет в Дублине за £45 в год. Например, математик, ставший пивоваром, изобрёл химическую технику, которая дала стауту его бархатистую пену, добавляя азот в кеги и маленькие шарики внутри банок Guinness. Этот метод привёл к популярности «нитро» напитков как в пиве, так и в кофе.
Однако самая влиятельная инновация пивоварни никак не связана с пивом. Именно здесь был создан т-тест, один из важнейших статистических методов. Когда ученые объявляют результаты своих исследований статистически значимыми, они часто используют т-тест. Но как он работает и почему его изобрели именно в пивоварне?
В начале XX века Guinness, проработав почти 150 лет, стала крупнейшей пивоварней в мире. До этого контроль качества продуктов основывался на грубой оценке на глаз и обоняние. Однако глобальная экспансия требовала от руководства Guinness повысить точность и стандарты производства. Компания наняла команду учёных для проведения исследований в поисках идеального пива, превращая пивоварню в центр экспериментов для решения различных вопросов: от выбора лучшего ячменя до анализа уровня сахара в солодовом экстракте.
Среди научных исследований перед командой встала проблема интерпретации данных при небольших размерах выборок. Одна из задач касалась цветков хмеля, важных ингредиентов Guinness, придающих пиву горечь и служащих естественным консервантом. Для оценки качества хмеля измеряли содержание мягкой смолы. Например, 8% считалось хорошим и типичным значением. Но тестирование всех цветков было экономически невыгодным, поэтому использовались случайные образцы.
Предположим, было измерено содержание мягкой смолы в девяти образцах, и в среднем получилось 6% — слишком мало. Значит ли это, что весь урожай плохой? Или это просто естественная вариация в малых выборках? Это вопрос статистической значимости. Именно этот вопрос стал основой для разработки т-теста, который изобрёл Уильям Сили Госсет, главный экспериментальный пивовар Guinness.
До Госсета концепция статистической значимости применялась к большим выборкам. Он понял, что для малых выборок необходимо разработать новые распределения, известные теперь как t-распределения. Эти распределения напоминают нормальное распределение, но имеют более широкие хвосты, что означает необходимость более высокого отношения сигнал/шум для признания значимости.
Госсет разработал новый подход к анализу данных, позволивший делать выводы в условиях небольших выборок. Свои результаты он публиковал под псевдонимом «Стьюдент», чтобы не раскрывать конкурентам секреты исследований Guinness. Его метод, известный как т-тест Стьюдента, используется до сих пор и является одним из самых распространённых инструментов в науке.
Таким образом, стремление к однородности и качеству пива в пивоварне Guinness вдохновило на создание одного из важнейших статистических методов, который изменил подход к научным исследованиям во многих областях.