На первый взгляд, статистическая значимость кажется очень полезным и объективным инструментом для проверки гипотез и подтверждения научных открытий. Однако в последние десятилетия все больше ученых обращают внимание на то, что статистическая значимость имеет свои недостатки и подводные камни. Во-первых, статистическая значимость не гарантирует, что результаты имеют практическую или теоретическую ценность. Например, если в эксперименте участвует очень большое количество испытуемых, то даже очень маленькие различия между группами могут оказаться статистически значимыми, но при этом не иметь никакого смысла или влияния на реальную жизнь. Во-вторых, статистическая значимость зависит от выбора уровня значимости (обычно 0.05), который является произвольным и не учитывает специфику каждого исследования. В-третьих, статистическая значимость может быть легко искажена или подделана с помощью различных приемов, таких как выборочное представление данных, манипулирование переменными, игнорирование альтернативных объяснений и т. д.
Все эти проблемы привели к тому, что в научном сообществе возникло явление, которое называется «кризисом воспроизводимости». Это означает, что многие научные результаты, которые были опубликованы в престижных журналах и получили широкую известность, не могут быть повторены другими исследователями при повторении тех же условий эксперимента. Это подрывает доверие к науке и ее авторитет в обществе. Кроме того, это ведет к потере времени и ресурсов, которые могли бы быть использованы для более полезных и качественных исследований.
Одним из первых ученых, который попытался обратить внимание на эту проблему и предложить решение, был Джеффри Лофтус, редактор журнала «Память и познание». В 1993–1997 годах он писал редакционные статьи, в которых критиковал преобладание статистической значимости в психологии и призывал исследователей использовать более простые и наглядные способы представления данных, такие как средние значения, графики и диаграммы. Он также предлагал учитывать не только статистическую, но и клиническую значимость, то есть насколько результаты имеют отношение к реальным ситуациям и проблемам. Лофтус хотел, чтобы психологи больше думали о смысле и интерпретации своих данных, а не о том, как получить желаемое Р-значение.
Лофтус советует использовать более простые и понятные подходы. Например, он предлагает отобразить прямые средние значения для сравнения групп добровольцев в психологическом эксперименте. Графики позволяют видеть, есть ли большой разброс между отдельными участниками исследования или оценки сконцентрированы вокруг среднего значения. Это позволяет исследователям оценить, например, улучшили ли добровольцы свои результаты в сложном математическом тесте, если на самом деле они сначала писали о своих мыслях и чувствах в течение 10 минут, в отличие от простого сидения в течение 10 минут.
Тем не менее, большинство исследователей продолжают акцентировать внимание на статистической значимости своих результатов.
Хотя Лофтус не был единственным, кто высказывал такие мысли, его статьи вызвали большой резонанс в научном мире. Многие согласились с его критикой и поддержали его предложения. Однако многие другие продолжали придерживаться традиционного подхода и считали, что статистическая значимость является необходимым и достаточным условием для научной достоверности. Таким образом, вопрос о том, как правильно проводить и оценивать научные исследования, остается открытым и актуальным до сих пор.
Психолог и прикладной статистик Ричард Мори из Университета Кардиффа, Уэльс, призывает исследователей пересмотреть традиционный подход к статистической значимости. Он предлагает сосредоточиться на разработке теорий ума и поведения, которые дают проверяемые прогнозы. Такой подход позволит ученым выбирать наиболее подходящие статистические инструменты для своих нужд.
Статистика помогает нам сомневаться в том, что мы видим
— Ричард Мори.
Однако все еще многие исследователи уделяют пристальное внимание статистической значимости в надежде найти истину. Мори выражает надежду, что в будущем подход, основанный на ошибке нулевого ритуала, уступит место новым и более эффективным методам.