
Статистическая значимость: путь к научной славе или ловушка для исследователей?
Статистическая значимость — понятие, которое используется в науке для того, чтобы оценить, насколько вероятно, что полученные результаты не являются случайными или ошибочными. Если результаты статистически значимы, то это означает, что они достаточно надежны и воспроизводимы, и что они могут свидетельствовать о наличии какого-то интересного явления или закономерности. Статистическая значимость часто измеряется с помощью так называемого Р-значения, которое показывает, какова вероятность получить такие же или более экстремальные данные при условии, что никакого эффекта на самом деле нет. Чем меньше Р-значение, тем меньше шансов, что результаты объясняются просто случайностью.
На первый взгляд, статистическая значимость кажется очень полезным и объективным инструментом для проверки гипотез и подтверждения научных открытий. Однако в последние десятилетия все больше ученых обращают внимание на то, что статистическая значимость имеет свои недостатки и подводные камни. Во-первых, статистическая значимость не гарантирует, что результаты имеют практическую или теоретическую ценность. Например, если в эксперименте участвует очень большое количество испытуемых, то даже очень маленькие различия между группами могут оказаться статистически значимыми, но при этом не иметь никакого смысла или влияния на реальную жизнь. Во-вторых, статистическая значимость зависит от выбора уровня значимости (обычно 0.05), который является произвольным и не учитывает специфику каждого исследования. В-третьих, статистическая значимость может быть легко искажена или подделана с помощью различных приемов, таких как выборочное представление данных, манипулирование переменными, игнорирование альтернативных объяснений и т. д.
Все эти проблемы привели к тому, что в научном сообществе возникло явление, которое называется «кризисом воспроизводимости». Это означает, что многие научные результаты, которые были опубликованы в престижных журналах и получили широкую известность, не могут быть повторены другими исследователями при повторении тех же условий эксперимента. Это подрывает доверие к науке и ее авторитет в обществе. Кроме того, это ведет к потере времени и ресурсов, которые могли бы быть использованы для более полезных и качественных исследований.
Одним из первых ученых, который попытался обратить внимание на эту проблему и предложить решение, был Джеффри Лофтус, редактор журнала «Память и познание». В 1993–1997 годах он писал редакционные статьи, в которых критиковал преобладание статистической значимости в психологии и призывал исследователей использовать более простые и наглядные способы представления данных, такие как средние значения, графики и диаграммы. Он также предлагал учитывать не только статистическую, но и клиническую значимость, то есть насколько результаты имеют отношение к реальным ситуациям и проблемам. Лофтус хотел, чтобы психологи больше думали о смысле и интерпретации своих данных, а не о том, как получить желаемое Р-значение.
Лофтус советует использовать более простые и понятные подходы. Например, он предлагает отобразить прямые средние значения для сравнения групп добровольцев в психологическом эксперименте. Графики позволяют видеть, есть ли большой разброс между отдельными участниками исследования или оценки сконцентрированы вокруг среднего значения. Это позволяет исследователям оценить, например, улучшили ли добровольцы свои результаты в сложном математическом тесте, если на самом деле они сначала писали о своих мыслях и чувствах в течение 10 минут, в отличие от простого сидения в течение 10 минут.
Тем не менее, большинство исследователей продолжают акцентировать внимание на статистической значимости своих результатов.
Хотя Лофтус не был единственным, кто высказывал такие мысли, его статьи вызвали большой резонанс в научном мире. Многие согласились с его критикой и поддержали его предложения. Однако многие другие продолжали придерживаться традиционного подхода и считали, что статистическая значимость является необходимым и достаточным условием для научной достоверности. Таким образом, вопрос о том, как правильно проводить и оценивать научные исследования, остается открытым и актуальным до сих пор.
Психолог и прикладной статистик Ричард Мори из Университета Кардиффа, Уэльс, призывает исследователей пересмотреть традиционный подход к статистической значимости. Он предлагает сосредоточиться на разработке теорий ума и поведения, которые дают проверяемые прогнозы. Такой подход позволит ученым выбирать наиболее подходящие статистические инструменты для своих нужд.
— Ричард Мори.
Однако все еще многие исследователи уделяют пристальное внимание статистической значимости в надежде найти истину. Мори выражает надежду, что в будущем подход, основанный на ошибке нулевого ритуала, уступит место новым и более эффективным методам.
На первый взгляд, статистическая значимость кажется очень полезным и объективным инструментом для проверки гипотез и подтверждения научных открытий. Однако в последние десятилетия все больше ученых обращают внимание на то, что статистическая значимость имеет свои недостатки и подводные камни. Во-первых, статистическая значимость не гарантирует, что результаты имеют практическую или теоретическую ценность. Например, если в эксперименте участвует очень большое количество испытуемых, то даже очень маленькие различия между группами могут оказаться статистически значимыми, но при этом не иметь никакого смысла или влияния на реальную жизнь. Во-вторых, статистическая значимость зависит от выбора уровня значимости (обычно 0.05), который является произвольным и не учитывает специфику каждого исследования. В-третьих, статистическая значимость может быть легко искажена или подделана с помощью различных приемов, таких как выборочное представление данных, манипулирование переменными, игнорирование альтернативных объяснений и т. д.
Все эти проблемы привели к тому, что в научном сообществе возникло явление, которое называется «кризисом воспроизводимости». Это означает, что многие научные результаты, которые были опубликованы в престижных журналах и получили широкую известность, не могут быть повторены другими исследователями при повторении тех же условий эксперимента. Это подрывает доверие к науке и ее авторитет в обществе. Кроме того, это ведет к потере времени и ресурсов, которые могли бы быть использованы для более полезных и качественных исследований.
Одним из первых ученых, который попытался обратить внимание на эту проблему и предложить решение, был Джеффри Лофтус, редактор журнала «Память и познание». В 1993–1997 годах он писал редакционные статьи, в которых критиковал преобладание статистической значимости в психологии и призывал исследователей использовать более простые и наглядные способы представления данных, такие как средние значения, графики и диаграммы. Он также предлагал учитывать не только статистическую, но и клиническую значимость, то есть насколько результаты имеют отношение к реальным ситуациям и проблемам. Лофтус хотел, чтобы психологи больше думали о смысле и интерпретации своих данных, а не о том, как получить желаемое Р-значение.
Лофтус советует использовать более простые и понятные подходы. Например, он предлагает отобразить прямые средние значения для сравнения групп добровольцев в психологическом эксперименте. Графики позволяют видеть, есть ли большой разброс между отдельными участниками исследования или оценки сконцентрированы вокруг среднего значения. Это позволяет исследователям оценить, например, улучшили ли добровольцы свои результаты в сложном математическом тесте, если на самом деле они сначала писали о своих мыслях и чувствах в течение 10 минут, в отличие от простого сидения в течение 10 минут.
Тем не менее, большинство исследователей продолжают акцентировать внимание на статистической значимости своих результатов.
Хотя Лофтус не был единственным, кто высказывал такие мысли, его статьи вызвали большой резонанс в научном мире. Многие согласились с его критикой и поддержали его предложения. Однако многие другие продолжали придерживаться традиционного подхода и считали, что статистическая значимость является необходимым и достаточным условием для научной достоверности. Таким образом, вопрос о том, как правильно проводить и оценивать научные исследования, остается открытым и актуальным до сих пор.
Психолог и прикладной статистик Ричард Мори из Университета Кардиффа, Уэльс, призывает исследователей пересмотреть традиционный подход к статистической значимости. Он предлагает сосредоточиться на разработке теорий ума и поведения, которые дают проверяемые прогнозы. Такой подход позволит ученым выбирать наиболее подходящие статистические инструменты для своих нужд.
Статистика помогает нам сомневаться в том, что мы видим
— Ричард Мори.
Однако все еще многие исследователи уделяют пристальное внимание статистической значимости в надежде найти истину. Мори выражает надежду, что в будущем подход, основанный на ошибке нулевого ритуала, уступит место новым и более эффективным методам.
Наши новостные каналы
Подписывайтесь и будьте в курсе свежих новостей и важнейших событиях дня.
Рекомендуем для вас

32 удивительных подарка за последние 20 лет: ученые пытаются понять, за что косатки «балуют» людей
Природная доброта? Любопытство? Желание выйти на контакт?...

Найдено идеальное место для жизни на Марсе
По словам ученых, оно похоже… на нашу Сибирь....

Уникальная находка в Нидерландах: археологи обнаружили римский лагерь далеко за пределами Империи
Как лидар и искусственный интеллект нашли объект-«невидимку» II века....

Тайна разгадана: стало известно, почему большинство кошек предпочитают спать строго на одном боку
Оказалось, что это древний защитный механизм, которому миллионы лет....

«Вертолетная» конструкция да Винчи может сделать беспилотники тише, быстрее и даже дешевле
Ученые поражены, насколько разработка Леонардо опередила время....

Ученые и режиссеры все время обманывали нас насчет динозавров
Оказалось, древние ящеры бегали в четыре раза медленнее, чем считалось....

Ученые хотят создать хранилище микробов, чтобы те… не вымерли
Звучит кошмарно, но на самом деле от этого зависит судьба всего человечества....