uzluga.ru
добавить свой файл
1
Парапсихология и психофизика. - 1994. - №4. - С.64-71.


Статистический подход к интерпретации, обработке результатов и проверке гипотез в экспериментах по выявлению экстрасенсорных способностей человека


А.Г.Чуновкина


Показаны ограничения в использовании общепринятых подходов к статистической обработке результатов экстрасенсорного восприятия (ЭСВ) по схеме Бернулли, не учитывающие специфическую природу явления: способность к ЭСВ непостоянна, плохо контролируется человеком и проявляется на короткий промежуток времени. Предложен новый подход к статистической обработке результатов измерений, основанный на анализе последовательности правильных ответов в серии, использовании последовательных статистических процедур (критериев), максимально учитывающий специфику ЭСВ и особенности проведения измерений. Для предложенного метода проведена оценка ошибки первого рода.


Широкое распространение получили тесты, направленные на выявление экстрасенсорных способностей человека. В подобных тестах испытуемому предлагается распознать цвет, материал или предсказать появление случайного события. Простота и наглядность подобных тестов обеспечили им популярность [2].

Встает вопрос, что собственно можно сказать на основании результатов этих тестов, как интерпретировать их результаты, какие выводы можно сделать?

Для того, чтобы обоснованно ответить на эти вопросы необходимо разрешить следующие задачи:

- разработка формализованной математической (статистической) модели проводимого эксперимента;

- интерпретация результатов эксперимента в рамках принятой модели;

- разработка механизма принятия решения на основе результатов эксперимента, что связано с выдвижением конкурирующих гипотез и выработки критерия принятия решения;

- обработка результатов эксперимента в соответствии с принятым критерием.

Схема проведения эксперимента по перечисленным тестам сводится к многократному повторению одного и того же задания: распознавание цветов, материалов из числа названных или предсказание случайного события из числа возможных. Формализовано это может быть сформулировано следующим образом: N раз (10-20) ставится одно задание, на которое может быть дан один из m (2-3-4) ответов. Если предположить, что испытуемый случайным образом пытается угадать правильный ответ, то эта схема соответствует испытаниям Бернулли с вероятностью успеха p=1/m и вероятностью неудачи q=(m-1)/m.

Число правильных ответов Nправ в серии из N вопросов при случайном угадывании распределено по биномиальному закону с параметром p:


Pk=P{Nправ=k} = Cnk pkqN-k = Cnk (1/m)k ((m-1)/m)N-k


Для любого значения k могут быть вычислены соответствующие вероятности по приведенной формуле и таким образом определены наиболее вероятные (правдоподобные) значения Nправ.

В основу любой модели должны быть положены некие предположения, которые в дальнейшем используются в рамках данной модели. Эти предположения формируются либо на основании предварительных исследований, либо принимаются на веру, исходя из здравого смысла. Выдвигается следующее предположение:

Предположение. Ответы человека, обладающие пси-способностями соответствуют схеме испытаний Бернулли с вероятностью успеха p>1/m.

Высказанное предположение представляется естественным с учетом вышесказанного. Рассмотрим, как с его использованием может быть сконструирован критерий, на основании которого делается вывод о наличии или отсутствии пси-способностей у испытуемого. Слабые стороны высказанного предположения будут обсуждены ниже.

Выдвигаются две конкурирующие гипотезы:

H0: испытуемый обладает пси-способностями, т.е. p>1/m

H1: пси-способности у испытуемого отсутствуют, т.е. p=1/m

Объективная информация содержится в результатах эксперимента, наиболее естественным представляется анализировать число правильных ответов Nправ. Для того, чтобы сформулировать критерий на основании данного показателя (статистики) необходимо задать такое число Nкрит, что при NправNкрит будет приниматься гипотеза H0, а при Nправкрит гипотеза H1. Любой статистический критерий в полной мере характеризуется вероятностью ошибок I и II рода, другими словами уровнем значимости и мощностью 1-.

Обычно уровень значимости задается исследователем и тогда различные критерии сопоставляются по своим мощностям. Уровень значимости - это вероятность ошибочно отвергнуть нулевую гипотезу. т.е. вероятность события {Nправкрит}, при условии, что справедлива гипотеза H0:


=P{NправкритH0} = P{Nправкритp>1/m}


Задавшись уровнем значимости можно определить значение Nкрит. Гипотеза H0 является сложной и для вычисления Nкрит может быть заменена рядом простых:


H0i: p=pi>1/m; p1
2<...<1


Тогда для заданного уровня значимости при выбранном или предварительно оцененном значении параметра pi может быть определено значение Nкрит в результате решения уравнения:

=P{Nправкрит}=(N!/(N-n)!n!)pin(1-pi)N-n

Мощность критерия тем выше, чем меньше вероятность ошибочно принять гипотезу H1, т.е. чем меньше значение вероятности ошибки второго рода, вычисляемое по формуле:

=P{NправNкритp=1/m}=CNn(1/m)n((m-1)/m)N-n=(1/m)NСNn(m-1)N-n

В таблицах 1-3 для уровня значимости =0,1 и N=20 приведены значения Nкрит и вероятности ошибок второго рода для значений m=2, 3 и 5. Видно, что с увеличением m резко возрастает мощность критерия.


Таблица 1


Критические значения параметра Ккрит и вероятности ошибки второго рода для разных вероятностей правильного распознавания р (n=20, m=2, =0,1)


р

Nкрит




0,72

0,76

0,80

0,86

0,90

0,92

0,96

12

13

14

15

16

17

18

0,13

0,09

0,06

0,006

0,001

0,0002

0,00002



Таблица 2


Критические значения параметра Ккрит и вероятности ошибки второго рода для разных вероятностей правильного распознавания р (n=20, m=3, =0,1)


р

Nкрит




0,63

0,67

0,72

0,77

0,83

10

11

12

13

14

0,09

0,01

0,004

0,0008

0,0001



Таблица 3


Критические значения параметра Ккрит и вероятности ошибки второго рода для разных вероятностей правильного распознавания р (n=20, m=5, =0,1)


р

Nкрит




0,40

0,45

0,50

0,60

0,62

0,65

0,70

6

7

8

9

10

11

12

0,2

0,08

0,03

0,003

0,003

0,003

0


Остановимся подробнее на оценивании параметров рi, используемых при определении значения Nкрит. Естественно трактовать параметры рi как параметры, количественно характеризующие степень проявления пси-способностей у испытуемого. На основании значений этих параметров, оцененных по результатам эксперимента можно обоснованно сопоставлять степень проявления пси-способностей различных людей по используемому тесту. Традиционной статистической оценкой вероятности успеха по выборке является:


р=Nправ/N


Таким образом, после оценивания параметра рi по результатам эксперимента, можно воспользоваться таблицами 1-3 для задания значения Nкрит и принятия решения.

Вернемся к обсуждению недостатков выдвинутого предположения. Приведенный способ оценивания р и проверки гипотез предполагает, что значение р остается постоянным в течение всего эксперимента или его изменения сопоставимы с погрешностями его оценивания. Это предположение является весьма жестким и законно может вызвать возражения. Достаточно представить эксперимент из 20 вопросов при двух вариантах ответов, когда испытуемый дал правильные ответы на первые десять ответов, а общее число правильных ответов оказалось меньше Nкрит. В соответствии с сконструированным критерием в этом случае гипотеза H0 должна быть отвергнута. Однако серию из десяти правильных ответов трудно объяснить случайным угадыванием (вероятность такого события практически равна нулю).

Описанный пример говорит о том, что число правильных ответов не является достаточной статистикой, т.е. не содержит всю полезную информацию, содержащуюся в результатах эксперимента. Интерес представляет также максимальная длина серии из правильных ответов (N), а также общее число серий из правильных или неправильных ответов (N). Эти статистики обычно используют для проверки случайного характера выборки и независимости наблюдений в выборке.

В нашем случае превышение этими статистиками критических значений говорит от отличии параметра р от 1/2 при рассмотрении результатов теста с двумя возможными ответами.

Критические значения статистик для уровня значимости =0,05 соответственно равны:


(N)крит=3,3log10(N+1); (N)крит=[1/2(N+1-1,96(N-1)1/2)]


Таким образом, если нарушается хотя бы одно из неравенств:


(N)<(N)крит; (N)>(N)крит


то это говорит о неслучайном характере ответов.

Для N=20 соответствующие значения равны:


(20)крит=5; (20)крит=6


В данном случае не представляется возможным определить мощность критерия поскольку незатабулирован двумерный закон распределения статистики {(N),(N)} при р1/2. При значениях р1/2 (т.е. m>2) можно предположить простой критерий, основанный на длине серии из правильных ответов в независимости от общего числа вопросов. Вероятность серии L правильных ответов при случайном угадывании равна: (1/m)L и резко убывает с ростом L особенно при m>2. Значения вероятностей для различных m и L приведены в таблице 4. Из таблицы видно, что для уровня значимости =0,01 (выделено в таблице) длина серии правильных ответов, большая критического значения: qкрит(2)=7 для m=2, qкрит(3)=5 для m=3, qкрит(5)=3 для m=5 - говорит о неслучайном угадывании ответов.


Таблица 4


Вероятность серии правильных ответов в зависимости от длины серии L и числа возможных вариантов ответов m.


L

m

1

2

3

4

5

6

7


2


3


5


0,5


0,33


0,2


0,25


0,1


0,04


0,12


0,06


0,01


0,06


0,02


0


0,03


0,01


0


0,02


0


0


0,01


0


0



При тестировании пси-способностей применяют обычно не один, а несколько тестов. Обработка результатов такого объединенного эксперимента составляет отдельную задачу. Строго говоря, для ее решения необходимо построение многомерного закона распределения статистик, используемых в различных тестах, что само по себе представляет самостоятельную сложную задачу. Если ограничиться эвристическими соображениями при построении объединенного критерия, то процедура принятия решения может быть сформулирована подобно одному из нижеприводимых способов:

- H0 принимается, если она принимается по всем частным критериям;

- H0 принимается, если она принимается в более, чем половине случаев и т.п.

При вычислении уровня значимости такого критерия необходимо учитывать зависимость между результатами различных тестов при условии справедливости гипотезы H0 и естественно значение уровня значимости несколько возрастает. Однако мощность критерия значительно увеличится, поскольку значение вычисляется в предположении справедливости гипотезы H1 (в этом случае результаты различных тестов независимы).

В заключении кратко остановимся на вопросах организации тестирования. Принципиально возможны две схемы проведения эксперимента или их комбинации:

- без обучения. Например, испытуемому предлагается разложить конверты с различными цветами и он узнает об результатах только после выполнения всего задания,

- с обучением. Когда испытуемый знает о результатах предыдущего задания и может корректировать свои ответы в дальнейшем.

При обработке результатов во втором случае следует в большей мере ориентироваться на длину серий из правильных ответов. При постановке эксперимента важно исключить влияние субъективных факторов, в частности, такого рода: например, в тесте с конвертами общее число красных и синих конвертов не должно быть известно испытуемому и должно быть случайным в каждом эксперименте.


Литература


1. С.А.Айвазян, И.С.Енюков, Л.Д.Мешалкин. Основы моделирования и первичная обработка данных - М.:Финансы и статистика,1983

2. Ли А.Г. К вопросу о методике изучения некоторых необычных феноменов психики человека. - Парапсихология в СССР,1991,N2,с.37-42

3. А.Г.Чуновкина. Статистический критерий обнаружения экстрасенсорных способностей человека. - Парапсихология и психофизика,1992,N3,с.57-64