ПОЛИГРАФ - ФОРУМ

York

В нижней табличке помещены значения ФОП для пар сравнения. В данном случае это косинусы реакций. Справа, под знаком суммы, указываются суммы ФОП по отдельным параметрам и общая сумма по полиграмме. Значения ФОП в ячейках таблицы могуи принимать своё значение как со знаком плюс, так и со знаком минус. В случае истинности нулевой гипотезы ФОП имеет мат. ожидание(среднее значение) равное нулю. Это значит что каждое значение ФОП с одинаковой вероятностью может принять как положительное значение так и отрицательное. Меняя знаки у значений ФОП, и каждый раз суммируя их мы получим 2^15 (для данной полиграммы) значений суммарной ФОП полиграммы, которые могли бы надбюдать в случае истинности нулевой гипотезы. Но в данном случае наблюдаем (-4.21 - это статистика теста). Раз значение суммы отрицательна, то альтернативная гипотеза П>C. Тогда, если сосчитать все варианты суммарной ФОП, которые меньше, чем наблюдаемое и поделить на общее количество вариантов, то мы получим p-value. Вот, собственно и вся суть. Понятно, что вручную это не проделать, даже с помощью Excel, поэтому он мало известен. Если кому-то нужна более развёрнутая информация, то можно прослушать лекцию школы анализа даннах МФТИ.

Надо ещё рассмотреть разницу между тестом Вилкосона и Перестановочным критерием. Технология теста Вилкоксона предусматривает перевод значений анализируемой случайной величины в ранги. Затем эти ранги суммируются особым образомб и так получается новая случайная величина, значение которой называется статистикой теста. Далее на основе свойств новой случайной величины и её конкретного значения вычисляется p-value (либо определяется критичекая область) и уже далее принимается решение. При переводе элементов выборки в ранги теряется информация об их конкретных значениях и решение принимается на основе связанной с первоначальной, но другой случайной величины. В смысле потери информации хуже дело обстоит в тесте знаков, там теряется информация даже об относительных размерах элементов выборки, учитывается информация только о знаках элементов выборки. Но надо подчеркнуть, что тест знаков не предаётся на этой основе "анафеме", а находит своё применение на практике.
В отличие от первых двух тестов в Перестановочном критерии используется вся информация, которорую несут элементы выборки: и о знаке, и об абсолютной величине. Критерий использует больше информации и поэтому является более точным, чем тест Вилкоксона.

Тут можно провести параллель с ФОП, значениея которой образуются из сырых параметров, а затем уже проводятся тесты (в случае теста Вилкоксона происходят уже два преобразования). Но для того, что бы из данных полиграммы получить альтернативную гипотезу и вычислить p-value, необходимо провести некоторое преобразование исходных физиологических данных для их сведения в единую выборку. Такое преобразование и названо ФОП.

Существует непараметрический тест, который называется Медианный критерий. С его помощью можно проверить равенство медианы (проверить нулевую гипотезу) для нескольких выборок, не делая преобразований. Но он не даст алтернативу (она должна будет сформулировна из других причин). Видимо придётся "прикрутить" ещё и этот тест. Smile

В видео ещё можно обратить внимание на вычисляемые альтернативы и p-value для разных ФОП.

Закономерным будет вопрос о том какой ФОП выбрать. Это уже вопрос не математики. а физиологии с психологией. Если эти науки не дают ответа - то вопрос практики. Надо пропустить большую выборку подтверждённых полиграмм и посмотреть на сравнительную эффективность классификации с обеими ФОП. Есть ещё вариант - пользоваться обеими сразу. И ориентироваться на самый низкий р-value.

Прогоняя полиграммы я увидел, что в случае когда альтернативы по всем параметрам совпадают, то обе ФОП дают достаточно близкие p-value. В случае когда, какой -либо параметр находится в контренде, то p-value начинают расходится в значениях. Это лекго объяснимо. ФОП косинусов уравновешивая вклад каждого параметра, в случае противоречия их, ожидаемо ухудшает результат. А ФОП относительных реакций, ориентируясь в большей мере на КГР, менее чувствительна к противоречиям по параметрам.

$erP

С новым видом ФОП еще придется разбираться... очень интересная идея...
Пока еще рассмотрим принципиальные моменты на примере старой...

Очень сложно всё перемешалось с вопросами-комментариями-ответами. Делать ссылки на уже сделанные комментарии, которые были сделаны на уже сделанные ответы – это снежный ком…

Попробую просто ещё высказаться системно по тем моментам, которые мне кажутся определяющими, ключевыми… Постараюсь, что называется, другими словами…

$erP

Для того, чтобы посмотреть, одинаково или по разному оценивают полиграммы статметоды, основанные на обработке сырых параметрах и на ФОП, надо проводить обширное исследование на большом количестве полиграмм. Или же вручную смоделировать какие-то реакции и посмотреть, что как считает.

Смоделируем реакции. И поскольку реальные реакции смоделировать очень сложно, сделаем это искусственно вручную… на числах…

Возьмем для начала две «крайние» ситуации с распределением реакций.

1я ситуация.
Тест из 3х пар CQ-RQ. Реакция на каждый из вопросов отличается НА известную определенную величину по возрастанию. В данном случае на 1. Так что разница между реакциями – всегда одна, а отношение – всегда разное.

Иллюстрация – рис. 1.

Применяем тест Вилкоксона в двух вариантах. Один – стандартный Вилкоксон, основан на ранжировании разницы между сырыми параметрами. Другой – ФОП Вилкоксон, одновыборочный, основан на ранжировании вычисленного отношения между реакциями.

В расчетах приходится сталкиваться с ограничениями: стандартный Вилкоксон не предназначен для обобщенной обработки сырых параметров разных характеристик. Поэтому предполагаем, что представленные на гистограммах данные – это данные какой-то одной характеристики. Для выработки понимания того, есть ли различия в используемых подходах обработки данных, это достаточно.

Для ситуации 1

Рис. 2. Обработка Ситуации 1 стандартным Вилкоксоном и ФОП-Вилкоксоном

Видим, что для одних и тех же реакций разные Вилкоксоны присваивают разные ранги.

2я ситуация.
Реакция на каждый из вопросов отличается В определенное число раз по возрастанию. В данном случаев в 2 раза. Так что разница между реакциями – всегда разная, а отношение – всегда одно и тоже.

Иллюстрация – рис. 3.

Обрабатываем.

Рис. 4. Обработка ситуации 2 стандартным Вилкоксоном и ФОП-Вилкоксоном.

Ожидаемо видим, что для каждой ситуации один и тот же тест присваивает одним и тем же реакциям очень разные ранги. Думаю, это тот случай, когда «эффект бьет в глаза» и тест ранговых корреляций нет смысла проводить…

Но поскольку смоделированные реакции настолько очевидные, что все рассчитанные ранги «смотрят» в одну сторону, то статметоды с разными данными на выходе в итоге дают один и тот же результат: p-value настолько низкая, что сомневаться о выявлении достоверных различий не приходится.

То есть для очевидных ситуаций данные, представленные разными шкалами, не влияют на итоговый результат.

А если сделать ситуацию менее очевидной?

Внесем, некоторые изменения в реакции для ситуации 1 и ситуации 2.

Ситуация 3.
Понизили реакции на 3й RQ, сохранив при этом ситуационный принцип: разница в реакциях осталась равной 1. В двух сравниваемых парах RQ > CQ. В одной паре CQ>RQ.

Рис. 5 – вид смоделированных реакций.

Обрабатываем статметодами. Получаем.

Рисунок 6. – обработка ситуации 3.

Что изменилось по сравнению с ситуацией 1?
Ранги количественно не поменялись. Поменялось лишь направление одного ранга.

Статистика для стандартного Вилкоксона = 15.
Статистика для ФОП Вилкоксона = 6.

И столь разная статистика дает основание уже для разных выводов.

В таком раскладе реакций стандартный Вилкоксон уже перестает давать основание для обвинительного вывода: p-value >> 0,05 при RQ > CQ не дает оснований говорить, что реакции на контрольные и релевантные вопросы достоверно отличаются друг от друга.

Но при этом при данном раскладе реакций ФОП Вилкоксон продолжает считать, что основания для обвинения есть: p-value < 0,05, т.е. можно уверенно говорить, что при RQ > CQ реакции на RQ > статистически значимо больше реакций на CQ.

Следующая ситуация 4
Повысили реакции на 1й CQ, сохранив при этом ситуационный принцип: отношение между реакциями осталось равным 2. Но в двух сравниваемых парах RQ > CQ. В одной паре CQ>RQ.

Рис. 7. - иллюстрация для ситуации 4.

Что изменилось в обработке по сравнению с ситуацией 2?

Рис. 8. Обработка ситуации 4.

Ранги количественно не поменялись. Поменялось лишь направление одного ранга.

Статистика для стандартного Вилкоксона = 6.
Статистика для ФОП Вилкоксона = 15.

По сравнению с ситуацией 2 стандартный Вилкоксон продолжает находить основание для обвинительного вывода по данному набору реакций: p-value < 0,05, т.е. при RQ > CQ можно утверждать, что реакции на контрольные и релевантные вопросы достоверно отличаются друг от друга.

Но ФОП Вилкоксон перестает обвинять. p-value >> 0,05, т.е. можно говорить, что при RQ > CQ, ФОП Вилкоксон не видит между ними достоверных различий.

Итак, подведем итоги.
Имеем две модели реакций.

Так и хочется спросить… а визуально эти картинки как воспринимается? В обоих случаях RQ > CQ. В какую сторону душа кладётся? При визуальном анализе кого более тянет обвинять, левого или правого?

На основании изложенного можно сделать следующие выводы.
Статметоды на основании сырых параметров и ФОП-параметров дают разный результат. При оценке очевидных случаев этот разный результат не виден. Разный результат может быть увиден в неочевидных случаях.
Нужно хорошее исследование на валидность и точность. Такое, какое есть для PolyScore и OSS.

З.Ы. Очень надеюсь, что с иллюстрациями не перепутал.
Потом посмотрю - проконтролирую...

York

Я разделяю Ваше настороженное отношение к Соколу. Всё должно проверяться. В том числе и работа Сокола на полиграммах. В этом я совершенно с Вами согласен. Но...

York

York

Я сам проблему теста Вилкосона вижу в другом. Объеденяя через ФОП параметры реакций разной физиологии, мы почти наверняка объединяем в выборку случайные величины из разных генеральных совокупностей У того же Холендера чёрным по белому написано, что "..каждое Z извлечено из непрерывной и симметричной относительно Q совокупности..." - это для ФОП выполняется - это то условие, которе не позволяет использовать ФОП вида Х/Y - 1, Q - медиана равная нулю. И далее '..возможно, что разные Z извлечены из разных совокупностей)' - это тоже выполняется, но вот как это может сказаться на мощности теста не ясно (хотя катастрофы точно не должно быть, уж Холлендер бы об этом сообщил). Поэтому нужно было найти ещё один тест, который можно было бы использовать параллельно - это Перестановочный критерий. Сйчас мне известна ФОП, которая даёт длч всех физиологичесих параметров случайные величины из одного распределения при нулевой гипотезе. Но будет ли она работать лучше или хуже можно выяснить только на практике.

York

Александр Калафати

Юрий, а давайте проверим.
Есть 100 подтвержденных случаев. Есть баллы из 3 обсчетов данного массива. На самом деле даже больше, т.к. были те, которые начинал присылать, но останавливались.

Хотя, если нас не интересует сила разницы, то это очень напоминает 3хбалку. -1 0 +1

York

Александр Калафати

В метрику сложнее. Полиграммы в пдф формате. Теоретически можно их перевести в мм. Иди иные условные единицы.
Хочем?

$erP

Не вопрос оцифровать КГР и мнж... Дыхание - ???

Александр Калафати

Курвиметр

York

Александр Калафати

1) Опыта нет
2) пока никак, надо попробовать и посмотреть.

$erP

Организация проста...
Полиграммы распределяются среди волонтеров... и они занимаются...
Сложность -
1) выдержать единый масштаб измерений...
2) дыхание... кажется что курвиметр не очень удобен для следования за такими перегибами...

В принципе... 20 лет назад чел, который первый наткнулся на статью Крэпола об объктивном методе измерения... пробовал это делать... и, с его слов, у него это получалось...