Список форумов ПОЛИГРАФ - ФОРУМ ПОЛИГРАФ - ФОРУМ
Для общения по теме " Детекция лжи "
 
  На главную FAQFAQ   ПоискПоиск   ПользователиПользователи   ГруппыГруппы   РегистрацияРегистрация 
 ПрофильПрофиль   Войти и проверить личные сообщенияВойти и проверить личные сообщения   ВходВход 

Сокол НТФП
На страницу Пред.  1, 2, 3 ... 10, 11, 12 ... 19, 20, 21  След.
 
Начать новую тему   Ответить на тему    Список форумов ПОЛИГРАФ - ФОРУМ -> Общий форум
Предыдущая тема :: Следующая тема  
Автор Сообщение
York



Зарегистрирован: 29.09.2010
Сообщения: 2616
Откуда: Вологда

СообщениеДобавлено: Ср Авг 12, 2020 8:54 pm    Заголовок сообщения: Ответить с цитатой



В нижней табличке помещены значения ФОП для пар сравнения. В данном случае это косинусы реакций. Справа, под знаком суммы, указываются суммы ФОП по отдельным параметрам и общая сумма по полиграмме. Значения ФОП в ячейках таблицы могуи принимать своё значение как со знаком плюс, так и со знаком минус. В случае истинности нулевой гипотезы ФОП имеет мат. ожидание(среднее значение) равное нулю. Это значит что каждое значение ФОП с одинаковой вероятностью может принять как положительное значение так и отрицательное. Меняя знаки у значений ФОП, и каждый раз суммируя их мы получим 2^15 (для данной полиграммы) значений суммарной ФОП полиграммы, которые могли бы надбюдать в случае истинности нулевой гипотезы. Но в данном случае наблюдаем (-4.21 - это статистика теста). Раз значение суммы отрицательна, то альтернативная гипотеза П>C. Тогда, если сосчитать все варианты суммарной ФОП, которые меньше, чем наблюдаемое и поделить на общее количество вариантов, то мы получим p-value. Вот, собственно и вся суть. Понятно, что вручную это не проделать, даже с помощью Excel, поэтому он мало известен. Если кому-то нужна более развёрнутая информация, то можно прослушать лекцию школы анализа даннах МФТИ.

Надо ещё рассмотреть разницу между тестом Вилкосона и Перестановочным критерием. Технология теста Вилкоксона предусматривает перевод значений анализируемой случайной величины в ранги. Затем эти ранги суммируются особым образомб и так получается новая случайная величина, значение которой называется статистикой теста. Далее на основе свойств новой случайной величины и её конкретного значения вычисляется p-value (либо определяется критичекая область) и уже далее принимается решение. При переводе элементов выборки в ранги теряется информация об их конкретных значениях и решение принимается на основе связанной с первоначальной, но другой случайной величины. В смысле потери информации хуже дело обстоит в тесте знаков, там теряется информация даже об относительных размерах элементов выборки, учитывается информация только о знаках элементов выборки. Но надо подчеркнуть, что тест знаков не предаётся на этой основе "анафеме", а находит своё применение на практике.
В отличие от первых двух тестов в Перестановочном критерии используется вся информация, которорую несут элементы выборки: и о знаке, и об абсолютной величине. Критерий использует больше информации и поэтому является более точным, чем тест Вилкоксона.

Тут можно провести параллель с ФОП, значениея которой образуются из сырых параметров, а затем уже проводятся тесты (в случае теста Вилкоксона происходят уже два преобразования). Но для того, что бы из данных полиграммы получить альтернативную гипотезу и вычислить p-value, необходимо провести некоторое преобразование исходных физиологических данных для их сведения в единую выборку. Такое преобразование и названо ФОП.

Существует непараметрический тест, который называется Медианный критерий. С его помощью можно проверить равенство медианы (проверить нулевую гипотезу) для нескольких выборок, не делая преобразований. Но он не даст алтернативу (она должна будет сформулировна из других причин). Видимо придётся "прикрутить" ещё и этот тест. Smile



В видео ещё можно обратить внимание на вычисляемые альтернативы и p-value для разных ФОП.

Закономерным будет вопрос о том какой ФОП выбрать. Это уже вопрос не математики. а физиологии с психологией. Если эти науки не дают ответа - то вопрос практики. Надо пропустить большую выборку подтверждённых полиграмм и посмотреть на сравнительную эффективность классификации с обеими ФОП. Есть ещё вариант - пользоваться обеими сразу. И ориентироваться на самый низкий р-value.

Прогоняя полиграммы я увидел, что в случае когда альтернативы по всем параметрам совпадают, то обе ФОП дают достаточно близкие p-value. В случае когда, какой -либо параметр находится в контренде, то p-value начинают расходится в значениях. Это лекго объяснимо. ФОП косинусов уравновешивая вклад каждого параметра, в случае противоречия их, ожидаемо ухудшает результат. А ФОП относительных реакций, ориентируясь в большей мере на КГР, менее чувствительна к противоречиям по параметрам.

_________________
http://skl-ol.ru
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
$erP
Site Admin


Зарегистрирован: 29.06.2005
Сообщения: 7865
Откуда: Москва

СообщениеДобавлено: Чт Авг 13, 2020 4:55 pm    Заголовок сообщения: Ответить с цитатой

С новым видом ФОП еще придется разбираться... очень интересная идея...
Пока еще рассмотрим принципиальные моменты на примере старой...

Очень сложно всё перемешалось с вопросами-комментариями-ответами. Делать ссылки на уже сделанные комментарии, которые были сделаны на уже сделанные ответы – это снежный ком…

Попробую просто ещё высказаться системно по тем моментам, которые мне кажутся определяющими, ключевыми… Постараюсь, что называется, другими словами…

Цитата:
Они могут быть сырыми параметрами, а могут быть их комбинацией. Главное, чтобы они были случайными величинами.


Это один из самых-самых-самых ключевых моментов: что... какие значения брать для оценки. Если принимать во внимание, что применение теста как совокупности действий направлено на выявление интересующего исследователя свойства (Летков, «Точность полиграфного теста», журнал ДЛ), то наличие такого свойства проявляется в «сдвиге» (термин позаимствован из Холлендера) регистрируемых параметров. На умном языке экспериментальной психологии это описывается как «разным уровням независимой переменной должны соответствовать разные уровни зависимой переменной». Разные уровни независимой переменной – это наличие свойства. Разные уровни зависимой переменной – это его проявление в регистрируемых параметрах. Отсутствие «сдвига» в значениях зависимой переменной указывает на отсутствие свойства (это очень очень грубо говоря… в контексте обсуждаемой темы).

Разумеется, для выявления «сдвига» надо иметь адекватный инструментарий для измерения: надо понимать, что лучше измерять и чем лучше измерять. Это вопрос внутреней валидности.

Обсуждаемые ранговые статметоды нацелены на выявление «сдвига» в параметрах (опущу занудные детали типо «различие в медианах двух выборок»), наличие которого указывает на присутствие «эффекта обработки» объекта (Холлендер), то есть системного воздействия на объект исследуемым свойством.

Поэтому главное не то, чтобы закладываемые в статметод параметры «были случайными величинами». Это необходимое, но не достаточное условие. Главное, чтобы это были такие параметры, «сдвиг» в распределении которых наиболее адекватно отражал бы наличие или отсутствие системного воздействия на объект.

«Сдвиг» традиционно и наиболее распространенно рассматривается как разность между непосредственно измеряемыми, то есть «сырыми», параметрами.

Это, как минимум, обуславливается общими принципами построения исследования и созданием на их основе измерительного теста как ключевой исследовательской единицы: если тест регистрирует параметры, относящиеся к разным уровням зависимой переменной, то разность в уровнях зависимой переменной выражается, соответственно, в разности параметров…

Обсуждаемые статметоды по любому «заточены» на оценку различия, выраженного в разнице между значениями параметров. Это видно по тому, что ранжированию подвергается именно разница между параметрами, а не отношение параметров… Даже когда статметод называется «одновыборочным», а закладываемая в него выборка сформирована вычисленными отношениями некоторых величин.

Т.н. одновыборочный статметод – он условно одновыборочный… у него только на словах на вход статметода идет одна выборка. А на самом деле он почти обычный двухвыборочный. С необходимостью стандартно рассчитывать разницу между значениями двух выборок. Просто в качестве второй выборки берутся какие то известные по ситуации значения. В случае с ФОП, которая используется в Соколе, этими вторыми известными значениями являются выборка из «0». Потому что значения ФОП в случае наличия исследовательского эффекта сдвигаются относительно «0». То есть ранжируются не сами значения ФОП как таковые, а каждый раз формально вычисляемая разница (ФОП – 0). Но поскольку понятно, что такая разница совпадает со значениями самой ФОП, то никто по факту не заморачивается на вычисление этой разницы. И кажется, что ранжируются значения ФОП как таковые.

Таким образом, обсуждаемые статметоды в любом случае исследуют различие между параметрами. Но в случае стандартного подхода статметод исследует разницу между сырыми параметрами. Такой подход напрямую соответствует исследованию того, что называется «сдвиг» в исследуемом явлении…

В случае ФОП-подхода статметод тоже исследует «сдвиг»… Но исследуется «сдвиг» в данных, являющихся результатом обработки сырых параметров… Адекватно ли соответствует «сдвиг», выявленный на обработанных сырых параметрах, «сдвигу», выявленному на самих сырых параметрах?

Приведенный где-то по тексту пример из Холлендера о том, что в одновыборочном тесте обрабатывались данные измерения отношения массы Луны к массе Земли не совсем корректен. Не корректен в том плане, что ключевое слово в этом примере – измерение. В примере речь идет об измеренном параметре. Не вычисленном, как в ФОП, а измеренном. И даже измерительный прибор назван - спутник... в количестве семи штук... Сырой параметр – он измеренный параметр. Так же как в полиграфе в качестве сырого параметра по КГР также в своей основе лежит измеренное отношение. В случае с КГР исходный параметр - это текущее сопротивление в Омах, то есть измеренное отношение U/I. Само значение сопротивления в Омах – это шкала отношений. Далее из данных, измеренных по шкале отношений, вычисляются реакции, которые переводятся в сантиметры (миллиметры, клетки, условные единицы), что уже соответствует шкале интервалов. Это – адекватный перевод, без потери необходимой информации.

Примеры исследований ( http://www.ld.eposgroup.ru/forum/viewtopic.php?p=89519#89519 ) вроде бы показывают – что да… все находится в соответствии… Но что это за примеры? Можно ли на этих примерах уверенно делать обобщающие выводы? Может, это были такие явные примеры, что и без статметодов все было ясно?

«Статистические гипотезы не оцениваются обычно в тех случаях, когда установленное различие столь велико, что “эффект бьет в глаза”» (Корнилова, Эксперимент и квазиэксперимет в психологии). Полиграф – это тот фактор, который изначально работает на то, чтобы CQ и RQ различались между собой. И если это различие между CQ и RQ выявляется таким грубым методом, как «на глаз» (хотя надо еще посмотреть, насколько он «грубый»), то более точными математическими методами оно будет выявлено тем более. Но это не значит, что «на глаз» и «математически» имеют одинаковую мощность… Просто методика получения материала такова, что на этом материале одинаково хорошо работают все методы оценки…

Поэтому надо лезть в суть методов оценки… разбираться с теорией и проверять на моделируемых ситуациях…
Покопаемся еще немного теоретически.

Ключевое различие данных, представленных в качестве значений сырых параметров, и значений ФОП, в том, что сырые полиграфные значения измеряются и представляются в уже упомянутой интервальной шкале, а ФОП переводит эти значения из шкалы интервалов в шкалу порядка.

А это разные шкалы. О разности говорит хотя бы то, что интервальная шкала относится к т.н. метрическому типу шкал. Порядковая шкала относится к т.н. качественному типу шкал. Эти шкалы разные по своим возможностям. По разрешающей способности. По мощности в выявлении различий. По применяемым к ним операциям и даже статметодам.

У Холлендера на стр. 72 применительно к одновыборочному тесту так и сказано: «Свойство методов, основанных на статистике знаковых рангов, для одной выборки, по существу, те же, что и для соответствующих методов для повторных наблюдений. Правда, могут появиться различия в эффективности, обусловленные различиями в типе данных».

Различие в данных, представленных в разных шкалах, принципиально в следующем.

Если Вы дадите независимому наблюдателю данные о реакциях КГР, представленные в шкале интервалов, этот независимый наблюдатель путем применения нехитрых математических операций из школьной программы скажет, какие реакции КГР друг относительно друга больше-меньше… на сколько больше-меньше… во сколько раз больше-меньше. Например, скажет реакция КГР на CQ величиной в 10 см. больше реакции на RQ величиной в 1 см. Больше НА 9 см. и больше В 10 раз.

В порядковой шкале независимый наблюдатель очень ограничен в объеме получаемой информации. Если независимому наблюдателю представить данные о том, что одна пара вопросов CQ-RQ и другая пара вопросов CQ-RQ имеет одинаковое соотношение по КГР 2:1, то этот наблюдатель не сможет сказать, одинаковые ли в этих парах реакции на однотипные вопросы, или разные… а если они разные, то НА одинаковую ли они разницу отличаются, или нет. Ведь соотношение 2:1 может получиться из сочетания разных сырых параметров: и 1смCQ, 2 смRQ, 4смCQ и 8см.RQ, а может и 10смCQ, 20смRQ, 40смCQ, 80смRQ.

Поэтому когда реакция КГР на один из сравниваемых вопросов очень и очень мала, близка к нулю, по отношению к ней любая реакция получит свои 3 балла. А для ФОП и 4 балла и 5 баллов. В таких случаях обычно отходят от оценки данных по шкале порядка и возвращаются в оценку по шкале интервалов. Например, оценивают бОльшую реакцию на сравниваемый вопрос как слабую (1 балл), среднюю (2 балла) или сильную (3 балла), и формально вычитают её (или из нее) 0 баллов за отсутствующую реакцию на второй вопрос в сравниваемой паре.

Степень адекватности применяемой шкалы определяется простым правилом: равная разность параметров в рамках этой шкалы должна исходить из равной разности в исследуемом свойстве.

Для выборки, сформированной значениями ФОП, это правило не подходит. Это не значит, что разница между значениями ФОП не адекватно отражает исследуемое свойство. Это значит, что она может отражает его по другому, отлично от разница между сырыми параметрами, которая более адекватно соответствует цели выявления исследуемого свойству.

Таким образом, если в статметоды на вход подаются сырые параметры и параметры ФОП, то это данные, представленные в разных шкалах. Между шкалами нет прямо пропорционального соответствия. И использование данных в разных шкалах не может не приводить к получению внутри обсуждаемых статметодов разных рангов. А это, разные ранги, в свою очередь, после обработки статметодами, имеет полное право отразиться на выходе в разных статистиках и p-value, соответственно.

Если в приведенных примерах ( http://www.ld.eposgroup.ru/forum/viewtopic.php?p=89519#89519 ) не найдено различий в работе статметодов, вовсе не значит, что их нет. Если разница между CQ и RQ очевидно большая, то даже самая грубая система оценки даст на выходе значения, указывающие на наличие этой разницы.

_________________
Мое почтение... $erP

................................... ЛЕГКО СОЛГАТЬ ТЯЖЕЛО


Последний раз редактировалось: $erP (Чт Авг 13, 2020 7:22 pm), всего редактировалось 5 раз(а)
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
$erP
Site Admin


Зарегистрирован: 29.06.2005
Сообщения: 7865
Откуда: Москва

СообщениеДобавлено: Чт Авг 13, 2020 5:13 pm    Заголовок сообщения: Ответить с цитатой

Для того, чтобы посмотреть, одинаково или по разному оценивают полиграммы статметоды, основанные на обработке сырых параметрах и на ФОП, надо проводить обширное исследование на большом количестве полиграмм. Или же вручную смоделировать какие-то реакции и посмотреть, что как считает.

Смоделируем реакции. И поскольку реальные реакции смоделировать очень сложно, сделаем это искусственно вручную… на числах…

Возьмем для начала две «крайние» ситуации с распределением реакций.

1я ситуация.
Тест из 3х пар CQ-RQ. Реакция на каждый из вопросов отличается НА известную определенную величину по возрастанию. В данном случае на 1. Так что разница между реакциями – всегда одна, а отношение – всегда разное.

Иллюстрация – рис. 1.



Применяем тест Вилкоксона в двух вариантах. Один – стандартный Вилкоксон, основан на ранжировании разницы между сырыми параметрами. Другой – ФОП Вилкоксон, одновыборочный, основан на ранжировании вычисленного отношения между реакциями.

В расчетах приходится сталкиваться с ограничениями: стандартный Вилкоксон не предназначен для обобщенной обработки сырых параметров разных характеристик. Поэтому предполагаем, что представленные на гистограммах данные – это данные какой-то одной характеристики. Для выработки понимания того, есть ли различия в используемых подходах обработки данных, это достаточно.

Для ситуации 1

Рис. 2. Обработка Ситуации 1 стандартным Вилкоксоном и ФОП-Вилкоксоном



Видим, что для одних и тех же реакций разные Вилкоксоны присваивают разные ранги.

2я ситуация.
Реакция на каждый из вопросов отличается В определенное число раз по возрастанию. В данном случаев в 2 раза. Так что разница между реакциями – всегда разная, а отношение – всегда одно и тоже.

Иллюстрация – рис. 3.




Обрабатываем.

Рис. 4. Обработка ситуации 2 стандартным Вилкоксоном и ФОП-Вилкоксоном.




Ожидаемо видим, что для каждой ситуации один и тот же тест присваивает одним и тем же реакциям очень разные ранги. Думаю, это тот случай, когда «эффект бьет в глаза» и тест ранговых корреляций нет смысла проводить…

Но поскольку смоделированные реакции настолько очевидные, что все рассчитанные ранги «смотрят» в одну сторону, то статметоды с разными данными на выходе в итоге дают один и тот же результат: p-value настолько низкая, что сомневаться о выявлении достоверных различий не приходится.

То есть для очевидных ситуаций данные, представленные разными шкалами, не влияют на итоговый результат.

А если сделать ситуацию менее очевидной?

Внесем, некоторые изменения в реакции для ситуации 1 и ситуации 2.

Ситуация 3.
Понизили реакции на 3й RQ, сохранив при этом ситуационный принцип: разница в реакциях осталась равной 1. В двух сравниваемых парах RQ > CQ. В одной паре CQ>RQ.

Рис. 5 – вид смоделированных реакций.




Обрабатываем статметодами. Получаем.

Рисунок 6. – обработка ситуации 3.




Что изменилось по сравнению с ситуацией 1?
Ранги количественно не поменялись. Поменялось лишь направление одного ранга.

Статистика для стандартного Вилкоксона = 15.
Статистика для ФОП Вилкоксона = 6.

И столь разная статистика дает основание уже для разных выводов.

В таком раскладе реакций стандартный Вилкоксон уже перестает давать основание для обвинительного вывода: p-value >> 0,05 при RQ > CQ не дает оснований говорить, что реакции на контрольные и релевантные вопросы достоверно отличаются друг от друга.

Но при этом при данном раскладе реакций ФОП Вилкоксон продолжает считать, что основания для обвинения есть: p-value < 0,05, т.е. можно уверенно говорить, что при RQ > CQ реакции на RQ > статистически значимо больше реакций на CQ.


Следующая ситуация 4
Повысили реакции на 1й CQ, сохранив при этом ситуационный принцип: отношение между реакциями осталось равным 2. Но в двух сравниваемых парах RQ > CQ. В одной паре CQ>RQ.

Рис. 7. - иллюстрация для ситуации 4.






Что изменилось в обработке по сравнению с ситуацией 2?

Рис. 8. Обработка ситуации 4.



Ранги количественно не поменялись. Поменялось лишь направление одного ранга.

Статистика для стандартного Вилкоксона = 6.
Статистика для ФОП Вилкоксона = 15.

По сравнению с ситуацией 2 стандартный Вилкоксон продолжает находить основание для обвинительного вывода по данному набору реакций: p-value < 0,05, т.е. при RQ > CQ можно утверждать, что реакции на контрольные и релевантные вопросы достоверно отличаются друг от друга.

Но ФОП Вилкоксон перестает обвинять. p-value >> 0,05, т.е. можно говорить, что при RQ > CQ, ФОП Вилкоксон не видит между ними достоверных различий.


Итак, подведем итоги.
Имеем две модели реакций.




Так и хочется спросить… а визуально эти картинки как воспринимается? В обоих случаях RQ > CQ. В какую сторону душа кладётся? При визуальном анализе кого более тянет обвинять, левого или правого?

На основании изложенного можно сделать следующие выводы.
Статметоды на основании сырых параметров и ФОП-параметров дают разный результат. При оценке очевидных случаев этот разный результат не виден. Разный результат может быть увиден в неочевидных случаях.
Нужно хорошее исследование на валидность и точность. Такое, какое есть для PolyScore и OSS.


З.Ы. Очень надеюсь, что с иллюстрациями не перепутал.
Потом посмотрю - проконтролирую...

_________________
Мое почтение... $erP

................................... ЛЕГКО СОЛГАТЬ ТЯЖЕЛО
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
York



Зарегистрирован: 29.09.2010
Сообщения: 2616
Откуда: Вологда

СообщениеДобавлено: Чт Авг 13, 2020 7:32 pm    Заголовок сообщения: Ответить с цитатой

Я разделяю Ваше настороженное отношение к Соколу. Всё должно проверяться. В том числе и работа Сокола на полиграммах. В этом я совершенно с Вами согласен. Но...

$erP писал(а):

«Сдвиг» традиционно и наиболее распространенно рассматривается как разность между непосредственно измеряемыми, то есть «сырыми», параметрами.

Это, как минимум, обуславливается общими принципами построения исследования и созданием на их основе измерительного теста как ключевой исследовательской единицы: если тест регистрирует параметры, относящиеся к разным уровням зависимой переменной, то разность в уровнях зависимой переменной выражается, соответственно, в разности параметров…


Всё было бы гораздо проще и ничего не надо было бы искать, если б полиграфологи делали свои выводы на каком-нибудь одном физиологическом параметре. А они делают на трёх-четырёх разных параметрах. Что такое в этом случае сдвиг? Как определить есть ли сдвиг, если КГР имеет сдвиг в одну сторону, а сердце и лёгкие в другую?

$erP писал(а):

Обсуждаемые статметоды по любому «заточены» на оценку различия, выраженного в разнице между значениями параметров. Это видно по тому, что ранжированию подвергается именно разница между параметрами, а не отношение параметров… Даже когда статметод называется «одновыборочным», а закладываемая в него выборка сформирована вычисленными отношениями некоторых величин.

Т.н. одновыборочный статметод – он условно одновыборочный… у него только на словах на вход статметода идет одна выборка. А на самом деле он почти обычный двухвыборочный. С необходимостью стандартно рассчитывать разницу между значениями двух выборок. Просто в качестве второй выборки берутся какие то известные по ситуации значения.


Тут уже зависит от того как хочется смотреть на эти вещи. Допусти м необходимо сделать несколько замеров, как бысто бегун достигает финиша. Можно конесчно записать в выборку значения, которые показал секундомер - и это будет одна выборка. А можно записывать время старта и время финиша, и получить таким образом две выборки.

$erP писал(а):

В случае с ФОП, которая используется в Соколе, этими вторыми известными значениями являются выборка из «0». Потому что значения ФОП в случае наличия исследовательского эффекта сдвигаются относительно «0». То есть ранжируются не сами значения ФОП как таковые, а каждый раз формально вычисляемая разница (ФОП – 0). Но поскольку понятно, что такая разница совпадает со значениями самой ФОП, то никто по факту не заморачивается на вычисление этой разницы. И кажется, что ранжируются значения ФОП как таковые.


Не вижу ничего необычного в том, что медиана равна нулю. У разности: амплитуд по КГР, длин линий дыхания, спазмов, величины подъёма АД медиана тоже равна нулю.


$erP писал(а):

А вот если бы использовалась ФОП вида (Y/X)? {в скобках замечу, что для статметода, на вход которого подаются значения ФОП, вычисляемые по существующей формуле 6*(Y-X)/(Y+X) и значения ФОП, вычисляемые по формуле (Y/X), на выходе дадут один и тот же результат}, Значения ФОП (Y/X) были бы симметричны относительно «1». И надо было бы исследовать наличие сдвига значений ФОП относительно «1». И тогда без официальной операции вычитания никак нельзя было бы обойтись: потребовалось бы, как и положено для ранговых методов, для каждого значения ФОП проводить дополнительную операцию вычисления разницы между значением фактического отношения сырых параметров и случайно-теоретического: (ФОП – 1).


Функцию вида Y/X - 1 нельзя использовать. Она не симметрична относительно единицы. Она ограничена с низу и не ограничена сверху. Её область значений от -1 до бесконечности, отрицательные значения будут заключены между минус единицей и нулём, а все положительные больше нуля и до бесконечности. О каком ранжировании тут можно говорить. Ранги отрицательных величин вероятнее всего будут меньше положительных в силу особенности функции, а разность параметров симметрична относительно нуля в случае нулевой гипотезы. Я писал о требованиях к ФОП - она должна быть симметрична относительно медианы - нуля.

$erP писал(а):

Приведенный где-то по тексту пример из Холлендера о том, что в одновыборочном тесте обрабатывались данные измерения отношения массы Луны к массе Земли не совсем корректен. Не корректен в том плане, что ключевое слово в этом примере – измерение. В примере речь идет об измеренном параметре. Не вычисленном, как в ФОП, а измеренном. Сырой параметр – он измеренный параметр. .


Хоти те верьте, хотите нет. Нет такого прибора, который прямо бы "как линейкой" измерял отношение масс космических тел. Все подобные измерения являются косвенными, значения вычисляются, затем вычисляются погрешности измеренного параметра, исходя из погрешностейй приборов. Я изучал и физику и астраномию и ни разу мне не встретлось описание эксперимента, прибора или даже принципиальной возможности по прямому "на весах" взвешивания космического тела, не говоря уже об отношении масс. Если у Холлендера встретилось слово измерили - это не стоит понимать как "использовали весы".
Вот примерно так, в общих чертах, взвешивают коосмические тела:

Как взвесить Солнце

Я когда писал про закон Кеплера забыл о полуосях орбит)

Что бы "взвесить" Солнце надо измеерить время (периоды обращения) и расстояние (полуоси орбит).

$erP писал(а):

И даже измерительный прибор назван - спутник... в количестве семи штук... Сырой параметр – он измеренный параметр


Наверняка космонавты облетали Землю и Луну, замеряли параметры орбит вокруг космических тел, а из них находили отношение масс. Не выступал же спутник в качестве весов.

$erP писал(а):

Т.н. одновыборочный статметод – он условно одновыборочный… у него только на словах на вход статметода идет одна выборка. А на самом деле он почти обычный двухвыборочный


Он именно, что одновыборочный. Как в случае замера промежутков времени с помощью секундомера. А можно записывать время начала отсчёта и время окончания отсчёта - вреде бы как уже и две выборки.

$erP писал(а):

Для выборки, сформированной значениями ФОП, это правило не подходит. Это не значит, что разница между значениями ФОП не адекватно отражает исследуемое свойство. Это значит, что она может отражает его по другому, отлично от разница между сырыми параметрами, которая более адекватно соответствует цели выявления исследуемого свойству.

Таким образом, если в статметоды на вход подаются сырые параметры и параметры ФОП, то это данные, представленные в разных шкалах. Между шкалами нет прямо пропорционального соответствия. И использование данных в разных шкалах не может не приводить к получению внутри обсуждаемых статметодов разных рангов. А это, разные ранги, в свою очередь, после обработки статметодами, имеет полное право отразиться на выходе в разных статистиках и p-value, соответственно.


Со многим тут можно согласиться, но...Вы смотрите со стороны шкал, а можно посмотреть со стороны технологии теста. Маштабы могут быть разные, а результат теста один и то же. Что измениться с точки зрения результата теста, если все элементы выборки умножить на одно и тоже число? Ничего не изсенится. Результат останется прежним. Если мы применим к элементам выборки линейное преобоазование, то результат теста останется абсалютно таким же как и без преобразования. Вот вариационный ряд:

1 3 4 7 8

Умножим каждый его элемент, например на десять

10 30 40 70 80

Ранги, которые будут присвоены элементам этих рядов останутся прежними, а значит результат теста будет тот же.

Бог с ней с ФОП вида {Х-Y}/{X+Y}. Как Вы и предрекли я от неё отказался, так какединственная причина была её использовать - близость к баллам. Но так как именно эта её особенность вызвала "бурю", то я её слегка модифицировал - сделал линейное преобразование и теперь результаты тестов для отдельного сырого параметра полностью совпадают с результатами теста ФОП.

"Старая" ФОП умножала каждый элемент выорки на своё число, но все эти числа были близки и достаточно маленькими поэтому результаты теста (вычичляемый p - value) хоть и могли слегка разниться, но не часто. Умножим элементы выборки на 1.01, 1.03, 1.02, 1.04, 1,02. Получим

1.01 3.09 4.08 7.28 8.16

Ранги присваемые элементам выборки отстанутся прежними и результат теста останется прежним.

Я специально тупо перебирал десятки полиграмм и смотрел есть ли какая существенная разница в теста (потерял столько времени из-за близости к баллам, будь они неладны Very Happy )х Существенной разницы не было! Тот пример который я дал в своём сообщении является воопиющим.

Теперь же с теми ФОП, которые я включил в Сокол, результаты тестов полностью идентичны результатам тестов с сырыми параметрами.

_________________
http://skl-ol.ru


Последний раз редактировалось: York (Пт Авг 14, 2020 6:48 pm), всего редактировалось 6 раз(а)
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
York



Зарегистрирован: 29.09.2010
Сообщения: 2616
Откуда: Вологда

СообщениеДобавлено: Чт Авг 13, 2020 9:15 pm    Заголовок сообщения: Ответить с цитатой

$erP писал(а):

Смоделируем реакции. И поскольку реальные реакции смоделировать очень сложно, сделаем это искусственно вручную… на числах…


Моделирование это хорошо. но тут необходимо стохастическое моделирование, чтобы сделать стоящий того вывод. Вы подобрали числа и у Вас получилмсь ситуации которые никогда не реализуются в действительноси. Например в реальности никогда не будет такого, что при измерении непрерывных величин всем элементам выборки будет присвоен один ранг. Такую выборку необходимо будет тут же забраковать.



Если в результате измерений получены одинаковые ранги для все выборки, то используемые приборы надо выкинуть, или кому-то оторвать кривые руки Very Happy

Для тестов допустимо небольшое количество связок (совпадение рангов), большое их количество сильно исказить результат, но вот так что бы все! Так не бывает.

Вторая причина по которой Ваши примеры неубедительны - это масштабы, которые вы использовали. Я уже писал, что если элементы выборки умножать на маленьке числа, то это либо ни чегог не изменить в результате теста или внесёт минимальные изменения. Вы использовали единицы, а масштабы полиграмм это сотни и тысячи. То есть разность сырых параметров умножается на числа порядка 0.01 и 0.001. Именно по причине масштабав, перебрав десятки полиграмм, не увидел существенного расходения с результатами тестов для сырых параметров. Уверяю Вас, что я бы не стал использовать такого вида ФОП если б увидел существенные расхождения. По простой причине - можно сделать линейное преобразование (которое сводится к умножению на постоянное число) и результаты будут абсолютно идентичны.

$erP писал(а):

Статметоды на основании сырых параметров и ФОП-параметров дают разный результат. При оценке очевидных случаев этот разный результат не виден. Разный результат может быть увиден в неочевидных случаях.
Нужно хорошее исследование на валидность и точность. Такое, какое есть для PolyScore и OSS.


Уберите из старой ФОП деление на сумму параметров, умножте её на любое постоянное число и увидите, что разница в результатах тестов исчезнет.

В принципе Ваши аргументы понятны и вообщем верны, но масштаб измеряемых величин делает их несостоятельными. А для линейного преобразования и масштаб данных не играет роли. Провести корректировку ФОП очень просто - достаточно поделить элемент выборки на среднее выборочное, или среднее квадратичное. При этом результаты на полиграммых будут мало отличимы от резкльтатов старой ФОП и при этом абсолютно идентичны тестам с сырыми параметрами. Это я проверил на практике.

_________________
http://skl-ol.ru
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
York



Зарегистрирован: 29.09.2010
Сообщения: 2616
Откуда: Вологда

СообщениеДобавлено: Чт Авг 13, 2020 9:47 pm    Заголовок сообщения: Ответить с цитатой

Я сам проблему теста Вилкосона вижу в другом. Объеденяя через ФОП параметры реакций разной физиологии, мы почти наверняка объединяем в выборку случайные величины из разных генеральных совокупностей У того же Холендера чёрным по белому написано, что "..каждое Z извлечено из непрерывной и симметричной относительно Q совокупности..." - это для ФОП выполняется - это то условие, которе не позволяет использовать ФОП вида Х/Y - 1, Q - медиана равная нулю. И далее '..возможно, что разные Z извлечены из разных совокупностей)' - это тоже выполняется, но вот как это может сказаться на мощности теста не ясно (хотя катастрофы точно не должно быть, уж Холлендер бы об этом сообщил). Поэтому нужно было найти ещё один тест, который можно было бы использовать параллельно - это Перестановочный критерий. Сйчас мне известна ФОП, которая даёт длч всех физиологичесих параметров случайные величины из одного распределения при нулевой гипотезе. Но будет ли она работать лучше или хуже можно выяснить только на практике.
_________________
http://skl-ol.ru
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
York



Зарегистрирован: 29.09.2010
Сообщения: 2616
Откуда: Вологда

СообщениеДобавлено: Пт Авг 14, 2020 6:23 pm    Заголовок сообщения: Ответить с цитатой

$erP писал(а):

С новым видом ФОП еще придется разбираться... очень интересная идея...


Да ФОП очень интересная и её надо исследовать. Что я и сделал. Результаты оформил в виде статьи, а то обязательно затеряются и забуду про них. Надеюсь, что тем кому интересно разберутся, и оценят результаты.


http://www.ld.eposgroup.ru/forum/viewtopic.php?p=89553#89553

_________________
http://skl-ol.ru


Последний раз редактировалось: York (Пн Авг 17, 2020 4:55 pm), всего редактировалось 2 раз(а)
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
Александр Калафати



Зарегистрирован: 12.10.2011
Сообщения: 1852
Откуда: Москва

СообщениеДобавлено: Пт Авг 14, 2020 11:36 pm    Заголовок сообщения: Ответить с цитатой

Юрий, а давайте проверим.
Есть 100 подтвержденных случаев. Есть баллы из 3 обсчетов данного массива. На самом деле даже больше, т.к. были те, которые начинал присылать, но останавливались.

Хотя, если нас не интересует сила разницы, то это очень напоминает 3хбалку. -1 0 +1

_________________
Быть, а не казаться.
http://polygraph-triumph.ru/
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Посетить сайт автора
York



Зарегистрирован: 29.09.2010
Сообщения: 2616
Откуда: Вологда

СообщениеДобавлено: Сб Авг 15, 2020 12:18 am    Заголовок сообщения: Ответить с цитатой

Александр Калафати писал(а):
Юрий, а давайте проверим.
Есть 100 подтвержденных случаев. Есть баллы из 3 обсчетов данного массива. На самом деле даже больше, т.к. были те, которые начинал присылать, но останавливались.


Проверить это хорошо. Но Вы пишите про баллы. В Сокол нужно вводить метрику. Метрика есть?

Александр Калафати писал(а):

Хотя, если нас не интересует сила разницы, то это очень напоминает 3хбалку. -1 0 +1


Наверное так и есть, но программа учтёт малейшую разницу, если она стабильна по всем парам сравнения, что человек на глаз не сможет. Насколько эффективней это будет не ясно. Но хоть и малейшие, но стабильные реакции во всех парах сравнения, по любому параметру это мощный признак свидетельствующий в пользу альтернативы. К тому же программа выдаст p-value в валидности которого можно не сомневаться.

А силу разницы, как я надеяюсь, должна учитывать другая ФОП, но пока я её не анализировал, но то что она менее склонна учитывать контренд к КГР по дыханию и ФПГ это легко увидеть на глаз, перебирая данные полиграмм. Это примерно как известный факт - КГР чаще получает максимальные баллы чем дыхание и ФПГ и поэтому когда они находятся в контретренде к КГР, например если тренд по КГР положительный, то их отрицательные баллы отрицательные баллы окажут меньшее влиянте на конечный результат. Это то что отмечал Serp: "...маленькие вектора, от которых ничего не зависит.."

Я завтра-послезавтра намернен отснят видио, где в ускоренном режиме предоставлю возможность сравнить результаты работы трёх ФОП на 20 - 30 полиграммах. Так что можно будет посмотреть и сравнить.

_________________
http://skl-ol.ru
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
Александр Калафати



Зарегистрирован: 12.10.2011
Сообщения: 1852
Откуда: Москва

СообщениеДобавлено: Сб Авг 15, 2020 2:59 pm    Заголовок сообщения: Ответить с цитатой

В метрику сложнее. Полиграммы в пдф формате. Теоретически можно их перевести в мм. Иди иные условные единицы.
Хочем?

_________________
Быть, а не казаться.
http://polygraph-triumph.ru/
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Посетить сайт автора
$erP
Site Admin


Зарегистрирован: 29.06.2005
Сообщения: 7865
Откуда: Москва

СообщениеДобавлено: Сб Авг 15, 2020 8:31 pm    Заголовок сообщения: Ответить с цитатой

Не вопрос оцифровать КГР и мнж... Дыхание - ???
_________________
Мое почтение... $erP

................................... ЛЕГКО СОЛГАТЬ ТЯЖЕЛО
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
Александр Калафати



Зарегистрирован: 12.10.2011
Сообщения: 1852
Откуда: Москва

СообщениеДобавлено: Вс Авг 16, 2020 8:52 am    Заголовок сообщения: Ответить с цитатой

Курвиметр
_________________
Быть, а не казаться.
http://polygraph-triumph.ru/
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Посетить сайт автора
York



Зарегистрирован: 29.09.2010
Сообщения: 2616
Откуда: Вологда

СообщениеДобавлено: Вс Авг 16, 2020 10:39 am    Заголовок сообщения: Ответить с цитатой

Александр Калафати писал(а):
Курвиметр


Чтобы оценить перспективу и достижимость цели, два вопроса:

1) У Вас имеется опыт такой оцифровки полиграмм? Потому что, если имеется Вы можете сказать сколько на это уходит времени и даёт ли это приемлемую точность. Если подобного опыта нет, то это всё надо будет выяснить практическим путём, хотя бы на одной полиграмме.

2) Как Вы представляете организацию этого процесса?

_________________
http://skl-ol.ru
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
Александр Калафати



Зарегистрирован: 12.10.2011
Сообщения: 1852
Откуда: Москва

СообщениеДобавлено: Вс Авг 16, 2020 11:23 am    Заголовок сообщения: Ответить с цитатой

1) Опыта нет
2) пока никак, надо попробовать и посмотреть.

_________________
Быть, а не казаться.
http://polygraph-triumph.ru/
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Посетить сайт автора
$erP
Site Admin


Зарегистрирован: 29.06.2005
Сообщения: 7865
Откуда: Москва

СообщениеДобавлено: Вс Авг 16, 2020 1:35 pm    Заголовок сообщения: Ответить с цитатой

Организация проста...
Полиграммы распределяются среди волонтеров... и они занимаются...
Сложность -
1) выдержать единый масштаб измерений...
2) дыхание... кажется что курвиметр не очень удобен для следования за такими перегибами...

В принципе... 20 лет назад чел, который первый наткнулся на статью Крэпола об объктивном методе измерения... пробовал это делать... и, с его слов, у него это получалось...

_________________
Мое почтение... $erP

................................... ЛЕГКО СОЛГАТЬ ТЯЖЕЛО
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
Показать сообщения:   
Начать новую тему   Ответить на тему    Список форумов ПОЛИГРАФ - ФОРУМ -> Общий форум Часовой пояс: GMT + 3
На страницу Пред.  1, 2, 3 ... 10, 11, 12 ... 19, 20, 21  След.
Страница 11 из 21

 
Перейти:  
Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах
You cannot attach files in this forum
You cannot download files in this forum


Powered by phpBB © 2001, 2005 phpBB Group
Рейтинг@Mail.ru Rambler's Top100