Список форумов ПОЛИГРАФ - ФОРУМ ПОЛИГРАФ - ФОРУМ
Для общения по теме " Детекция лжи "
 
  На главную FAQFAQ   ПоискПоиск   ПользователиПользователи   ГруппыГруппы   РегистрацияРегистрация 
 ПрофильПрофиль   Войти и проверить личные сообщенияВойти и проверить личные сообщения   ВходВход 

Сокол НТФП
На страницу Пред.  1, 2, 3 ... 9, 10, 11 ... 19, 20, 21  След.
 
Начать новую тему   Ответить на тему    Список форумов ПОЛИГРАФ - ФОРУМ -> Общий форум
Предыдущая тема :: Следующая тема  
Автор Сообщение
York



Зарегистрирован: 29.09.2010
Сообщения: 2621
Откуда: Вологда

СообщениеДобавлено: Пт Авг 07, 2020 2:24 pm    Заголовок сообщения: Ответить с цитатой

$erP писал(а):

Длина линии дыхания (далее ДЛЛ) - очень жесткий параметр в плане своей изменчивости. Если для случая КГР легко найти или представить соотношение амплитуд 3:1... 4:1... 10:1... то для дыхания такие соотношения нереальны... Даже если человек не будет дышать несколько секунд, то это не значит, что параметр ДЛЛ превращается в ноль.


Ситуация с изменчивостью в определённой доле сглаживается выставляемыми баллами. Для соотношения КГР 3:1, 5:1, 10:1 будет выставлен один и тот же балл. ФОП - это ограниченная функция поэтому она так же сглаживает ситуацию с изменчивостью.

1:3

6*(3-1)/(3+1)= 6* 2/4 = 3

1:5

6*(5-1)/(5+1)=6*4/6 = 4

1:10

6*(10-1)/(10+1) = 6*9/11 = 4.9

1:100

6*(100-1)/(100+1) = 6*99/100 = 5,4

Баллы равные 3 встречаются относительно редко, а значения ФОП большие 3 и тем более 4 ещё реже. Потолком ФОП можно сделать не 6, а 3 (или 4), но тогда разница между баллами и ФОП в области типичных значений будет более существенна. Если одновременно менять коэффициенты у ФОП для всех параметров, то результаты тестов останутся неизменны. Можно вовсе коэффициент убрать, т.е. положить его равным единице.

Основным ориентиром для меня при написании этого варианта программы были баллы 7-ми позиционной системы, то как они выставляются полиграфологом. По каждому параметру балл выставляется в диапазоне от -3 до +3. В этом можно сказать и состоит моё личное представление, которое зашито в ФОП. Но опять же назвать его только моим я не берусь. Сами баллы - это дискретные случайные числа. С ними можно провести разве, что тест знаков. Поэтому нужна была непрерывная функция, но являющаяся аналогом дискретных баллов. Известно, что максимальные баллы по дыханию и ФПГ выставляются полиграфологами реже, чем по КГР. И ФОП чаще принимает значения большие по КГР, чем по дыханию и ФПГ. Поэтому не удивительно, что компоненты вектора по дыханию и ФПГ должны быть чаще короче чем компонента по КГР.

На данный момент мне никто не сообщал, что не согласен с тем как выставила баллы программа, не приводил пример полиграммы где было бы очевидна катастрофическая разница между баллами эксперта и баллами программы. Поэтому я надеюсь, что и ФОП определяется адекватно экспертным оценкам.

_________________
http://skl-ol.ru
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
$erP
Site Admin


Зарегистрирован: 29.06.2005
Сообщения: 7865
Откуда: Москва

СообщениеДобавлено: Пт Авг 07, 2020 3:28 pm    Заголовок сообщения: Ответить с цитатой

York, спасибо за ответы...

York писал(а):
Хочу подчернуть, что я не пзиционировал "Сокол" как законченный программный продукт, а как скорее как исследовательский проект, поэтому все замечания, критика, информация способствующая развитию т.д. и т.п. приветсвуются.

Собственно, поэтому и есть повод и для обсуждения... может даже и немного для дискуссии... Извините, что приходится отрывать от дел...

Многое кажется или спорным, или не корректным... При наличии критериальной валидности - то есть результатов испытаний - по большому счету, какая была бы разница, почему всё хорошо работает... если все хорошо работает... Но пока ее нет - спорные или кажущиеся некорректными моменты во-первых, представляются как ухудшающими результат... во-вторых, автоматом апроксимируется на результат работы менее понятных статметодов... кои появляются как грибы после дождя...

_________________
Мое почтение... $erP

................................... ЛЕГКО СОЛГАТЬ ТЯЖЕЛО
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
York



Зарегистрирован: 29.09.2010
Сообщения: 2621
Откуда: Вологда

СообщениеДобавлено: Пт Авг 07, 2020 3:45 pm    Заголовок сообщения: Ответить с цитатой

$erP

Спасибо за критику, за сомнения, за указание на слабые места. Без этого нельзя. И лучше критика, чем "глас вопиющего в пустыне". Критика заставляет ещё раз всё продумать, проверить, осмыслить и т.д. и т.п.

$erP писал(а):

...При наличии критериальной валидности - то есть результатов испытаний - по большому счету, какая была бы разница, почему всё хорошо работает... если все хорошо работает...


Надеюсь, что кто - нибудь из полиграфологов заинтересуется и окажет содействие своими полиграммами, их оценкой Соколом. Особенно это касается подтверждённых случаев. А если все результаты будут основаны исключительно на моих полиграммах вполне закономерной реакцией будет недоверие.


$erP писал(а):

во-вторых, автоматом апроксимируется на результат работы менее понятных статметодов... кои появляются как грибы после дождя...


Появление разных тестов причиной имеет не только изучение их, но и тот факт, что если результаты их имеют хорошую корреляцию, то это тоже является указанием на их правильную работу.

_________________
http://skl-ol.ru
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
York



Зарегистрирован: 29.09.2010
Сообщения: 2621
Откуда: Вологда

СообщениеДобавлено: Пт Авг 07, 2020 9:21 pm    Заголовок сообщения: Ответить с цитатой

****ранее тут был написан бред Very Happy я видимо почти спал когда писал***

Я забыл сказать ещё об одной важной детали в свете проведённого обсуждения. Я сравнивал результаты одновыборочног теста Вилкоксона с голыми разностями реакций (это когда берётся разность параметров реакций из сравниваемой пары) с результатами одновыборочного теста Вилкоксона в котором в качестве случайной величины выступала ФОП, полученная из параметров реакций . Сейчас проделал то же самое на десятке полиграмм. И получил то же самое, что и ранее. Результаты по вычислению альтернативы полностью совпадают (а иного и быть не может), р-value разнятся незначительно. Так что результаты практически одинаковые, а для целей классификации можно считать, что одни и те же. На скриншоте показан пример наиболее сильного рассхождения в значениях p-value.

Пример



Внизу альтернатива и p-value для дыхания, КГР, ФПГ (сверху вниз)

_________________
http://skl-ol.ru


Последний раз редактировалось: York (Ср Авг 12, 2020 3:54 pm), всего редактировалось 1 раз
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
York



Зарегистрирован: 29.09.2010
Сообщения: 2621
Откуда: Вологда

СообщениеДобавлено: Сб Авг 08, 2020 11:28 am    Заголовок сообщения: Ответить с цитатой

$erP писал(а):

В любом случае, мне очень кажется, что применение стат. методов для зависимых выборок является очень не очевидным и требующим тщательного доказывания.
С критериями для независимых выборок было бы, кажется, проще. Например, направленный критерий Манна - Уитни... Для "рядов" вообще идеально подходит...

В общем, по моему личному мнению, с конструктной валидностью у Сокола не все так просто: одно лишь применение известных и описанных стат. методов еще не значит, что все правильно и понятно.

И этот вывод сделан только по отношению к достаточно простому и хорошо известному Вилкоксону. А в программе накапливаются и накапливаются такие методы, названия которых известны лишь посвященным... и найти их описание надо еще постараться… не говоря уже о том, чтобы понять, как они работают… и работают ли в области анализа данных, зарегистрированных на полиграфе…

Но во всем этом есть смысл: «Такому нелегальному использованию статистики может быть дано известное прагматическое оправдание; во многих случаях оно приводит к плодотворным результатам» (Стивенс С., 1960, разработчик измерительных шкал)


Раз существуют сомнения в отношении конструктной валидности у Сокола, то отмахиваться от этого нельзя и действительно надо разобраться, чтобы не оставалось недомолвок и недопонимания.

$erP писал(а):

2) Измеряемые наблюдения X(i) и Y(i) должны быть зависимы (Холлендер, Вульф «Непараметрические методы», стр. 50 и проч.). Обычно эта зависимость проявляется в том, что два раза производится измерение одного и того же параметра до и после какого-либо воздействия на объект.


В первую очередь необходимо разобраться с понятиями зависимости-независимости. В статистике понятие независимости-зависимости употребляется в двух вариантах. В условно первом говорят о зависимости-независимости выборок. Но я думаю, что это не совсем удачное употребление этого слова в данной ситуации. Свидетельством тому служат множество слов, которые так же употребляют в такой ситуации для описания выборок: парные, связные, сопоставленные. Зачем придумывать слова, если уже есть, то которое точно описывает ситуацию. Но дело в том, что оно (зависимые-независимые) уже занято, имеет строгое математическое определение и на практическом уровне описывает другую ситуацию. О ней я напишу ниже.

Независимыми называют выборки, если измерения производились на на объектах разных групп. Как получить независимые выборки в случае детекции лжи? Возьмём две группы опрашиваемых. В одной группе каждому мы зададим по одному контрольному вопросу и замерим, например изменение давления после ответа на вопрос. Второй группе зададим по проверочному вопросу и так же измерим изменение давления. Таким образом мы получим две независимые выборки. Для независимых выборок существуют свои статистические тесты для того, чтобы выяснить имеется ли разница в изменении давления после ответа на вопрос у тех, кому задавали контрольные по сравнению с теми, кому задавали проверочные. Может фактически разницы и нет, а вся вариативность в данных проистекает из несистематических действующих факторов, и постоянная составляющая в них отсутствует?

Зависимыми называют выборки, если измерения производились на одних и тех же объектах до обработки (воздействия) и после. У нас есть одна группа опрашиваемых и каждому мы сначала задали по контрольному вопросу и замерили давление. А затем каждому из этой группы мы задали по проверочному вопросу и снова измерили давление. Таким образом мы получили две зависимые или связные выборки. Для таких выборок существуют свои стат. тесты, чтобы определить был ли какой-то эффект от воздействия разными типами вопросов. Действительно ли у людей давление после проверочного вопроса изменяется сильнее чем после контрольного? В частности, для такой ситуации подходит двух выборочный тест Вилкоксона.

Такие ситуации характерны, например, для медицины. Таким образом проверяют эффективность лекарств. В книге Холлендера и Вульфа всё изложение построено на примерах и таких типичных ситуациях и из медицины в том числе. В чём разница медицинских примеров с детекцией лжи? В том, что те параметры, которые замеряют исследователи медики имеют малую вариативность. «Медицинское» давление изменяется очень медленно, не скачет, измерять дважды- трижды не имеет смысла – покажет почти то же самое. А погрешность измерения роли почти не играет. В детекции же лжи все параметры имеют большую вариативность. То же изменение давления на один и тот же вопрос имеет большой разброс. Поэтому для того, чтобы выяснить действительно ли у одного и того же человека давление изменяется сильнее на проверочный вопрос, необходимо задать пары вопросов несколько раз. В результате мы получим парные измерения. Мы можем составить из них разность, которая образует случайную величину со значениями равными:

Z(i) = X(i) – Y(i), где X(i) и Y(i) – изменение давления на контрольный и проверочный вопрос соответственно.

Как же выяснить сильнее меняется давление на проверочный вопрос, на контрольный вопрос или одинаково, т.е. эффекта не присутствует, а вся вариативность обеспечивается несистематическими, неконтролируемыми факторами? У нас имеется выборка случайной величины Z(i), измерения произведены на одном и том же объекте (хотя это уже не суть важно – выборка «обезличивается» и речь идёт уже просто о случайной величине). Выборки мала – как правило в ней от 5 до 10 элементов. Закон распределения её нам не известен, параметры распределения соответственно тоже, и в силу малости выборки мы установить его и проверить не может. Если б у нас было несколько десятков замеров, то тогда допустило было бы воспользоваться параметрическими методами, t- критерием Стьюдента, в частности. Но выборка крайне мала. Поэтому мы должны обратиться к непараметрическим методам, свободным от распределения.

Далее необходимо подумать о свойствах полученной выборки Z(i), в случае если эффект от типа вопросов отсутствует. Вы этом случае, при отсутствии систематического фактора, превышение изменения давления на контрольный вопрос X(i) над изменением давления на проверочный вопрос Y(i) будет происходить с той же вероятностью, что и превышение Y(i) над X(I). Т.е. это будет происходить с вероятностью 0,5 (50%). А это значит, что случайная величина Z c вероятностью 0,5 будет принимать значение большее нуля, и с вероятностью 0,5 меньшее нуля. А это значит, что медиана этой случайной величины равна нулю (это следует из определения медианы). Таким образом по имеющейся выборке нам необходимо проверить равенство нулю медианы случайной величины Z. Для этого существует одновыборочный тест Вилкоксона, который и используется в Соколе.

Двухвыбророчный тест и одновыборочный тесты Вилкоксона похожи, разница в том, что в первом случае измерения проводятся на разных объектах (и выборки должны быть зависимы- связны), а во втором случае измерения могут быть проведены на одном объекте.

Собственно говоря про двухвыборочный и одновыборочный тесты Вилкоксона у Холендера, Вульфа написано в начале Главы 3 и в параграфе 3.7.

В параграфе говорится следующее: "Отметим, что допущение A1, с обработкой повторных парных наблюдений с помощью статситики знаковых рангов, не является обязательным для одной выборки, поскольку её данные - вовсе не разноасти парных наблюдений"

"Не разности парных наблюдений" - необходимо понимать, как наблюдения снятые не с разных объектов, не путать с разностями сянтых с одного объекта.

В приведённом в параграфе примере космонавты делали несколько замеров на одном и том же объекте - системе космических тел Земля - Луна (и замеряют отношение масс, не разность)

Я думаю, что мы должны избавиться от путанницы связанной с двухвыборочным и одновыборочным тестом Вилкоксона.

$erP писал(а):

]3) Все n наблюдений {Y(i) - X(i)} должна быть взаимно независима друг от друга (Холлендер, Вульф «Непараметрические методы», стр. 51).

Перейду ко второму пониманию зависимости-независимости. Для начала я просмотрел стр. 51 у Холлендера, Вульфа, для того чтобы понять контекст употребления термина «независимость», но не нашёл ничего.
Если речь идёт о случайных величинах, то их независимость определяется так: «Случайная величина Y является независимой от случайной величины Х, если её закон распределения не зависит от того какие значения принимает случайная величина Х».
В случае измерения какого- либо параметра все значения Y(i) рассматривают как независимые случайные величины с одним и тем же законом распределения. Но это всё голая математика. На практике же это означает, что на измерение Y(i) не должно влиять значение уже измеренной случайной величины Y(i-1).

Допустим проводят измерение температуры у больных неисправным градусником, или плохо стряхивают его. И получается так, что если у первого больного реальная температура выше, чем у второго, то при последующем измерении у второго (после первого) покажет температуру ещё большую чем у первого. Т.е. значение замеренной температуры у второго будет зависеть от значения температуры первого. И произведённые замеры не являются независимыми.
В детекции лжи независимость измерений обеспечивается исправностью аппаратуры и промежутком времени между вопросами, в ходе которого физиология человека возвращается в базовое состояние.

_________________
http://skl-ol.ru


Последний раз редактировалось: York (Сб Авг 08, 2020 4:44 pm), всего редактировалось 9 раз(а)
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
York



Зарегистрирован: 29.09.2010
Сообщения: 2621
Откуда: Вологда

СообщениеДобавлено: Сб Авг 08, 2020 1:31 pm    Заголовок сообщения: Ответить с цитатой

York писал(а):
$erP писал(а):

Для дальнейшего разговора еще раз кратко выражу свое понимание работы Сокола.

Оценка полиграмм Соколом происходит по схеме:

1) Берутся данные полиграмм...
2) York их оценивает и выставляет баллы с помощью изобретенной им формулы, которая называется ФОП...
3) Эти баллы обрабатываются статметодами...
4) Статметоды показывают, насколько хорошо York с помощью ФОП оценил полиграммы...

ФОП - функция оценки полиграмм, самоговорящее название. Именно на этом этапе, по сути, и происходит оценка полиграмм. Дальнейшее - это обработка того, как произошла оценка полиграмм.
Поэтому полученный результат зависит, прежде всего, от того, насколько хорошо York оценил полиграммы с помощью ФОП. Если ФОП плохая, то у самой хорошей полиграммы есть все шансы показать плохой результат.
На вопросы "Почему Вы изобрели именно такую ФОП и проверяли ли Вы правильность ее работы?" должны, в конечном итоге, иметься ответы.


$erP, извините, но это упрощение или даже утрирование, которое целиком уничтожает смысл. И что значит ФОП плохая? От чего она может стать плохой?

ФОП - это случайная величина, образованная из других случайных величин - параметров реакций. Требования предъявляемые к ней я описал. Единственный произвол - это коэффициенты. Но нет никакой теории ни математической, ни физиологической, ни психологической из которой следовал бы однозначный выбор коэффициентов. Они могут быть получены только результатом определённого подбора. Поэтому я ориентировался на присваиваемые баллы.


Теперь можно перейти к сути ФОП. Наверное, название не удачное и заставляет думать не о том, чем является эта функция. Но назвать её непрерывными баллами было нельзя. Баллы потому и баллы, что они дискретны. Но с помощью баллов производится оценка полиграммы, и так как значения ФОП близки к типичным значениям баллов программы, поэтому она и была названа ФОП.
Итак, у нас есть выборка случайной величины, полученная разностью парных замеров, произведённых на одном и том же объекте. В случае истинности нулевой гипотезы эта случайная величина имеет медиану равную нулю и имеет симметричное распределение:

Z = (X – Y) - разность сырых параметров

Теперь составим другую случайную величину:

ФОП = (X - Y)/(X + Y) = Z/(X+Y)

Что мы можем о ней сказать? Если Z – разность параметров, то ФОП это относительная разность параметров. Она является безразмерной величиной. Знаменатель её всегда положительная величина и поэтому не влияет на знак функции. Знак её определяется знаком числителя, т.е. всегда совпадает со знаком разности параметров Z. Нетрудно видеть, что в случае истинности нулевой гипотезы для Z медиана ФОП так же будет равна нулю как и медиана Z. В случае, если для Z не выполняется нулевая гипотеза, а будет является справедливой альтернатива, то и для ФОП это будет справедливо. Коме того так как знак ФОП всегда совпадает со знаком Z, то и знак медианы у обоих случайных величин будет совпадать. А это значит, что вычисляемая альтернатива для обоих величин всегда будет совпадать. Подведу итоги:

1) Для Z и ФОП нулевая гипотеза справедлива одновременно;
2) Для Z и ФОП альтернативная гипотеза справедлива одновременно, причём альтернативные гипотезы всегда совпадают;
3) Медианы обеих случайных величин равны нулю;
4) Обе случайные величины имеют симметричное распределение относительно медианы - в случае справедливости нулевой гипотезы;
5) ФОП безразмерная случайная величина;
6) ФОП все физиологические параметры приводит к одному масштабу;
7) ФОП удовлетворяет критериям, которые предъявляются к случайной величине для проведения непараметрических тестов.


Вывод; если тест покажет, что выборка сделанная из ФОП соответствует нулевой гипотезе (медиана равна нулю), то же самое будет справедливо и для Z – разности сырых параметров. И наоборот, если для ФОП выполняется альтернатива С > П, то и для Z будет справедлива та же альтернатива C > П. И если для ФОП выполняется альтернатива П > C, то и для Z справедливо то же самое.
В этом заключается смысл ФОП, а не в оценке полиграммы, не смотря на название. 6 – ка подобрана для близости к баллам. Умножение ФОП на любое число одновременно для всех параметров не изменит результатов тестов, так как порядок вариационного ряда не изменится, не изменятся значения рангов, а значит и значения наблюдаемой статистики в тесте Вилкоксона.

Я надеюсь, что в достаточной мере обосновал конструктную валидность Сокола?

_________________
http://skl-ol.ru


Последний раз редактировалось: York (Сб Авг 08, 2020 2:48 pm), всего редактировалось 1 раз
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
York



Зарегистрирован: 29.09.2010
Сообщения: 2621
Откуда: Вологда

СообщениеДобавлено: Сб Авг 08, 2020 2:39 pm    Заголовок сообщения: Ответить с цитатой

Не смотря на то, что в целях классификации (диагностики) разность парамеров можно заменить на ФОП, есть пара технических моментов, которые требуют своего разрешения и соответственно времени. Один из них отражён в этом сообщении

http://ld.eposgroup.ru/forum/viewtopic.php?p=89519#89519

Надо выделить, что эти моменты не связанны с конструктной валидностью, а связаны с самими статистическими тестами. Тест Вилкоксона пребразует подаваемые ему на вход случайные величины в другую случайную величину - статистику теста, на основе которой уже можно принять решение, сделать выбор из нулевой и альтернативной гипотезы. Преобразование осуществляется через ранжирование, которое съедает часть информации содержащейся в выборке. Но об этом я напишу позже.

_________________
http://skl-ol.ru
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
York



Зарегистрирован: 29.09.2010
Сообщения: 2621
Откуда: Вологда

СообщениеДобавлено: Вс Авг 09, 2020 11:03 am    Заголовок сообщения: Ответить с цитатой

York писал(а):
$erP спасибо!


$erP писал(а):
То есть вместо Вилкоксоновского первого шага Z(i) = X(i) - Y(i) Вы используете формулу Z(i) = 6*{X(i) - Y(i)}/{X(i) + Y(i)}. Согласитесь, что Вилкоксон бы немного удивился от такой замены.


Не соглашусь. Тервер и матстат изучают своийства и работают со случайными величинами. Им нет никакого дела до происхождения случайных величин. Получены ли они измерением каких-либо физических величин, или путём комбинации других случайных величин - для математики неважно. Разность двух случайных величин - это случайная величина. Сумма двух случайных величин - это случайная величина. Частное двух случайных величин - это случайная величина. Умножение случайной величины на число - это случайная величина. Поэтому ФОП - это равноправная случайная велична, обладающая всеми свойствами случайных величин, и к которой применимы все теоремы теорвера и матстат, на основе которых созданы статсистические тесты.

Кроме того есть два варианта теста Вилкоксона: двухвыборочный (для него нужны две случайные величины из значений которых составляются разности z = x-y) и одновыборочный (только одна случайная величины, разности из двух составлять не надо)

$erP писал(а):

По стандарту входными данными в, например, критерий Вилкоксона являются сырые параметры реакций по двум зависимым выборкам и разница между ними: Z(i) = X(i) - Y(i).


Нет такого стандарта. На вход подаются значения случайных величин. Они могут быть сырыми параметрами, а могут быть их комбинацией. Главное, чтобы они были случайными величинами.


С целью лигиматизации ФОП должен подкрепить свои слова примером. Сошлюсь на того же Холлендера, Вульфа с примером про космонавтов из Главы 3 параграф 3.7. Они измеряли отношение масы Земли к массе Луны. Как можно измерить это отношение масс? Взвесить Луну, Землю и поделить? Взвесить весами космическое тело невозможно. Необходимо придумать способ, в ходе которого измерялись бы некоторые параметры, из которых можно было бы вычислить требуемую характеристику.

Космонавты производили измерения некоторых физических величин - получали выборку сырых парамтров. Затем с помощью некоторых формул вычисляли отношение масс космических тел. Т.е. из первоначальных случайных величин, применяя некоторе формулы получали другие случайные величины. А уже их подавали на вход стат. теста Вилкоксона.

Я не знаю технологию измерений, которые использовали космонавты, но могу предположить принципиальную возможность получения требуемого отношение масс космичеких тел. Для этого можно воспользоваться законом Кеплера, который гласит, что отношение кубов периодов обращения двух космических тел равно обратному отношению квадратов их масс. Т.е. для того чтобы измерить отношение масс надо измерить другие сырые параметры - периоды обращения, а на вход стат. тестов подавать уже полученные с помощью формул другие случайные величины - отношения масс.

_________________
http://skl-ol.ru
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
Александр Калафати



Зарегистрирован: 12.10.2011
Сообщения: 1852
Откуда: Москва

СообщениеДобавлено: Вс Авг 09, 2020 5:19 pm    Заголовок сообщения: Ответить с цитатой

Насколько я понял:

1. Делить на сумму (Х + Y) решили, чтобы ввести поправку и предел функции не убегал в бесконечность. А так, проведя линейное преобразование, его можно было ограничить до (+-1).
2. Дальше с помощью константы подобрали значения баллов.
3. Остаётся вопрос как подобраны весовые коэффициенты. По ЭДА Вы немного описали. А как подбирали соотношения по ДЛД, манжете спазму? какие соотношения амплитуд\спазмов приводят к тому, что ПО выставляет балл?
4. Есть исследования подобных соотношений, проведенных при разработке систем OSS, OSS2 нужны ли они Вам?
5. Учитываете ли Вы особенности отечественной техники ( например проблемы с АД у линейки "диагноз"), какой канал для оценки ЭДА/КГР используете с ручной центровкой или с автоматической?

_________________
Быть, а не казаться.
http://polygraph-triumph.ru/
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Посетить сайт автора
York



Зарегистрирован: 29.09.2010
Сообщения: 2621
Откуда: Вологда

СообщениеДобавлено: Пн Авг 10, 2020 1:16 am    Заголовок сообщения: Ответить с цитатой

Александр Калафати писал(а):
Насколько я понял:

1. Делить на сумму (Х + Y) решили, чтобы ввести поправку и предел функции не убегал в бесконечность...


Это одна из причин.

Александр Калафати писал(а):

1. А так, проведя линейное преобразование, его можно было ограничить до (+-1).


Не совссем понял про какое линейное преобразование Вы говорите, про какое - то другое? Вообще тут не каждое линейное преобразование подойдёт. А если про это- то да.

Александр Калафати писал(а):

2. Дальше с помощью константы подобрали значения баллов.
3. Остаётся вопрос как подобраны весовые коэффициенты. По ЭДА Вы немного описали. А как подбирали соотношения по ДЛД, манжете спазму? какие соотношения амплитуд\спазмов приводят к тому, что ПО выставляет балл?


Если я правильно понимаю, что Вы имете ввиду, то тут скорее наоборот. Программа выставляет баллы, а константа в ФОП подобрана таким образом, что бы её значения были как можно ближе к выставляемым баллам. Не баллы выставляются программой на основе ФОП, а величина ФОП подбирается под баллы. Первая причина присутсвия баллов скорее психологическая. На самом деле сами значения которые принимает ФОП не играют роли. Она может быть ограничена модулем единицы, и другие варианты возможны. Для тестов Вилкоксона и Перестановочного критерия важны не абсолютные значения ФОП, а их относительные значения. В тесте Вилкоксона все значения ФОП переводятся в ранги. Вариационному ряду 9, 10 будут соотвествовать ранги 1,2. И вариационному ряду 900, 1000 будут соответствовать ранги 1,2. Примерно то же в Перестановочном критерии, хотя там ранги не присваиваются.

В названии программы абриавиатура НТФП расшифровывается как непараметрические тесты физиологических параметров. Непараметрические тесты должны проверять нулевую гипотезу для разности сырых параметров реакций. Для проведения стат. тестов вычислять баллы необязательно. Можно было сделать так, что в программу осуществляется ввод данных, а она выдаёт альтернативную гипотезу и p - value. Но полиграфологу привыкли к баллам, это фактически стандарт. И полиграфологи как правило не знакомы с математической статистикой. Поэтому им, не вникая в технологию тестов, проще было бы связать баллы выставленные программой с результатами непараметрических тестов и принять новую для них ситуацию. Большой положительный балл - маленькое р - value - принимаем решение, аналогично для отрицательных баллов. Мне самому так привычнее, хотя я знаю всю технологию вычисления альтернативы и р - value. Кроме того всё это у меня началось с осмысления того как принимается решение с помощью баллов, почему они суммируются по разным каналам, фактически они просто суммируются по всем парам и параметрам и т.д. и т.п.
Вторая причина программных баллов сопоставление их с результатами тестов для неподтверждёнными полиграмми.

Подчеркну, что выставляемые программой баллы никак не используются в стат. тестах и ни как не влияют на их результаты.

Теперь о том как выставляются баллы. Очень просто. Фактически это симулятор экспертных баллов. В программе есть групповой бокс с название "Пороги для баллов". Оказалось, что для симуляции достаточно тех порогов, которые выставлены по умолчанию (их можно менять) и для всех параметров одинаковы. Для того чтобы определить достаточность, я построил регрессию. Вот поле корреляции (рассеяния) для шести пар сравнения (таких у меня подавляющее большинство):



Для 8-ми пар сравнений



Для 10 - ти пар сравнения



Имеется хорошая корреляция экспертных баллов с программными. Правда наблюдается относительное завышение экспертных баллов, но оно имеет простое объяснение о котором я писал, оно не связано с программой.

Полиграфолог, котрый решит воспользоваться программой, имеет принципиальную возможность подобрать пороги таким образом чтобы они коррелировали с его экспертными баллами, если его не устроят те что стоят по умолчанию.

До сих полиграфологи, скачавшые программу, не сообщали мне о том, что программы выставляемые программой им не нравятся. Скажу сразу, что полиграфологов, которые скачали программу немного, но некоторые вступали со мной в переписку, в первую очередь говорили о баллах и резких критических замечаний не было. Если вдруг кому-то станет важным проводить более тонкую настройку симуляции, то можно сделать подбор порогов и отдельно по параметрам. Я пока не вижу большого смысла тратить ресурсы на это, так как выставление баллов в программе это вспомогательная (второстепенная) функция.


Александр Калафати писал(а):

4. Есть исследования подобных соотношений, проведенных при разработке систем OSS, OSS2 нужны ли они Вам?


Любая информация может быть полезной.

Александр Калафати писал(а):

5. Учитываете ли Вы особенности отечественной техники ( например проблемы с АД у линейки "диагноз"), какой канал для оценки ЭДА/КГР используете с ручной центровкой или с автоматической?


a) Не учитывает. б) Это зависит от того какие данные внесёт пользователь. Программа просто проверит нулевую гипотезу для этих параметров.

_________________
http://skl-ol.ru
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
Александр Калафати



Зарегистрирован: 12.10.2011
Сообщения: 1852
Откуда: Москва

СообщениеДобавлено: Пн Авг 10, 2020 7:29 am    Заголовок сообщения: Ответить с цитатой

Юрий, спасибо, за ответы. Я правильно понял. ФОП первична, баллы это её визуализация для специалистов.

2. Данные пришлю.
3. Касательно однотемности / многоаспектности - опыт американских специалистов показал, такой подход себя оправдал слабо. Самая точный результат получается по общей сумме баллов.
Те же ПВ в Юте 3ПВ:
Вы брали пирожки и бабушки?
Бабушкины пирожки взяли Вы?
Вы хоть как-то причастны в кражу бабушкиных пирожков?

Третий вопрос покрывает все возможные аспекты события. И получается, что тест Юта 3пв - многоаспектный, по классификации федералов, а вот ютовцы всегда считали его исключительно по общей сумме.

4. Что делать с многотемными тестами? Как е подходы могут быть там?
5. Что делать с поисковыми тестами, какие там есть подходы?

_________________
Быть, а не казаться.
http://polygraph-triumph.ru/
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Посетить сайт автора
York



Зарегистрирован: 29.09.2010
Сообщения: 2621
Откуда: Вологда

СообщениеДобавлено: Пн Авг 10, 2020 10:24 am    Заголовок сообщения: Ответить с цитатой

Александр Калафати писал(а):
Юрий, спасибо, за ответы. Я правильно понял. ФОП первична, баллы это её визуализация для специалистов.


Да. Это так и есть, и лучше не сформулируешь.

Про баллы надо бы добавить ещё следующее. Для принятия решения полиграфологом основную роль играет не величина балла как таковая, а пороговое значение, которое определяет принятие решения полиграфологом. Например, если один полиграфолог насчитал на полиграмме +17, а другой на ней же +27, то оба примут одно решение. Если для экспертных баллов эти пороги (-5,+5), то можно определить соответсвующие им программные. Для этого надо посмотреть на диаграмму рассеяния. Например, для 6 пар сравнения. Но оси иксов выделим (-5), проведём вертикальную линию вверх до пересечения с красной линией регрессии. Далее проведём горизонтальную линию до пересечения с осью игреков. И увидм, что пересечение произошло в (-5) автоматических баллов. Это говорит о том, что отрицательные пороги принятия для автоматических баллов и экспертных совпадают. Т.е. как отрицательные классификаторы экспертные и автоматические баллы совпадают. Другая картина для положительных баллов. Если проделать процедуру для (+5) экспертных баллов можно увидеть, что им соответсвует (+2) автоматических баллов. Причина всё та жt, о ней писал и озвуивал в видео - завышение экспертных баллов в положительную сторону. Так что это надо учитывать.
Кстати, таким же образом, через поле корреляции, можно оценивать соответсвие баллов выставляемых двумя экспертами. Посмотреть как соответствую пороговые баллы друг другу. Для этого надо, чтобы эксперты оценивали одни и те же полиграммы. Дарю идею проведения исследований заинтересованным лицам). Тем более, что есть где опубликовать результат. Если что с обработкой данных могу оказать помощь Smile


Александр Калафати писал(а):

4. Что делать с многотемными тестами? Как е подходы могут быть там?


Для использования стат.тестов необходимо минимум 5 пар сравниваемых вопросов. Что бы их получить надо пять раз повторить многотемный тест. В программу вести данные пар сравнения соотвествующих одной теме.

Александр Калафати писал(а):

5. Что делать с поисковыми тестами, какие там есть подходы?


Любой анализ данных должен начинаться с поиска и обнаружения выбросов. Для Сокола+ я написал алгоритм который анализирует введённые данные на предмет выбросов и при обнаружение подозрительных значений выдаёт некотороую оценку вероятности того, что оно является выбросом. Что бы показать как им можно пользоваться я собираюсь снять видео.

В поисковых тестах (и ТЗВ) реакцию на истинный признак можно расматривать как выброс (что в теории так и есть). Поэтому можно посмотреть как алгоритм будет работать с тестами этих типов.

_________________
http://skl-ol.ru
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
Александр Калафати



Зарегистрирован: 12.10.2011
Сообщения: 1852
Откуда: Москва

СообщениеДобавлено: Пн Авг 10, 2020 8:07 pm    Заголовок сообщения: Ответить с цитатой

1) Я так понимаю, что пока алгоритм подходит для тестов типа :
С R C R C R

или

C R N C R N C R N

А как быть с форматами

С R R C R R C ?

2) многотемные тесты, они же скрининги проводить не менее 5 повторов?
3 повтора вопроса это получается оценка "на глаз"?

_________________
Быть, а не казаться.
http://polygraph-triumph.ru/
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Посетить сайт автора
York



Зарегистрирован: 29.09.2010
Сообщения: 2621
Откуда: Вологда

СообщениеДобавлено: Вт Авг 11, 2020 1:45 am    Заголовок сообщения: Ответить с цитатой

Александр Калафати писал(а):
1) Я так понимаю, что пока алгоритм подходит для тестов типа :
С R C R C R

или

C R N C R N C R N



Да

Александр Калафати писал(а):

А как быть с форматами

С R R C R R C ?


Тут всё диктуют требования предъявляемые к данным для проведения стат.тестов. Ни один вопрос не должен входить дважды и более в сравниваемую пару. Это требование обеспечивает независимость измерений. Допустим если параметр контрольного вопроса входит в две пары, то это уже зависмые измерения. Данные полученные в обеих парах будут связаны параметрами одного контрольного вопроса. Поэтому в таком формате теста надо не включать в сравниваемые пары один из релевантных вопросов. Это требование со стороны математики. Допустимо ли это с других точек зрения это уже другое дело.

Александр Калафати писал(а):

2) многотемные тесты, они же скрининги проводить не менее 5 повторов?


5 наблюдений - это минимум, который должен быть для проведения тестов.
Александр Калафати писал(а):

3 повтора вопроса это получается оценка "на глаз"?


Я похоже зашорился) Ведь каждая пара даёт три - четыре значения. Три на три = девять. Это больше пяти. Получается, что для трёх повторов уже можно проводить тесты.

_________________
http://skl-ol.ru
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
York



Зарегистрирован: 29.09.2010
Сообщения: 2621
Откуда: Вологда

СообщениеДобавлено: Ср Авг 12, 2020 7:57 pm    Заголовок сообщения: Ответить с цитатой

$erP писал(а):

По поводу изменчивости... Мне кажется... я уверен... что Вы ее, эту ФОП, измените... Возможно, что даже через некоторое время после этого поста.


Это что называется самосбывающийся прогноз. Very Happy

Тот вид ФОП, что я показывал - это только один из возможных. Выбрал я его, как уже писал из психологических соображений, так как к нему можно подобрать ни на что не влияющий коэффициент, так что бы значения ФОП были близки к привычным баллам. А по поводу баллов писал, отвечая А.Калафати - они получаются вовсе не из ФОП.

Выбор сделанный из психологических посылов, не является лучшим (что не говорит, что он является плохим). Всё дело в том, что такая ФОП (не всегда) может давать несколько отличающиеся значения p-value, от тех, что будут получены, если на вход теста подавать чистую разность параметров реакций (при этом проводятся тесты по физиологическим по отдельности). Об этм был мой пост: http://www.ld.eposgroup.ru/forum/viewtopic.php?p=89519#89519

Но эту ФОП можно слегка модифицировать и результаты тестов c чистыми разностями и с ФОП будут совпадать абсолютно. Правда из-за модификации будут болеее существенные отклонения от соответствующих и таких привычных баллов.

Суть самой описанной мною раннее ФОП не изменится, она будет удовлетворять всем требованиям , главное из которых - одновременное выполнение нулевой гипотезы и альтернативы. В силу указанных причин такая модификация будет более естественной. Но такая ФОП по прежнему будет явялтся относительной, т.е. учитывающей вариативность параметров. Если разница между амплитудами КГР, условно, равна 10, то это будет давать больший вклад в результат, чем линия дыхания, разница в длине которой, в сравниваемой паре будет, например, 3.

$erP писал(а):

Получается, что, например, сдал Вам Владимир (Питер) свои полиграммы... и эти полиграммы обрабатываете сначала, по сути, Вы в лице, так сказать, ФОП... а затем то, что получилось на выходе из ФОПа, уже и обрабатывают объективные статметоды. И Владимир (Питер), в итоге, получает не оценку статметодами разницы в реакциях на КВ и ПВ, а оценку статметодами результатов Вашего субъективного представления о разнице в реакциях на КВ и ПВ.

Фактически, все зависит не от того, какие объективно полиграммы у Владимира (Питера), а от ФОП... то есть от Вашего на них взгляда...

Не сырые данные полиграмм определяют правильность их оценки статметодами... Не сами статметоды определяют адекватность полученных значений... а ФОП... как он изначально посчитает, так все потом и сложится...

ФОП - это сердце Сокола... Very Happy Всё остальное - уже формально обслуживающий его персонал...

И возникает вопрос: Ваше личное представление о том, как должно производиться измерение разницы между реакциями - оно действительно адекватно отражает разницу между реакциями? Ведь от того, насколько адекватно ФОП оценивает разницу в реакциях, зависит дальнейшее соответствие сделанных непараметрическими методами расчетов реальной действительности.

Я не говорю, что Ваше представление, выраженное в ФОПе, о разнице в реакциях на КВ и ПВ не правильное... Хотя о том, что оно не совсем правильное, у меня основания говорить есть...

Я делаю упор на то, что оно, Ваше представление, сейчас очень субъективно... не имеет видимой объективной базы для доверия к нему... и, значит,
во-первых, Ваше представление изменчиво... очень зависимо от Ваших личных представлений, знаний, опыта, настроения, ощущения правильности, поэтому...
во-вторых, оно требует очень тщательной проверки и перепроверки на правильность, то бишь валидность.
Ну и, в третьих, полиграфологи, конечно, должны понимать, что, "загоняя" полиграммы в Сокол для математической обработки, они получают вовсе вовсе не объективную оценку объективных реакций объективными методами.


Ваши опасения понятны. Если начать "дурковать", и "лепить" ФОП руководствуясь, например, представлением древних греков о психической материи, теорией теплорода и философией Гегеля, то точно такой результат и будет, как Вы описываете. Результат стат. тестов будет зависеть не от того какие параметры у полиграмм, а от личного представления и феерического сумбура в голове автора.
Но, если потребовать, что бы ФОП отвечала тем условиям, которые я сформулировал, то результаты тестов при использовании различных ФОП будет невелики. По математическим причинам. Потому что это случайные величины, обладающие общей характеристикой: нулевая гипотеза и альтернативы выполнятся для них одновременно.

А все небольшая разница (а разница будет заключаться только в значениях вычисленного p-value и в наблюдаемой статистике) будет проистекать из технологии статистического теста. А стат. тест это просто вероятностная машина (что справедливо в отношении любого теста, в том числе и полиграфного), которая на вход получает случайные числа и на выход даёт случайное число - значение наблюдаемй статистики, и второе случайное число - p-value.

Даже, если взять две разные выборки из одной и той же генеральной совокупности, то результаты одного и того же стат. теста (в смысле величины p-value) будут различны. Не говоря уже о разных тестах, которые должны проверить одну нулевую гипотезу.

Всё написанное - теоретические умозаключения, но я их проверяю на тех данных, что у меня есть, и не имею оснований отвергнуть их. Можно поставить вопрос о том насколько разные результаты (в смысле значений p-value) , будут давать разные ФОП, но нельзя говорить о том, что ФОП будут давать какие попало результаты, и тем более противоречащие друг другу на пустом месте и не зависящие от того какие полиграммы.

$erP писал(а):

Это неправильный подход. Это неправильные соотношения. Теперь понятно, почему в Вас по дыханию и ФПГ такие маленькие вектора, от которых, как правило, ничего что зависит.

Длина линии дыхания (далее ДЛЛ) - очень жесткий параметр в плане своей изменчивости. Если для случая КГР легко найти или представить соотношение амплитуд 3:1... 4:1... 10:1... то для дыхания такие соотношения нереальны... Даже если человек не будет дышать несколько секунд, то это не значит, что параметр ДЛЛ превращается в ноль.


Фраза: "..по дыханию и ФПГ такие маленькие вектора, от которых, как правило, ничего что зависит", излишне категорична. Зависит и много зависит, даже несмотря на то, что для обсуждаемой ФОП значениея по КГР часто принимают большие значения, так как она строится на отношении разности параметров к величине самих параметров.

Весь текст выше можно считать преамбулой к обсуждению ФОП № 2. Это очень интересная ФОП. Она полностью уравнивает реакции по всем каналам. Для неё не играет роли и абсолютная разница реакций и относительная разница реакций. Что бы понять, что это за ФОП необходимо вспомнить, что такое вектора и включить пространственное воображение - поэтому без рисунков тут не обойтись. Рассмотрим две сравниваемые пары вопросов, и для того что бы не напрягать воображение рассмотрим только два параметра: дыхание И КГР. Сделаем это для того что бы провести все построения на плоскости (в трёхмерном пространстве и пространстве большей размерности всё будет аналогично). Для дыхания имеем две разности (для 1-0й и 2-0й пары), ровно как и для КГР. По оси х - ов отложим разность параметров для первой пары, по оси ординат разность параметров для второй пары.



delta d1 - это разность параметров первой сравниваемой пары
delta d2 - это разность параметров второй сравниваемой пары



delta k1 - это разность параметров первой сравниваемой пары
delta k2 - это разность параметров второй сравниваемой пары

Мы имеем два вектора, которые образуют с осью абцисс одинаковый по величине угол alpha, не смотря на то что разности параметров по дыханию и КГР сильно различаются, угол одинаковый. Такую картинку я нарисовал, чтобы легче было понять, что угол, а значит и косинус угла не зависит, от мащтабов в котрых происходят изменеия физиологических показателей.

И вместе с тем косинус как случайная величина удовлетворяет всем требованиям для ФОП. Функция ограничена - изменяется от -1 до 1, симметрична относительно нуля, безразмерна. И что главное косинус угла реакций имеет совпадение нулевой и адьтернативной гипотезы с разностью параметров, и в случае истинности нулевой гипотезы имеет медиану равную нулю. Но так как косинус реакции не зависит от вариативности физиологических параметров, то если его использовать в качестве ФОП, то все физиологические параметры будут вносить одинаковый вклад в результат теста независимо от своей вариативности. Точно так же как если б делать тесты по отдельности для каждого параметра. В последнем случае нас не беспокоят масштабы физиологических параметров, вариативность КГР по сравнению с ФПГ и Дыханием.

Кроме того, нетрудно увидеть, что в случае истинности нулевой гипотезы косинусы реакций всех параметров, будут принадлежать одному равномерному распределению! Таким образом мы имеем случайную величину, распределение которой нам известно. У нас появляется возможность ещё для одного теста - проверка на равномерность распределения. Если равномерность распределения подтверждается, то это автоматически означает, что человек одинаково реагирует на оба типа вопросов. Если отвергается, то человек реагирует по- разному. Правда этот тест не даёт направленной альтернативы. Но в этом случае альтернативу могут дать банальные экспертные баллы!

Я понимаю, что изложенное мною может быть, непонятно, непривычно, странно и поэтому вызывать недоверие. Попытаюсь продемонстрировать результаты на практике. Для этого отсниму видео с результатами.
Но прежде, для понимания и в силу

$erP писал(а):

И этот вывод сделан только по отношению к достаточно простому и хорошо известному Вилкоксону. А в программе накапливаются и накапливаются такие методы, названия которых известны лишь посвященным... и найти их описание надо еще постараться… не говоря уже о том, чтобы понять, как они работают… и работают ли в области анализа данных, зарегистрированных на полиграфе…


мне необходимо объяснить технологию Перестановочного критерия. Он решает задачу аналогичную одновыборочному тесту Вилкоксона. И суть его даже проще чем теста Вилкоксона.

_________________
http://skl-ol.ru
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
Показать сообщения:   
Начать новую тему   Ответить на тему    Список форумов ПОЛИГРАФ - ФОРУМ -> Общий форум Часовой пояс: GMT + 3
На страницу Пред.  1, 2, 3 ... 9, 10, 11 ... 19, 20, 21  След.
Страница 10 из 21

 
Перейти:  
Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах
You cannot attach files in this forum
You cannot download files in this forum


Powered by phpBB © 2001, 2005 phpBB Group
Рейтинг@Mail.ru Rambler's Top100