ПОЛИГРАФ - ФОРУМ

$erP

Читая книгу Л.Г.Алексеева и Ф.В.Потемкина "Проблемы прикладной психофизиологии" (далее ППП), в главе "Объективные и субъективные факторы в оценке результатов СПФИ" на стр. 239 увидел любопытные данные относительно точности полиграфных выводов в зависимости от количества потенциально лживых и правдивых людей в популяции обследуемых. (видимо, речь идет о т.н. base-rate - "базовом уровне", понятии, ныне известном всем полиграфологам... )

Согласно вычислениям авторов книги в случае, если процент лживых людей в популяции обследуемых составляет 10%, то точность определения лгущих людей составляет 50%. Авторы представляют свои вычисления в наглядной таблице, которую я привожу здесь - см. таблицу "Ситуация 1". И поясняют полученные данные следующими комментариями: "Как видим, процент правильных решений относительно лживых людей 50%, т.е. равносильно случайному угадыванию (подбрасыванию монеты). Это вопиющий факт, на который обращают внимание и тем самым формируют общественное мнение противники применения полиграфа".

Далее авторы развивают свою мысль, указывая на уменьшение точности при уменьшении количества лгущих людей в популяции обследуемых: "Эксперты должны помнить, что при частоте потенциально лживых людей в популяции обследуемых меньше 10%, вероятность правильных выводов эксперта о лживости будет чрезвычайно низкой, даже если самый лучший специалист будет использовать самую совершенную систему классификации".
Данное высказывание авторы также иллюстрируют данными, приведенными ими в таблице "Ситуация 3".

Хочу обратить внимание тех, кто тоже решил все таки почитать данный труд дошел в своем упорстве до данной главы.
Это не правильные данные.
Столь низкие проценты точности в определении лгущих у авторов получились из за того, что они по каким то причинам взяли в расчет данные, изначально перевернутые с ног на голову.

В каждой из таблиц в строке "Вывод = > Неправильно" должны быть поменяны между собой местами "Данные о лжи/Данные о правде".
Тогда представленные числа начинают соответствовать реальной действительности, все дальнейшие расчеты к ним применяются адекватно, данные о количестве выявленных лживых и правдивых проверяемых становятся правильными.

По мне ситуация с данными числами и вычислениями кажется тем более странной до анекдотичности, что их приводят 1) столь опытный полиграфолог 2) кандидат (физико-математических?) наук...

А, может, я и не прав? Может это случай из парадоксально-занимательной математики, к примерам которой от York'a мы уже привыкли?

York

Не читал, но уже осуждаю Very Happy

Хотя нет. Посчитал, парадоксов не увидел. Вроде бы все верно.

Описка: 1089 следует читать как 1098 Very Happy

York

Александр Калафати

Правильная математика. Кстати это обоснование для "последовательных барьеров" в скрининге. Т.к. именно там мы можем столкнуться с такими экстремальными "base rate".

York

$erP

York

Ситуация 1

Из 100 лживых правильно определены как лживые 90 человек

Из 900 правдивых правильно определены как правдивые 810 человек.

Из 900 правдивых неправильно определены как лживые 90 человек

Из 100 лживых неправильно определены как правдивые 10 человек

Я уже писал (я, вообще, одни и те же вещи повторяю на форуме многокраьно, наверное, надоел уже Very Happy

) что все эти проценты, пропорции это эрзац математика. В конечном итоге она не приведёт к правильному пониманию, а мозги "уделает" будь здоров. Запутает, то есть.

В реальной ситуации из 1000 , практически, такого расклада не будет. Не будет 90 правильно, 810 правильно, 10 и 90 неправильно и т.д. Эти числа - это математические ожидания количества правильно и неправильно определённых.

Правильное математичесоке мышление - это мышление в вероятностной парадигме. При этом не возникает необходимсоти расскладывать людей по ячейкам таблицы, из -за чего немудренно и запутаться.

Кроме того присутствует в нашем деле разнобой в терминологии. В этой табличке - "Валидность решающей системы" - это есть чувствительность и спецфичность, а процент лживых - это умноеженная на 100 априорная вероятность, или частота встречаемости признака (хотя частота и вероятность это не совсем одно и тоже).

В одной из соседних тем я рассылал экселевский файлик. Если в нём в пункте 3 - "3. Расчёт точности определения шпиона на основе "частоты встречаемости признака" (априорной вероятности)" ввести соотвествующие числа то можно получить указанные в табличке решения (только не в процентах). Например для ситуации 1: чвп = 0,1 чм = 0,9 см = 0,9; или чвп = 0,9 чм = 0,9 чвп = 0,9. Тоже самое можно проделать и для ситуации 3.

В этом файлике все расчёты сделаны в правильной парадигме - вероятностной. А вероятностная парадигма, если речь идёт о тестах любой природы - это формула Байеса (опять повторяюсь Very Happy

)

В подтверждении слов из книги Алексеева и Потёмкина приведу картинку, которую выложил третьего дня в соседней теме. Эта картинка как раз об этом. Построена на данных ESS, чувствительность, примерно, - 0,66, специфичность - 0,94.

Обратите внимание, что "твориться" в районе АВ = 0,1 (или 10%) - катастрофа!) Можно поиграться и построить подобные полигоны для разных чувствительностей и спецфичностей, но в районе 10% процентов ситуация будет примерно одна и та же (Для реальных условий полиграфного теста, когда чувствительность и специфичность не более 0,95).

Ситуация иная, если чувствительность и специфичность порядка 0,99. Тогда точность теста будет более 0,91 (91%). Например, если иметь тест с чувств и спец = 0,9999, то точность тогда уже будет (для АВ = 0,1) - 0,9991. Но где ж взять тест с такими характеристиками? Как я думаю, если только батарея ТЗВ. Но в реальных условиях это редкость, хотя и не исчезающе малая.

Имея ввиду вышесказанное хотелось бы обратить внимание на то, что какие бы методы не использовали для классификации полиграмм, какие бы соображения для этого не привлекали, например, из психологии, физиологии будь она даже трижды дифференциальной, на самом деле ни чего мы доказать ни кому не можем, если нам неизвестны хотя бы такие характеристики как чувствительность и специфичность. Утверждать иное, ссылаясь на любые науки это значит игнорировать законы математики, которая как известно не только язык науки, но и царица наук Smile

ПС Прощу прощения за тон мой, если он показался недопустимым, но всему виной правота моя в данном случае (и в вопросах процентов и пропорций)... Smile

$erP

$erP

Александр Калафати

Сергей Владимирович.
1000 человек
10% АВ даёт 900 человек правдивых и 100 лживых.
90% точность теста (условно 90% для правдивых и 90% для лживых)

Вывод о лжи: 90 из 900 - "неправильная" ложь. 90 из 100- "правильная" ложь. Итого 180 , или 50%.

Вывод о правде: 810 из 900 "правильная" правда и 10 из 100 "непраивльная правда". Итого 820 или 99...

Что не так? Это по табличке.

С Юрием согласен. Это некое ожидание. того что будет.
И получаем чувствительность 50% , избирательность 99% .

Но это ситуация скрининга. И она показывает необходимость проведения следующего теста с теми, кто провалил первый тест.
Там выборка уже будет 50\50.

York

$erP

Сосчитав так, как Вы сосчитали в исправильных Вами таблицах, Вы получили не процент правильных решений после тестирования всей тысячи, не зная кто из них кто, а прцент правильных решений из 100 лживых, и процент правильных решений из 900 правдивых. То есть, Вы получили чувствительность и специфичность. У Вас числа из второй строки из таблицы и из нижней совпадают.

York

$erP

$erP

$erP