Список форумов ПОЛИГРАФ - ФОРУМ ПОЛИГРАФ - ФОРУМ
Для общения по теме " Детекция лжи "
 
  На главную FAQFAQ   ПоискПоиск   ПользователиПользователи   ГруппыГруппы   РегистрацияРегистрация 
 ПрофильПрофиль   Войти и проверить личные сообщенияВойти и проверить личные сообщения   ВходВход 

Еще раз про статистическую значимость
На страницу Пред.  1, 2, 3 ... 8, 9, 10 ... 12, 13, 14  След.
 
Начать новую тему   Ответить на тему    Список форумов ПОЛИГРАФ - ФОРУМ -> Общий форум
Предыдущая тема :: Следующая тема  
Автор Сообщение
e2e4



Зарегистрирован: 11.09.2010
Сообщения: 143

СообщениеДобавлено: Сб Мар 03, 2018 2:38 pm    Заголовок сообщения: Ответить с цитатой

[quote="York"]
York писал(а):

Может быть мощность равна около 80%?

"Мощностью критерия называют вероятность попадания критерия называют попадание критерия в критическую область при условии, что справедлива конкурирующая гипотеза."

Гурман стр. 287.


80% => 0.8 , именно Гурманская мощность и есть чувствительность, разве нет?

или вы хотите сказать, что мы имеем с двумя отдельными случаями, для которых чувствительность, она же мощность, она повер , она же элла кацнельбоген....

просто если два отдельных случая, для которых чувствительность не посчитана, тогда почему указана?

_________________
...Остап не баловал своих противников разнообразием дебютов...
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
York



Зарегистрирован: 29.09.2010
Сообщения: 2600
Откуда: Вологда

СообщениеДобавлено: Вс Мар 04, 2018 12:02 am    Заголовок сообщения: Ответить с цитатой


Давайте сосредоточимся, не смотря на субботний вечер, и поддержим друг друга, если что...

Пусть отсечка, как Вы предложили по нулю. Если результат теста принимает отрицательный балл, то полиграфолог берет за Но - правда. Тогда Но - это статистика теста (балл) принадлежит "синему" распределению. Тогда альфа это "площадь" под синией линией с баллами меньше нуля (заштриховыванная синим и зеленым). Это значение посчитано и равно 0,159. То есть критическая область в этом случае (в случае отрицательного балла) это баллы от 0 до -13. Тогда согласно приведенного определения мощность (вероятность попадания критерия (балла) в критическую область (от 0 до -13) при условии справедливости конкурирующей гипотезы) равна "площади" под зеленой линией. В силу симметричности распределения она равна 1 - 0.159 = 0,841. Тогда согласно определения бета (ошибка второго рода) = 1 - мощность = 1- 0,841= 0,159. Это площадь в области положительных баллов, под зеленой линией (не заштрихованная).

Если статистика теста (балл) положительно, то гипотезы меняются местами, все остальное, в силу симметрии тоже самое.

Проверяйте. Если наврал - поправляйте.

З.Ы. В статье, любезно предоставленой Александром Калафати, все параметры распределений распределений представлены целыми числами. Вероятность того, что они именно таковы равна нулю. То есть они безбожно округлены. Если брать в расчет критерий точности предоставленных данных, то статью трудно назвать научной. Если не изменяет память, то стандарт предоставления данных - до 5 знака после запятой. Поэтому позволил подкорректировать параметры взятые из статьи на 0,2 каждый. Хвостики (красный и синий) совпали "практически полностью"

З.Ы. Прошу прощения: не Гурман, а Гмурман. Я его всегда в гурманы записываю. Почти уверен что это так и есть Smile[


Последний раз редактировалось: York (Пн Фев 25, 2019 12:36 pm), всего редактировалось 3 раз(а)
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
e2e4



Зарегистрирован: 11.09.2010
Сообщения: 143

СообщениеДобавлено: Вс Мар 04, 2018 7:01 am    Заголовок сообщения: Ответить с цитатой

York, Вы проделали большую работу. Просто огромную. Дожали тему до логического конца. Спасибо. Большое спасибо.
_________________
...Остап не баловал своих противников разнообразием дебютов...
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
York



Зарегистрирован: 29.09.2010
Сообщения: 2600
Откуда: Вологда

СообщениеДобавлено: Вс Мар 04, 2018 11:24 am    Заголовок сообщения: Ответить с цитатой

В предыдущее свое сообщение внес технические исправления, математическая суть осталась прежней, но теперь альфа, бета, мощность приведены в соответствии с "идеологией" ESS. То есть теперь, если статистика (суммарный балл) меньше нуля, то Но - распределение статистики это "синяя линия". При отсечке нуль, статистика находится в критической области и Но отвергается в пользу Н1 - распределение статистики это "зеленая линия"(на человеческом языке ответы опрашиваемого относятся к классу лживых ответов, или попросту ложь)

e2e4
В принципе, согласен с Вами, что касается темы ветки - статистической значимости вообще и в инструментальной детекции лжи в частности, на примере ESS, обсудили до состояния, когда уже не понятно, что еще и обсудить...Осталось только установить отсечки "справа и слева" подвигать их туда сюда, но то дело не сути, а техники.

Что касается ESS, то серьезные неясности еще есть и одну из них обозначил

$erP писал(а):
Коллеги, а зачем вы ограничиваетесь рамками -13...+13 баллов? только потому что так написано у самих разработчиков? Коллеги, все мы знаем, что со стороны виднее...

Ведь понятно же... что теоретически... по принципу "а если... а вдруг..." 2RQ тест может получить любой балл от -40 до +40... то есть вероятность получить какой то определенный балл по тесту составляет 1/81...


Cначала, я думал, что распределение статистики соответствующее табличке похоже на логнормальное

Александр Калафати писал(а):
Да, я думал об этом, но представленная выборка была сделана на 3 повторах теста.

Ну и тест повторяется 5 раз, только если у нас INC. Например +3 или +4 при 3 х повторах. Тогда надо суммировать +16 к +4 или к +3 и получим +20 +19 баллов.

А так, можно еще добавить баллы по ФПГ - 4 каналу, но та выборка проверялась на 3х повторах с 3 каналами.

И мне кажется, что выборка ограничена -13 и 13 именно из-за значения "сигмы". Так как они не получили значения для лжецов выше +13, то они не стали указывать p-value...


Какой же возможный максимальный балл для трех повторов?

Если больше тринадцати то теоретическое распределение можно продолжать за +13 (-13) (а на самом деле надо продолжать). Тогда оно будет больше похоже на нормальное.

Ограничить табличку +-13 они могли и потому, что в этом случае p -value меньше 0,001, как указано в таблице. Поэтому если балл меньше(больше) -+13, то "говорите, что p - value меньше одной тысячной и все". Представляю, если полиграфолог скажет, что вероятность ошибки меньше, например, одной миллионной, "высокий суд" может испытать некоторое напряжение.

С точки зрения математики (это можно показать математически) если статистика теста получена по трем каналам, то эта случайная величина отличная от статистики полученной по четырем каналам. То есть для этих случаев должны быть разные таблицы.

Кроме того статистика теста извлеченная на двух повторах, это случайная величина отличная от статистики полученной на трех повторах и т.д.

То есть для каждого количества повторов должно быть приведены свои средние, стандартные отклонения и таблички с p - value.

_________________
http://skl-ol.ru


Последний раз редактировалось: York (Вс Мар 04, 2018 11:31 am), всего редактировалось 2 раз(а)
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
York



Зарегистрирован: 29.09.2010
Сообщения: 2600
Откуда: Вологда

СообщениеДобавлено: Вс Мар 04, 2018 11:29 am    Заголовок сообщения: Ответить с цитатой

e2e4 писал(а):

80% => 0.8 , именно Гурманская мощность и есть чувствительность, разве нет?

или вы хотите сказать, что мы имеем с двумя отдельными случаями, для которых чувствительность, она же мощность, она повер , она же элла кацнельбоген....

просто если два отдельных случая, для которых чувствительность не посчитана, тогда почему указана?


Прошел по Вашей ссылке. На странице 161 в сноске написано, что чувствительность это и есть мощность. Очень необычно, что связь между понятиями дается в сносках. Искал определение мощности в книге, найти не смог. Поэтому мне не понятно что имел ввиду автор под мощностью.

Я сначала думал, что речь о чувствительности теста идет, но если чувствительность это мощность, то это не чувствительность теста, потому что чувствительность теста это не мощность... Very Happy

_________________
http://skl-ol.ru
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
Александр Калафати



Зарегистрирован: 12.10.2011
Сообщения: 1852
Откуда: Москва

СообщениеДобавлено: Вс Мар 04, 2018 10:58 pm    Заголовок сообщения: Ответить с цитатой

Вот нашел распределения баллов для 2ПВ и 3ПВ.
В принципе видно, что распределения совпадают, как для лживых, так и для правдивых. Для 2 ПВ , вообще идеальное совпадение.

_________________
Быть, а не казаться.
http://polygraph-triumph.ru/
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Посетить сайт автора
York



Зарегистрирован: 29.09.2010
Сообщения: 2600
Откуда: Вологда

СообщениеДобавлено: Пн Мар 05, 2018 2:53 pm    Заголовок сообщения: Ответить с цитатой

Александр! Вы нашли очень интересные данные! Хотя они о обрезаны но, что это за данные понять можно. Найду минутку, все подготовлю и выложу.

Выкладываю. Это такие же таблицы как и та, что из презентации, обсуждаемая в этой теме. Только почему - то столбец с числами обозначен как альфа, а не р - value. Но не буду придираться. Я проделал все то, что c p - value из таблицы из презентации, чтобы получить распределение баллов.

Вот, что получилось для 3ПВ



Особо интересного тут ни чего нет. Это просто "кусок" колокола. Вершина колокола будет около - 9(среднее). Это точно. Можно видеть, что линия ломанная, то есть это полигон частот. Это значит, что это либо реальные данные. либо смоделированные на компьютере.

А вот вторая таблица интереснее! Потому, что это та же таблица что из презентации.

Видно, что все точки легли на плавную линию. То есть, это не полигон частот, а теоретическое распределение, такое же как я строил выше на основе данных из статьи. Так же я писал выше, что данные в статье и табличке "неаккуратно" округлены и поэтому хоть и есть совпадение, но не совсем полное. А в найденной Вами таблице теоретическое распределение построено на "не округленных" данных. И оп-ля! Хвосты, синий и оранжевый, практически идентичны.

Синим выделены данные из презентации.

Зеленым и оранжевым данные из второй найденной вами таблицы.



Если и это не убедит людей, которые имеют скептическое отношение к тому, что я писал, то их позицию не изменит уже ни чего... Very Happy

А то что в первой таблице нет полной симметрии в числах так это потому, что это полигон частот, а не теоретическое распределение.

ЗЫ Любой желающий может воспроизвести мои действия.

_________________
http://skl-ol.ru
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
$erP
Site Admin


Зарегистрирован: 29.06.2005
Сообщения: 7851
Откуда: Москва

СообщениеДобавлено: Ср Мар 07, 2018 3:28 pm    Заголовок сообщения: Ответить с цитатой

Ох ё! Shocked
Читать не перечитать...

_________________
Мое почтение... $erP

................................... ЛЕГКО СОЛГАТЬ ТЯЖЕЛО
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
York



Зарегистрирован: 29.09.2010
Сообщения: 2600
Откуда: Вологда

СообщениеДобавлено: Пт Мар 09, 2018 2:52 pm    Заголовок сообщения: Ответить с цитатой




Вот вся 'физика' для правдивых и 2пв. Нижняя строка это p - value.

Подобоанные параметры нормального распределения в районе 6 и хорошо совпадают с "хвостиком"


Последний раз редактировалось: York (Пн Фев 25, 2019 1:42 pm), всего редактировалось 1 раз
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
$erP
Site Admin


Зарегистрирован: 29.06.2005
Сообщения: 7851
Откуда: Москва

СообщениеДобавлено: Пт Янв 25, 2019 5:03 pm    Заголовок сообщения: Ответить с цитатой

$erP писал(а):
Ох ё!
Читать не перечитать...


Решил спокойно перечитать умные рассуждения умных людей... и... Question Shocked

Мужик: "Золотая Рыбка, а где же всё?"
Золотая Рыбка: "А всё - было..."

York, а куда всё делось?


http://www.ld.eposgroup.ru/forum/viewtopic.php?p=85582#85582

http://www.ld.eposgroup.ru/forum/viewtopic.php?p=85618#85618

http://www.ld.eposgroup.ru/forum/viewtopic.php?p=85624#85624

http://www.ld.eposgroup.ru/forum/viewtopic.php?p=85693#85693

http://www.ld.eposgroup.ru/forum/viewtopic.php?p=85717#85717

http://www.ld.eposgroup.ru/forum/viewtopic.php?p=85723#85723

http://www.ld.eposgroup.ru/forum/viewtopic.php?p=85728#85728

http://www.ld.eposgroup.ru/forum/viewtopic.php?p=85737#85737

http://www.ld.eposgroup.ru/forum/viewtopic.php?p=85748#85748

_________________
Мое почтение... $erP

................................... ЛЕГКО СОЛГАТЬ ТЯЖЕЛО
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
York



Зарегистрирован: 29.09.2010
Сообщения: 2600
Откуда: Вологда

СообщениеДобавлено: Пт Янв 25, 2019 5:42 pm    Заголовок сообщения: Ответить с цитатой

Ни кому в этой жизни доверять нельзя Sad ...даже фотохостингам, которые, как показывает эмпирический опыт - есть ЗЛО... сейвпик обещал хранить фото год после последнего просмотра, то есть год ни кто не должен был открывать страницу с фото. Это условие уж точно не выполнено. С момента размещения год ещё не минул.
_________________
http://skl-ol.ru
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
$erP
Site Admin


Зарегистрирован: 29.06.2005
Сообщения: 7851
Откуда: Москва

СообщениеДобавлено: Вс Фев 10, 2019 2:56 pm    Заголовок сообщения: Ответить с цитатой

В силу практической необходимости пришлось разбираться с ESS.
После того, как разобрался и вновь перечитал тему, увидел, что те выводы, к которым пришел лично я, в некоторых принципиальных моментах расходятся с выводами участников обсуждения темы.
Но я пришел к конкретным значениям ошибок, существенно отличным от того, что предлагают разработчики ESS.
Поэтому продолжу тему.
И сразу выложу итоговые результаты, которые у меня получились, а потом кратко изложу свою позицию и обоснование… хотя, подозреваю, получится длинно. Извиняюсь, если что-то пойдет в повторение или в явное недоразумение – скорей всего это из за предательства фотохостинга, съевшего ценную информацию.

_________________
Мое почтение... $erP

................................... ЛЕГКО СОЛГАТЬ ТЯЖЕЛО


Последний раз редактировалось: $erP (Пн Фев 11, 2019 9:32 am), всего редактировалось 1 раз
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
$erP
Site Admin


Зарегистрирован: 29.06.2005
Сообщения: 7851
Откуда: Москва

СообщениеДобавлено: Вс Фев 10, 2019 2:57 pm    Заголовок сообщения: Ответить с цитатой

1) Итак... начало с конца...

Для теста 2RQ.
Если полиграфолог получил -4 балла ESS и сделал вывод «Лжет», то вероятность ошибки – обвинения правдивого - составляет 21%, а не 4,8% как предлагают считать разработчики ESS.
Для того, чтобы не превысить уровень ошибки обвинения правдивого в 5%, полиграфолог должен принимать решение «лжет» на -9 баллах и меньше.

Если полиграфолог получил +4 балла ESS и сделал вывод «Правдив», то вероятность ошибки – оправдания лгущего – составляет 21%.
Для того, чтобы не превысить уровень ошибки в 5% оправдания лгущего, полиграфолог должен принимать решения о «Правде» при наборе +9 баллов или больше.

Симметрия в выводах «точность – ошибка» для лгущих и правдивых получается в связи с одинаковыми средними и стандартными отклонениями для теста 2RQ.

Для теста 3RQ нет симметрии. Поэтому проценты «точность – ошибка» разные» для лгущих и правдивых.

Для теста 3RQ.
Если применив тест 3RQ, полиграфолог получил граничные -4 балла и решил сделать вывод «Лжет», то вероятность ошибиться составляет 24%.
Для того, чтобы не превысить уровень ошибки обвинения правдивого в 5%, полиграфолог должен принимать решение «лжет» на -10 баллах и меньше.
Если полиграфолог получил граничные +5 баллов и решил сделать вывод «Правдив», то вероятность ошибиться составляет 17%.
Для того, чтобы не превысить уровень ошибки в 5% оправдания лгущего, полиграфолог должен принимать решения о «Правде» при наборе +10 баллов или больше.

_________________
Мое почтение... $erP

................................... ЛЕГКО СОЛГАТЬ ТЯЖЕЛО
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
$erP
Site Admin


Зарегистрирован: 29.06.2005
Сообщения: 7851
Откуда: Москва

СообщениеДобавлено: Вс Фев 10, 2019 2:59 pm    Заголовок сообщения: Ответить с цитатой

2) Отдельно - о личной неправоте.

Признаю свою полную неправоту в ранее отстаиваемом мнении, что относительно ESS без разницы «дает корова молоко» или «корова молоко дает». Для ESS это принципиальная разница. И это будет видно.

_________________
Мое почтение... $erP

................................... ЛЕГКО СОЛГАТЬ ТЯЖЕЛО
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
$erP
Site Admin


Зарегистрирован: 29.06.2005
Сообщения: 7851
Откуда: Москва

СообщениеДобавлено: Вс Фев 10, 2019 3:00 pm    Заголовок сообщения: Ответить с цитатой

3) О распределении и формуле.

Цитата:
Распределения далеки от нормального. В хвосте (от -13 до 0) содержится примерно 0,159, в остальной половине, соответственно, примерно 0,841. Должно быть похоже на логнормальное распределение, которое при увеличении диапазона баллов становится похожим на нормальное и т.д. и т.п.

Формул нет и не будет потому, все таблицы это результат численного моделирования на компьютере. Поэтому и полиграфологу саморучно не чего и рассчитывать - нет формул.


Приводимые разработчиками ESS данные – это данные, относящиеся к нормальному распределению. Соответственно, есть формула, и полиграфологи сами могут все рассчитать.

Приводимые разработчиками ESS данные относятся именно к функции нормального распределения, которая представляет собой сумму значений плотности нормального распределения до какого то балла, в пределе давая единицу. Для лгущих все данные делятся пополам по средней, -6 баллов. Для правдивых серединой является +6. В таблицах разработчиков ESS этого не видно, потому что они усеченные. Поэтому по внешнему виду эти данные никоим образом не похожи на данные «колокольчика». Но и к логнормальному распределению эти данные тоже не относятся.

На примере теста 2RQ. Если взять предлагаемые разработчиками ESS значения средних (для лгущих -6 баллов и для правдивых +6 баллов) и стандартного отклонения (для лгущих 6 баллов и для правдивых тоже 6 баллов) и с помощью Excel получить значения функции нормального распределения, но они «тютелька в тютельку» совпадают с теми, что дают разработчики ESS.

_________________
Мое почтение... $erP

................................... ЛЕГКО СОЛГАТЬ ТЯЖЕЛО


Последний раз редактировалось: $erP (Пн Фев 11, 2019 9:31 am), всего редактировалось 2 раз(а)
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
Показать сообщения:   
Начать новую тему   Ответить на тему    Список форумов ПОЛИГРАФ - ФОРУМ -> Общий форум Часовой пояс: GMT + 3
На страницу Пред.  1, 2, 3 ... 8, 9, 10 ... 12, 13, 14  След.
Страница 9 из 14

 
Перейти:  
Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах
You cannot attach files in this forum
You cannot download files in this forum


Powered by phpBB © 2001, 2005 phpBB Group
Рейтинг@Mail.ru Rambler's Top100