Список форумов ПОЛИГРАФ - ФОРУМ ПОЛИГРАФ - ФОРУМ
Для общения по теме " Детекция лжи "
 
  На главную FAQFAQ   ПоискПоиск   ПользователиПользователи   ГруппыГруппы   РегистрацияРегистрация 
 ПрофильПрофиль   Войти и проверить личные сообщенияВойти и проверить личные сообщения   ВходВход 

Еще раз про статистическую значимость
На страницу Пред.  1, 2, 3 ... 5, 6, 7 ... 12, 13, 14  След.
 
Начать новую тему   Ответить на тему    Список форумов ПОЛИГРАФ - ФОРУМ -> Общий форум
Предыдущая тема :: Следующая тема  
Автор Сообщение
York



Зарегистрирован: 29.09.2010
Сообщения: 2600
Откуда: Вологда

СообщениеДобавлено: Ср Фев 28, 2018 7:50 pm    Заголовок сообщения: Ответить с цитатой

$erP писал(а):
York(злой статистик) писал(а):
Вроде бы ни где не говорится, что p и есть вероятность, что лицо, например, правдиво.

А в чем принципиальная разница?

При желании можно считать, что ни какой. Реактор не рванет, спутник не упадет. Существенное расхождения будут только в случае малой ЧВП, но уверен, что это просто не станет явным с последствиями.

$erP писал(а):

Никто не думает по результатам тестирования, что " +4 балла - это баллы, которые с 0,05 вероятностью продуцировал лгущий человек"

Ни кто ведь не запрещает так думать. Задавшись подобным вопросом можно определить правила принятия решения.

$erP писал(а):

Во втором томе 4х томника Пеленицина - Сошникова, на стр. 307 жирным шрифтом написаны слова Нельсона из его лекции на каком то очередном ЕСП НШДЛ: "р-величина - это вероятность ошибки, вероятность того, что мы ошибаемся, когда признаем кого-то виновным или невиновным по результатам конкретного тестирования".


Цитата:

Когда результирующее значение p меньше заданного решения alpha, оно
интерпретируется как означающий, что существует достаточно низкая вероятность того, что оценка была порождена правдивым
лицо и случай будут классифицированы как обманчивые.


Это разные утверждения.

_________________
http://skl-ol.ru
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
York



Зарегистрирован: 29.09.2010
Сообщения: 2600
Откуда: Вологда

СообщениеДобавлено: Ср Фев 28, 2018 8:17 pm    Заголовок сообщения: Ответить с цитатой

Александр Калафати писал(а):
York(злой статистик) писал(а):
Тот же предмет, но слегка изменим угол обзора...

Вопрос 1
Если опрос будет проводиться с опрашиваемым, который будет лгать, то какова вероятность, что результатом будет + 5 баллов?

Если отталкиваться от таблички, то перед нами 27 альтернатив. Лгущий может получить от - 13 до +13 баллов. У каждой альтернативы своя вероятность. Альтернативы представляют собой полную группу не пересекающихся событий. Поэтому сумма их вероятностей равна единице. У альтернативы +5 своя конкретная вероятность, которая является ответом на вопрос.

Вопрос 2.
Опрашиваемый в результате опроса получил +5 баллов. Какова вероятность, что он лгал?

Перед нами две альтернативы: лгал - не лгал. Это полная группа не пересекающихся событий. Сумма вероятностей этих двух альтернатив равна единице. Вероятность, что лгал не равна вероятности +5 баллов из первого вопроса.



1) Вообще-то какая вероятность того, что лгущий субъект получит +5 и БОЛЕЕ как раз и показывает р-value. Нам все равно на самом деле, получит ли он +6, +7 и т.д., так вывод -то будет все равно один - ложноотрицательный. Т.е. ошибочным.


Это как раз так и есть потому что р-value вероятности вложенных событий. Если лгущий получил +7 баллов- это означает, что произошло событие +6 и более, +5 и более и т.д. Вероятность объемлющего события всегда больше вероятности вложенного. Например событие получил (- 13) баллов и более содержит в себе все остальные события, а его вероятность равна 1. Вложенное событие - если оно происходит, автоматически означает, что произошло его объемлющее. Если произошло +5 это значит, что произошло и (-13) и более.

В приведенной цитате у меня говорится о вероятности получить ровно +5 баллов, а не о событии +5 баллов и более.
Можно и так поставить вопрос. Цель показать, что разные вопросы - разные вероятности, если при этом начать анализировать вложенность, то получилось бы сложно и непонятно.

Александр Калафати писал(а):

В контексте нашей реальности возможно 3 исхода (для лгущего) - верный обвинительный, неопределенный и ложный оправдательный. Их сумма должна ровняться 1.
Для ложно оправдательного вероятность нам известна. Это вероятность в нашем случае и означает ошибку.

Итого у нас 6 случаев, которые могут произойти в результате теста:

Верно оправдательный, Верно обвинительный, ложно оправдательный , ложно обвинительный, неопределенный для честного, неопределенный для лживого.

Т.е. человек может быть либо честным, либо нет. А вот у теста может быть аж 6 итогов.


{Человек солгал, человек правду} - это одно пространство элементарных событий. Вычислить, оценить, определить вероятность событий, которые входят в это пространство- это задача, которая отличается от задачи вычисления событий другого вероятностного пространства.

Другое вероятностное пространство:
{верный обвинительный, неопределенный, ложный оправдательный}

Решение вероятностной задачи начинаться с определения вероятностного пространства в котором "обитают" события вероятности, которых необходимо определить.

_________________
http://skl-ol.ru
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
$erP
Site Admin


Зарегистрирован: 29.06.2005
Сообщения: 7851
Откуда: Москва

СообщениеДобавлено: Ср Фев 28, 2018 8:36 pm    Заголовок сообщения: Ответить с цитатой

Коллеги, это споры из серии "как правильно: корова молоко дает, или дает корова молоко?"

Есть, на мой взгляд, гораздо более серьезные вопросы к самой "физике" процесса выработки ESS... к ней и без того куча реальных вопросов, а не выдумываемых по принципу "а если"...

Из всем доступных источников. Очень кратко.
Взяли несколько тысяч заведомо "лгущих" и заведомо "правдивых" результатов... обсчитали по известным правилам... огромная статистика...
Получили нормальное распределение. Высчитали для 2RQ теста, что а) правдивые дают средний балл +6, стандартное отклонение 6. б) лгущие дают средний балл -6, стандартное отклонение 6.

Далее, указывает Нельсон, на основе полученных данных можно рассчитать вероятность ошибки проведенного теста. Полиграфологи сами это могут сделать, но, оказывается, полиграфологам не надо "самим делать никаких вычислений. Они за вас уже давно выполнены специалистами". В итоге всем представлены эти самые "нормативные таблицы" с p-value и альфа...
Но что это за расчеты? как они получены? Вот об этом вообще нигде не говорится... по крайней мере я - не нашел... Зато сказано, что"все числа в такой таблице были рассчитаны на основе средних значений и стандартных отклонений обширных данных, полученных в ходе проведенных ранее тестирований, с использованием хорошо известных статистических формул". Хотя бы одну привел для понимания, что это за такая "хорошо известная статистическая формула"...
Зато есть мантра... "В конце концов, не важно, кто рассчитал эти данные. Важно, что они были рассчитаны профессионально и правильно. В нашем случае такие расчеты уже были сделаны и сделаны правильно". Вот, собственно, и весь научных подход: "откуда взялось - тебя не касается"...

А у меня сходу, даже не вдаваясь в глубину, уже куча вопросов к самой "физике"...
Если, например, средний балл для правдивого +6, а сигма 6, то почти половина из всех полученных для правдивых баллов ESS укладывается в интервал от -12 до +6 (напоминаю... поправьте, если ошибаюсь: три сигма влево от среднего - это почти половина всех данных). Ну хорошо... берем +4 балла как "линию отсечки". Но и эта отсечка по линии +4 балла отсекает примерно 40% всех "правдивых" данных как негодных для идентификации этих самых правдивых. Две пятых данных, обработанных ESSом - это ненужных мусор?
Те же самые рассуждения и для лгущих... которые приводят к выводу о том, что и в этой выборке 40% данных оказываются негодными для диагностики этих самых лгущих...

А ведь есть еще и фактически такие же данные для тестов 3RQ... Там порядок данных на выброс тот же...

Вот как понять это? Или я чего то не понимаю?

Выручает то, что, в конце концов, Нельсон приводит на итоговую таблицу эффективности его системы... и там, разумеется, все гладко...
Если бы эта таблица была отрецензирована и опубликована в каком нибудь хорошем "ваковском" психофизиологическом журнале - цены бы ей не было...
А так... журнал Polygraph - это, по большому счету, журнал для междусобойчиков... для того, чтобы похвалить себя... для "охотничьих рассказов"...


Вот такие мысли...

_________________
Мое почтение... $erP

................................... ЛЕГКО СОЛГАТЬ ТЯЖЕЛО
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
York



Зарегистрирован: 29.09.2010
Сообщения: 2600
Откуда: Вологда

СообщениеДобавлено: Ср Фев 28, 2018 9:04 pm    Заголовок сообщения: Ответить с цитатой

$erP писал(а):
Коллеги, это споры из серии "как правильно: корова молоко дает, или дает корова молоко?"


Если оперировать с точность до определений, то да - молоко. И даром, что ответ на вопрос какова ошибка теста - будет обманом. И утверждение, что априорное распределение (Байес) не важно, если использовать ESS тоже неправда. Ни чего не рванет и не упадет на голову...

Можно выдумать табличку с подходящими числами, написать несколько статей "ни о чем и обо всем сразу" и продукт готов. Я не об ESS. Я о такой возможности в принципе. Eсли мы не будем придираться к каждому сучку, то ... реактор не рванет, спутник не упадет... а заказчик будет доволен.

Цитата:

Из всем доступных источников. Очень кратко.
Взяли несколько тысяч заведомо "лгущих" и заведомо "правдивых" результатов... обсчитали по известным правилам... огромная статистика...


Зачем им несколько тысяч заведомо "лгущих" и заведомо "правдивых"? В статье постоянно bootstrap упоминается. bootstrap - это когда берется одна выборка и из нее генерируется охрилион виртуальных выборок. Если есть несколько тысяч реальных выборок - зачем bootstrap?

_________________
http://skl-ol.ru
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
e2e4



Зарегистрирован: 11.09.2010
Сообщения: 143

СообщениеДобавлено: Ср Фев 28, 2018 9:22 pm    Заголовок сообщения: Ответить с цитатой

$erP писал(а):

Вот как понять это? Или я чего то не понимаю?


Сигма действительно не маленькая, поэтому ничего иного не остается, как присоединиться к непонимающим.

К теме не относиться, но рекомендую к прочтению "ложная память" Джулии Шоу.

_________________
...Остап не баловал своих противников разнообразием дебютов...
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
$erP
Site Admin


Зарегистрирован: 29.06.2005
Сообщения: 7851
Откуда: Москва

СообщениеДобавлено: Ср Фев 28, 2018 10:01 pm    Заголовок сообщения: Ответить с цитатой

York(злой статистик) писал(а):
Если оперировать с точность до определений, то да - молоко. И даром, что ответ на вопрос какова ошибка теста - будет обманом...

York, даже если Вы и правы, "Вашу честь" Вы этим не проймёте...

York(злой статистик) писал(а):
Зачем им несколько тысяч заведомо "лгущих" и заведомо "правдивых"? В статье постоянно bootstrap упоминается. bootstrap - это когда...
Да... я знаю... но в статьях и не говорится, что были взяты только "живые" лгущие и правдивые... Взяты - и взяты... для журнала Polygraph этого вполне достаточно...
_________________
Мое почтение... $erP

................................... ЛЕГКО СОЛГАТЬ ТЯЖЕЛО
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
York



Зарегистрирован: 29.09.2010
Сообщения: 2600
Откуда: Вологда

СообщениеДобавлено: Ср Фев 28, 2018 10:04 pm    Заголовок сообщения: Ответить с цитатой

$erP писал(а):


А у меня сходу, даже не вдаваясь в глубину, уже куча вопросов к самой "физике"...
Если, например, средний балл для правдивого +6, а сигма 6, то почти половина из всех полученных для правдивых баллов ESS укладывается в интервал от -12 до +6 (напоминаю... поправьте, если ошибаюсь: три сигма влево от среднего - это почти половина всех данных). Ну хорошо... берем +4 балла как "линию отсечки". Но и эта отсечка по линии +4 балла отсекает примерно 40% всех "правдивых" данных как негодных для идентификации этих самых правдивых. Две пятых данных, обработанных ESSом - это ненужных мусор?
Те же самые рассуждения и для лгущих... которые приводят к выводу о том, что и в этой выборке 40% данных оказываются негодными для диагностики этих самых лгущих...

А ведь есть еще и фактически такие же данные для тестов 3RQ... Там порядок данных на выброс тот же...

Вот как понять это? Или я чего то не понимаю?

Выручает то, что, в конце концов, Нельсон приводит на итоговую таблицу эффективности его системы... и там, разумеется, все гладко...

Вот такие мысли...


Кто - нибудь тоже обязательно скажет, что проблема надумана.. все ведь работает и не хуже чем с другими системами. Или есть данные, что не работает, или работает хуже? Smile

На самом деле если не опубликовано все как положено - то этого и нет. А есть только трындежь. Я об этом уж лет так несколько назад писал...

_________________
http://skl-ol.ru
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
York



Зарегистрирован: 29.09.2010
Сообщения: 2600
Откуда: Вологда

СообщениеДобавлено: Ср Фев 28, 2018 10:10 pm    Заголовок сообщения: Ответить с цитатой

$erP писал(а):
York(злой статистик) писал(а):
Если оперировать с точность до определений, то да - молоко. И даром, что ответ на вопрос какова ошибка теста - будет обманом...

York, даже если Вы и правы, "Вашу честь" Вы этим не проймёте...


Прав - не сомневайтесь. А касаемо "Вашей чести"... Мне на самом деле это не очень - то интересно. Я дурной (со слов спутницы) , из чистой любви к искусству чем только не занимаюсь Smile.

_________________
http://skl-ol.ru
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
$erP
Site Admin


Зарегистрирован: 29.06.2005
Сообщения: 7851
Откуда: Москва

СообщениеДобавлено: Ср Фев 28, 2018 10:13 pm    Заголовок сообщения: Ответить с цитатой

York(злой статистик) писал(а):
Кто - нибудь тоже обязательно скажет, что проблема надумана.. все ведь работает и не хуже чем с другими системами. Или есть данные, что не работает, или работает хуже?
Данных, разумеется, нет... Пускай всё идет как по маслу, а кому надо, пусть доказывает, что это на самом деле маргарин...

Есть гораздо более непонятные и противоречиво-нелогичные вещи, следующие из таблиц ESS... Вы их, фактически, заметили и обозначили...

_________________
Мое почтение... $erP

................................... ЛЕГКО СОЛГАТЬ ТЯЖЕЛО
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
York



Зарегистрирован: 29.09.2010
Сообщения: 2600
Откуда: Вологда

СообщениеДобавлено: Ср Фев 28, 2018 11:26 pm    Заголовок сообщения: Ответить с цитатой

York(злой статистик) писал(а):
Про теорему умножения чуть позже.


Обещал- выкладываю.

Слева - "корова молоко дает"; справа - " дает корова молоко".

_________________
http://skl-ol.ru
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
York



Зарегистрирован: 29.09.2010
Сообщения: 2600
Откуда: Вологда

СообщениеДобавлено: Чт Мар 01, 2018 12:13 am    Заголовок сообщения: Ответить с цитатой

Александр Калафати писал(а):


Вот только нюанс в том, что у нас двоичная ситуация или лжет, или говорит правду. Других ситуаций нет. У нас нет генеральных совокупностей. Мы не экстраполируем результаты этого эксперимента на других людей. Конкретный человек. Конкретный эксперимент. Конкретный результат.



Это задача бинарной классификации. Есть два класса объектов. Есть объект. Надо определить к какому классу относится объект и определить вероятность ошибки.

_________________
http://skl-ol.ru
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
e2e4



Зарегистрирован: 11.09.2010
Сообщения: 143

СообщениеДобавлено: Чт Мар 01, 2018 9:16 am    Заголовок сообщения: Ответить с цитатой

York(злой статистик) писал(а):

Обещал- выкладываю.


Так то да, но только у нас нет P(H0) и p-value выбираем сами, как это нам позволяет высчитать "вероятность что солгал, если в результате теста +5" ? Просто назнвчить P(H0) =0.25 , а p-value = 0,05 ?

Ну а давайте просто перебором назначим разные {P(-13) = 1/27;... P(0)=1/27;...P(+13) =1/27 } и -p-value = 0,05 , и тоже получиться таблица с P(Hx | "вероятность что солгал, если в результате теста +5" ). A зафиксируем вероятность "вероятность что солгал, если в результате теста +5" , получим разные p-value. Мне кажется вы сами пару страниц назад решили, что они явно делали что-то другое. Я вот тоже ошибался когда подумал, что "О! кто-то сделал ход фишером" . Но увы, обычным конём. Взяли бутстрэпом нагенерировали выборок из нескольких сотен проверок ( и лживых, и читсых, всех скопом), загнали в матрицу хи квадрат, и выдернули оттуда альфу. Скорее всего сделали так.

_________________
...Остап не баловал своих противников разнообразием дебютов...
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
$erP
Site Admin


Зарегистрирован: 29.06.2005
Сообщения: 7851
Откуда: Москва

СообщениеДобавлено: Чт Мар 01, 2018 9:47 am    Заголовок сообщения: Ответить с цитатой

York(злой статистик) писал(а):
Обещал- выкладываю.

Слева - "корова молоко дает"; справа - " дает корова молоко".

York, ничего не изменилось... а именно - без долгих и, скорей всего, очень спорных комментариев ничего не понятно... уж извините...

Но... судя по обозначениям, как то похожим на обозначения условных вероятностей, Вы для аргументации своей позиции используете Байесовскую статистику...

Если так, то, думаю, в этом и есть ключ ко всем разночтениям...

ESS создавалась как раз для того, чтобы уйти от использования Байесовской статистики.. уйти от бесконечных "а если... а вдруг...", которыми можно заклевать мозг до посинения...
ESS - эмпирическая система... она создавалась с использованием "параметрического" ("частотного") подхода... в основу которого был заложен массив данных проведенных тестирований...

"Как ни странно, самым простым способом решения этой проблемы оказался следующий: не применять Байесовскую статистику, а заменить ее использованием "параметрической статистики, особенно если учесть, что с ее помощью можно было уверенно отвечать на все научные вопросы, сформулированные в начале моей лекции" (Р.Нельсон, П-С., т3, стр. 281, сохранено оригинальное выделение текста).

Ну, правда... зачем делать сложным, то что проще простого? Зачем гадать на Байесовской кофейной гуще, если есть наработанный эмпирический материал?
Разумеется, недостатки есть... есть много непонятного... но это уже совсем другая плоскость изучения...

_________________
Мое почтение... $erP

................................... ЛЕГКО СОЛГАТЬ ТЯЖЕЛО
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
Александр Калафати



Зарегистрирован: 12.10.2011
Сообщения: 1852
Откуда: Москва

СообщениеДобавлено: Чт Мар 01, 2018 10:36 am    Заголовок сообщения: Ответить с цитатой

Юрий, т.е. Вы хотите сказать, что при условии P(Ho) = 0,5 , Р(>= +5) = 9/27, Р-vakue = 0.04.
То вероятность ошибки = 0.06? Так?

А если взять за P(Ho) значение 0,25 , то и вовсе 0.03. Т.е. если я прав, по сути все упирается в верно посчитанные р- value и Р(Но)...

_________________
Быть, а не казаться.
http://polygraph-triumph.ru/
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Посетить сайт автора
$erP
Site Admin


Зарегистрирован: 29.06.2005
Сообщения: 7851
Откуда: Москва

СообщениеДобавлено: Чт Мар 01, 2018 10:56 am    Заголовок сообщения: Ответить с цитатой

Коллеги, а зачем вы ограничиваетесь рамками -13...+13 баллов? только потому что так написано у самих разработчиков? Коллеги, все мы знаем, что со стороны виднее...

Ведь понятно же... что теоретически... по принципу "а если... а вдруг..." 2RQ тест может получить любой балл от -40 до +40... то есть вероятность получить какой то определенный балл по тесту составляет 1/81...

_________________
Мое почтение... $erP

................................... ЛЕГКО СОЛГАТЬ ТЯЖЕЛО
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
Показать сообщения:   
Начать новую тему   Ответить на тему    Список форумов ПОЛИГРАФ - ФОРУМ -> Общий форум Часовой пояс: GMT + 3
На страницу Пред.  1, 2, 3 ... 5, 6, 7 ... 12, 13, 14  След.
Страница 6 из 14

 
Перейти:  
Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах
You cannot attach files in this forum
You cannot download files in this forum


Powered by phpBB © 2001, 2005 phpBB Group
Рейтинг@Mail.ru Rambler's Top100