Перейти к содержимому
Дипломат

Дневник Дипломата. Страничка о Байесе.

Recommended Posts

Думаю, что лучше здесь вести обсуждение теоретических и практических вопросов применения формулы Байеса, чем в соответствующей теме конкурса.

Продублирую немного теории....

 

1) Пусть есть гипотеза П1 (победа первой команды).
Из линии берем вероятность справедливости этой гипотезы:
р1=(1-м)/К1, К1 - коэффициент на П1, м - маржа.
Назовем эту вероятность априорной.

2)Поступает некоторое свидетельство Н1, говорящее ДОПОЛНИТЕЛЬНО о справедливости гипотезы П1. Вероятность справедливости этого свидетельства рн.

3)Можно теперь уточнить вероятность р1 и получить апостериорную вероятность р1а:

р1а=(р1*рн))/(р1*рн+(1-р1)*(1-рн))

4) Теперь принимаем р1=р1а.
5) Если есть еще свидетельства о гипотезе П1, то переходим к пункту 2, иначе - к пункту 6.
6) Оцениваем полученную вероятность р1 гипотезы П1 и принимаем решение о ставке.


Аналогично поступаем с гипотезами Х (ничья) и П2 (победа второй команды) и получаем уточненные вероятности рх и р2.

Вопрос о принятии решения о ставке можно решать по-разному. Два крайних варианта:
1) ставка делается согласно той гипотезе, которой соответствует наибольшая вероятность.
2) Ставка делается, если вероятность соответствующей гипотезы выше заранее установленного порога.


В качестве свидетельств может выступать мнение экспертов, тогда говорят, что работает экспертная система на базе байесовского подхода. 

 

  • Like 1

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Имеет смысл разобрать особенности самой формулы.

1) если вероятность свидетельства 0.5, то апостериорная вероятность равна априорной

2) если вероятность свидетельства больше 0.5, то апостериорная вероятность выше априорной, и соответственно - наоборот

3) если вероятность свидетельства 1, то апостериорная вероятность тоже станет 1

4) формула симметрична, то есть формально можно менять местами априорную вероятность и вероятность свидетельства

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Тур 3,     05.12.2018                    
          итоговый    прогноз     
1. 22:45        Фулхэм -     Лестер                                Х    Х2
2. 23:00         Манчестер Юн -    Арсенал               П1    12
3. 21:00          Кан -    Ним                                          П2    12
                          
          Прогнозы участников     
Lovectb              П2    Х    Х     
Motivation         Х    П1    П2     
piralgin33           Х    П2    П2     
Xutpbiu174         П2    П2    П2     
insmaf                 Х    П2    П2     
vakap                 П2    П1    П2     
DrXPEH               Х    П2    П2

Казалось бы неожиданный прогноз на 2-й матч, при четырех мнениях эксперто П2 и двух мнениях П1 итоговый прогноз П1 !!!

Посмотрим на таблицу вероятностей свидетельств экспертов

Lovectb    6    1    0,406248438
Motivation    6    4    0,593746875
piralgin33    6    4    0,593746875
Xutpbiu174    6    3    0,546872656
insmaf    3    1    0,499996875
vakap    3    3    0,593745313
DrXPEH    3    1    0,499996875

В каждой строке после ника - количество прогнозов, количество угадываний и эта самая вероятность свидетельств. Пока не буду уточнять как она вычисляется, но обратите внимание на вероятности свидетельств в пользу П2 (выделено синим) и на вероятности свидетельств в пользу П1 (выделено красным). Последовательное применение этих вероятностей по формуле Байеса (начальная вероятность и П1 и П2 были 1/3) привели к вероятности П1 0.516, и к вероятности П2 0.469. (пусть не смущают большие вероятности, просто я их не нормирую, что не является обязательным). Обратите внимание, те свидетельства, которые имеют вероятность почти 0.5 (0.4999) - не влияют фактически на итоговый прогноз. В итоге результат решался по двум свидетельствам как на П1, так и на П2

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

То же касается и прогноза на 3-й матч. Первый эксперт своим свидетельством уменьшил вероятность ничьей и как результат вероятность П1 хоть и не изменилась, но стала выше вероятности ничьей. Поэтому на двойник прогноз 12.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Ааа ясно,  получается прогноз тех кто больше угадывает, ценится больше чем те что нет. Ну в принципе логично. 

Интересно чтобы вышло если  использовать  замену переменной в данных расчетах. 

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах
18 минут назад, Дипломат сказал:

То же касается и прогноза на 3-й матч. Первый эксперт своим свидетельством уменьшил вероятность ничьей и как результат вероятность П1 хоть и не изменилась, но стала выше вероятности ничьей. Поэтому на двойник прогноз 12.

Но я взял х2 на Ним что-то мне показалось так будет вероятнее. 

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах
5 минут назад, Motivation сказал:

Но я взял х2 на Ним что-то мне показалось так будет вероятнее. 

Я не могу пойти против Байеса...

Изначально вероятность на ничью взята 1/3 (как и на П1 и П2 )

Все дали прогноз на П2 Lovectb дал прогноз на Х, в результате вероятность ничьей стала (0.4 - вероятность свидетельства Lovectb)

 0.333*0.4/(0.333*0.4+0.667*0.6)=0.255, а вероятность П1 осталась 0.333

 

Изменено пользователем Дипломат

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах
6 минут назад, Дипломат сказал:

Я не могу пойти против Байеса...

Изначально вероятность на ничью взята 1/3 (как и на П1 и П2 )

Все дали прогноз на П2 Lovectb дал прогноз на Х, в результате вероятность ничьей стала (0.4 - вероятность свидетельства Lovectb)

 0.333*0.4/(0.333*0.4+0.667*0.6)=0.255, а вероятность П1 осталась 0.333

 

Это понятно, но у меня свои расчеты, я сверяю их с теорией вероятности что вы даете, и сопоставляю не обходимые мне факторы. 

А если так пошутить, то Байес меня плагиатит уже второй день, рассчитывает итог  так как я предлагаю перед расчетом.)) 

  • Like 1

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Важный момент, иллюстрирующий возможности Байеса.

Всего за два тура 8 экспертов дали 36 прогнозов на 6 матчей. Угадано 18. То есть, 50%.

Эти же прогнозы, прошедшие через Байеса, привели к угадыванию 4 из 6, то есть 66%.

Конечно, нельзя что-то утверждать - слишком рано. Но это иллюстрация того, что хотелось бы видеть регулярно.

  • Like 1

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах
2 минуты назад, Motivation сказал:

Это понятно, но у меня свои расчеты, я сверяю их с теорией вероятности что вы даете, и сопоставляю не обходимые мне факторы. 

А если так пошутить, то Байес меня плагиатит уже второй день, рассчитывает итог  так как я предлагаю перед расчетом.)) 

Это не есть хорошо, но может и не есть плохо...

Получается, что в целом ваши факторы примерно такие же, как и у остальных экспертов! Хорошо это или плохо - зависит наверное от величины "примерно"... ))

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах
2 минуты назад, Дипломат сказал:

Это не есть хорошо, но может и не есть плохо...

Получается, что в целом ваши факторы примерно такие же, как и у остальных экспертов! Хорошо это или плохо - зависит наверное от величины "примерно"... ))

Ну это очевидно что вариаций 3 и естественно расход будет небольшим по отношению друг к другу. Даже если я наугад буду тыкать все равно по дистанции меня вытянет к 50% каждого из них. Равносильно падению монетки, которая выпадает по закону противодействия. 

  • Like 2

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах
3 минуты назад, Motivation сказал:

Ну это очевидно что вариаций 3 и естественно расход будет небольшим по отношению друг к другу. Даже если я наугад буду тыкать все равно по дистанции меня вытянет к 50% каждого из них. Равносильно падению монетки, которая выпадает по закону противодействия. 

Согласен, если тыкать - так и будет. И полученные 50% (при прогнозах не в открытую) никак не повлияют на итог.

Это, безусловно проблема (не тыкание, а выход на 50% на дистанции).... 

Посмотрим, что будет туров эдак через 10...

  • Like 1

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах
5 минут назад, Дипломат сказал:

Согласен, если тыкать - так и будет. И полученные 50% (при прогнозах не в открытую) никак не повлияют на итог.

Это, безусловно проблема (не тыкание, а выход на 50% на дистанции).... 

Посмотрим, что будет туров эдак через 10...

Да,да для того чтобы что-то конкретизировать нужно больше данный. Тк что наблюдаем, дальше. 

Мне нравится использовать различные теории, это куда перспективнее чем просто усреднять цифры забитых и пропущенных, хоть и требует гораздо больше времени. ))

  • Like 1

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Хотел ответить быстренько про тотоху и Баейса, но закончил читать тему о сравнении линий в 34 страницы.... И перешел к вашей "Тервер для серьезных", и вы на 5 странице:

Цитата

Ну или подожди окончания разговора по теме - не долго ужЕ.

Ага кончено, а впереди еще 21 страница:classic_biggrin:

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Важно иметь ввиду, что формула Байеса одинаково хорошо учитывает как положительные свидетельства, так и отрицательные!

То есть, общий результат улучшают не только те эксперты, которые угадывают много, но и те, кто угадывает мало!!

Поэтому, в нашем конкурсе прогноз каждого ценен примерно одинаково. (в связи с этим немного изменится правило распределения призовых)

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Байес...

Реверенд Байес был священником. Жил в 18 веке. Всё время, окромя исповедей, посвящал изучению статистики. (Хотя, может и на исповедях он не сильно отклонялся от основной цели жизни).

Его основная идея состоит в том, что любое утверждение имеет, пусть сколь угодно малую, вероятность быть истинным. Эта вероятность может быть даже нулевой, но это не мешает вести вычисления....

Этот ключевой момент и заложен в формулу, приведенную в самом начале.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах
14 минуты назад, Дипломат сказал:

Байес...

Реверенд Байес был священником. Жил в 18 веке. Всё время, окромя исповедей, посвящал изучению статистики. (Хотя, может и на исповедях он не сильно отклонялся от основной цели жизни).

Его основная идея состоит в том, что любое утверждение имеет, пусть сколь угодно малую, вероятность быть истинным. Эта вероятность может быть даже нулевой, но это не мешает вести вычисления....

Этот ключевой момент и заложен в формулу, приведенную в самом начале.

Ставки - это игрушка дьявола ЕЖЕ! Байес не одобряет 2d1690f3dbd64d38c04b94e52f960596.gif

Изменено пользователем zybik

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах
10 минут назад, zybik сказал:

Ставки - это игрушка дьявола ЕЖЕ! Байес не одобряет 2d1690f3dbd64d38c04b94e52f960596.gif

Байес не делал ставок и не принимал ставок. Он изучал статистику! А статистика - это не только ставки. :classic_smile:

Так вот, все имеет вероятность быть истинным. Вопрос в том, что бы знать эти вероятности. Зачем? Это открывает врата в мир истины....

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Сразу же надо было оговорить, что данная страничка дневника преследует цель сопроводить теоретическими измышлениями соответствующий конкурс

Ну вот и оговариваю... :classic_smile:

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Итак, вероятности...

Надо бы определиться с ними как-то....

Вообще-то вероятностей в природе не существует. Ее придумал человек для своего удобства. Точно так же, как в природе нет чисе, например...

Человек прекрасно понимает, что он придумал именно для своего удобства, но в то же время этот вымысел должен отражать как-то реалии. Поэтому, ВЕРОЯТНОСТЬ - ЭТО СВОЙСТВО. Свойство природы.

Самих определений вероятности практически несчетное количество. Но можно выделить 3 основных.

1) Вероятность - это отношение количества благоприятствующих исходов к общему количеству равновозможных. 

Очень удобное определение!!! Во-первых, сразу ясно, что вероятность изменяется от 0 до 1, так как является отношением части к целому. Во-вторых, ее можно вычислять!

Но, увы, это определение подходит только для симметричных исходов (монета, кубик, а так же почти подходит для чет/нечет, счет в теннисе и т.п)

2) Вероятность близка к частоте, если эта частота устойчива. Это уже подходит ко всему, с чем можно провести эксперимент, или по чему есть ретро данные.

3) Вероятность - это любая функция Р(Х), изменяющаяся в пределах от 0 до 1.

 

Вот эти три понимания вероятности и пригодяться для применения формулы Байеса в прогнозе результатов. Почти всегда - 2-е определение.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

В формуле Байеса участвует три вероятности: априорная, свидетельства, апостериорная.

Апостериорную мы вычисляем и она становится априорной для следующего вычисления. Поэтому, ее нужно задать один раз - в самом начале, до вычислений.

В качестве проблемы, которую будем решать с помощью Байеса, у нас выступает следующее: для какой из 3-х гипотез (П1, Х, П2) вероятность наибольшая. И, без потери общности, сконцентрируемся на гипотезе П1.

Что взять в качестве начальной вероятности П1 ? Очевидно то, что не использует ни одно из будущих свидетельств, то есть некую "чистую", общую для всех матчей вероятность. 

Нужно выбирать между вероятностью по кэфу в линии и Ра=1/3. И это - серьезный вопрос.

Можно попытаться сделать так. Взять Ра=1/3 и тогда вообще не думать о линии (что там учтено или нет). Не уверен, что это лучший вариант, но он подходит как очень удобный. На нем и остановимся.

Сложнее с вероятностями свидетельств. Тут нужно определиться - что вообще за свидетельства будем использовать? Возможно множество вариантов, но среди них два принципиально отличающихся.

1. Можно, выбрав из некоторых соображений (может логических, а может подсмотрев у кого-то) свидетельство А, пытаться определить его вероятность, используя второе определение вероятности - то есть через частоту.

НАПРИМЕР. Для некой команды племени мумба-юмба весьма важно - удовлетворил ли вождь свою жену накануне или нет.  Берем ретро данные и находим соответствующие частоты П1 этой команды. Пусть команда выиграла в 50 матчах из 60, когда вождь справился, и выиграла 20 из 50, когда ничего не получилось. Имеем два свидетельства: А1 - если вождь справился, то Р(А1)=50/60, а если нет - А2, то Р(А2)=20/50. Накануне матча читаем новости племени и выбираем в качестве вероятности свидетельсьва А соответствующую вероятность.

 

  • Like 1

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

То есть, свидетельство - это некий доминантный критерий, имеющий собственную вероятность наступления, которая, в свою очередь, оказывает существенное влияние на вероятность события (априорную). Так? 

  • Like 1

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах
1 час назад, sergei-777 сказал:

То есть, свидетельство - это некий доминантный критерий, имеющий собственную вероятность наступления, которая, в свою очередь, оказывает существенное влияние на вероятность события (априорную). Так? 

Да, но я бы не стал его называть доминантным

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Но он же оказывает существенное влияние (как в вашем примере). Наверняка есть ещё критерии, но степень их влияния на результат может быть гораздо ниже и, соответственно, наш критерий, как бы доминирует в этом влиянии... Впрочем, ваше право... это уже вопрос терминологии, который хоть и важен для взаимопонимания, но не является основополагающим в решении самой задачи.

Хотелось бы более подробно прочитать об однородности выборок (с примерами именно из сферы ставок) и об устойчивости частот (с примерами из той же сферы).

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах
1 час назад, Дипломат сказал:

1. Можно, выбрав из некоторых соображений (может логических, а может подсмотрев у кого-то) свидетельство А, пытаться определить его вероятность, используя второе определение вероятности - то есть через частоту.

НАПРИМЕР. Для некой команды племени мумба-юмба весьма важно - удовлетворил ли вождь свою жену накануне или нет.  Берем ретро данные и находим соответствующие частоты П1 этой команды. Пусть команда выиграла в 50 матчах из 60, когда вождь справился, и выиграла 20 из 50, когда ничего не получилось. Имеем два свидетельства: А1 - если вождь справился, то Р(А1)=50/60, а если нет - А2, то Р(А2)=20/50. Накануне матча читаем новости племени и выбираем в качестве вероятности свидетельсьва А соответствующую вероятность.

 

На этом примере хорошо видны проблемы, связанные с выбором свидетельств и получения их вероятностей...

1) информация может быть инсайдерской

2) информация может быть уже учтена в кэфах (именно поэтому лучше брать начальную априорную вероятность не по кэфам)

3) информация может быть ошибочна. Ведь может на самом деле результат команды сильно влияет от того, присутствует ли вождь на матче или нет, а он отдыхает после удачногй ночи и ему пофиг футбол - и результат оказывается улучшается, если око начальника отсутствует. Но вождь может отсутствовать и по другим причинам!!! В результате - фиктивное увеличение вероятности!!!!!

И это - характерно для каждого свидетельства.

Но! Формула Байеса на столько замечательна, что часть недостатков можно сгладить, если привлечь как можно больше свидетельств и при этом вероятности их несколько уменьшить.... Но об этом нужно говорить отдельно.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Создайте аккаунт или войдите для комментирования

Вы должны быть пользователем, чтобы оставить комментарий

Создать аккаунт

Зарегистрируйтесь для получения аккаунта. Это просто!

Зарегистрировать аккаунт

Войти

Уже зарегистрированы? Войдите здесь.

Войти сейчас

×
Вверх