Байесовские сети


4 года 11 мес. назад #51413 от Роман Пантелеев
Я могу пролить ведро воды, может проехать поливалка, может забиться канализация, может прорвать водоснабжение и множество других причин. В итоге посчитанные вероятности летят к чертям. И точно считать Вы сможете только когда соберёте все причины и точно их вероятности - т.е. никогда. В итоге все что может дать этот расчёт только более вероятную причину среди РАССМАТРИВАЕМЫХ. Но причина может вполне оказаться среди не рассмотренных и что с этим всем делать? И зачем?!
Спасибо сказали: Виктор Сорока

Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.


4 года 11 мес. назад - 4 года 11 мес. назад #51416 от Георгий Лейбович

Александр Запорожцев пишет: .....
Самое интересное дальше)))
Имея такую модель мы можем задать вопрос - если мы наблюдаем, что трава мокрая - какова вероятность того, что идет дождь и что включена поливальная установка. Получаем интересный результат - идет дождь с вероятностью 0.29, а вероятность включения поливальной установки = 0.88


Александр, я не против :) Б-статистики и Б-сетей, но Ваш пример очень просто решается обычными методами - расчёт условных вероятностей.
Мокрая трава: 0.2 + 0.6 (1 - 0.2) = 0.68, где (1 - 0.2) - условие полива только без дождя
Вероятность мокрой травы из-за дождя: 0.2/0.68= 0,294
Вероятность включения полива - 0.6/0.68= 0.882
Вероятность совпадения - 0.882 х 0.2 = 0.176
Проверяем, получим ли 1: 0.294 + 0.882 - 0.176 = 1 Вот и всё.



В том то и дело, что всюду приводят простые примеры, которые должны увлечь и убедить в полезности (далеко не только в этом случае), но не убеждают, что надо городить огород. И Вы же не думаете, что Б-статистика много проще классической?
Одно из преимуществ этих сетей в том, что построив её, установив в общем виде условные вероятности, можно при поступлении новых данных (разного вида) просто пересчитывать, хотя это "пересчитывать" может быть очень громоздко. Можно и корректировать сеть, что много более интересно. Но из простого примера ничего не видно.
Лучше привести интересные конкретные примеры решения задачь, которые оказалось проще решить с помощью этих сетей. Это интересно.
Спасибо сказали: Виктор Сорока

Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.


4 года 11 мес. назад - 4 года 11 мес. назад #51417 от Александр Запорожцев

Георгий Лейбович пишет: Александр, я не против :) Б-статистики и Б-сетей, но Ваш пример очень просто решается обычными методами - расчёт условных вероятностей. Да, конечно!
В том то и дело, что всюду приводят простые примеры, На простых примерах легче понять суть подхода
И Вы же не думаете, что Б-статистика много проще классической? Специалисты различают два подхода: классический и байесовский. Классический основан на понимании случайности как объективной неопределенности, а байесовский подход основан а понимании случайности как меры нашего незнания . Нет конечно - сложность обоих методов одинаковая.
Лучше привести интересные конкретные примеры решения задач, которые оказалось проще решить с помощью этих сетей. Это интересно.

Примеров много, но все они сложные.

Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.


4 года 11 мес. назад #51418 от Александр Запорожцев

Роман Пантелеев пишет: Я могу пролить ведро воды, может проехать поливалка, может забиться канализация, может прорвать водоснабжение и множество других причин. В итоге посчитанные вероятности летят к чертям. И точно считать Вы сможете только когда соберёте все причины и точно их вероятности - т.е. никогда. В итоге все что может дать этот расчёт только более вероятную причину среди РАССМАТРИВАЕМЫХ. Но причина может вполне оказаться среди не рассмотренных и что с этим всем делать? И зачем?!

Совершенно верно - собрать полные данные о всех ВОЗМОЖНЫХ причинах невозможно. Байесовский подход основан на применении понятия вероятности к нашим субъективным суждениям - не более того. Обратите внимание, что здесь мы снова встречаемся с тем, что объективной истины нет, а есть только наши субъективные оценки (вспоминаем стейкхолдеров).

Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.


4 года 11 мес. назад - 4 года 11 мес. назад #51422 от Георгий Лейбович

Александр Запорожцев пишет: ...
В том то и дело, что всюду приводят простые примеры, На простых примерах легче понять суть подхода ...
Лучше привести интересные конкретные примеры решения задач, которые оказалось проще решить с помощью этих сетей. Это интересно.

Примеров много, но все они сложные.[/quote]

Попробую даже на этом простом примере рассказать хоть немного о сути Б-сетей в той части, которую я хоть немного понимаю.
Запишем вероятность того, что трава мокрая: Р(М) = Р(Д) + Р(П) - Р(Д)Р(П) = Р(Д) + Р(П)(1 - Р(Д)). - формула 1
Установив соотношение вероятностей в общем случае (построив маленькую сеть) посмотрим, что с этим можно сделать
1. В случае Р(Д) = 0.2 и Р(П) = 0.6 получаем вероятность мокрой травы Р(М) = 0.2 + 0.6 (1 - 0.2) = 0.68. Зная это, легко найти параметры, если наблюдаем мокрую траву - это значит, что попали в область "мокрых" дней. Тогда делим всё на 0.68, то есть, исходные параметры те же, но наблюдаем только мокрые дни. Поэтому вероятности рассчитаны для них только. Отсюда 0.294 и 0.882 (задача, приведённая Александром).
2. А теперь, зная формулу 1, можно рассмотреть случай наблюдения, например, за количеством "мокрых" дней при одном параметре фиксированном. То есть, связав наблюдаемые переменные условными вероятностями, можно рассчитывать одни из них по наблюдаемым значениям других.
Например, пусть "мокрых" дней наблюдается 0.8, а вероятность дождя 0.2. Тогда по формуле 1 получаем, что частота включений поливальной установки Р(П) = 0.75
При этом, в ситуации недостатка знаний, можно сделать следующий шаг - подставлять как точные, так и статистические или интуитивные данные. Затем полученные разультаты можно корректировать, зная соотношение. Если обнаружится, что есть устойчивое расхождение наблюдения и расчёта - это сигнал к совершенствованию сети - её обучению.
3. А теперь представим, что переменных много, и мы связали их в сеть - к каждому узлу сети подходит несколько связей. Если мы можем связать их в вероятностную модель, то имея много наблюдений можем, в принципе, оцифровать эти связи. То есть, это задача, обратная приведённой Александром, где все исходные параметры известны. И прямая, и обратная задачи вычислительно крайне (иногда - чудовищно) громоздкие, предложены различные способы упрощения вычислений.
Видимо, я лишь немного коснулся сути Б-сетей.

Добавлю, что вероятности 0.294 и 0.882 появились как условные вероятности при предъявлении факта, что трава - мокрая.

Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.


4 года 11 мес. назад - 4 года 11 мес. назад #51423 от Александр Запорожцев

Георгий Лейбович пишет: Запишем вероятность того, что трава мокрая: Р(М) = Р(Д) + Р(П) - Р(Д)Р(П) = Р(Д) + Р(П)(1 - Р(Д)). - формула 1

Эта формула вероятности суммы совместных событий, которая записывается так P(A+B]=P(A]+P(B]−P(A⋅B]?
Тогда вы считаете, что событие "трава мокрая" - это сумма двух совместных событий "идет дождь" и "производиться полив". Действительно, предполагается, что эти события независимые, а значит они могут происходить одновременно.
Я только не понял, где таблица условных вероятностей?
В том примере, который я привел таблица условных вероятностей имел вид

и тогда вероятность того, что трава мокрая равна 0.68
Если изменить условные вероятности и принять их следующими

то вероятность того, что трава мокрая измениться и будет равна 0.66
Вложения:

Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.


4 года 11 мес. назад #51424 от Роман Пантелеев
У меня другой вопрос: ДЛЯ ЧЕГО эти сложные вычисления? Только для того чтобы понять наиболее вероятную причину? Или есть ещё какие то серьезные полезности?

Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.


4 года 11 мес. назад #51425 от Александр Запорожцев

Роман Пантелеев пишет: У меня другой вопрос: ДЛЯ ЧЕГО эти сложные вычисления? Только для того чтобы понять наиболее вероятную причину? Или есть ещё какие то серьезные полезности?

Не могу в полной мере ответить на Ваши вопросы так как еще сам только пытаюсь разобраться, но
1. Это другой подход к изучению реальности, когда мы модель этой реальности в виде причин и следствий, в которой отражаем наш текущий уровень знаний.
2. Собираем сведения о вероятности проявления состояний, в которых может находиться каждый элемент модели.
3. На основе оценки вероятностей можно оценить последствия действия причин, а также рассчитать вероятность последствий при разных сочетаниях промежуточных следствий.
4. Можно сверить эти выводы с реальными данными и, если они будут противоречить расчетным значениям, то это будут свидетельствовать, что наша модель недостаточно точка или вообще ошибочна. - будем менять модель.
Собственно в этом и заключается баесовский подход, когда мы учитываем те свидетельства, которые наблюдаем в реальности.

Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.


4 года 11 мес. назад #51426 от Александр Запорожцев

Роман Пантелеев пишет: У меня другой вопрос: ДЛЯ ЧЕГО эти сложные вычисления? Только для того чтобы понять наиболее вероятную причину? Или есть ещё какие то серьезные полезности?

Ничего сложного в вычислении нет - программа сама считает. Достаточно только простроить модель и ввести данные о вероятностях

Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.


4 года 11 мес. назад #51428 от Георгий Лейбович

Александр Запорожцев пишет: ......
Тогда вы считаете, что событие "трава мокрая" - это сумма двух совместных событий "идет дождь" и "производиться полив". Действительно, предполагается, что эти события независимые, а значит они могут происходить одновременно.
Я только не понял, где таблица условных вероятностей?...

Не так. Независимыми событиями являются вероятность включения Р(П) и Р(Д). Повторю, что Р(П) - это вероятность включения, она не зависит от дождя. В Вашем примере она равна 0.6. Переменная "производится полив" - условная, она равна Р(П)(1 - Р(Д)), поэтому Р(М) равна сумме вероятностей дождя Р(Д) и вероятности "производится полив". Вероятность того, что трава мокрая, складывается из вероятности дождя (0.2/0.68) и вероятности "производится полив (0.6(1 - 0.2)/0.68)" или 0,71
В более общем виде вероятность "производится полив" равна Р(П)(1 - кР(Д)), где к определяет, как реагирует поливальная установка на дождь.
А зачем мне таблица? Кроме того, пока Вы работаете с такими задачами - Б-сети не при чём. Поэтому я и пишу, что примеры простые, но притянутые за уши. Хороший, но простой пример здесь привести трудно. А простой, но плохой - вредно.

По поводу громоздких вычислений. А Вы прикиньте, что у вас много узлов и много соединяющих дуг. И, соответственно, много условных вероятностей (если их нет - то ничего нет). Комп быстро исчерпает свои возможности, поэтому идут на многие ухищрения.Это задачка с одним узлом и тремя (Вы на картинке одну дугу связи (условную) пропустили) дугами простая.

И вообще Б-сети - не об этом и не для этого.

Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.

Работает на Kunena форум