Попытка понять теорию Байеса с помощью прямого применения

Попытка понять теорию Байеса с помощью прямого применения ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Попытка понять теорию Байеса с помощью прямого применения

Цитата

Сообщение Anonymous » 01 мар 2024, 21:54

Я пытаюсь применить теорему Байеса к своей проблеме, чтобы понять методологию и порядок расчета чисел.

По сути, у меня есть данные о четырех художниках и количестве объектов, которые они создают каждый месяц за 80 периодов.

Меня интересует буква «h», и я считаю, что существует три равновероятных варианта последнего обновления: 1) ушел с работы, 2) получил повышение и делился временем между созданием и управлением другими людьми, 3) был работал над проектом.

Для реализации этого процесса я использовал код Аллена Дауни Think Bayes.

из эмпирического импорта Pmf # Определить гипотезы гипос = ["левый", "управляющий", "проект"] # Определить априорные вероятности — все они одинаково вероятны предшествующий = Pmf(1/len(гипо), гипо) # Отобразить априорные вероятности print("Априорные вероятности:") печать (предшествующая) Результат:

Априорные вероятности: осталось 0,333333 управляющий 0,333333 проект 0.333333 тип d: float64 Код:

# Нормализовать данные для расчета вероятности нормализованные_данные = df.div(df.sum(ось=1), ось=0) Нормализованные данные:

h j n t 0 0,000000 1,000000 0,000000 0,0 1 0,666667 0,333333 0,000000 0,0 2 0,571429 0,428571 0,000000 0,0 3 0,769231 0,230769 0,000000 0,0 4 0,700000 0,300000 0,000000 0,0 Теперь я запутался.

из эмпирического импорта Pmf # Определить гипотезы гипос = ["левый", "управляющий", "проект"] # Рассчитайте вероятность, используя нормализованные данные вероятности = {} для гипо в гипо: правдоподобия [гипо] = нормализованные_данные.apply (лямбда-строка: строка, если гипо == «влево», иначе 1, ось = 1) # Выполняем байесовское обновление, чтобы получить апостериорные вероятности posterior_history = [предыдущий] для гипо в гипо: posterior = Prior.copy() # Создаем копию априорных вероятностей если гипо == "левый": # Обеспечиваем выравнивание меток строк и выполняем поэлементное умножение для индекса, строка в вероятности[hypo].iterrows(): если индекс в заднем.index: задний.loc[индекс] *= строка posterior /= posterior.sum() # Нормализуем апостериорные вероятности posterior_history.append(задний) Выход:

[осталось 0,333333 управляющий 0,333333 проект 0.333333 тип d: float64, осталось 0,333333 управляющий 0,333333 проект 0.333333 тип d: float64, осталось 0,333333 управляющий 0,333333 проект 0.333333 тип d: float64, осталось 0,333333 управляющий 0,333333 проект 0.333333 тип d: float64] Меня смутил результат по двум причинам. 1) задний такой же, как и предшествующий. 2) Есть четыре выхода.

Возможно, я слишком усложняю ситуацию и мне следует просто обновить значения, используя только один столбец нормализованных данных.

Что мне попробовать дальше?

Я создал список данных data_to_dict, таким образом:
{'h': {0: 0.0, 1:2,0, 2:4,0, 3:10,0, 4:7,0, 5:6,0, 6:4,0, 7:10,0, 8:11,0, 9:3,0, 10:4,0, 11:6,0, 12:3,0, 13:4,0, 14:8,0, 15:9,0, 16:6,0, 17:5,0, 18:6,0, 19:5,0, 20:4,0, 21:1,0, 22:3,0, 23:4,0, 24:0,0, 25:2,0, 26:6,0, 27:4,0, 28:8,0, 29:2,0, 30:4,0, 31:2,0, 32:2,0, 33:3,0, 34:2,0, 35:3,0, 36:2,0, 37:3,0, 38:3,0, 39:1,0, 40:4,0, 41:2,0, 42:1,0, 43:3,0, 44:3,0, 45:1,0, 46:1,0, 47:1,0, 48:5,0, 49:2,0, 50:2,0, 51:4,0, 52:4,0, 53:2,0, 54:3,0, 55:4,0, 56:2,0, 57:2,0, 58:1,0, 59:4,0, 60:3,0, 61:3,0, 62:3,0, 63:1,0, 64:3,0, 65:2,0, 66:2,0, 67:4,0, 68:2,0, 69:2,0, 70:1,0, 71:0,0, 72:5,0, 73:0,0, 74:3,0, 75:3,0, 76:2,0, 77:2,0, 78:2,0, 79:4,0, 80:1,0, 81:2,0, 82:0,0}, 'j': {0: 2,0, 1:1,0, 2:3,0, 3:3,0, 4:3,0, 5:2,0, 6:1,0, 7:9,0, 8:7,0, 9:4,0, 10:0,0, 11:3,0, 12:6,0, 13:2,0, 14:5,0, 15:4,0, 16:1,0, 17:2,0, 18:2,0, 19:3,0, 20:6,0, 21:6,0, 22:3,0, 23:4,0, 24:5,0, 25:3,0, 26:2,0, 27:1,0, 28:4,0, 29:0,0, 30:1,0, 31:0,0, 32:0,0, 33:2,0, 34:2,0, 35:1,0, 36:0,0, 37:4,0, 38:2,0, 39:0,0, 40:0,0, 41:2,0, 42:2,0, 43:1,0, 44:2,0, 45:1,0, 46:1,0, 47:2,0, 48:0,0, 49:1,0, 50:1,0, 51:2,0, 52:0,0, 53:0,0, 54:0,0, 55:1,0, 56:2,0, 57:1,0, 58:0,0, 59:1,0, 60:0,0, 61:1,0, 62:1,0, 63:1,0, 64: 2,0, 65:0,0, 66:2,0, 67:2,0, 68:5,0, 69:1,0, 70:2,0, 71:2,0, 72:3,0, 73:0,0, 74:3,0, 75:0,0, 76:1,0, 77:2,0, 78:5,0, 79:3,0, 80:1,0, 81:4,0, 82:2.0}, 'н': {0: 0,0, 1:0,0, 2:0,0, 3:0,0, 4:0,0, 5:0,0, 6:0,0, 7:0,0, 8:0,0, 9:0,0, 10:0,0, 11:0,0, 12:0,0, 13:0,0, 14:0,0, 15:0,0, 16:0,0, 17:0,0, 18:0,0, 19:0,0, 20:0,0, 21:0,0, 22:0,0, 23:0,0, 24:0,0, 25:0,0, 26:0,0, 27:0,0, 28:0,0, 29:0,0, 30:0,0, 31:0,0, 32:0,0, 33:0,0, 34:0,0, 35:0,0, 36:0,0, 37:0,0, 38:0,0, 39:0,0, 40:0,0, 41:0,0, 42:0,0, 43:0,0, 44:0,0, 45:0,0, 46:0,0, 47:0,0, 48:0,0, 49:0,0, 50:0,0, 51:0,0, 52:0,0, 53:0,0, 54:0,0, 55:0,0, 56:0,0, 57:0,0, 58:0,0, 59:0,0, 60:0,0, 61:0,0, 62:0,0, 63:0,0, 64:0,0, 65:0,0, 66:0,0, 67:0,0, 68:0,0, 69:0,0, 70:0,0, 71:0,0, 72:0,0, 73:1,0, 74:3,0, 75:6,0, 76:8,0, 77:2,0, 78:3,0, 79:2,0, 80:2,0, 81:5,0, 82:2.0}, 'т': {0: 0,0, 1:0,0, 2:0,0, 3:0,0, 4:0,0, 5:0,0, 6:0,0, 7:0,0, 8:6,0, 9:3,0, 10:4,0, 11:8,0, 12:2,0, 13:5,0, 14:5,0, 15:3,0, 16:7,0, 17:3,0, 18:4,0, 19:2,0, 20:5,0, 21:1,0, 22:2,0, 23:2,0, 24:2,0, 25:1,0, 26:1,0, 27:6,0, 28:4,0, 29:5,0, 30:2,0, 31:3,0, 32:6,0, 33:1,0, 34:2,0, 35:1,0, 36:2,0, 37:1,0, 38:2,0, 39:1,0, 40:0,0, 41:2,0, 42:2,0, 43:2,0, 44:2,0, 45:2,0, 46:3,0, 47:0,0, 48:2,0, 49:5,0, 50:3,0, 51:4,0, 52:0,0, 53:1,0, 54:1,0, 55:0,0, 56:3,0, 57:1,0, 58:1,0, 59:0,0, 60:1,0, 61:1,0, 62:1,0, 63:2,0, 64:0,0, 65:1,0, 66:1,0, 67:0,0, 68:0,0, 69:0,0, 70:0,0, 71:0,0, 72:0,0, 73:0,0, 74:0,0, 75:0,0, 76:0,0, 77:0,0, 78:0,0, 79:0,0, 80:0,0, 81:0,0, 82:0.0}} df = pd.DataFrame(df_to_dict)

1709319263

Anonymous


Я пытаюсь применить теорему Байеса к своей проблеме, чтобы понять методологию и порядок расчета чисел.
 
По сути, у меня есть данные о четырех художниках и количестве объектов, которые они создают каждый месяц за 80 периодов.
 
Меня интересует буква «h», и я считаю, что существует три равновероятных варианта последнего обновления: 1) ушел с работы, 2) получил повышение и делился временем между созданием и управлением другими людьми, 3) был работал над проектом.
 
Для реализации этого процесса я использовал код Аллена Дауни Think Bayes.
 
из эмпирического импорта Pmf # Определить гипотезы гипос = ["левый", "управляющий", "проект"] # Определить априорные вероятности — все они одинаково вероятны предшествующий = Pmf(1/len(гипо), гипо) # Отобразить априорные вероятности print("Априорные вероятности:") печать (предшествующая)  Результат:
 
Априорные вероятности: осталось 0,333333 управляющий 0,333333 проект 0.333333 тип d: float64  Код:
 
# Нормализовать данные для расчета вероятности нормализованные_данные = df.div(df.sum(ось=1), ось=0)  Нормализованные данные:
 
 h j n t 0 0,000000 1,000000 0,000000 0,0 1 0,666667 0,333333 0,000000 0,0 2 0,571429 0,428571 0,000000 0,0 3 0,769231 0,230769 0,000000 0,0 4 0,700000 0,300000 0,000000 0,0  Теперь я запутался.
 
из эмпирического импорта Pmf # Определить гипотезы гипос = ["левый", "управляющий", "проект"]     # Рассчитайте вероятность, используя нормализованные данные     вероятности = {}     для гипо в гипо:         правдоподобия [гипо] = нормализованные_данные.apply (лямбда-строка: строка, если гипо == «влево», иначе 1, ось = 1)     # Выполняем байесовское обновление, чтобы получить апостериорные вероятности     posterior_history = [предыдущий]     для гипо в гипо:         posterior = Prior.copy() # Создаем копию априорных вероятностей         если гипо == "левый":             # Обеспечиваем выравнивание меток строк и выполняем поэлементное умножение             для индекса, строка в вероятности[hypo].iterrows():                 если индекс в заднем.index:                     задний.loc[индекс] *= строка         posterior /= posterior.sum() # Нормализуем апостериорные вероятности         posterior_history.append(задний)  Выход:
 
[осталось 0,333333  управляющий 0,333333  проект 0.333333  тип d: float64,  осталось 0,333333  управляющий 0,333333  проект 0.333333  тип d: float64,  осталось 0,333333  управляющий 0,333333  проект 0.333333  тип d: float64,  осталось 0,333333  управляющий 0,333333  проект 0.333333  тип d: float64]  Меня смутил результат по двум причинам. 1) задний такой же, как и предшествующий. 2) Есть четыре выхода.
 
Возможно, я слишком усложняю ситуацию и мне следует просто обновить значения, используя только один столбец нормализованных данных.
 
Что мне попробовать дальше?
 
Я создал список данных data_to_dict, таким образом:
 {'h': {0: 0.0,   1:2,0,   2:4,0,   3:10,0,   4:7,0,   5:6,0,   6:4,0,   7:10,0,   8:11,0,   9:3,0,   10:4,0,   11:6,0,   12:3,0,   13:4,0,   14:8,0,   15:9,0,   16:6,0,   17:5,0,   18:6,0,   19:5,0,   20:4,0,   21:1,0,   22:3,0,   23:4,0,   24:0,0,   25:2,0,   26:6,0,   27:4,0,   28:8,0,   29:2,0,   30:4,0,   31:2,0,   32:2,0,   33:3,0,   34:2,0,   35:3,0,   36:2,0,   37:3,0,   38:3,0,   39:1,0,   40:4,0,   41:2,0,   42:1,0,   43:3,0,   44:3,0,   45:1,0,   46:1,0,   47:1,0,   48:5,0,   49:2,0,   50:2,0,   51:4,0,   52:4,0,   53:2,0,   54:3,0,   55:4,0,   56:2,0,   57:2,0,   58:1,0,   59:4,0,   60:3,0,   61:3,0,   62:3,0,   63:1,0,   64:3,0,   65:2,0,   66:2,0,   67:4,0,   68:2,0,   69:2,0,   70:1,0,   71:0,0,   72:5,0,   73:0,0,   74:3,0,   75:3,0,   76:2,0,   77:2,0,   78:2,0,   79:4,0,   80:1,0,   81:2,0,   82:0,0},  'j': {0: 2,0,   1:1,0,   2:3,0,   3:3,0,   4:3,0,   5:2,0,   6:1,0,   7:9,0,   8:7,0,   9:4,0,   10:0,0,   11:3,0,   12:6,0,   13:2,0,   14:5,0,   15:4,0,   16:1,0,   17:2,0,   18:2,0,   19:3,0,   20:6,0,   21:6,0,   22:3,0,   23:4,0,   24:5,0,   25:3,0,   26:2,0,   27:1,0,   28:4,0,   29:0,0,   30:1,0,   31:0,0,   32:0,0,   33:2,0,   34:2,0,   35:1,0,   36:0,0,   37:4,0,   38:2,0,   39:0,0,   40:0,0,   41:2,0,   42:2,0,   43:1,0,   44:2,0,   45:1,0,   46:1,0,   47:2,0,   48:0,0,   49:1,0,   50:1,0,   51:2,0,   52:0,0,   53:0,0,   54:0,0,   55:1,0,   56:2,0,   57:1,0,   58:0,0,   59:1,0,   60:0,0,   61:1,0,   62:1,0,   63:1,0,   64: 2,0,   65:0,0,   66:2,0,   67:2,0,   68:5,0,   69:1,0,   70:2,0,   71:2,0,   72:3,0,   73:0,0,   74:3,0,   75:0,0,   76:1,0,   77:2,0,   78:5,0,   79:3,0,   80:1,0,   81:4,0,   82:2.0},  'н': {0: 0,0,   1:0,0,   2:0,0,   3:0,0,   4:0,0,   5:0,0,   6:0,0,   7:0,0,   8:0,0,   9:0,0,   10:0,0,   11:0,0,   12:0,0,   13:0,0,   14:0,0,   15:0,0,   16:0,0,   17:0,0,   18:0,0,   19:0,0,   20:0,0,   21:0,0,   22:0,0,   23:0,0,   24:0,0,   25:0,0,   26:0,0,   27:0,0,   28:0,0,   29:0,0,   30:0,0,   31:0,0,   32:0,0,   33:0,0,   34:0,0,   35:0,0,   36:0,0,   37:0,0,   38:0,0,   39:0,0,   40:0,0,   41:0,0,   42:0,0,   43:0,0,   44:0,0,   45:0,0,   46:0,0,   47:0,0,   48:0,0,   49:0,0,   50:0,0,   51:0,0,   52:0,0,   53:0,0,   54:0,0,   55:0,0,   56:0,0,   57:0,0,   58:0,0,   59:0,0,   60:0,0,   61:0,0,   62:0,0,   63:0,0,   64:0,0,   65:0,0,   66:0,0,   67:0,0,   68:0,0,   69:0,0,   70:0,0,   71:0,0,   72:0,0,   73:1,0,   74:3,0,   75:6,0,   76:8,0,   77:2,0,   78:3,0,   79:2,0,   80:2,0,   81:5,0,   82:2.0},  'т': {0: 0,0,   1:0,0,   2:0,0,   3:0,0,   4:0,0,   5:0,0,   6:0,0,   7:0,0,   8:6,0,   9:3,0,   10:4,0,   11:8,0,   12:2,0,   13:5,0,   14:5,0,   15:3,0,   16:7,0,   17:3,0,   18:4,0,   19:2,0,   20:5,0,   21:1,0,   22:2,0,   23:2,0,   24:2,0,   25:1,0,   26:1,0,   27:6,0,   28:4,0,   29:5,0,   30:2,0,   31:3,0,   32:6,0,   33:1,0,   34:2,0,   35:1,0,   36:2,0,   37:1,0,   38:2,0,   39:1,0,   40:0,0,   41:2,0,   42:2,0,   43:2,0,   44:2,0,   45:2,0,   46:3,0,   47:0,0,   48:2,0,   49:5,0,   50:3,0,   51:4,0,   52:0,0,   53:1,0,   54:1,0,   55:0,0,   56:3,0,   57:1,0,   58:1,0,   59:0,0,   60:1,0,   61:1,0,   62:1,0,   63:2,0,   64:0,0,   65:1,0,   66:1,0,   67:0,0,   68:0,0,   69:0,0,   70:0,0,   71:0,0,   72:0,0,   73:0,0,   74:0,0,   75:0,0,   76:0,0,   77:0,0,   78:0,0,   79:0,0,   80:0,0,   81:0,0,   82:0.0}} df = pd.DataFrame(df_to_dict)

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Привет! Есть ли какой-нибудь алгоритм, использующий грубую теорию множеств для уменьшения размерности с использованием P

Последнее сообщение Anonymous « 25 дек 2024, 14:11
Добавлено в форуме Python

Anonymous » 25 дек 2024, 14:11 » в форуме Python

Я пробовал использовать коды Python с этого сайта но, к сожалению, не получил никаких результатов. Я столкнулся с ошибкой.
Есть ли у кого-нибудь опыт использования грубой теории множеств для уменьшения размерности набора данных с использованием...

0 Ответы

13 Просмотры

Последнее сообщение Anonymous
25 дек 2024, 14:11
PHP. Статическое свойство ребенка отменяет родителей? Кто -нибудь может объяснить теорию?

Последнее сообщение Anonymous « 26 янв 2025, 02:09
Добавлено в форуме Php

Anonymous » 26 янв 2025, 02:09 » в форуме Php

Вот пример кода. Протестировано в PHP 5.6, PHP 7.3.
class a {
static public $prop = 'in a';
}

class b extends a {

}

a::$prop = 111;
b::$prop = 777;

print_r(a::$prop);

Как вы думаете, что мы получаем?
a::prop = 777 (!!!)

Я знаю принципы...

0 Ответы

28 Просмотры

Последнее сообщение Anonymous
26 янв 2025, 02:09
Смешивание категориальных и непрерывных данных в классификаторе Наивного Байеса с использованием scikit-learn

Последнее сообщение Anonymous « 30 июл 2024, 22:31
Добавлено в форуме Python

Anonymous » 30 июл 2024, 22:31 » в форуме Python

Я использую scikit-learn на Python для разработки алгоритма классификации, позволяющего предсказывать пол определенных клиентов. Среди прочего я хочу использовать классификатор Наивного Байеса, но моя проблема в том, что у меня есть сочетание...

0 Ответы

17 Просмотры

Последнее сообщение Anonymous
30 июл 2024, 22:31
Как реализовать смесь гамма-распределений в Python без Байеса?

Последнее сообщение Anonymous « 03 янв 2025, 17:44
Добавлено в форуме Python

Anonymous » 03 янв 2025, 17:44 » в форуме Python

Я пытаюсь создать примеры для сравнения и противопоставления байесовского MCMC (например, HMC) с небайесовскими эквивалентами. Один из случаев, который мне кажется трудным, — это создание смеси гамма-распределений.
Сначала я добился некоторого...

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
03 янв 2025, 17:44
Как реализовать смесь гамма-распределений в Python без Байеса?

Последнее сообщение Anonymous « 04 янв 2025, 22:51
Добавлено в форуме Python

Anonymous » 04 янв 2025, 22:51 » в форуме Python

Я пытаюсь создать примеры для сравнения и противопоставления байесовского MCMC (например, HMC) с небайесовскими эквивалентами. Один из случаев, который мне кажется трудным, — это создание смеси гамма-распределений.
Сначала я добился некоторого...

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
04 янв 2025, 22:51

Вернуться в «Python»