Scipy Stats ttest_1samp Проверка гипотез для сравнения предыдущей производительности с образцомPython

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Scipy Stats ttest_1samp Проверка гипотез для сравнения предыдущей производительности с образцом

Сообщение Anonymous »

Моя проблема, которую я пытаюсь решить

У меня есть данные о производительности за 11 месяцев:

Код: Выделить всё

        Month  Branded  Non-Branded  Shopping  Grand Total
0    2/1/2015     1330          334       161         1825
1    3/1/2015     1344          293       197         1834
2    4/1/2015      899          181       190         1270
3    5/1/2015      939          208       154         1301
4    6/1/2015     1119          238       179         1536
5    7/1/2015      859          238       170         1267
6    8/1/2015      996          340       183         1519
7    9/1/2015     1138          381       172         1691
8   10/1/2015     1093          395       176         1664
9   11/1/2015     1491          426       199         2116
10  12/1/2015     1539          530       156         2225
Предположим, сейчас 1 февраля 2016 года, и я спрашиваю: «Статистически отличаются ли результаты января от результатов за последние 11 месяцев?»

Код: Выделить всё

       Month  Branded  Non-Branded  Shopping  Grand Total
11  1/1/2016     1064          408       106         1578
Я наткнулся на блог...

Я наткнулся на блог Иайнгаллахера . Я воспроизведу здесь (на случай, если блог выйдет из строя).


1-выборочный t-критерий

Т-критерий Стьюдента для 1 выборки используется, когда мы хотим сравнить выборочное среднее значение со средним
генеральным значением (которое мы уже знаем). Рост среднего британца
175,3 см. В ходе опроса был зафиксирован рост 10 мужчин из Великобритании, и мы хотим знать, отличается ли среднее значение выборки от среднего
по населению.

Код: Выделить всё

# 1-sample t-test
from scipy import stats
one_sample_data = [177.3, 182.7, 169.6, 176.3, 180.3, 179.4, 178.5, 177.2, 181.8, 176.5]

one_sample = stats.ttest_1samp(one_sample_data, 175.3)

print "The t-statistic is %.3f and the p-value is %.3f." % one_sample
Результат:

Код: Выделить всё

The t-statistic is 2.296 and the p-value is 0.047.
Наконец, на мой вопрос...

На примере Иайнгаллахера он знает среднее значение генеральной совокупности и сравнивает выборку (

Код: Выделить всё

one_sample_data).  В МОЕМ примере я хочу посмотреть, отличается ли статистически 01.01.2016
от предыдущих 11 месяцев. Итак, в моем случае предыдущие 11 месяцев представляют собой массив (а не одно среднее значение генеральной совокупности), а моя выборка представляет собой одну точку данных (вместо массива)... так что это как бы наоборот.

ВОПРОС

Если бы я сосредоточился на данных столбца «Покупки»:
Будет scipy.stats.ttest_1samp

Код: Выделить всё

([161,197,190,154,179,170,183,172,176,199,156], 106)
дает действительный результат, хотя моя выборка (первые параметры) представляет собой список предыдущих результатов, и я сравниваю его со средним значением popmean. это не среднее значение генеральной совокупности, а одна выборка.
Если это неправильная статистическая функция, какие-либо рекомендации о том, что использовать для этой ситуации проверки гипотезы?

Подробнее здесь: https://stackoverflow.com/questions/357 ... ormance-to
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «Python»