У меня есть данные о производительности за 11 месяцев:
Код: Выделить всё
Month Branded Non-Branded Shopping Grand Total
0 2/1/2015 1330 334 161 1825
1 3/1/2015 1344 293 197 1834
2 4/1/2015 899 181 190 1270
3 5/1/2015 939 208 154 1301
4 6/1/2015 1119 238 179 1536
5 7/1/2015 859 238 170 1267
6 8/1/2015 996 340 183 1519
7 9/1/2015 1138 381 172 1691
8 10/1/2015 1093 395 176 1664
9 11/1/2015 1491 426 199 2116
10 12/1/2015 1539 530 156 2225
Код: Выделить всё
Month Branded Non-Branded Shopping Grand Total
11 1/1/2016 1064 408 106 1578
Я наткнулся на блог Иайнгаллахера . Я воспроизведу здесь (на случай, если блог выйдет из строя).
1-выборочный t-критерий
Т-критерий Стьюдента для 1 выборки используется, когда мы хотим сравнить выборочное среднее значение со средним
генеральным значением (которое мы уже знаем). Рост среднего британца
175,3 см. В ходе опроса был зафиксирован рост 10 мужчин из Великобритании, и мы хотим знать, отличается ли среднее значение выборки от среднего
по населению.
Код: Выделить всё
# 1-sample t-test
from scipy import stats
one_sample_data = [177.3, 182.7, 169.6, 176.3, 180.3, 179.4, 178.5, 177.2, 181.8, 176.5]
one_sample = stats.ttest_1samp(one_sample_data, 175.3)
print "The t-statistic is %.3f and the p-value is %.3f." % one_sample
Код: Выделить всё
The t-statistic is 2.296 and the p-value is 0.047.
На примере Иайнгаллахера он знает среднее значение генеральной совокупности и сравнивает выборку (
Код: Выделить всё
one_sample_data). В МОЕМ примере я хочу посмотреть, отличается ли статистически 01.01.2016
ВОПРОС
Если бы я сосредоточился на данных столбца «Покупки»:
Будет scipy.stats.ttest_1samp
Код: Выделить всё
([161,197,190,154,179,170,183,172,176,199,156], 106)
Если это неправильная статистическая функция, какие-либо рекомендации о том, что использовать для этой ситуации проверки гипотезы?
Подробнее здесь: https://stackoverflow.com/questions/357 ... ormance-to