Проверьте распределение определенного значения, например, сколько раз погода была именно облачной, в данном столбце. Не стесняйтесь проверить другие значения. Проверить это можно, вызвав функциюclear с соответствующими параметрами.
Код: Выделить всё
#Importing the modules
import pandas as pd
import numpy as np
from scipy.stats import mode
weather = pd.read_csv(path, sep = ",", delimiter = None)
#code to check distribution of variable
def clear(df,col,val):
""" Check distribution of variable
df,col,val
This function accepts a dataframe,column(feature) and value which returns count of the value,
containing the value counts of a variable(value_counts)
Keyword arguments:
df - Pandas dataframe
col - Feature of the datagrame
val - value of the feature
Returns:
value_counts - Value count of the feature
"""
value_counts = df[(df.col == val)] # filtering dataframe
print(len(value_counts))
Подробнее здесь: https://stackoverflow.com/questions/630 ... a-function