- Количество нулей — 103168. li>
Количество единиц — 32364. - Количество наблюдений меньше 1 и больше 0,8 — 2594.
< li>Количество наблюдений больше 0 и меньше 0,8 равно 129.
Код: Выделить всё
pd.qcut(df['MAX_PERC'],80,retbins=True, duplicates='drop')
Код: Выделить всё
# Define the counts
count_zeros = 103168
count_ones = 32364
count_between_08_1 = 2594
count_between_0_08 = 129
# Create arrays for each range
zeros = np.zeros(count_zeros)
ones = np.ones(count_ones)
between_08_1 = np.random.uniform(0.8, 1.0, count_between_08_1)
between_0_08 = np.random.uniform(0, 0.8, count_between_0_08)
# Combine all arrays
all_values = np.concatenate([zeros, ones, between_08_1, between_0_08])
# Shuffle the array to mix the values
np.random.shuffle(all_values)
# Create the DataFrame
df = pd.DataFrame({'MAX_PERC': all_values})
Подробнее здесь: https://stackoverflow.com/questions/785 ... d-in-my-df