- Предположим, ваш фрейм данных называется df, а столбцы — «col1» и «col2». Вы можете получить значение «col1», где «col2» максимальное, следующим образом:
df.loc[df['col2'].idxmax(), 'col1']
- Постройте график зависимости Y от X.
Поскольку X является непрерывной переменной, мы группируем ее по квантилям. Мы построили график Y каждой группы как функцию средней денежности в группе.
df5['X_q'] = df5['X_q'].apply(lambda interval: (interval.left + interval.right) / 2)
#or
df['X_cut'] = pd.cut(df.X, bins=3, labels=['old', 'medium', 'new'])
- чтобы отобразить все столбцы без усечения
- Используйте регулярное выражение для извлечения первого числа (с возможными запятыми)
df['hh_income_lb'] = df['hh_income_lb'].str.replace(',', '', regex=True) # remove commas
df['hh_income_lb'] = df['hh_income_lb'].astype(float)
- s = "(1.086, 1.853]"
first_num = float(s.split(',')[0][1:]) # Удалить '(' и преобразовать в число с плавающей запятой
print(first_num) # Вывод: 1.086 - Если хотите извлечь первое число с плавающей запятой из любой строки, независимо от того, как она выглядит (она может содержать скобки, пробелы, другой текст и т. д.), наиболее надежным способом является регулярное выражение.
s = "(1.086, 1.853]"
match = re.search(r'[-+]?\d*\.\d+|\d+', s)
if match:
first_float = float(match.group())
print(first_float)
else:
print("No float found.")
Подробнее здесь: https://stackoverflow.com/questions/798 ... ous-quests
Мобильная версия