Как получить индекс максимального количества требуемой строки в столбце списка кадра данных поляров? - Цифровое Кемерово

Как получить индекс максимального количества требуемой строки в столбце списка кадра данных поляров? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Как получить индекс максимального количества требуемой строки в столбце списка кадра данных поляров?

Цитата

Сообщение Anonymous » 25 сен 2024, 21:24

У меня есть фрейм данных Polars:

Код: Выделить всё

df = pl.DataFrame({'doc_id':[
['83;45;32;65;13','7;8;9'],
['9;4;5','4;2;7;3;5;8;10;11'],
['1000;2000','76;34;100001;7474;2924'],
['100;200','200;100'],
['3;4;6;7;10;11','1;2;3;4;5']
]})

каждый список состоит из идентификаторов документов, разделенных точкой с запятой. Если какой-либо элемент списка имеет более высокую точку с запятой, необходимо найти его индекс, создать новый столбец как len_idx_at и заполнить индексным номером. .
Например:

Код: Выделить всё

['83;45;32;65;13','7;8;9']

Этот список состоит из двух элементов, в первом элементе около 4 точек с запятой, следовательно, в нем 5 документов, аналогично во втором элементе около 2 точек с запятой, а это означает, что у него 3 документа. .
Здесь мы должны рассмотреть индекс элемента с наибольшим количеством документов в приведенном выше случае - это будет индекс 0, поскольку он имеет 4 точки с запятой.
ожидаемый результат:

Код: Выделить всё

shape: (5, 2)
┌─────────────────────────────────┬────────────┐
│ doc_id                          ┆ len_idx_at │
│ ---                             ┆ ---        │
│ list[str]                       ┆ i32        │
╞═════════════════════════════════╪════════════╡
│ ["83;45;32;65;13", "7;8;9"]     ┆ 0          │
│ ["9;4;5", "4;2;7;3;5;8;10;11"]  ┆ 1          │
│ ["1000;2000", "76;34;100001;74… ┆ 1          │
│ ["100;200", "200;100"]          ┆ 0          │
│ ["3;4;6;7;10;11", "1;2;3;4;5"]  ┆ 0          │
└─────────────────────────────────┴────────────┘

Если все элементы в списке имеют одинаковое количество точек с запятой, предпочтительным будет нулевой индекс, как показано в выводе выше.

Подробнее здесь: https://stackoverflow.com/questions/742 ... lumn-of-po

Реклама

1727288694

Anonymous

У меня есть фрейм данных Polars:
[code]df = pl.DataFrame({'doc_id':[
['83;45;32;65;13','7;8;9'],
['9;4;5','4;2;7;3;5;8;10;11'],
['1000;2000','76;34;100001;7474;2924'],
['100;200','200;100'],
['3;4;6;7;10;11','1;2;3;4;5']
]})
[/code]
каждый список состоит из идентификаторов документов, разделенных точкой с запятой. Если какой-либо элемент списка имеет более высокую точку с запятой, необходимо найти его индекс, создать новый столбец как len_idx_at и заполнить индексным номером. .
Например:
[code]['83;45;32;65;13','7;8;9']
[/code]
Этот список состоит из двух элементов, в первом элементе около 4 точек с запятой, следовательно, в нем 5 документов, аналогично во втором элементе около 2 точек с запятой, а это означает, что у него 3 документа. .
Здесь мы должны рассмотреть индекс элемента с наибольшим количеством документов в приведенном выше случае - это будет индекс 0, поскольку он имеет 4 точки с запятой.
ожидаемый результат:
[code]shape: (5, 2)
┌─────────────────────────────────┬────────────┐
│ doc_id                          ┆ len_idx_at │
│ ---                             ┆ ---        │
│ list[str]                       ┆ i32        │
╞═════════════════════════════════╪════════════╡
│ ["83;45;32;65;13", "7;8;9"]     ┆ 0          │
│ ["9;4;5", "4;2;7;3;5;8;10;11"]  ┆ 1          │
│ ["1000;2000", "76;34;100001;74… ┆ 1          │
│ ["100;200", "200;100"]          ┆ 0          │
│ ["3;4;6;7;10;11", "1;2;3;4;5"]  ┆ 0          │
└─────────────────────────────────┴────────────┘
[/code]
Если все элементы в списке имеют одинаковое количество точек с запятой, предпочтительным будет нулевой индекс, как показано в выводе выше. 

Подробнее здесь: [url]https://stackoverflow.com/questions/74211704/how-to-get-an-index-of-maximum-count-of-a-required-string-in-a-list-column-of-po[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Как получить индекс максимального количества требуемой строки в столбце списка кадра данных поляров?

Последнее сообщение Anonymous « 25 сен 2024, 18:47
Добавлено в форуме Python

Anonymous » 25 сен 2024, 18:47 » в форуме Python

У меня есть фрейм данных Polars:
df = pl.DataFrame({'doc_id':[
,
,
,
,

]})

каждый список состоит из идентификаторов документов, разделенных точкой с запятой. Если какой-либо элемент списка имеет более высокую точку с запятой, необходимо...

0 Ответы

22 Просмотры

Последнее сообщение Anonymous
25 сен 2024, 18:47
Как умножить значения массива, содержащегося в столбце кадра данных, на значение в другом столбце?

Последнее сообщение Anonymous « 12 янв 2025, 04:15
Добавлено в форуме Python

Anonymous » 12 янв 2025, 04:15 » в форуме Python

Я попытался сделать это, чтобы создать новый столбец, где каждая строка представляет собой массив, содержащий значения столбца b, умноженные на столбец a.
data = {'a': , 'b': [ , ]}
df = pd.DataFrame(data)
df = df.apply(lambda row: [row * x for x...

0 Ответы

28 Просмотры

Последнее сообщение Anonymous
12 янв 2025, 04:15
Как умножить значения массива, содержащегося в столбце кадра данных, на значение в другом столбце?

Последнее сообщение Anonymous « 12 янв 2025, 10:40
Добавлено в форуме Python

Anonymous » 12 янв 2025, 10:40 » в форуме Python

Я попытался сделать это, чтобы создать новый столбец, где каждая строка представляет собой массив, содержащий значения столбца b, умноженные на столбец a.
data = {'a': , 'b': [ , ]}
df = pd.DataFrame(data)
df = df.apply(lambda row: [row * x for x...

0 Ответы

19 Просмотры

Последнее сообщение Anonymous
12 янв 2025, 10:40
Как умножить значения массива, содержащегося в столбце кадра данных, на значение в другом столбце?

Последнее сообщение Anonymous « 12 янв 2025, 18:39
Добавлено в форуме Python

Anonymous » 12 янв 2025, 18:39 » в форуме Python

Я попытался сделать это, чтобы создать новый столбец, где каждая строка представляет собой массив, содержащий значения столбца b, умноженные на столбец a.
data = {'a': , 'b': [ , ]}
df = pd.DataFrame(data)
df = df.apply(lambda row: [row * x for x...

0 Ответы

27 Просмотры

Последнее сообщение Anonymous
12 янв 2025, 18:39
Как умножить значения массива, содержащегося в столбце кадра данных, на значение в другом столбце?

Последнее сообщение Anonymous « 13 янв 2025, 00:34
Добавлено в форуме Python

Anonymous » 13 янв 2025, 00:34 » в форуме Python

Я попытался сделать это, чтобы создать новый столбец, где каждая строка представляет собой массив, содержащий значения столбца b, умноженные на столбец a.
data = {'a': , 'b': [ , ]}
df = pd.DataFrame(data)
df = df.apply(lambda row: [row * x for x...

0 Ответы

15 Просмотры

Последнее сообщение Anonymous
13 янв 2025, 00:34

Вернуться в «Python»

Programmiererforum