Как определить новые значения и отсортировать их по этим значениям при объединении списка с самим собой? - Цифровое Кемерово

Как определить новые значения и отсортировать их по этим значениям при объединении списка с самим собой? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Как определить новые значения и отсортировать их по этим значениям при объединении списка с самим собой?

Цитата

Сообщение Anonymous » 26 май 2024, 01:28

У меня есть кадр данных pandas, подобный следующему:

Код: Выделить всё

+------------+-------------------+---------+--------+----------+
| process_no | process_durations | columns | orders | customer |
+------------+-------------------+---------+--------+----------+
| 0          | 3                 | [0]     | [3109] | [0]      |
+------------+-------------------+---------+--------+----------+
| 1          | 100               | [11]    | [5855] | [0]      |
+------------+-------------------+---------+--------+----------+
| 2          | 81                | [8]     | [5304] | [0]      |
+------------+-------------------+---------+--------+----------+

Я хочу объединить этот фрейм данных сам с собой, получить общую длину заказов, длину уникальных значений для столбцов и список уникальных значений для клиентов. Затем я хочу отсортировать по убыванию длины заказов и по возрастанию длины столбцов. Но мне также следует сохранить исходную версию комбинации. В этой ситуации я сделал следующее:

Код: Выделить всё

from itertools import combinations
from operator import itemgetter

data = pd.DataFrame({
'process_no': [0, 1, 2],
'process_durations': [3, 100, 81],
'columns': [[0], [11], [8]],
'orders': [[3109], [5855], [5304]],
'customer': [[0], [0], [0]]
})

vals = data.values.tolist()
cross_combine = list(combinations(vals, r=2))

sorted_cross_combine = sorted(
[
(
x,
-(len(x[0][3]) + len(x[1][3])),
len(set(x[0][2] + x[1][2])),
list(set(x[0][4] + x[1][4]))
)
for x in cross_combine
],
key=itemgetter(1, 2)
)
print(sorted_cross_combine)

[(([0, 3, [0], [3109], [0]], [1, 100, [11], [5855], [0]]), -2, 2, [0]),
(([0, 3, [0], [3109], [0]], [2, 81, [8], [5304], [0]]), -2, 2, [0]),
(([1, 100, [11], [5855], [0]], [2, 81, [8], [5304], [0]]), -2, 2, [0])]

А вот мой пример вывода, если вы хотите сделать это с пандами,

Код: Выделить всё

+-----------------------------+-----------------------------+-------------+--------------+-----------+
| x1                          | x2                          |order_length |column_length | customers |
+-----------------------------+-----------------------------+-------------+--------------+-----------+
| [0, 3, [0], [3109], [0]]    | [1, 100, [11], [5855], [0]] | -2          | 2            | [0]       |
+-----------------------------+-----------------------------+-------------+--------------+-----------+
| [0, 3, [0], [3109], [0]]    | [2, 81, [8], [5304], [0]]   | -2          | 2            | [0]       |
+-----------------------------+-----------------------------+-------------+--------------+-----------+
| [1, 100, [11], [5855], [0]] | [2, 81, [8], [5304], [0]]   | -2          | 2            | [0]       |
+-----------------------------+-----------------------------+-------------+--------------+-----------+

Если вы посмотрите на столбцы x1 и x2,

Код: Выделить всё

orders   => [3109] and [5855]
columns  => [0] and [11]
customer => [0] and [0]

Код: Выделить всё

order_length  => -len([3109] + [5855])
column_length => len(set([0] + [1]))
customers     => list(set([0] + [0]))

Я хочу спросить:
Могу ли я сделать это, пока процесс объединения еще продолжается, при условии, что он более эффективен? Например, я знаю, что такой функции нет, но представляю себе что-то вроде этого:

Код: Выделить всё

def calc(x, y):
return (
x + y,
-(len(x[3]) + len(y[3])),
len(set(x[2] + y[2])),
list(set(x[4] + y[4]))
)

cross_combine = list(combinations(vals, r=2, func=calc))

Или есть ли способ сделать весь процесс более эффективным? Процесс создания значения sorted_cross_combine занимает около 20 секунд для списка vals, содержащего примерно 6500 элементов.
Вы можете скачать примеры данных по ссылке. Вам необходимо привести тип данных следующим образом:

Код: Выделить всё

import ast

data = pd.read_csv('a.csv')

for col in ['columns', 'orders', 'customer']:
data[col] = data[col].apply(ast.literal_eval)

Заранее спасибо.

Подробнее здесь: https://stackoverflow.com/questions/785 ... t-with-its

Реклама

1716676127

Anonymous

У меня есть кадр данных pandas, подобный следующему:
[code]+------------+-------------------+---------+--------+----------+
| process_no | process_durations | columns | orders | customer |
+------------+-------------------+---------+--------+----------+
| 0          | 3                 | [0]     | [3109] | [0]      |
+------------+-------------------+---------+--------+----------+
| 1          | 100               | [11]    | [5855] | [0]      |
+------------+-------------------+---------+--------+----------+
| 2          | 81                | [8]     | [5304] | [0]      |
+------------+-------------------+---------+--------+----------+
[/code]
Я хочу объединить этот фрейм данных сам с собой, получить общую длину заказов, длину уникальных значений для столбцов и список уникальных значений для клиентов. Затем я хочу отсортировать по убыванию длины заказов и по возрастанию длины столбцов. Но мне также следует сохранить исходную версию комбинации. В этой ситуации я сделал следующее:
[code]from itertools import combinations
from operator import itemgetter

data = pd.DataFrame({
'process_no': [0, 1, 2],
'process_durations': [3, 100, 81],
'columns': [[0], [11], [8]],
'orders': [[3109], [5855], [5304]],
'customer': [[0], [0], [0]]
})

vals = data.values.tolist()
cross_combine = list(combinations(vals, r=2))

sorted_cross_combine = sorted(
[
(
x,
-(len(x[0][3]) + len(x[1][3])),
len(set(x[0][2] + x[1][2])),
list(set(x[0][4] + x[1][4]))
)
for x in cross_combine
],
key=itemgetter(1, 2)
)
print(sorted_cross_combine)

[(([0, 3, [0], [3109], [0]], [1, 100, [11], [5855], [0]]), -2, 2, [0]),
(([0, 3, [0], [3109], [0]], [2, 81, [8], [5304], [0]]), -2, 2, [0]),
(([1, 100, [11], [5855], [0]], [2, 81, [8], [5304], [0]]), -2, 2, [0])]
[/code]
А вот мой пример вывода, если вы хотите сделать это с пандами,
[code]+-----------------------------+-----------------------------+-------------+--------------+-----------+
| x1                          | x2                          |order_length |column_length | customers |
+-----------------------------+-----------------------------+-------------+--------------+-----------+
| [0, 3, [0], [3109], [0]]    | [1, 100, [11], [5855], [0]] | -2          | 2            | [0]       |
+-----------------------------+-----------------------------+-------------+--------------+-----------+
| [0, 3, [0], [3109], [0]]    | [2, 81, [8], [5304], [0]]   | -2          | 2            | [0]       |
+-----------------------------+-----------------------------+-------------+--------------+-----------+
| [1, 100, [11], [5855], [0]] | [2, 81, [8], [5304], [0]]   | -2          | 2            | [0]       |
+-----------------------------+-----------------------------+-------------+--------------+-----------+
[/code]
Если вы посмотрите на столбцы x1 и x2,
[code]orders   => [3109] and [5855]
columns  => [0] and [11]
customer => [0] and [0]
[/code]
[code]order_length  => -len([3109] + [5855])
column_length => len(set([0] + [1]))
customers     => list(set([0] + [0]))
[/code]
Я хочу спросить:
Могу ли я сделать это, пока процесс объединения еще продолжается, при условии, что он более эффективен? Например, я знаю, что такой функции нет, но представляю себе что-то вроде этого:
[code]def calc(x, y):
return (
x + y,
-(len(x[3]) + len(y[3])),
len(set(x[2] + y[2])),
list(set(x[4] + y[4]))
)

cross_combine = list(combinations(vals, r=2, func=calc))
[/code]
Или есть ли способ сделать весь процесс более эффективным? Процесс создания значения sorted_cross_combine занимает около 20 секунд для списка vals, содержащего примерно 6500 элементов.
Вы можете скачать примеры данных по ссылке. Вам необходимо привести тип данных следующим образом:
[code]import ast

data = pd.read_csv('a.csv')

for col in ['columns', 'orders', 'customer']:
data[col] = data[col].apply(ast.literal_eval)
[/code]
Заранее спасибо.
 

Подробнее здесь: [url]https://stackoverflow.com/questions/78505497/how-to-define-new-values-and-sort-by-those-values-when-combining-a-list-with-its[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Как определить новые значения и отсортировать их по этим значениям при объединении списка с самим собой?

Последнее сообщение Anonymous « 25 май 2024, 03:33
Добавлено в форуме Python

Anonymous » 25 май 2024, 03:33 » в форуме Python

У меня есть кадр данных pandas, подобный следующему:
+------------+-------------------+---------+--------+----------+
| process_no | process_durations | columns | orders | customer |
+------------+-------------------+---------+--------+----------+...

0 Ответы

17 Просмотры

Последнее сообщение Anonymous
25 май 2024, 03:33
Группируйте элементы ассоциативного массива по значениям и сохраняйте исходные ключи как новые значения в каждой группе.

Последнее сообщение Anonymous « 14 окт 2024, 10:08
Добавлено в форуме Php

Anonymous » 14 окт 2024, 10:08 » в форуме Php

Я хочу иметь возможность группировать ассоциативные массивы по их ключам. Пока что не знаю, какой синтаксис использовать.

На данный момент у меня есть такой код:

$associativeArray = array( Ripe Mango => Yellow , Strawberry => Red , Lemon =>...

0 Ответы

23 Просмотры

Последнее сообщение Anonymous
14 окт 2024, 10:08
Отсортировать плоский ассоциативный массив по алфавиту по значениям и сохранить исходные ключи.

Последнее сообщение Anonymous « 01 апр 2024, 11:25
Добавлено в форуме Php

Anonymous » 01 апр 2024, 11:25 » в форуме Php

Я хочу отсортировать плоский ассоциативный массив по его значениям в алфавитном порядке и сохранить исходные ключи.
$arr = ;

станет

Есть идеи?
Вот мой полный фактический массив для сортировки:
$arr = ;

Подробнее здесь:

0 Ответы

45 Просмотры

Последнее сообщение Anonymous
01 апр 2024, 11:25
Создайте новые строки на основе отсутствующих сгруппированных по значениям.

Последнее сообщение Anonymous « 04 дек 2023, 09:11
Добавлено в форуме Python

Anonymous » 04 дек 2023, 09:11 » в форуме Python

Учитывая приведенный ниже фрейм данных, если строки сгруппированы по имени и фамилии, как я могу найти и создать новые строки для группы, в которой нет строки для каждого типа в списке типов.
Итак, в приведенном ниже примере для Боба Джека будут...

0 Ответы

19 Просмотры

Последнее сообщение Anonymous
04 дек 2023, 09:11
Ошибка «Преобразование массива в строку» при объединении значения в строку

Последнее сообщение Anonymous « 17 янв 2025, 02:13
Добавлено в форуме Php

Anonymous » 17 янв 2025, 02:13 » в форуме Php

У меня есть массив, подобный приведенному ниже:
{
quantity : 1 ,
product_id : 41 ,
option : 28 ,
option [] : 25
}

Я запускаю вышеописанное в цикле foreach как $key => $value. Но когда я пытаюсь объединить их в строку, я получаю ошибку...

0 Ответы

4 Просмотры

Последнее сообщение Anonymous
17 янв 2025, 02:13

Вернуться в «Python»

Programmiererforum