Посчитайте все уникальные тройки

Посчитайте все уникальные тройки ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Цитата

Сообщение Anonymous » 02 июл 2024, 15:43

Предположим, что у меня есть фрейм данных Pandas A со столбцами с именем user_id и историей, где история представляет собой массив целых чисел. А возможные истории ограничены сверху 2000. Мне нужно перебрать все строки A для каждой истории b = [b1, b2, b3, ..., bn]. Все bi уникальны (появляются в массиве только один раз). Мне нужно найти все возможные тройки (bi, bj, bk) такие, что i < j < k, и подсчитать вхождения всех таких троек. Кроме того, мы считаем тройку (bi, bj, bk) такой же, как (bj, bi, bk), если bi > bj.

Код: Выделить всё

import pandas as pd
from itertools import combinations

# Example DataFrame A (replace this with your actual DataFrame)
import pandas as pd
from collections import defaultdict

# Example DataFrame A (replace this with your actual DataFrame)
A = pd.DataFrame({
'user_id': [1, 2, 3],
'history': [[1, 2, 3], [2, 3, 4], [1, 3, 5]]
})

# Initialize a dictionary to store counts of triples
triple_counts = defaultdict(int)

# Iterate over each row of A
for index, row in A.iterrows():
history = row['history']
n = len(history)

# Iterate over all triples (bi, bj, bk) where i < j < k
for i in range(n):
for j in range(i + 1, n):
for k in range(j + 1, n):
bi = history[i]
bj = history[j]
bk = history[k]

if bi < bj:
triple_counts[(bi, bj, bk)] += 1
else:
triple_counts[(bj, bi, bk)] += 1

# Output the counts of all triples
for triple, count in triple_counts.items():
print(f"Triple {triple}: Count = {count}")

Проблема этого подхода заключается в том, что A представляет собой чрезвычайно большой фрейм данных, а сложность каждой строки равна O(n^3), поэтому выполнение этого вычисления занимает целую вечность. Есть ли более быстрый способ сделать это, используя операции pytorch или тензора?

Подробнее здесь: https://stackoverflow.com/questions/786 ... ue-triples

1719924204

Anonymous

Предположим, что у меня есть фрейм данных Pandas A со столбцами с именем user_id и историей, где история представляет собой массив целых чисел. А возможные истории ограничены сверху 2000. Мне нужно перебрать все строки A для каждой истории b = [b1, b2, b3, ..., bn]. Все bi уникальны (появляются в массиве только один раз). Мне нужно найти все возможные тройки (bi, bj, bk) такие, что i < j < k, и подсчитать вхождения всех таких троек. Кроме того, мы считаем тройку (bi, bj, bk) такой же, как (bj, bi, bk), если bi > bj.
[code]import pandas as pd
from itertools import combinations

# Example DataFrame A (replace this with your actual DataFrame)
import pandas as pd
from collections import defaultdict

# Example DataFrame A (replace this with your actual DataFrame)
A = pd.DataFrame({
'user_id': [1, 2, 3],
'history': [[1, 2, 3], [2, 3, 4], [1, 3, 5]]
})

# Initialize a dictionary to store counts of triples
triple_counts = defaultdict(int)

# Iterate over each row of A
for index, row in A.iterrows():
history = row['history']
n = len(history)

# Iterate over all triples (bi, bj, bk) where i < j < k
for i in range(n):
for j in range(i + 1, n):
for k in range(j + 1, n):
bi = history[i]
bj = history[j]
bk = history[k]

if bi < bj:
triple_counts[(bi, bj, bk)] += 1
else:
triple_counts[(bj, bi, bk)] += 1

# Output the counts of all triples
for triple, count in triple_counts.items():
print(f"Triple {triple}: Count = {count}")
[/code]
Проблема этого подхода заключается в том, что A представляет собой чрезвычайно большой фрейм данных, а сложность каждой строки равна O(n^3), поэтому выполнение этого вычисления занимает целую вечность. Есть ли более быстрый способ сделать это, используя операции pytorch или тензора? 

Подробнее здесь: [url]https://stackoverflow.com/questions/78687048/count-all-unique-triples[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Посчитайте все уникальные тройки

Последнее сообщение Anonymous « 30 июн 2024, 04:29
Добавлено в форуме Python

Anonymous » 30 июн 2024, 04:29 » в форуме Python

Предположим, что у меня есть фрейм данных Pandas A со столбцами с именем user_id и историей, где история представляет собой массив целых чисел. А возможные истории ограничены сверху 2000. Мне нужно перебрать все строки A для каждой истории b = . Все...

0 Ответы

21 Просмотры

Последнее сообщение Anonymous
30 июн 2024, 04:29
Посчитайте все уникальные тройки

Последнее сообщение Anonymous « 02 июл 2024, 14:57
Добавлено в форуме Python

Anonymous » 02 июл 2024, 14:57 » в форуме Python

Предположим, что у меня есть фрейм данных Pandas A со столбцами с именем user_id и историей, где история представляет собой массив целых чисел. А возможные истории ограничены сверху 2000. Мне нужно перебрать все строки A для каждой истории b = . Все...

0 Ответы

16 Просмотры

Последнее сообщение Anonymous
02 июл 2024, 14:57
Выведите список из предложения и посчитайте символы для каждого слова.

Последнее сообщение Anonymous « 06 дек 2024, 17:02
Добавлено в форуме Python

Anonymous » 06 дек 2024, 17:02 » в форуме Python

Мне нужно вывести список с количеством символов в списке из двух элементов, который дает количество символов для каждого слова:

[ , , , ]

Я использую функцию

def char(s):
l = [] # list for holding your result

# convert string s into a list...

0 Ответы

20 Просмотры

Последнее сообщение Anonymous
06 дек 2024, 17:02
Посчитайте, сколько часов прошло с эпохи?

Последнее сообщение Anonymous « 30 дек 2024, 16:20
Добавлено в форуме JAVA

Anonymous » 30 дек 2024, 16:20 » в форуме JAVA

Это простой вопрос, но я нервничаю из-за того, насколько сложным может оказаться ответ.

Я хочу знать в своем заявлении, сколько часов прошло с тех пор эпоха. Точнее, я хочу знать, «сколько раз с момента начала эпохи часы GMT заканчивались на 00»...

0 Ответы

13 Просмотры

Последнее сообщение Anonymous
30 дек 2024, 16:20
C ++ STD :: Уникальные возвраты явно не уникальные результаты

Последнее сообщение Anonymous « 18 июл 2025, 23:48
Добавлено в форуме C++

Anonymous » 18 июл 2025, 23:48 » в форуме C++

Я экспериментировал с C ++ STD :: уникальные функции, но результаты, которые он возвращает, действительно меня смущает. Я сделал простую функцию, чтобы проверить его, например,
#include
#include
#include

int main()
{
std::vector test;
for(int i...

0 Ответы

20 Просмотры

Последнее сообщение Anonymous
18 июл 2025, 23:48

Вернуться в «Python»