Функция C++ возвращает результат очень медленно, намного медленнее, чем функционально эквивалентный код Python.

Функция C++ возвращает результат очень медленно, намного медленнее, чем функционально эквивалентный код Python. ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Функция C++ возвращает результат очень медленно, намного медленнее, чем функционально эквивалентный код Python.

Цитата

Сообщение Anonymous » 01 дек 2024, 22:01

У меня есть функция, которая используется в скрипте, который я пишу, для удаления избыточных блокирующих ключевых слов из списка. По сути, с вводом (в любом порядке):

Код: Выделить всё

{"apple", "bapple", "banana", "cherry", "bananaman", "sweetherrypie", "sweet", "b"}

Он должен вывести сжатый массив строк (в любом порядке):

Код: Выделить всё

{"apple", "cherry", "sweet", "b"}

Это сделано для того, чтобы уменьшить количество ключевых слов, которые алгоритм сопоставления должен пройти в рамках личного учебного проекта (если строка содержала «банан», она также будет содержать «b», поэтому « банан" не нужен, и от него можно отказаться.
Он должен был быть чрезвычайно производительным, поскольку должен был работать со списками, содержащими более 10 000 000 строк.
Первоначально я написал код Python для этого:

Код: Выделить всё

def deduplicate_keywords(keywords):
def inner_loop(unique_keywords, keyword):
for unique_keyword in unique_keywords:
# Check if the current keyword includes any of the unique keywords
if unique_keyword in keyword:
return  # Match so it is not added to unique keywords
# If the keyword does not include any of the shorter keywords, add it to unique_keywords
unique_keywords.append(keyword)
return

# Remove duplicates and sort the keywords by length in ascending order
keywords = sorted(set(keywords), key=len)
unique_keywords = []

for keyword in keywords:
inner_loop(unique_keywords, keyword)
return unique_keywords

И тест производительности для измерения производительности:

Код: Выделить всё

class TestDeduplicateKeywords(unittest.TestCase):
def test_performance_intensive_case(self):
keywords = [
"abcdef",
"def",
"ghidef",
"jkl",
"mnop",
"qrst",
"uvwxyz",
"ghijkl",
"abcdefgh",
"ijklmnop",
"mnopqrstuv",
"rstuvwx",
"mnopqrstuvwx",
"uvwx",
]

# Extending the list to make it very long and complex
base_keywords = keywords[:]
for i in range(200000):
base_keywords.extend([f"{k}{i}" for k in keywords])
base_keywords.extend([f"{i}{k}" for k in keywords])
base_keywords.extend([f"{i}{k}{i}" for k in keywords])

keywords = base_keywords

old_function_time = 0
new_function_time = 0

for repeat in range(100):
# This loop (not present in the C++ code) is used to loop it multiple times to find an average
start_time = time.time()
result = deduplicate_keywords(keywords)
end_time = time.time()
old_function_time = (
repeat * old_function_time + (end_time - start_time)
) / (repeat + 1)
start_time = time.time()
result = deduplicate_keywords_new(keywords)
# Above is a function that can be edited to check whether changes speed up the code
end_time = time.time()
new_function_time = (
repeat * new_function_time + (end_time - start_time)
) / (repeat + 1)

# As the list is extended with numbers, the result will be unique non-redundant keywords
expected_result = ["def", "jkl", "mnop", "qrst", "uvwx"]

self.assertEqual(set(result), set(expected_result))
print(
f"Test performance_intensive_case for old function took {old_function_time} seconds\n"
f"Test performance_intensive_case for new function took {new_function_time} seconds\n"
)

if old_function_time <  new_function_time:
print(f"Old is faster than new")
else:
print(f"New is faster than old")

if __name__ == "__main__":
unittest.main()

Это было слишком медленно для моих нужд: 5,677098312377932 секунды на моем слабом ноутбуке (при запуске 100 раз, чтобы найти среднее время), как указано в журнале консоли:

Код: Выделить всё

.Test performance_intensive_case for old function took 5.677098312377932 seconds

Поэтому я попробовал написать то же самое на C++, чтобы посмотреть, получу ли я прирост производительности. Это было настолько намного медленнее, поэтому я добавил в саму функцию некоторый временной код, чтобы увидеть, в чем заключалось замедление. Вот функция:

Код: Выделить всё

#include 
#include 
#include 
#include 
#include 
#include 
#include 

std::vector deduplicate_keywords(const std::vector &keywords)
{
auto t_start = std::chrono::steady_clock::now();
auto inner_loop = [](std::vector &unique_keywords, const std::string &keyword)
{
for (const auto &unique_keyword : unique_keywords)
{
if (keyword.find(unique_keyword) != std::string::npos)
{
return; // Match so it is not added to unique keywords
}
}
// Otherwise, add it to unique_keywords
unique_keywords.push_back(keyword);
};

// Remove duplicates using a set
auto t1 = std::chrono::steady_clock::now();
std::cout 

Подробнее здесь: [url]https://stackoverflow.com/questions/78812814/c-function-returns-extremely-slowly-far-slower-than-functionally-equivalent-p[/url]

1733079712

Anonymous

У меня есть функция, которая используется в скрипте, который я пишу, для удаления избыточных блокирующих ключевых слов из списка.  По сути, с вводом (в любом порядке):
[code]{"apple", "bapple", "banana", "cherry", "bananaman", "sweetherrypie", "sweet", "b"}
[/code]
Он должен вывести сжатый массив строк (в любом порядке):
[code]{"apple", "cherry", "sweet", "b"}
[/code]
Это сделано для того, чтобы уменьшить количество ключевых слов, которые алгоритм сопоставления должен пройти в рамках личного учебного проекта (если строка содержала «банан», она также будет содержать «b», поэтому « банан" не нужен, и от него можно отказаться.
Он должен был быть чрезвычайно производительным, поскольку должен был работать со списками, содержащими более 10 000 000 строк.
Первоначально я написал код Python для этого:
[code]def deduplicate_keywords(keywords):
def inner_loop(unique_keywords, keyword):
for unique_keyword in unique_keywords:
# Check if the current keyword includes any of the unique keywords
if unique_keyword in keyword:
return  # Match so it is not added to unique keywords
# If the keyword does not include any of the shorter keywords, add it to unique_keywords
unique_keywords.append(keyword)
return

# Remove duplicates and sort the keywords by length in ascending order
keywords = sorted(set(keywords), key=len)
unique_keywords = []

for keyword in keywords:
inner_loop(unique_keywords, keyword)
return unique_keywords
[/code]
И тест производительности для измерения производительности:
[code]class TestDeduplicateKeywords(unittest.TestCase):
def test_performance_intensive_case(self):
keywords = [
"abcdef",
"def",
"ghidef",
"jkl",
"mnop",
"qrst",
"uvwxyz",
"ghijkl",
"abcdefgh",
"ijklmnop",
"mnopqrstuv",
"rstuvwx",
"mnopqrstuvwx",
"uvwx",
]

# Extending the list to make it very long and complex
base_keywords = keywords[:]
for i in range(200000):
base_keywords.extend([f"{k}{i}" for k in keywords])
base_keywords.extend([f"{i}{k}" for k in keywords])
base_keywords.extend([f"{i}{k}{i}" for k in keywords])

keywords = base_keywords

old_function_time = 0
new_function_time = 0

for repeat in range(100):
# This loop (not present in the C++ code) is used to loop it multiple times to find an average
start_time = time.time()
result = deduplicate_keywords(keywords)
end_time = time.time()
old_function_time = (
repeat * old_function_time + (end_time - start_time)
) / (repeat + 1)
start_time = time.time()
result = deduplicate_keywords_new(keywords)
# Above is a function that can be edited to check whether changes speed up the code
end_time = time.time()
new_function_time = (
repeat * new_function_time + (end_time - start_time)
) / (repeat + 1)

# As the list is extended with numbers, the result will be unique non-redundant keywords
expected_result = ["def", "jkl", "mnop", "qrst", "uvwx"]

self.assertEqual(set(result), set(expected_result))
print(
f"Test performance_intensive_case for old function took {old_function_time} seconds\n"
f"Test performance_intensive_case for new function took {new_function_time} seconds\n"
)

if old_function_time <  new_function_time:
print(f"Old is faster than new")
else:
print(f"New is faster than old")

if __name__ == "__main__":
unittest.main()
[/code]
Это было слишком медленно для моих нужд: 5,677098312377932 секунды на моем слабом ноутбуке (при запуске 100 раз, чтобы найти среднее время), как указано в журнале консоли:
[code].Test performance_intensive_case for old function took 5.677098312377932 seconds
[/code]
Поэтому я попробовал написать то же самое на C++, чтобы посмотреть, получу ли я прирост производительности. Это было [b]настолько[/b] намного медленнее, поэтому я добавил в саму функцию некоторый временной код, чтобы увидеть, в чем заключалось замедление.  Вот функция:
[code]#include 
#include 
#include 
#include 
#include 
#include 
#include 

std::vector deduplicate_keywords(const std::vector &keywords)
{
auto t_start = std::chrono::steady_clock::now();
auto inner_loop = [](std::vector &unique_keywords, const std::string &keyword)
{
for (const auto &unique_keyword : unique_keywords)
{
if (keyword.find(unique_keyword) != std::string::npos)
{
return; // Match so it is not added to unique keywords
}
}
// Otherwise, add it to unique_keywords
unique_keywords.push_back(keyword);
};

// Remove duplicates using a set
auto t1 = std::chrono::steady_clock::now();
std::cout 

Подробнее здесь: [url]https://stackoverflow.com/questions/78812814/c-function-returns-extremely-slowly-far-slower-than-functionally-equivalent-p[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Функция C++ возвращает результат очень медленно, намного медленнее, чем функционально эквивалентный код Python.

Последнее сообщение Anonymous « 30 июл 2024, 22:43
Добавлено в форуме Python

Anonymous » 30 июл 2024, 22:43 » в форуме Python

У меня есть функция, которая используется в скрипте, который я пишу, для удаления избыточных блокирующих ключевых слов из списка. По сути, с вводом (в любом порядке):
{ apple , bapple , banana , cherry , bananaman , sweetherrypie , sweet , b }
Он...

0 Ответы

18 Просмотры

Последнее сообщение Anonymous
30 июл 2024, 22:43
Функция C++ возвращает результат очень медленно, намного медленнее, чем функционально эквивалентный код Python.

Последнее сообщение Anonymous « 30 июл 2024, 23:47
Добавлено в форуме Python

Anonymous » 30 июл 2024, 23:47 » в форуме Python

У меня есть функция, которая используется в скрипте, который я пишу, для удаления избыточных блокирующих ключевых слов из списка. По сути, с вводом (в любом порядке):
{ apple , bapple , banana , cherry , bananaman , sweetherrypie , sweet , b }
Он...

0 Ответы

24 Просмотры

Последнее сообщение Anonymous
30 июл 2024, 23:47
Функция C++ возвращает результат очень медленно, намного медленнее, чем функционально эквивалентный код Python.

Последнее сообщение Anonymous « 01 дек 2024, 22:01
Добавлено в форуме C++

Anonymous » 01 дек 2024, 22:01 » в форуме C++

У меня есть функция, которая используется в скрипте, который я пишу, для удаления избыточных блокирующих ключевых слов из списка. По сути, с вводом (в любом порядке):
{ apple , bapple , banana , cherry , bananaman , sweetherrypie , sweet , b }

Он...

0 Ответы

9 Просмотры

Последнее сообщение Anonymous
01 дек 2024, 22:01
Почему моя функция сортировки C ++ намного медленнее, чем моя функция сортировки C#?

Последнее сообщение Anonymous « 17 авг 2025, 07:56
Добавлено в форуме C++

Anonymous » 17 авг 2025, 07:56 » в форуме C++

Я очень новичок в c ++ , но у меня есть опыт работы с другими объектно -ориентированными языками программирования. Первоначально я написал программу в c ++ для практики, но мне было любопытно посмотреть, как она будет работать против моего основного...

0 Ответы

8 Просмотры

Последнее сообщение Anonymous
17 авг 2025, 07:56
Webassembly работает намного медленнее, чем чистая функция JavaScript.

Последнее сообщение Anonymous « 19 апр 2024, 22:34
Добавлено в форуме C++

Anonymous » 19 апр 2024, 22:34 » в форуме C++

Я новичок в веб-сборке. я просто пробую, написав функцию для фильтрации массива объектов по некоторым критериям и возврата массива идентификаторов. я запускаю эту функцию и измеряю время выполнения. Удивительно, но Webassembly работает в 10 раз...

0 Ответы

16 Просмотры

Последнее сообщение Anonymous
19 апр 2024, 22:34

Вернуться в «Python»