Почему декодирование большой строки base64 происходит быстрее в однопоточных процессах, чем в многопоточных? - Цифровое Кемерово

Почему декодирование большой строки base64 происходит быстрее в однопоточных процессах, чем в многопоточных? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Почему декодирование большой строки base64 происходит быстрее в однопоточных процессах, чем в многопоточных?

Цитата

Сообщение Anonymous » 11 окт 2024, 22:43

Мне нужно декодировать несколько больших строк base64 размером от нескольких сотен МБ до ~5 ГБ каждая.
Очевидное решение — один вызов до base64.b64decode ("эталонный вариант").
Я пытаюсь ускорить процесс с помощью многопроцессорности, но, что удивительно, он намного медленнее эталонного реализация.
На моей машине я получаю:
reference_implementation
decoding time = 7.37

implmementation1
Verify result Ok
decoding time = 7.59

threaded_impl
Verify result Ok
decoding time = 13.24

mutiproc_impl
Verify result Ok
decoding time = 11.82

Что я делаю неправильно?
(Внимание: код требует много памяти!)
import base64

from time import perf_counter
from binascii import a2b_base64
import concurrent.futures as fut
from time import sleep
from gc import collect
from multiprocessing import cpu_count

def reference_implementation(encoded):
"""This is the implementation that gives the desired result"""
return base64.b64decode(encoded)

def implmementation1(encoded):
"""Try to call the directly the underlying library"""
return a2b_base64(encoded)

def threaded_impl(encoded, N):
"""Try multi threading calling the underlying library"""
# split the string into pieces
d = len(encoded) // N # number of splits
lbatch = (d // 4) * 4 # lenght of first N-1 batches, the last is len(source) - lbatch*N
batches = []
for i in range(N-1):
start = i * lbatch
end = (i + 1) * lbatch
# print(i, start, end)
batches.append(encoded[start:end])
batches.append(encoded[end:])
# Decode
ret = bytes()
with fut.ThreadPoolExecutor(max_workers=N) as executor:
# Submit tasks for execution and put pieces together
for result in executor.map(a2b_base64, batches):
ret = ret + result
return ret

def mutiproc_impl(encoded, N):
"""Try multi processing calling the underlying library"""
# split the string into pieces
d = len(encoded) // N # number of splits
lbatch = (d // 4) * 4 # lenght of first N-1 batches, the last is len(source) - lbatch*N
batches = []
for i in range(N-1):
start = i * lbatch
end = (i + 1) * lbatch
# print(i, start, end)
batches.append(encoded[start:end])
batches.append(encoded[end:])
# Decode
ret = bytes()
with fut.ProcessPoolExecutor(max_workers=N) as executor:
# Submit tasks for execution and put pieces together
for result in executor.map(a2b_base64, batches):
ret = ret + result
return ret

if __name__ == "__main__":
CPU_NUM = cpu_count()

# Prepare a 4.6 GB byte string (with less than 32 GB ram you may experience swapping on virtual memory)
repeat = 60000000
large_b64_string = b'VGhpcyBzdHJpbmcgaXMgZm9ybWF0dGVkIHRvIGJlIGVuY29kZWQgd2l0aG91dCBwYWRkaW5nIGJ5dGVz' * repeat

# Compare implementations
print("\nreference_implementation")
t_start = perf_counter()
dec1 = reference_implementation(large_b64_string)
t_end = perf_counter()
print('decoding time =', (t_end - t_start))

sleep(1)

print("\nimplmementation1")
t_start = perf_counter()
dec2 = implmementation1(large_b64_string)
t_end = perf_counter()
print("Verify result", "Ok" if dec2==dec1 else "FAIL")
print('decoding time =', (t_end - t_start))
del dec2; collect() # force freeing memory to avoid swapping on virtual mem

sleep(1)

print("\nthreaded_impl")
t_start = perf_counter()
dec3 = threaded_impl(large_b64_string, CPU_NUM)
t_end = perf_counter()
print("Verify result", "Ok" if dec3==dec1 else "FAIL")
print('decoding time =', (t_end - t_start))
del dec3; collect()

sleep(1)

print("\nmutiproc_impl")
t_start = perf_counter()
dec4 = mutiproc_impl(large_b64_string, CPU_NUM)
t_end = perf_counter()
print("Verify result", "Ok" if dec4==dec1 else "FAIL")
print('decoding time =', (t_end - t_start))
del dec4; collect()

Подробнее здесь: https://stackoverflow.com/questions/790 ... threaded-p

Реклама

1728675794

Anonymous

Мне нужно декодировать несколько больших строк base64 размером от нескольких сотен МБ до ~5 ГБ каждая.
Очевидное решение — один вызов до base64.b64decode ("эталонный вариант").
Я пытаюсь ускорить процесс с помощью многопроцессорности, но, что удивительно, он намного медленнее эталонного реализация.
На моей машине я получаю:
reference_implementation
decoding time = 7.37

implmementation1
Verify result Ok
decoding time = 7.59

threaded_impl
Verify result Ok
decoding time = 13.24

mutiproc_impl
Verify result Ok
decoding time = 11.82

Что я делаю неправильно?
(Внимание: код требует много памяти!)
import base64

from time import perf_counter
from binascii import a2b_base64
import concurrent.futures as fut
from time import sleep
from gc import collect
from multiprocessing import cpu_count

def reference_implementation(encoded):
"""This is the implementation that gives the desired result"""
return base64.b64decode(encoded)

def implmementation1(encoded):
"""Try to call the directly the underlying library"""
return a2b_base64(encoded)

def threaded_impl(encoded, N):
"""Try multi threading calling the underlying library"""
# split the string into pieces
d = len(encoded) // N            # number of splits
lbatch = (d // 4) * 4           # lenght of first N-1 batches, the last is len(source) - lbatch*N
batches = []
for i in range(N-1):
start = i * lbatch
end = (i + 1) * lbatch
# print(i, start, end)
batches.append(encoded[start:end])
batches.append(encoded[end:])
# Decode
ret = bytes()
with fut.ThreadPoolExecutor(max_workers=N) as executor:
# Submit tasks for execution and put pieces together
for result  in executor.map(a2b_base64, batches):
ret = ret + result
return ret

def mutiproc_impl(encoded, N):
"""Try multi processing calling the underlying library"""
# split the string into pieces
d = len(encoded) // N            # number of splits
lbatch = (d // 4) * 4           # lenght of first N-1 batches, the last is len(source) - lbatch*N
batches = []
for i in range(N-1):
start = i * lbatch
end = (i + 1) * lbatch
# print(i, start, end)
batches.append(encoded[start:end])
batches.append(encoded[end:])
# Decode
ret = bytes()
with fut.ProcessPoolExecutor(max_workers=N) as executor:
# Submit tasks for execution and put pieces together
for result  in executor.map(a2b_base64, batches):
ret = ret + result
return ret

if __name__ == "__main__":
CPU_NUM = cpu_count()

# Prepare a 4.6 GB byte string (with less than 32 GB ram you may experience swapping on virtual memory)
repeat = 60000000
large_b64_string = b'VGhpcyBzdHJpbmcgaXMgZm9ybWF0dGVkIHRvIGJlIGVuY29kZWQgd2l0aG91dCBwYWRkaW5nIGJ5dGVz' * repeat

# Compare implementations
print("\nreference_implementation")
t_start = perf_counter()
dec1 = reference_implementation(large_b64_string)
t_end = perf_counter()
print('decoding time =', (t_end - t_start))

sleep(1)

print("\nimplmementation1")
t_start = perf_counter()
dec2 = implmementation1(large_b64_string)
t_end = perf_counter()
print("Verify result", "Ok" if dec2==dec1 else "FAIL")
print('decoding time =', (t_end - t_start))
del dec2; collect()     # force freeing memory to avoid swapping on virtual mem

sleep(1)

print("\nthreaded_impl")
t_start = perf_counter()
dec3 = threaded_impl(large_b64_string, CPU_NUM)
t_end = perf_counter()
print("Verify result", "Ok" if dec3==dec1 else "FAIL")
print('decoding time =', (t_end - t_start))
del dec3; collect()

sleep(1)

print("\nmutiproc_impl")
t_start = perf_counter()
dec4 = mutiproc_impl(large_b64_string, CPU_NUM)
t_end = perf_counter()
print("Verify result", "Ok" if dec4==dec1 else "FAIL")
print('decoding time =', (t_end - t_start))
del dec4; collect()
 

Подробнее здесь: [url]https://stackoverflow.com/questions/79003772/why-does-decoding-a-large-base64-string-appear-to-be-faster-in-single-threaded-p[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Почему декодирование большой строки base64 происходит быстрее в однопоточных процессах, чем в многопоточных?

Последнее сообщение Anonymous « 11 окт 2024, 18:45
Добавлено в форуме Python

Anonymous » 11 окт 2024, 18:45 » в форуме Python

Мне нужно декодировать несколько больших строк base64 размером от нескольких сотен МБ до ~5 ГБ каждая.
Очевидное решение — один вызов до base64.b64decode ( эталонный вариант ).
Я пытаюсь ускорить процесс с помощью многопроцессорности, но, что...

0 Ответы

8 Просмотры

Последнее сообщение Anonymous
11 окт 2024, 18:45
Почему декодирование большой строки base64 в одном потоке происходит быстрее, чем при многопроцессорной обработке?

Последнее сообщение Anonymous « 19 сен 2024, 21:03
Добавлено в форуме Python

Anonymous » 19 сен 2024, 21:03 » в форуме Python

Мне нужно декодировать несколько больших строк base64 размером от нескольких сотен МБ до ~5 ГБ каждая.
Очевидное решение — один вызов до base64.b64decode ( эталонный реализацию ).
Я пытаюсь ускорить процесс с помощью многопроцессорности, но, что...

0 Ответы

5 Просмотры

Последнее сообщение Anonymous
19 сен 2024, 21:03
Почему декодирование большой строки base64 в одном потоке происходит быстрее, чем при многопроцессорной обработке?

Последнее сообщение Anonymous « 22 сен 2024, 14:47
Добавлено в форуме Python

Anonymous » 22 сен 2024, 14:47 » в форуме Python

Мне нужно декодировать несколько больших строк base64 размером от нескольких сотен МБ до ~5 ГБ каждая.
Очевидное решение — один вызов до base64.b64decode ( эталонный реализацию ).
Я пытаюсь ускорить процесс с помощью многопроцессорности, но, что...

0 Ответы

4 Просмотры

Последнее сообщение Anonymous
22 сен 2024, 14:47
Оптимизация увеличения размера стека для максимизации использования специальных сегментов в многопоточных процессах

Последнее сообщение Anonymous « 12 окт 2024, 10:13
Добавлено в форуме C++

Anonymous » 12 окт 2024, 10:13 » в форуме C++

Как оптимизировать переключение контекста между процессами при следующей настройке?
Существует n сегментов, каждому сегменту назначается поток. Максимальный размер стека потока, назначенного i-му сегменту, обозначается threadSize для всех 1 ≤ i ≤...

0 Ответы

13 Просмотры

Последнее сообщение Anonymous
12 окт 2024, 10:13
Странное декодирование base64 python

Последнее сообщение Гость « 09 мар 2024, 17:45
Добавлено в форуме Python

Гость » 09 мар 2024, 17:45 » в форуме Python

Good afternoon everyone, I have encountered the following problem. From a stream of TCP segments, I pulled binary data with the help of wireshark, which I later found out is a bmp file. Then I load one big line of binary data, clear it from spaces,...

0 Ответы

10 Просмотры

Последнее сообщение Гость
09 мар 2024, 17:45

Вернуться в «Python»

Programmiererforum