Как оптимизировать код Python для анализа большого набора данных о продажах?Python

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Как оптимизировать код Python для анализа большого набора данных о продажах?

Сообщение Anonymous »

Я работаю над вопросом, где мне нужно обработать большой набор транзакций продаж, хранящихся в файле CSV, и обобщить результаты. Код работает медленнее, чем ожидалось, и его выполнение занимает слишком много времени, особенно по мере увеличения размера набора данных. Я использую pandas для загрузки и обработки данных. Могу ли я провести какую-либо оптимизацию, чтобы сократить время вычислений и ускорить получение результатов? Вот код, который я использую:
import pandas as pd
import numpy as np

# Sample dataset
n = 10**6 # million rows
np.random.seed(0)
transaction_ids = np.arange(1, n+1)
customer_ids = np.random.randint(100, 200, n)
sale_amounts = np.random.uniform(50, 500, n)
transaction_dates = pd.date_range('2023-01-01', periods=n, freq='T')

# DataFrame
df = pd.DataFrame({
'transaction_id': transaction_ids,
'customer_id': customer_ids,
'sale_amount': sale_amounts,
'transaction_date': transaction_dates
})

# Categorization function
def categorize_transaction(sale_amount):
if sale_amount > 400:
return 'High Value'
elif sale_amount > 200:
return 'Medium Value'
else:
return 'Low Value'

category_map = {
'High Value': (df['sale_amount'] > 400),
'Medium Value': (df['sale_amount'] > 200) & (df['sale_amount']

Подробнее здесь: https://stackoverflow.com/questions/793 ... es-dataset
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «Python»