Каковы некоторые распространенные ошибки при оптимизации кода Python для больших наборов данныхPython

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Каковы некоторые распространенные ошибки при оптимизации кода Python для больших наборов данных

Сообщение Anonymous »

Я новичок в вопросах переполнения стека. Мне нужна ваша поддержка и руководство. Я относительно новичок в разработке подсказок с помощью Python и недавно начал проект, который включает обработку больших наборов данных для оптимизации подсказок модели ИИ.
Я работаю над проектом по очистке и обработке больших набор данных с использованием Python и Pandas. Мой текущий код очень медленный и неэффективен для больших наборов данных. Вот упрощенная версия того, что я делаю:
Вот упрощенная версия моего кода:

Код: Выделить всё

import pandas as pd
import time

# Load the dataset
url = 'https://archive.ics.uci.edu/ml/machine-learning-databases/00320/student.zip'
start_time = time.time()
df = pd.read_csv(url, compression='zip', sep=';')

# Basic data cleaning
df.dropna(inplace=True)
df['text'] = df['school'].str.lower()

# Processing step
def process_text(text):
result = ''
for char in text:
result = char + result
return result

df['processed_text'] = df['text'].apply(process_text)

processing_time = time.time() - start_time

print("Processing time:", processing_time)
print(df.head())
Функцияprocess_text переворачивает каждую строку посимвольно, что делает код очень медленным.
Проблема: Коду требуется несколько минут для обработки даже небольшой части набора данных.
Вопрос
: Как я могу оптимизировать этот код для более эффективной обработки больших наборов данных? Есть предложения по улучшению производительности?

Подробнее здесь: https://stackoverflow.com/questions/786 ... e-datasets
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «Python»