Я разработал код, преобразующий файл Excel в текст. Я хочу посчитать людей, идущих из одного и того же места, но результат все равно неправильный. Я хочу считать по преобразованному тексту.
Это скрипт, который преобразует файл Excel в текст и подсчитывает количество людей, отправляющихся из одного и того же места:
import pandas as pd
from google.colab import files
# Function to read a specified column from the uploaded Excel file
def read_excel_column(file_path, column_name):
try:
df = pd.read_excel(file_path)
if column_name in df.columns:
return df[column_name]
else:
raise ValueError(f"Column '{column_name}' not found in the Excel file.")
except Exception as e:
print(f"Error reading the Excel file: {e}")
return None
# Function to process the column data
def process_data(column_data):
data = {
'Text': column_data
}
# Create DataFrame
df = pd.DataFrame(data)
# Split 'Text' column into 'Depart' and 'Destination'
df[['Depart', 'Destination']] = df['Text'].str.split(' to ', expand=True)
# Remove rows with None values in 'Destination'
df = df.dropna(subset=['Destination'])
# Group by 'Depart' and concatenate 'Destination'
grouped = df.groupby('Depart')['Destination'].apply(lambda x: ', '.join(set(x.dropna()))).reset_index()
return grouped
# Function to save the processed data to a text file
def save_output_to_file(grouped_data, output_file):
try:
with open(output_file, 'w') as f:
for index, row in grouped_data.iterrows():
f.write(f"Depart: {row['Depart']}\nDestination: {row['Destination']}\n\n")
print(f"Data saved to {output_file}")
except Exception as e:
print(f"Error saving the file: {e}")
# Upload the Excel file
uploaded = files.upload()
# Assuming only one file is uploaded, get the file name
excel_file_path = list(uploaded.keys())[0]
# Specify the column name you want to read
column_name = 'Text'
# Read the specified column
column_data = read_excel_column(excel_file_path, column_name)
if column_data is not None:
# Process the data
grouped_data = process_data(column_data)
# Define the output file path
output_file_path = 'output_depart_dest.txt'
# Save the processed data to the output file
save_output_to_file(grouped_data, output_file_path)
# Download the output file
files.download(output_file_path)
else:
print("Failed to read the column data.")
Подробнее здесь: https://stackoverflow.com/questions/787 ... -managment
Python Excel для управления текстовыми задачами ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение
-
-
Изменение группы элементов управления текстовыми коробками на readonly = false
Anonymous » » в форуме C# - 0 Ответы
- 16 Просмотры
-
Последнее сообщение Anonymous
-
-
-
Изменение группы элементов управления текстовыми коробками на readonly = false
Anonymous » » в форуме C# - 0 Ответы
- 9 Просмотры
-
Последнее сообщение Anonymous
-