Как я могу использовать re для анализа CSV-файла на наличие следующих элементов? data-testid="xxxxx-follow"Python

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Как я могу использовать re для анализа CSV-файла на наличие следующих элементов? data-testid="xxxxx-follow"

Сообщение Anonymous »

У меня есть скрипт, который должен анализировать CSV-файл на предмет элементов, имеющих уникальный идентификатор: data-testid="xxxxx-follow".. поле «xxxxx» заполнено набором случайных чисел, которые однозначно идентифицируют кнопка, поэтому в основном я пытаюсь создать сценарий, который сможет идентифицировать эти элементы и экспортировать их в отдельный файл csv, однако вывод для этого файла csv — «HTML, data-testid», который не является желаемые результаты, которые я ищу, есть предложения?
`
def filter_dynamic_testid_elements(input_csv, output_csv):
df = pd.read_csv(input_csv)
# Define the regex pattern to find matches with specific structure
pattern = re.compile(r'data-testid="(\d+)-follow"')

# Extract data-testid values and the original HTML
def extract_testid(html):
match = pattern.search(html)
if match:
return match.group(0) # Returns the full matched text
return None

df['data-testid'] = df['HTML'].apply(extract_testid)
filtered_df = df.dropna(subset=['data-testid']) # Drop rows where 'data-testid' is None

# Save only the rows that have a valid data-testid attribute
filtered_df.to_csv(output_csv, index=False)
print(f"Saved filtered elements to {output_csv}")

see above ^
def filter_dynamic_testid_elements(input_csv, output_csv):
df = pd.read_csv(input_csv)
# Define the regex pattern to find matches with specific structure
pattern = re.compile(r'data-testid="(\d+)-follow"')

# Extract data-testid values and the original HTML
def extract_testid(html):
match = pattern.search(html)
if match:
return match.group(0) # Returns the full matched text
return None

df['data-testid'] = df['HTML'].apply(extract_testid)
filtered_df = df.dropna(subset=['data-testid']) # Drop rows where 'data-testid' is None

# Save only the rows that have a valid data-testid attribute
filtered_df.to_csv(output_csv, index=False)
print(f"Saved filtered elements to {output_csv}")`


Подробнее здесь: https://stackoverflow.com/questions/784 ... -testid-xx
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «Python»