Извлечение разделов из научных статей по HTML на PythonPython

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Извлечение разделов из научных статей по HTML на Python

Сообщение Anonymous »

Я пытаюсь извлечь разделы (Метод, Результаты, Обсуждение и Ссылки) из научных статей, чтобы найти несколько слов. Если я запускаю свой код, разделы начинаются в нужном месте, но не заканчиваются в следующем разделе. Может ли кто-нибудь помочь мне это исправить?

Код: Выделить всё

#Locating, extracting each section and searching for the terms (unypall sample)
import re
import logging
from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.chrome.options import Options
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from webdriver_manager.chrome import ChromeDriverManager
from bs4 import BeautifulSoup

logging.basicConfig(filename='error.log', level=logging.ERROR)

# Patterns
method_pattern = re.compile(r'(?

Подробнее здесь: [url]https://stackoverflow.com/questions/79084033/extract-sections-from-academic-papers-on-html-on-python[/url]
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «Python»