Увеличьте скорость синтаксического анализа XML в Python

Увеличьте скорость синтаксического анализа XML в Python ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Увеличьте скорость синтаксического анализа XML в Python

Цитата

Сообщение Anonymous » 15 окт 2024, 23:24

Мне приходится анализировать XML-данные объемом от десяти до ста ТБ (да, я знаю). Вы можете представить каждый XML-документ как набор записей, и цель состоит в том, чтобы выбрать небольшое подмножество полей из каждой записи.
Я использовал функцию iterparse в библиотеке lxml. и следуя советам автора. Мой код похож на версию, работающую в 0,97 с, за исключением более сложной логики. Однако мой парсер на самом деле не так быстр, как мне хотелось бы, и я ищу любые советы, библиотеки и методы, которые могут ускорить анализ - независимо от того, насколько он мал.
Единственное предостережение: рекомендации должны быть для Python или для библиотек, имеющих привязки к Python.

Подробнее здесь: https://stackoverflow.com/questions/788 ... -in-python

1729023889

Anonymous

Мне приходится анализировать XML-данные объемом от десяти до ста ТБ (да, я знаю). Вы можете представить каждый XML-документ как набор записей, и цель состоит в том, чтобы выбрать небольшое подмножество полей из каждой записи.
Я использовал функцию iterparse в библиотеке lxml. и следуя советам автора. Мой код похож на версию, работающую в 0,97 с, за исключением более сложной логики. Однако мой парсер на самом деле не так быстр, как мне хотелось бы, и я ищу любые советы, библиотеки и методы, которые могут ускорить анализ - независимо от того, насколько он мал.
Единственное предостережение: рекомендации должны быть для Python или для библиотек, имеющих привязки к Python.
 

Подробнее здесь: [url]https://stackoverflow.com/questions/78805719/increase-speed-of-xml-parsing-in-python[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Может ли кто-нибудь дать код синтаксического анализа этого фрагмента XML в Python?

Последнее сообщение Anonymous « 03 июл 2024, 00:50
Добавлено в форуме Python

Anonymous » 03 июл 2024, 00:50 » в форуме Python

Я работаю над проектом по языковой обработке, моя задача сейчас — проанализировать XML-файл, чтобы вернуть аннотацию. я начну с annotation.py:
import xml.etree.ElementTree as ET
import json

Classe entité défini par un nom et par un type d'entité...

0 Ответы

26 Просмотры

Последнее сообщение Anonymous
03 июл 2024, 00:50
Атрибут идентификатора синтаксического анализа Python вместо элемента из xml

Последнее сообщение Anonymous « 24 янв 2025, 08:07
Добавлено в форуме Python

Anonymous » 24 янв 2025, 08:07 » в форуме Python

Этот код Python обработал некоторые данные XML, как показано в комментарии
# 26Alexi Delano27Cari Lekebusch
def element_members(self, element):
for id, name in grouper( , 2):
yield int(id), name.strip()

Теперь данные XML удалили элемент...

0 Ответы

11 Просмотры

Последнее сообщение Anonymous
24 янв 2025, 08:07
Консоль выдает ошибки синтаксического анализа XML при загрузке содержимого из одного HTML-файла в другой

Последнее сообщение Гость « 11 мар 2024, 03:30
Добавлено в форуме Jquery

Гость » 11 мар 2024, 03:30 » в форуме Jquery

Я использую Firefox v123.0.1 (64-разрядная версия) для локального просмотра index.html for a static web page that I am developing, and I want to dynamically load the contents of another HTML file into a . My goal with having several HTML files is to...

0 Ответы

46 Просмотры

Последнее сообщение Гость
11 мар 2024, 03:30
Консоль выдает ошибки синтаксического анализа XML при загрузке содержимого из одного HTML-файла в другой

Последнее сообщение Гость « 17 мар 2024, 11:37
Добавлено в форуме Jquery

Гость » 17 мар 2024, 11:37 » в форуме Jquery

Я использую Firefox v123.0.1 (64-разрядная версия) для локального просмотра index.html статической веб-страницы, которую я разрабатываю, и хочу динамически загружать содержимое другого HTML-файла в . Моя цель, имея несколько HTML-файлов, состоит в...

0 Ответы

54 Просмотры

Последнее сообщение Гость
17 мар 2024, 11:37
Отключение внешних сущностей Ошибка синтаксического анализа XML

Последнее сообщение Anonymous « 25 июл 2024, 09:43
Добавлено в форуме JAVA

Anonymous » 25 июл 2024, 09:43 » в форуме JAVA

Я получаю блокирующую уязвимость от SonarQube (отключение доступа к внешним объектам при синтаксическом анализе XML.) в моем коде:
public void validateAgainstScheme(String xmlContent, String xsdLocation) throws SAXException, IOException
{...

0 Ответы

19 Просмотры

Последнее сообщение Anonymous
25 июл 2024, 09:43

Вернуться в «Python»