
Теперь я хотел бы проанализировать эти прямоугольники как структуру таблицы. Я мог бы просто перебрать прямоугольники и поместить их в CSV, отсортировав их по координатам x и y
Я столкнулся с двумя при этом возникают проблемы:
- Прямоугольники не обязательно выравнивать соответствующим образом, т. е. прямоугольники в одной горизонтальной строке могут иметь разные координаты x.
- Как можешь видите, некоторые прямоугольники могут занимать три столбца или даже больше, но может быть и так, что некоторые прямоугольники занимают три строки. Как это определить и сделать так, чтобы текст в большом охватывающем прямоугольнике был репрезентативным для всех охватываемых им строк/столбцов.
Подробнее здесь: https://stackoverflow.com/questions/793 ... t-into-csv
Мобильная версия