Как я могу выравнивать выходы массива Numpy из PDFIUM и STB_IMAGE при рендеринге идентичного контента? - Цифровое Кемерово

Как я могу выравнивать выходы массива Numpy из PDFIUM и STB_IMAGE при рендеринге идентичного контента? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Как я могу выравнивать выходы массива Numpy из PDFIUM и STB_IMAGE при рендеринге идентичного контента?

Цитата

Сообщение Anonymous » 01 сен 2025, 09:10

В C ++ я пытаюсь получить массив Numpy со страницы PDF с использованием pdfium: < /p>

Код: Выделить всё

py::array_t render_page_helper(FPDF_PAGE page, int target_width = 0, int target_height = 0, int dpi = 80) {
int width, height;

if (target_width > 0 && target_height > 0) {
width = target_width;
height = target_height;
} else {
width = static_cast(FPDF_GetPageWidth(page) * dpi / 72.0);
height = static_cast(FPDF_GetPageHeight(page) * dpi / 72.0);
}

FPDF_BITMAP bitmap = FPDFBitmap_Create(width, height, 1);
if (!bitmap) throw std::runtime_error("Failed to create bitmap");

FPDFBitmap_FillRect(bitmap, 0, 0, width, height, 0xFFFFFFFF);
FPDF_RenderPageBitmap(bitmap, page, 0, 0, width, height, 0, FPDF_ANNOT);

int stride = FPDFBitmap_GetStride(bitmap);
uint8_t* buffer = static_cast(FPDFBitmap_GetBuffer(bitmap));

// Return numpy array with shape (height, width, 4) = BGRA
auto result = py::array_t({height, width, 4}, buffer);
FPDFBitmap_Destroy(bitmap);
return result;
}
< /code>
Результат затем передается обратно в Python и обрабатывается с помощью: < /p>
arr = arr_bgra[:, :, [2, 1, 0]]
< /code>
, чтобы отрубиться из альфа -значения и переставить его в формат RGB.py::array_t render_image(const std::string& filename, int target_width = 224, int target_height = 224) {
int width, height, channels;
unsigned char* rgba = stbi_load(filename.c_str(), &width, &height, &channels, 4); // force RGBA
if (!rgba) throw std::runtime_error("Failed to load image");

// Temporary buffer (still RGBA after resize)
std::vector resized(target_width * target_height * 4);
stbir_resize_uint8(rgba, width, height, 0,
resized.data(), target_width, target_height, 0, 4);
stbi_image_free(rgba);

// Allocate Python-owned buffer for final RGB output
py::array_t result({target_height, target_width, 3});
auto buf = result.mutable_unchecked();

// Convert RGBA → RGB (drop alpha)
for (int y = 0; y < target_height; ++y) {
for (int x = 0; x < target_width; ++x) {
int idx = (y * target_width + x) * 4;
buf(y, x, 0) = resized[idx + 0]; // R
buf(y, x, 1) = resized[idx + 1]; // G
buf(y, x, 2) = resized[idx + 2]; // B
}
}

return result;
}

Для обработки и возврата Numpy массив напрямую.
Оба работают отлично, однако, когда представлено PDF и изображение того же содержимого , и все, что два трубопровода производят очень разные массивы. И мне интересно, можно ли даже дать результаты, которые похожи, без качания pdfium, поскольку использование его является чем -то вроде требования.

Подробнее здесь: https://stackoverflow.com/questions/797 ... dering-ide

Реклама

1756707038

Anonymous

 В C ++ я пытаюсь получить массив Numpy со страницы PDF с использованием pdfium: < /p>
[code]py::array_t render_page_helper(FPDF_PAGE page, int target_width = 0, int target_height = 0, int dpi = 80) {
int width, height;

if (target_width > 0 && target_height > 0) {
width = target_width;
height = target_height;
} else {
width = static_cast(FPDF_GetPageWidth(page) * dpi / 72.0);
height = static_cast(FPDF_GetPageHeight(page) * dpi / 72.0);
}

FPDF_BITMAP bitmap = FPDFBitmap_Create(width, height, 1);
if (!bitmap) throw std::runtime_error("Failed to create bitmap");

FPDFBitmap_FillRect(bitmap, 0, 0, width, height, 0xFFFFFFFF);
FPDF_RenderPageBitmap(bitmap, page, 0, 0, width, height, 0, FPDF_ANNOT);

int stride = FPDFBitmap_GetStride(bitmap);
uint8_t* buffer = static_cast(FPDFBitmap_GetBuffer(bitmap));

// Return numpy array with shape (height, width, 4) = BGRA
auto result = py::array_t({height, width, 4}, buffer);
FPDFBitmap_Destroy(bitmap);
return result;
}
< /code>
Результат затем передается обратно в Python и обрабатывается с помощью: < /p>
arr = arr_bgra[:, :, [2, 1, 0]]
< /code>
, чтобы отрубиться из альфа -значения и переставить его в формат RGB.py::array_t render_image(const std::string& filename, int target_width = 224, int target_height = 224) {
int width, height, channels;
unsigned char* rgba = stbi_load(filename.c_str(), &width, &height, &channels, 4); // force RGBA
if (!rgba) throw std::runtime_error("Failed to load image");

// Temporary buffer (still RGBA after resize)
std::vector resized(target_width * target_height * 4);
stbir_resize_uint8(rgba, width, height, 0,
resized.data(), target_width, target_height, 0, 4);
stbi_image_free(rgba);

// Allocate Python-owned buffer for final RGB output
py::array_t result({target_height, target_width, 3});
auto buf = result.mutable_unchecked();

// Convert RGBA → RGB (drop alpha)
for (int y = 0; y < target_height; ++y) {
for (int x = 0; x < target_width; ++x) {
int idx = (y * target_width + x) * 4;
buf(y, x, 0) = resized[idx + 0]; // R
buf(y, x, 1) = resized[idx + 1]; // G
buf(y, x, 2) = resized[idx + 2]; // B
}
}

return result;
}
[/code]
Для обработки и возврата Numpy массив напрямую. 
Оба работают отлично, однако, когда представлено PDF и изображение [b] того же содержимого [/b], и все, что два трубопровода производят очень разные массивы. И мне интересно, можно ли даже дать результаты, которые похожи, без качания pdfium, поскольку использование его является чем -то вроде требования.  

Подробнее здесь: [url]https://stackoverflow.com/questions/79752205/how-can-i-align-numpy-array-outputs-from-pdfium-and-stb-image-when-rendering-ide[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Как я могу выравнивать выходы массива Numpy из PDFIUM и STB_IMAGE при рендеринге идентичного контента?

Последнее сообщение Anonymous « 01 сен 2025, 09:10
Добавлено в форуме C++

Anonymous » 01 сен 2025, 09:10 » в форуме C++

В C ++ я пытаюсь получить массив Numpy со страницы PDF с использованием pdfium:
py::array_t render_page_helper(FPDF_PAGE page, int target_width = 0, int target_height = 0, int dpi = 80) {
int width, height;

if (target_width > 0 && target_height >...

0 Ответы

2 Просмотры

Последнее сообщение Anonymous
01 сен 2025, 09:10
Как я могу выравнивать выходы массива Numpy из PDFIUM и STB_IMAGE при рендеринге идентичного контента?

Последнее сообщение Anonymous « 02 сен 2025, 13:13
Добавлено в форуме Python

Anonymous » 02 сен 2025, 13:13 » в форуме Python

В C ++ я пытаюсь получить массив Numpy со страницы PDF с использованием pdfium:
py::array_t render_page_helper(FPDF_PAGE page, int target_width = 0, int target_height = 0, int dpi = 80) {
int width, height;

if (target_width > 0 && target_height >...

0 Ответы

1 Просмотры

Последнее сообщение Anonymous
02 сен 2025, 13:13
Как я могу выравнивать выходы массива Numpy из PDFIUM и STB_IMAGE при рендеринге идентичного контента?

Последнее сообщение Anonymous « 02 сен 2025, 13:13
Добавлено в форуме C++

Anonymous » 02 сен 2025, 13:13 » в форуме C++

В C ++ я пытаюсь получить массив Numpy со страницы PDF с использованием pdfium:
py::array_t render_page_helper(FPDF_PAGE page, int target_width = 0, int target_height = 0, int dpi = 80) {
int width, height;

if (target_width > 0 && target_height >...

0 Ответы

1 Просмотры

Последнее сообщение Anonymous
02 сен 2025, 13:13
Как я могу выравнивать выходы массива Numpy из PDFIUM и STB_IMAGE при рендеринге идентичного контента?

Последнее сообщение Anonymous « 07 сен 2025, 10:54
Добавлено в форуме Python

Anonymous » 07 сен 2025, 10:54 » в форуме Python

В C ++ я пытаюсь получить массив Numpy со страницы PDF с использованием pdfium:
py::array_t render_page_helper(FPDF_PAGE page, int target_width = 0, int target_height = 0, int dpi = 80) {
int width, height;

if (target_width > 0 && target_height >...

0 Ответы

3 Просмотры

Последнее сообщение Anonymous
07 сен 2025, 10:54
Как я могу выравнивать выходы массива Numpy из PDFIUM и STB_IMAGE при рендеринге идентичного контента?

Последнее сообщение Anonymous « 07 сен 2025, 10:54
Добавлено в форуме C++

Anonymous » 07 сен 2025, 10:54 » в форуме C++

В C ++ я пытаюсь получить массив Numpy со страницы PDF с использованием pdfium:
py::array_t render_page_helper(FPDF_PAGE page, int target_width = 0, int target_height = 0, int dpi = 80) {
int width, height;

if (target_width > 0 && target_height >...

0 Ответы

2 Просмотры

Последнее сообщение Anonymous
07 сен 2025, 10:54

Вернуться в «Python»

Programmiererforum