Я работаю над задачей, в которой мне дают: < /p>
Вопрос < /li>
Изображение (которое может содержать текст, таблицы или визуальный контент). < /li>
< /ul>
Цель - идентифицировать основу (координаты) в изображении, который содержит в образе. область. < /p>
Что я пробовал: < /p>
Я использовал LLMS (openai и антропов) со структурированным выводом для получения координат. Тем не менее, результаты не были надежными, точность составляла около 30%, а ограничивающие ящики часто были отключены или не связаны.class BoundingBox(BaseModel):
top_left: List[int]
bottom_right: List[int]
content: str
confidence: float
class ImageAnalysisResult(BaseModel):
question: str
image_resolution: List[int]
bounding_boxes: List[BoundingBox]
overall_answer: str
response = client.responses.parse(
model=model,
temperature=0.0,
input=[
{
"role": "system",
"content": system_prompt,
},
{
"role": "user",
"content": [
{
"type": "input_text",
"text": user_prompt,
},
{
"type": "input_image",
"image_url": f"data:image/png;base64,{base64_image}",
"detail": "high",
},
],
},
],
text_format=ImageAnalysisResult,
)
< /code>
Что я ищу: < /p>
Предварительная модель или комбинированный метод на основе NLP + CV2, который может найти ответ в изображении, используя ограничительные координаты. /> Любые предложения для моделей, библиотек или рабочих процессов, которые могут помочь? < /p>
Заранее! < /p>
Подробнее здесь: https://stackoverflow.com/questions/796 ... a-given-qu
Как извлечь ограничивающую коробку с изображения, которое содержит ответ на данное вопрос? ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение
-
-
Как извлечь ограничивающую коробку с изображения, которое содержит ответ на данное вопрос?
Anonymous » » в форуме Python - 0 Ответы
- 2 Просмотры
-
Последнее сообщение Anonymous
-
-
-
Как извлечь ограничивающую коробку с изображения, которое содержит ответ на данное вопрос?
Anonymous » » в форуме Python - 0 Ответы
- 2 Просмотры
-
Последнее сообщение Anonymous
-
-
-
Python folium.raster_layers.videoOverlay () Видео не заполняет ограничивающую коробку
Anonymous » » в форуме Python - 0 Ответы
- 21 Просмотры
-
Последнее сообщение Anonymous
-
-
-
Рисовать ограничивающую коробку вокруг самого большого контурного питона CV
Anonymous » » в форуме Python - 0 Ответы
- 18 Просмотры
-
Последнее сообщение Anonymous
-
-
-
Рисовать ограничивающую коробку вокруг самого большого контурного питона CV
Anonymous » » в форуме Python - 0 Ответы
- 18 Просмотры
-
Последнее сообщение Anonymous
-