Какова правильная логика классификации и категоризации изображений с помощью Python? - Цифровое Кемерово

Какова правильная логика классификации и категоризации изображений с помощью Python? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Какова правильная логика классификации и категоризации изображений с помощью Python?

Цитата

Сообщение Anonymous » 05 ноя 2024, 02:17

Я прочитал множество статей здесь и в других местах, консультировался с ChatGPT и Gemini и даже спрашивал реальных людей, но мне также хотелось бы узнать мнение этого сообщества:
Я пытаюсь создать классификатор фотографий.
Идея заключалась в том, что я могу использовать модель или обучить свою собственную и дать ей несколько тысяч изображений всех типов предметов, и она будет их хранить в соответствующих папках по категориям.
Изображения в основном посвящены различным событиям; на открытом воздухе, в помещении, есть сцена, публика, концерт, человек, выступающий с речью, церемония награждения, красная дорожка, мероприятия перед мероприятием, общение после мероприятия и многое другое. Я собираю изображения от 10 до 20 фотографов и вручную сортирую их по категориям, таким как «снимок слева от дома», «крупный план в центре», «вручение награды», «реакция публики», «до мероприятия» и т. д. не все события имеют одинаковые категории, и не все категории легко отличить друг от друга даже для человека.
Я попробовал следующее:

кластеризация изображений, затем нулевая съемка с помощью CLIP, а затем сортировка
тренировка моего собственного «верхнего слоя» CLIP с 10000 изображений, которые я уже классифицируется вручную
используйте другие модели, такие как alexnet, Densnet, EffectiveNet,
inception_v3, mobilenet, vgg
пробовал точно настроить каждую из этих моделей
различные методы кластеризации
затем я даже попробовал добавить к ней автоматические субтитры с помощью Florence, а затем с помощью
MiniLM -L6-v2 разбивает подписи на отдельные метки, затем сортирует их

и многое другое...
На данный момент моя лучшая точность была около 90%, с 2 типами кластеризации и обучением CLIP около месяца на моем компьютере с собственными данными, но я не верю, что сегодняшние технологии не могут добиться большего.
Итак, мой вопрос:
Какая логическая линия лучше всего подходит для такой задачи? Каков наилучший подход к классификации изображений такого типа? это не так просто, как отличить мотоцикл от банана. Для этого необходимо «увидеть» разницу между «дальним планом справа от дома» и «дальним планом дома слева», разницу между «развлечениями после мероприятия» и «концертом перед мероприятием», «ведущим А» и «ведущим Б» и т. д. .
Есть идеи?
Спасибо!

Подробнее здесь: https://stackoverflow.com/questions/791 ... ges-with-p

Реклама

1730762223

Anonymous

Я прочитал множество статей здесь и в других местах, консультировался с ChatGPT и Gemini и даже спрашивал реальных людей, но мне также хотелось бы узнать мнение этого сообщества:
Я пытаюсь создать классификатор фотографий.
Идея заключалась в том, что я могу использовать модель или обучить свою собственную и дать ей несколько тысяч изображений всех типов предметов, и она будет их хранить в соответствующих папках по категориям.
Изображения в основном посвящены различным событиям; на открытом воздухе, в помещении, есть сцена, публика, концерт, человек, выступающий с речью, церемония награждения, красная дорожка, мероприятия перед мероприятием, общение после мероприятия и многое другое. Я собираю изображения от 10 до 20 фотографов и вручную сортирую их по категориям, таким как «снимок слева от дома», «крупный план в центре», «вручение награды», «реакция публики», «до мероприятия» и т. д. не все события имеют одинаковые категории, и не все категории легко отличить друг от друга даже для человека.
Я попробовал следующее:
[list]
[*]кластеризация изображений, затем нулевая съемка с помощью CLIP, а затем сортировка
[*]тренировка моего собственного «верхнего слоя» CLIP с 10000 изображений, которые я уже классифицируется вручную
[*]используйте другие модели, такие как alexnet, Densnet, EffectiveNet,
inception_v3, mobilenet, vgg
[*]пробовал точно настроить каждую из этих моделей
[*]различные методы кластеризации
[*]затем я даже попробовал добавить к ней автоматические субтитры с помощью Florence, а затем с помощью
MiniLM -L6-v2 разбивает подписи на отдельные метки, затем сортирует их
[/list]
и многое другое...
На данный момент моя лучшая точность была около 90%, с 2 типами кластеризации и обучением CLIP около месяца на моем компьютере с собственными данными, но я не верю, что сегодняшние технологии не могут добиться большего.
Итак, мой вопрос:
Какая логическая линия лучше всего подходит для такой задачи? Каков наилучший подход к классификации изображений такого типа? это не так просто, как отличить мотоцикл от банана. Для этого необходимо «увидеть» разницу между «дальним планом справа от дома» и «дальним планом дома слева», разницу между «развлечениями после мероприятия» и «концертом перед мероприятием», «ведущим А» и «ведущим Б» и т. д. .
Есть идеи?
Спасибо! 

Подробнее здесь: [url]https://stackoverflow.com/questions/79157264/what-is-the-correct-line-of-logic-for-classifying-and-categorizing-images-with-p[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Какова правильная логика классификации изображений?

Последнее сообщение Anonymous « 05 ноя 2024, 13:51
Добавлено в форуме Python

Anonymous » 05 ноя 2024, 13:51 » в форуме Python

Я прочитал множество статей здесь и в других местах, консультировался с ChatGPT и Gemini и даже спрашивал реальных людей, но мне также хотелось бы узнать мнение этого сообщества:
Я пытаюсь создать классификатор фотографий.
Идея заключалась в том,...

0 Ответы

9 Просмотры

Последнее сообщение Anonymous
05 ноя 2024, 13:51
Наиболее эффективный способ категоризации, когда набор тегов не определен

Последнее сообщение Anonymous « 23 июн 2024, 17:46
Добавлено в форуме Python

Anonymous » 23 июн 2024, 17:46 » в форуме Python

Создавая систему категоризации, я столкнулся с проблемой, которую пытаюсь найти решение. В моей системе есть теги, используемые для категоризации, но с оговоркой, что со временем будет добавлено больше тегов и категорий.
Вместо того, чтобы...

0 Ответы

17 Просмотры

Последнее сообщение Anonymous
23 июн 2024, 17:46
Классификаторы категоризации текста

Последнее сообщение Anonymous « 29 ноя 2024, 07:24
Добавлено в форуме JAVA

Anonymous » 29 ноя 2024, 07:24 » в форуме JAVA

Кто-нибудь знает хорошие модели категоризации текста с открытым исходным кодом? Я знаю о Stanford Classifier, Weka, Mallet и т. д., но все они требуют обучения.

Мне нужно классифицировать новостные статьи по категориям «Спорт», «Политика»,...

0 Ответы

8 Просмотры

Последнее сообщение Anonymous
29 ноя 2024, 07:24
Java - даже позиционируйте буквы в строке для категоризации [дубликат]

Последнее сообщение Anonymous « 17 дек 2024, 17:43
Добавлено в форуме JAVA

Anonymous » 17 дек 2024, 17:43 » в форуме JAVA

public class UsingArrayGetEvenLettersFromString {

public static void main(String[] args) {
// even letters
String str = new String( hello );
char[] ch = str.toCharArray();
char[] eCh = {};
char[] oCh = {};
System.out.println( length : +ch.length);...

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
17 дек 2024, 17:43
Получаю неправильный ответ, хотя логика моего кода выглядит такой же, как логика решения [закрыто]

Последнее сообщение Anonymous « 01 янв 2024, 06:20
Добавлено в форуме C++

Anonymous » 01 янв 2024, 06:20 » в форуме C++

Я пытался решить вопрос с кодефом мой код давал неправильный ответ для тестового примера. но когда я проверил решение, код выглядел так, будто он имеет аналогичную логику и закодирован по-другому. Пожалуйста, помогите мне понять, почему это...

0 Ответы

60 Просмотры

Последнее сообщение Anonymous
01 янв 2024, 06:20

Вернуться в «Python»

Programmiererforum