Android Studio: пользовательская модель с набором ML, возвращающая неправильные ограничивающие рамки, несовпадения с пре

Android Studio: пользовательская модель с набором ML, возвращающая неправильные ограничивающие рамки, несовпадения с пре ⇐ Android

1 сообщение • Страница 1 из 1

Гость

Android Studio: пользовательская модель с набором ML, возвращающая неправильные ограничивающие рамки, несовпадения с пре

Цитата

Сообщение Гость » 17 мар 2024, 12:32

Я работаю над проектом Android Studio, в котором использую пользовательскую модель, завернутую в Google ML Kit, для обнаружения объектов в режиме реального времени. Однако я столкнулся с проблемой, из-за которой ограничивающие рамки, возвращаемые моделью, не соответствуют предварительному просмотру, отображаемому на экране. Хотя этикетки кажутся точными. Входное изображение имеет размер 1920 x 1920, а разрешение предварительного просмотра – 2239 x 1080. Вот моя функция:
private void BindPreview(ProcessCameraProvider CameraProvider) {
speaker.speakText("Please hold phone in front of you to detect obstacles");

preview = new Preview.Builder()
.setTargetResolution(new Size(1920, 1920))
.build();
cameraSelector = new CameraSelector.Builder().requireLensFacing(camFacing).build();
preview.setSurfaceProvider(previewView.getSurfaceProvider());

imageAnalysis = new ImageAnalysis.Builder()
.setTargetResolution(new Size(1920, 1920))
.setBackpressureStrategy(ImageAnalysis.STRATEGY_KEEP_ONLY_LATEST)
.build();

imageAnalysis.setAnalyzer(ContextCompat.getMainExecutor(this),
new ImageAnalysis.Analyzer() {
@ExperimentalGetImage
@Override
public void analyze(@NonNull ImageProxy imageProxy) {
Image image = imageProxy.getImage();
if (image != null) {
InputImage inputImage = InputImage.fromMediaImage(image, imageProxy.getImageInfo().getRotationDegrees());
Task task = objectDetector.process(inputImage);

task.addOnSuccessListener(
new OnSuccessListener() {
@Override
public void onSuccess(List detectedObjects) {
if (!detectedObjects.isEmpty()) {
objectQueue.addAll(detectedObjects);
Matrix mappingMatrix = ProjectHelper.getMappingMatrix(imageProxy, previewView);
for (DetectedObject object : detectedObjects) {
Rect boundingBox = ProjectHelper.mapBoundingBox(object.getBoundingBox(), mappingMatrix);
rectangleOverlayView.updateRect(boundingBox);
rectangleOverlayView.invalidate();
}
}
}
}
)
.addOnFailureListener(
new OnFailureListener() {
@Override
public void onFailure(@NonNull Exception e) {
Log.e("Object Detection", e.getMessage());
}
}
)
.addOnCompleteListener(
new OnCompleteListener() {
@Override
public void onComplete(@NonNull Task task) {
imageProxy.close();
image.close();
}
}
);

}
}
});

CameraProvider.bindToLifecycle((LifecycleOwner) this, cameraSelector, imageAnalysis, preview);
}

Я получил функцию getMappingMatrix из другого вопроса о переполнении стека, но, похоже, она не очень помогла. Вот эта функция:
public static Matrix getMappingMatrix(ImageProxy imageProxy, PreviewView previewView) {
Rect cropRect = imageProxy.getCropRect();
int rotationDegrees = imageProxy.getImageInfo().getRotationDegrees();
Matrix matrix = new Matrix();

// A float array of the source vertices (crop rect) in clockwise order.
float[] source = {
cropRect.left,
cropRect.top,
cropRect.right,
cropRect.top,
cropRect.right,
cropRect.bottom,
cropRect.left,
cropRect.bottom
};

// A float array of the destination vertices in clockwise order.
float[] destination = {
0f,
0f,
previewView.getWidth(),
0f,
previewView.getWidth(),
previewView.getHeight(),
0f,
previewView.getHeight()
};

// The destination vertexes need to be shifted based on rotation degrees.
// The rotation degree represents the clockwise rotation needed to correct
// the image.

// Each vertex is represented by 2 float numbers in the vertices array.
int vertexSize = 2;
// The destination needs to be shifted 1 vertex for every 90° rotation.
int shiftOffset = rotationDegrees / 90 * vertexSize;
float[] tempArray = destination.clone();
for (int toIndex = 0; toIndex < source.length; toIndex++) {
int fromIndex = (toIndex + shiftOffset) % source.length;
destination[toIndex] = tempArray[fromIndex];
}
matrix.setPolyToPoly(source, 0, destination, 0, 4);
return matrix;
}

Я использую модель, рекомендованную документацией ML Kit.
Классификатор изображений EfficientNet-Lite
Вот мой onCreate функция:

@Override
protected void onCreate(Bundle savedInstanceState) {
super.onCreate(savedInstanceState);
setContentView(R.layout.activity_object_detection);
LocalModel localModel =
new LocalModel.Builder()
.setAssetFilePath("2.tflite")
.build();

CustomObjectDetectorOptions customObjectDetectorOptions =
new CustomObjectDetectorOptions.Builder(localModel)
.setDetectorMode(CustomObjectDetectorOptions.STREAM_MODE)
.enableClassification()
.setClassificationConfidenceThreshold(0.5f)
.setMaxPerObjectLabelCount(1)
.build();

objectDetector = ObjectDetection.getClient(customObjectDetectorOptions);
previewView = findViewById(R.id.cameraPreview);
context = this;
rectangleOverlayView = findViewById(R.id.rectangle_overlay);

cameraProviderFuture = ProcessCameraProvider.getInstance(this);
cameraProviderFuture.addListener(() -> {
try {
cameraProvider = cameraProviderFuture.get();
if(ContextCompat.checkSelfPermission(ObjectDetectionActivity.this, android.Manifest.permission.CAMERA) != PackageManager.PERMISSION_GRANTED){
activityResultLauncher.launch(Manifest.permission.CAMERA);
} else{
BindPreview(cameraProvider);
}
} catch (ExecutionException | InterruptedException e) {
e.printStackTrace(); // Handle exceptions as needed
Log.e("CamerX Camera Provider", e.getMessage());
}
}, ContextCompat.getMainExecutor(this));
}

Подробнее здесь: https://stackoverflow.com/questions/781 ... -boxes-mis

1710667954

Гость

Я работаю над проектом Android Studio, в котором использую пользовательскую модель, завернутую в Google ML Kit, для обнаружения объектов в режиме реального времени. Однако я столкнулся с проблемой, из-за которой ограничивающие рамки, возвращаемые моделью, не соответствуют предварительному просмотру, отображаемому на экране. Хотя этикетки кажутся точными. Входное изображение имеет размер 1920 x 1920, а разрешение предварительного просмотра – 2239 x 1080. Вот моя функция:
private void BindPreview(ProcessCameraProvider CameraProvider) {
speaker.speakText("Please hold phone in front of you to detect obstacles");

preview = new Preview.Builder()
.setTargetResolution(new Size(1920, 1920))
.build();
cameraSelector = new CameraSelector.Builder().requireLensFacing(camFacing).build();
preview.setSurfaceProvider(previewView.getSurfaceProvider());

imageAnalysis = new ImageAnalysis.Builder()
.setTargetResolution(new Size(1920, 1920))
.setBackpressureStrategy(ImageAnalysis.STRATEGY_KEEP_ONLY_LATEST)
.build();

imageAnalysis.setAnalyzer(ContextCompat.getMainExecutor(this),
new ImageAnalysis.Analyzer() {
@ExperimentalGetImage
@Override
public void analyze(@NonNull ImageProxy imageProxy) {
Image image = imageProxy.getImage();
if (image != null) {
InputImage inputImage = InputImage.fromMediaImage(image, imageProxy.getImageInfo().getRotationDegrees());
Task task = objectDetector.process(inputImage);

task.addOnSuccessListener(
new OnSuccessListener() {
@Override
public void onSuccess(List detectedObjects) {
if (!detectedObjects.isEmpty()) {
objectQueue.addAll(detectedObjects);
Matrix mappingMatrix =                                                                       ProjectHelper.getMappingMatrix(imageProxy, previewView);
for (DetectedObject object : detectedObjects) {
Rect boundingBox = ProjectHelper.mapBoundingBox(object.getBoundingBox(), mappingMatrix);
rectangleOverlayView.updateRect(boundingBox);
rectangleOverlayView.invalidate();
}
}
}
}
)
.addOnFailureListener(
new OnFailureListener() {
@Override
public void onFailure(@NonNull Exception e) {
Log.e("Object Detection", e.getMessage());
}
}
)
.addOnCompleteListener(
new OnCompleteListener() {
@Override
public void onComplete(@NonNull Task task) {
imageProxy.close();
image.close();
}
}
);

}
}
});

CameraProvider.bindToLifecycle((LifecycleOwner) this, cameraSelector, imageAnalysis, preview);
}

Я получил функцию getMappingMatrix из другого вопроса о переполнении стека, но, похоже, она не очень помогла.  Вот эта функция:
public static Matrix getMappingMatrix(ImageProxy imageProxy, PreviewView previewView) {
Rect cropRect = imageProxy.getCropRect();
int rotationDegrees = imageProxy.getImageInfo().getRotationDegrees();
Matrix matrix = new Matrix();

// A float array of the source vertices (crop rect) in clockwise order.
float[] source = {
cropRect.left,
cropRect.top,
cropRect.right,
cropRect.top,
cropRect.right,
cropRect.bottom,
cropRect.left,
cropRect.bottom
};

// A float array of the destination vertices in clockwise order.
float[] destination = {
0f,
0f,
previewView.getWidth(),
0f,
previewView.getWidth(),
previewView.getHeight(),
0f,
previewView.getHeight()
};

// The destination vertexes need to be shifted based on rotation degrees.
// The rotation degree represents the clockwise rotation needed to correct
// the image.

// Each vertex is represented by 2 float numbers in the vertices array.
int vertexSize = 2;
// The destination needs to be shifted 1 vertex for every 90° rotation.
int shiftOffset = rotationDegrees / 90 * vertexSize;
float[] tempArray = destination.clone();
for (int toIndex = 0; toIndex < source.length; toIndex++) {
int fromIndex = (toIndex + shiftOffset) % source.length;
destination[toIndex] = tempArray[fromIndex];
}
matrix.setPolyToPoly(source, 0, destination, 0, 4);
return matrix;
}

Я использую модель, рекомендованную документацией ML Kit.
Классификатор изображений EfficientNet-Lite
Вот мой onCreate функция:

@Override
protected void onCreate(Bundle savedInstanceState) {
super.onCreate(savedInstanceState);
setContentView(R.layout.activity_object_detection);
LocalModel localModel =
new LocalModel.Builder()
.setAssetFilePath("2.tflite")
.build();

CustomObjectDetectorOptions customObjectDetectorOptions =
new CustomObjectDetectorOptions.Builder(localModel)
.setDetectorMode(CustomObjectDetectorOptions.STREAM_MODE)
.enableClassification()
.setClassificationConfidenceThreshold(0.5f)
.setMaxPerObjectLabelCount(1)
.build();

objectDetector = ObjectDetection.getClient(customObjectDetectorOptions);
previewView = findViewById(R.id.cameraPreview);
context = this;
rectangleOverlayView = findViewById(R.id.rectangle_overlay);

cameraProviderFuture = ProcessCameraProvider.getInstance(this);
cameraProviderFuture.addListener(() -> {
try {
cameraProvider = cameraProviderFuture.get();
if(ContextCompat.checkSelfPermission(ObjectDetectionActivity.this, android.Manifest.permission.CAMERA) != PackageManager.PERMISSION_GRANTED){
activityResultLauncher.launch(Manifest.permission.CAMERA);
} else{
BindPreview(cameraProvider);
}
} catch (ExecutionException | InterruptedException e) {
e.printStackTrace(); // Handle exceptions as needed
Log.e("CamerX Camera Provider", e.getMessage());
}
}, ContextCompat.getMainExecutor(this));
}
 

Подробнее здесь: [url]https://stackoverflow.com/questions/78171749/android-studio-custom-model-with-ml-kit-returning-incorrect-bounding-boxes-mis[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Android Studio: пользовательская модель с набором ML, возвращающая неправильные ограничивающие рамки, несовпадения с пре

Последнее сообщение Гость « 17 мар 2024, 12:32
Добавлено в форуме JAVA

Гость » 17 мар 2024, 12:32 » в форуме JAVA

Я работаю над проектом Android Studio, в котором использую пользовательскую модель, завернутую в Google ML Kit, для обнаружения объектов в режиме реального времени. Однако я столкнулся с проблемой, из-за которой ограничивающие рамки, возвращаемые...

0 Ответы

24 Просмотры

Последнее сообщение Гость
17 мар 2024, 12:32
Pytorch быстрее r-cnn, нет ошибки возвращаемого значения изображения ограничивающей рамки (все ограничивающие рамки долж

Последнее сообщение Anonymous « 30 июл 2024, 02:08
Добавлено в форуме Python

Anonymous » 30 июл 2024, 02:08 » в форуме Python

Я пытаюсь обучить Faster R-CNN на пользовательском наборе данных.
Когда я тренируюсь без изображения объекта (изображение без ограничивающих рамок), он возвращает ошибку значения: «Все ограничивающие рамки должны иметь положительную высоту и ширину»...

0 Ответы

62 Просмотры

Последнее сообщение Anonymous
30 июл 2024, 02:08
Как преобразовать X AnyLabeling JSON в ограничивающие рамки, ориентированные на YOLOv8

Последнее сообщение Anonymous « 29 апр 2024, 05:12
Добавлено в форуме Python

Anonymous » 29 апр 2024, 05:12 » в форуме Python

В настоящее время я работаю над проектом, который включает преобразование файлов JSON, экспортированных из X AnyLabeling. Эти файлы содержат аннотации для повернутых ограничивающих рамок (0.json-11.json), и мне нужно преобразовать их в формат набора...

0 Ответы

35 Просмотры

Последнее сообщение Anonymous
29 апр 2024, 05:12
Проверьте, перекрываются ли две ограничивающие рамки

Последнее сообщение Anonymous « 02 июн 2024, 22:27
Добавлено в форуме C#

Anonymous » 02 июн 2024, 22:27 » в форуме C#

Я сделал что-то вроде этого:
Pseudo:
`Function checkOverlap(thisRectangle, otherRectangle):
if thisRectangle.UpperRight.Longitude otherRectangle.UpperRight.Longitude
return false
if thisRectangle.UpperRight.Latitude...

0 Ответы

13 Просмотры

Последнее сообщение Anonymous
02 июн 2024, 22:27
Как точно расположить 3D-ограничивающие рамки в Unity для HoloLens 2 на основе результатов обнаружения 2D-объектов?

Последнее сообщение Anonymous « 26 июн 2024, 18:07
Добавлено в форуме C#

Anonymous » 26 июн 2024, 18:07 » в форуме C#

I am developing an application for HoloLens 2 using Unity 2022.3.30f1 and MRTK Foundation 2.8.3. My goal is to position 3D bounding boxes in the real world based on 2D object detection results obtained from a YOLOv9 server.
Problem:

Несмотря на...

0 Ответы

17 Просмотры

Последнее сообщение Anonymous
26 июн 2024, 18:07

Вернуться в «Android»