Почему вероятности всегда одинаковы с моделью Mobilenet V2 (mobilenet_v2_1.4_224.tflite)? - Цифровое Кемерово

Почему вероятности всегда одинаковы с моделью Mobilenet V2 (mobilenet_v2_1.4_224.tflite)? ⇐ Android

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Почему вероятности всегда одинаковы с моделью Mobilenet V2 (mobilenet_v2_1.4_224.tflite)?

Цитата

Сообщение Anonymous » 11 фев 2025, 22:07

Я внедряю модель Tensorflow Lite в моем приложении Android, используя модель Mobilenet_v2_1.4_224.tflite, которую я загрузил с репозитория GitHub tensorflow:
Mobilenet из моделей Tensorflow < /p>
mobilenet > Приложение работает следующим образом: < /p>

Я захватываю изображение, используя камеру и сохраняю его в качестве временного файла. < /Li>
Затем изображение изменяется до 224x224 пикселей и нормализуется в соответствии с этапами предварительной обработки Mobilenet (вычитание 127,5 и разделение на 127,5). < /Li>
к модели для вывода. < /li>
< /ol>
, в то время как модель работает без каких -либо исключений, возвращаемые вероятности всегда одинаковы для всех классов, независимо от входного изображения. Например, вероятность каждого класса неизменно близок к нулю или равномерной, как если бы модель не отвечает на вход. /p>
mainactivity.kt

Код: Выделить всё

package com.example.myapplication

import android.Manifest
import android.content.pm.PackageManager
import android.graphics.Bitmap
import android.graphics.BitmapFactory
import android.net.Uri
import android.os.Bundle
import android.util.Log
import android.widget.Button
import android.widget.FrameLayout
import android.widget.Toast
import androidx.activity.ComponentActivity
import androidx.activity.result.contract.ActivityResultContracts
import androidx.core.content.ContextCompat
import androidx.core.content.FileProvider
import java.io.File
import java.io.InputStream
import java.nio.ByteBuffer
import java.text.SimpleDateFormat
import java.util.*

class MainActivity : ComponentActivity() {
private lateinit var photoUri: Uri
private lateinit var mobileNetClassifier: MobileNetClassifier

override fun onCreate(savedInstanceState: Bundle?) {
super.onCreate(savedInstanceState)
mobileNetClassifier = MobileNetClassifier(this)

// Layout programmatically
val layout = FrameLayout(this).apply {
id = FrameLayout.generateViewId()
}
setContentView(layout)

val button = Button(this).apply {
text = "Take a Photo"
setOnClickListener { checkPermissionsAndOpenCamera() }
}
layout.addView(button)

// Align button in the center
val params = FrameLayout.LayoutParams(
FrameLayout.LayoutParams.WRAP_CONTENT,
FrameLayout.LayoutParams.WRAP_CONTENT
).apply {
gravity = android.view.Gravity.CENTER
}
button.layoutParams = params
}

private fun analyzePhoto(photoUri: Uri) {
val inputStream: InputStream? = contentResolver.openInputStream(photoUri)
val bitmap = BitmapFactory.decodeStream(inputStream)
inputStream?.close()

// Convert the image to ByteBuffer
val byteBuffer = convertBitmapToByteBuffer(bitmap)

// Get the prediction
val result = mobileNetClassifier.classifyImage(byteBuffer)

// Display the result
Toast.makeText(this, "Result: $result", Toast.LENGTH_LONG).show()
}

private fun convertBitmapToByteBuffer(bitmap: Bitmap): ByteBuffer {
val IMAGE_MEAN = 127.5f
val IMAGE_STD = 127.5f
val IMAGE_SIZE_X = 224
val IMAGE_SIZE_Y = 224
val DIM_PIXEL_SIZE = 3
val NUM_BYTES_PER_CHANNEL = 4 // Float size

// Resize bitmap to match model input size
val resizedBitmap = Bitmap.createScaledBitmap(bitmap, IMAGE_SIZE_X, IMAGE_SIZE_Y, false)

val intValues = IntArray(IMAGE_SIZE_X * IMAGE_SIZE_Y)
resizedBitmap.getPixels(intValues, 0, resizedBitmap.width, 0, 0, resizedBitmap.width, resizedBitmap.height)

val byteBuffer = ByteBuffer.allocateDirect(
IMAGE_SIZE_X * IMAGE_SIZE_Y * DIM_PIXEL_SIZE * NUM_BYTES_PER_CHANNEL
)
byteBuffer.order(ByteOrder.nativeOrder())
byteBuffer.rewind()

// Normalize pixel values
for (pixel in intValues) {
byteBuffer.putFloat(((pixel shr 16 and 0xFF) - IMAGE_MEAN) / IMAGE_STD) // Red
byteBuffer.putFloat(((pixel shr 8 and 0xFF) - IMAGE_MEAN) / IMAGE_STD)  // Green
byteBuffer.putFloat(((pixel and 0xFF) - IMAGE_MEAN) / IMAGE_STD)       // Blue
}
return byteBuffer
}

private fun checkPermissionsAndOpenCamera() {
when {
ContextCompat.checkSelfPermission(this, Manifest.permission.CAMERA) == PackageManager.PERMISSION_GRANTED -> {
openCamera()
}
else ->  {
requestPermissionLauncher.launch(Manifest.permission.CAMERA)
}
}
}

private val requestPermissionLauncher = registerForActivityResult(
ActivityResultContracts.RequestPermission()
) { isGranted: Boolean ->
if (isGranted) {
openCamera()
}
}

private val takePictureLauncher = registerForActivityResult(
ActivityResultContracts.TakePicture()
) { isSaved: Boolean ->
if (isSaved) {
analyzePhoto(photoUri)
}
}

private fun openCamera() {
val photoFile = createImageFile()
photoUri = FileProvider.getUriForFile(
this,
"${packageName}.provider",
photoFile
)
takePictureLauncher.launch(photoUri)
}

private fun createImageFile(): File {
val timestamp = SimpleDateFormat("yyyyMMdd_HHmmss", Locale.US).format(Date())
val storageDir = getExternalFilesDir(null)
return File.createTempFile(
"JPEG_${timestamp}_",
".jpg",
storageDir
)
}
}

mobilenetClassifier.kt

Код: Выделить всё

package com.example.myapplication

import android.content.Context
import android.graphics.Bitmap
import android.util.Log
import org.tensorflow.lite.Interpreter
import org.tensorflow.lite.support.common.FileUtil
import java.io.InputStream
import java.nio.ByteBuffer
import java.nio.ByteOrder

class MobileNetClassifier(context: Context) {

private val interpreter: Interpreter
private val labels: List

init {
interpreter = loadModel(context, "mobilenet_v2_1.4_224.tflite")
labels = loadLabels(context)
Log.d("MobileNetClassifier", "Model and labels successfully loaded")
}

private fun loadModel(context: Context, modelFileName: String): Interpreter {
return try {
val model = FileUtil.loadMappedFile(context, modelFileName)
Interpreter(model)
} catch (e: Exception) {
Log.e("MobileNetClassifier", "Error loading model file: $modelFileName", e)
throw RuntimeException("Failed to load model", e)
}
}

private fun loadLabels(context: Context): List {
val labelsList = mutableListOf()
try {
val inputStream: InputStream = context.assets.open("labels.txt")
inputStream.bufferedReader().useLines { lines ->
lines.forEach { line ->
if (line.isNotBlank()) labelsList.add(line.trim())
}
}
} catch (e: Exception) {
Log.e("MobileNetClassifier", "Error loading labels", e)
throw RuntimeException("Failed to load labels", e)
}
return labelsList
}

fun classifyImage(byteBuffer: ByteBuffer): String {
val output = Array(1) { FloatArray(1001) }
interpreter.run(byteBuffer, output)
val probabilities = output[0]
val maxIndex = probabilities.indices.maxByOrNull { probabilities[it] }
return labels.getOrNull(maxIndex ?: -1) ?: "Unknown"
}
}

Подробности проблемы:
Несмотря на то, что следуют рекомендуемой предварительной обработке и использованию действительной модели .tflite, выходные вероятности идентичны для всех входов. Может ли это быть проблемой с предварительной обработкой или самого файла модели?
Что я попробовал? Несколько изображений:
Я сделал разные фотографии с различным содержанием (например, объекты, ландшафты и т. Д.), Но вероятности классификации остаются одинаковыми каждый раз. Процесс:
Я обеспечил, чтобы модель Mobilenet_v2_1.4_224.tflite была правильно загружена с использованием метода Tensorflow Lite's FileUtil.LoadMapedFile. Функция, чтобы подтвердить, что нормализация пикселей (среднее вычитание и деление по стандартному отклонению) была реализована правильно. отправлено в модель, чтобы убедиться, что они меняются между изображениями. Журналы показывают, что входной буфер действительно отличается для каждого изображения. То же самое, независимо от входного изображения.
чего я ожидал? Содержание изображения. Поскольку Mobilenet является предварительно обученной моделью классификации изображений, она должна создавать различные выходы для различных входов, особенно для таких разных фотографий.

Подробнее здесь: https://stackoverflow.com/questions/792 ... bilenet-v2

Реклама

1739300838

Anonymous

 Я внедряю модель Tensorflow Lite в моем приложении Android, используя модель Mobilenet_v2_1.4_224.tflite, которую я загрузил с репозитория GitHub tensorflow:
Mobilenet из моделей Tensorflow < /p>
mobilenet > Приложение работает следующим образом: < /p>

 Я захватываю изображение, используя камеру и сохраняю его в качестве временного файла. < /Li>
 Затем изображение изменяется до 224x224 пикселей и нормализуется в соответствии с этапами предварительной обработки Mobilenet (вычитание 127,5 и разделение на 127,5). < /Li>
 к модели для вывода. < /li>
< /ol>
, в то время как модель работает без каких -либо исключений, возвращаемые вероятности всегда одинаковы для всех классов, независимо от входного изображения. Например, вероятность каждого класса неизменно близок к нулю или равномерной, как если бы модель не отвечает на вход.  /p>
[b] mainactivity.kt[/b]
[code]package com.example.myapplication

import android.Manifest
import android.content.pm.PackageManager
import android.graphics.Bitmap
import android.graphics.BitmapFactory
import android.net.Uri
import android.os.Bundle
import android.util.Log
import android.widget.Button
import android.widget.FrameLayout
import android.widget.Toast
import androidx.activity.ComponentActivity
import androidx.activity.result.contract.ActivityResultContracts
import androidx.core.content.ContextCompat
import androidx.core.content.FileProvider
import java.io.File
import java.io.InputStream
import java.nio.ByteBuffer
import java.text.SimpleDateFormat
import java.util.*

class MainActivity : ComponentActivity() {
private lateinit var photoUri: Uri
private lateinit var mobileNetClassifier: MobileNetClassifier

override fun onCreate(savedInstanceState: Bundle?) {
super.onCreate(savedInstanceState)
mobileNetClassifier = MobileNetClassifier(this)

// Layout programmatically
val layout = FrameLayout(this).apply {
id = FrameLayout.generateViewId()
}
setContentView(layout)

val button = Button(this).apply {
text = "Take a Photo"
setOnClickListener { checkPermissionsAndOpenCamera() }
}
layout.addView(button)

// Align button in the center
val params = FrameLayout.LayoutParams(
FrameLayout.LayoutParams.WRAP_CONTENT,
FrameLayout.LayoutParams.WRAP_CONTENT
).apply {
gravity = android.view.Gravity.CENTER
}
button.layoutParams = params
}

private fun analyzePhoto(photoUri: Uri) {
val inputStream: InputStream? = contentResolver.openInputStream(photoUri)
val bitmap = BitmapFactory.decodeStream(inputStream)
inputStream?.close()

// Convert the image to ByteBuffer
val byteBuffer = convertBitmapToByteBuffer(bitmap)

// Get the prediction
val result = mobileNetClassifier.classifyImage(byteBuffer)

// Display the result
Toast.makeText(this, "Result: $result", Toast.LENGTH_LONG).show()
}

private fun convertBitmapToByteBuffer(bitmap: Bitmap): ByteBuffer {
val IMAGE_MEAN = 127.5f
val IMAGE_STD = 127.5f
val IMAGE_SIZE_X = 224
val IMAGE_SIZE_Y = 224
val DIM_PIXEL_SIZE = 3
val NUM_BYTES_PER_CHANNEL = 4 // Float size

// Resize bitmap to match model input size
val resizedBitmap = Bitmap.createScaledBitmap(bitmap, IMAGE_SIZE_X, IMAGE_SIZE_Y, false)

val intValues = IntArray(IMAGE_SIZE_X * IMAGE_SIZE_Y)
resizedBitmap.getPixels(intValues, 0, resizedBitmap.width, 0, 0, resizedBitmap.width, resizedBitmap.height)

val byteBuffer = ByteBuffer.allocateDirect(
IMAGE_SIZE_X * IMAGE_SIZE_Y * DIM_PIXEL_SIZE * NUM_BYTES_PER_CHANNEL
)
byteBuffer.order(ByteOrder.nativeOrder())
byteBuffer.rewind()

// Normalize pixel values
for (pixel in intValues) {
byteBuffer.putFloat(((pixel shr 16 and 0xFF) - IMAGE_MEAN) / IMAGE_STD) // Red
byteBuffer.putFloat(((pixel shr 8 and 0xFF) - IMAGE_MEAN) / IMAGE_STD)  // Green
byteBuffer.putFloat(((pixel and 0xFF) - IMAGE_MEAN) / IMAGE_STD)       // Blue
}
return byteBuffer
}

private fun checkPermissionsAndOpenCamera() {
when {
ContextCompat.checkSelfPermission(this, Manifest.permission.CAMERA) == PackageManager.PERMISSION_GRANTED -> {
openCamera()
}
else ->  {
requestPermissionLauncher.launch(Manifest.permission.CAMERA)
}
}
}

private val requestPermissionLauncher = registerForActivityResult(
ActivityResultContracts.RequestPermission()
) { isGranted: Boolean ->
if (isGranted) {
openCamera()
}
}

private val takePictureLauncher = registerForActivityResult(
ActivityResultContracts.TakePicture()
) { isSaved: Boolean ->
if (isSaved) {
analyzePhoto(photoUri)
}
}

private fun openCamera() {
val photoFile = createImageFile()
photoUri = FileProvider.getUriForFile(
this,
"${packageName}.provider",
photoFile
)
takePictureLauncher.launch(photoUri)
}

private fun createImageFile(): File {
val timestamp = SimpleDateFormat("yyyyMMdd_HHmmss", Locale.US).format(Date())
val storageDir = getExternalFilesDir(null)
return File.createTempFile(
"JPEG_${timestamp}_",
".jpg",
storageDir
)
}
}
[/code]
[b] mobilenetClassifier.kt[/b]
[code]package com.example.myapplication

import android.content.Context
import android.graphics.Bitmap
import android.util.Log
import org.tensorflow.lite.Interpreter
import org.tensorflow.lite.support.common.FileUtil
import java.io.InputStream
import java.nio.ByteBuffer
import java.nio.ByteOrder

class MobileNetClassifier(context: Context) {

private val interpreter: Interpreter
private val labels: List

init {
interpreter = loadModel(context, "mobilenet_v2_1.4_224.tflite")
labels = loadLabels(context)
Log.d("MobileNetClassifier", "Model and labels successfully loaded")
}

private fun loadModel(context: Context, modelFileName: String): Interpreter {
return try {
val model = FileUtil.loadMappedFile(context, modelFileName)
Interpreter(model)
} catch (e: Exception) {
Log.e("MobileNetClassifier", "Error loading model file: $modelFileName", e)
throw RuntimeException("Failed to load model", e)
}
}

private fun loadLabels(context: Context): List {
val labelsList = mutableListOf()
try {
val inputStream: InputStream = context.assets.open("labels.txt")
inputStream.bufferedReader().useLines { lines ->
lines.forEach { line ->
if (line.isNotBlank()) labelsList.add(line.trim())
}
}
} catch (e: Exception) {
Log.e("MobileNetClassifier", "Error loading labels", e)
throw RuntimeException("Failed to load labels", e)
}
return labelsList
}

fun classifyImage(byteBuffer: ByteBuffer): String {
val output = Array(1) { FloatArray(1001) }
interpreter.run(byteBuffer, output)
val probabilities = output[0]
val maxIndex = probabilities.indices.maxByOrNull { probabilities[it] }
return labels.getOrNull(maxIndex ?: -1) ?: "Unknown"
}
}
[/code]
[b] Подробности проблемы: [/b] 
Несмотря на то, что следуют рекомендуемой предварительной обработке и использованию действительной модели .tflite, выходные вероятности идентичны для всех входов. Может ли это быть проблемой с предварительной обработкой или самого файла модели? 
 Что я попробовал? Несколько изображений:
Я сделал разные фотографии с различным содержанием (например, объекты, ландшафты и т. Д.), Но вероятности классификации остаются одинаковыми каждый раз. Процесс:
Я обеспечил, чтобы модель Mobilenet_v2_1.4_224.tflite была правильно загружена с использованием метода Tensorflow Lite's FileUtil.LoadMapedFile. Функция, чтобы подтвердить, что нормализация пикселей (среднее вычитание и деление по стандартному отклонению) была реализована правильно. отправлено в модель, чтобы убедиться, что они меняются между изображениями. Журналы показывают, что входной буфер действительно отличается для каждого изображения. То же самое, независимо от входного изображения. 
 чего я ожидал? Содержание изображения.  Поскольку Mobilenet является предварительно обученной моделью классификации изображений, она должна создавать различные выходы для различных входов, особенно для таких разных фотографий.  

Подробнее здесь: [url]https://stackoverflow.com/questions/79281349/why-are-the-probabilities-always-the-same-with-mobilenet-v2-model-mobilenet-v2[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

ValueError: не удалось транслировать входной массив из формы (224,224,3) в форму (224 224)

Последнее сообщение Anonymous « 12 июл 2025, 04:00
Добавлено в форуме Python

Anonymous » 12 июл 2025, 04:00 » в форуме Python

У меня есть список, скажем, temp_list с следующими свойствами:

len(temp_list) = 9260
temp_list .shape = (224,224,3)

Теперь, когда я преобразую в массив Numpy,

x = np.array(temp_list)

Я получаю ошибку:

ValueError: could not broadcast...

0 Ответы

6 Просмотры

Последнее сообщение Anonymous
12 июл 2025, 04:00
Почему в модели MobileNet V2 (mobilenet_v2_1.4_224.tflite) вероятности всегда одинаковы?

Последнее сообщение Anonymous « 14 дек 2024, 23:31
Добавлено в форуме Android

Anonymous » 14 дек 2024, 23:31 » в форуме Android

Я реализую модель TensorFlow Lite в своем приложении для Android, используя модель mobilenet_v2_1.4_224.tflite, которую я скачал из репозитория TensorFlow GitHub:
MobileNet из TensorFlow Models
Приложение работает следующим образом:

Я делаю...

0 Ответы

15 Просмотры

Последнее сообщение Anonymous
14 дек 2024, 23:31
Я получаю сообщение об ошибке типа «Ввод 1 слоя «модель_5» несовместим со слоем: ожидаемая форма = (Нет, 224, 224, 3), н

Последнее сообщение Anonymous « 13 ноя 2024, 11:01
Добавлено в форуме Python

Anonymous » 13 ноя 2024, 11:01 » в форуме Python

Я пытаюсь объединить характеристики двух входных изображений формы (299, 299, 3), (224, 224, 3) и получаю ошибки формы.
Вот мой код

from tensorFlow.keras.applications.inception_v3 import InceptionV3
from tensorflow.keras.applications.vgg16 import...

0 Ответы

12 Просмотры

Последнее сообщение Anonymous
13 ноя 2024, 11:01
Я получаю ошибку, например, «Вход 1 слоя» модели_5 »несовместима со слоем: ожидаемая форма = (нет, 224, 224, 3), найдена

Последнее сообщение Anonymous « 13 мар 2025, 19:04
Добавлено в форуме Python

Anonymous » 13 мар 2025, 19:04 » в форуме Python

Я пытаюсь объединить функции двух входов изображения формы (299, 299, 3), (224, 224, 3) и получаю ошибки формы.
Вот мой код

from tensorFlow.keras.applications.inception_v3 import InceptionV3
from tensorflow.keras.applications.vgg16 import VGG16...

0 Ответы

21 Просмотры

Последнее сообщение Anonymous
13 мар 2025, 19:04
Я получаю ошибку, например, «Вход 1 слоя» модели_5 »несовместима со слоем: ожидаемая форма = (нет, 224, 224, 3), найдена

Последнее сообщение Anonymous « 13 мар 2025, 19:22
Добавлено в форуме Python

Anonymous » 13 мар 2025, 19:22 » в форуме Python

Я пытаюсь объединить функции двух входов изображения формы (299, 299, 3), (224, 224, 3) и получаю ошибки формы.
Вот мой код

from tensorFlow.keras.applications.inception_v3 import InceptionV3
from tensorflow.keras.applications.vgg16 import VGG16...

0 Ответы

11 Просмотры

Последнее сообщение Anonymous
13 мар 2025, 19:22

Вернуться в «Android»

Programmiererforum