Обобщение гауссовой смеси для принятия любого количества аргументов приводит к проблемам с производительностью.

Обобщение гауссовой смеси для принятия любого количества аргументов приводит к проблемам с производительностью. ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Обобщение гауссовой смеси для принятия любого количества аргументов приводит к проблемам с производительностью.

Цитата

Сообщение Anonymous » 11 дек 2024, 15:52

Я оптимизирую гауссову смесь, используя оценку максимального правдоподобия. Первоначально я использовал следующую модель:

Код: Выделить всё

def normal(x, mu, sigma):
"""
Gaussian (normal) probability density function.

Args:
x (np.ndarray): Data points.
mu (float): Mean of the distribution.
sigma (float): Standard deviation of the distribution.

Returns:
np.ndarray: Probability density values.
"""
return (1 / (np.sqrt(2 * np.pi) * sigma)) * np.exp(-0.5 * ((x - mu) / sigma) ** 2)

def model(x, a, mu1, s1, mu2, s2):
return a*normal(x, mu1, s1) + (1-a)*normal(x, mu2, s2)

Это прекрасно работает и находит хорошее соответствие менее чем за секунду.
Теперь я хотел динамически генерировать такую функцию для любого количества пиков.

Код: Выделить всё

def generate_gaussian_mix(n):
def gaussian_mix(x, *params):

if len(params) != 3 * n - 1:
print(params)
raise ValueError(f"Expected {3 * n - 1} parameters, but got {len(params)}.")

params = np.asarray(params)
mu = params[0::3]  # Means
sigma = params[1::3]  # Standard deviations
a = params[2::3]  # Weights
a = np.hstack((a, 1 - np.sum(a)))

return np.sum((a / (np.sqrt(2 * np.pi) * sigma))*np.exp(-0.5 * ((x - mu) / sigma) ** 2))

return np.vectorize(gaussian_mix)

Вычисление этой модели на моем ноутбуке занимает более трех минут с таким же количеством пиков и событий. Какие шаги по оптимизации я мог бы предпринять, чтобы уменьшить величину этой второй функции? Есть ли хороший способ избежать векторизации? Есть ли у вас идеи, как избежать повторного нарезания?
для полноты картины это функция оптимизации:

Код: Выделить всё

def neg_log_event_likelyhood(model, event, theta):
x = -np.log(model(event, *theta))
return x

def fit_distribution_anneal(model, events, bounds, data_range = None, **kwargs):
def total_log_likelyhood(theta, model, events):
return np.sum(neg_log_event_likelyhood(model, events, theta))

if data_range is not None:
events = np.copy(events)
events = events[np.logical_and(events > data_range[0], events < data_range[1])]

result = dual_annealing(total_log_likelyhood, bounds, args=(model, events), **kwargs)
params = result.x

return params

Отжиг требуется, а не минимизируется из-за невыпуклого характера проблемы.

Подробнее здесь: https://stackoverflow.com/questions/792 ... formance-i

1733921537

Anonymous

Я оптимизирую гауссову смесь, используя оценку максимального правдоподобия. Первоначально я использовал следующую модель:
[code]def normal(x, mu, sigma):
"""
Gaussian (normal) probability density function.

Args:
x (np.ndarray): Data points.
mu (float): Mean of the distribution.
sigma (float): Standard deviation of the distribution.

Returns:
np.ndarray: Probability density values.
"""
return (1 / (np.sqrt(2 * np.pi) * sigma)) * np.exp(-0.5 * ((x - mu) / sigma) ** 2)

def model(x, a, mu1, s1, mu2, s2):
return a*normal(x, mu1, s1) + (1-a)*normal(x, mu2, s2)
[/code]
Это прекрасно работает и находит хорошее соответствие менее чем за секунду.
Теперь я хотел динамически генерировать такую функцию для любого количества пиков.
[code]def generate_gaussian_mix(n):
def gaussian_mix(x, *params):

if len(params) != 3 * n - 1:
print(params)
raise ValueError(f"Expected {3 * n - 1} parameters, but got {len(params)}.")

params = np.asarray(params)
mu = params[0::3]  # Means
sigma = params[1::3]  # Standard deviations
a = params[2::3]  # Weights
a = np.hstack((a, 1 - np.sum(a)))

return np.sum((a / (np.sqrt(2 * np.pi) * sigma))*np.exp(-0.5 * ((x - mu) / sigma) ** 2))

return np.vectorize(gaussian_mix)
[/code]
Вычисление этой модели на моем ноутбуке занимает более трех минут с таким же количеством пиков и событий. Какие шаги по оптимизации я мог бы предпринять, чтобы уменьшить величину этой второй функции? Есть ли хороший способ избежать векторизации? Есть ли у вас идеи, как избежать повторного нарезания?
для полноты картины это функция оптимизации:
[code]def neg_log_event_likelyhood(model, event, theta):
x = -np.log(model(event, *theta))
return x

def fit_distribution_anneal(model, events, bounds, data_range = None, **kwargs):
def total_log_likelyhood(theta, model, events):
return np.sum(neg_log_event_likelyhood(model, events, theta))

if data_range is not None:
events = np.copy(events)
events = events[np.logical_and(events > data_range[0], events < data_range[1])]

result = dual_annealing(total_log_likelyhood, bounds, args=(model, events), **kwargs)
params = result.x

return params
[/code]
Отжиг требуется, а не минимизируется из-за невыпуклого характера проблемы. 

Подробнее здесь: [url]https://stackoverflow.com/questions/79271090/generalizing-a-gaussian-mix-to-take-any-number-of-arguments-causes-performance-i[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Просмотр без необходимости обновлений @Binding, что приводит к проблемам с производительностью.

Последнее сообщение Anonymous « 09 окт 2023, 19:27
Добавлено в форуме IOS

Anonymous » 09 окт 2023, 19:27 » в форуме IOS

У меня есть следующее корневое представление

@StateObject Private var vm = NCMediaViewModel() @State Private var title = Медиа ///... var body: some View { ZStack(выравнивание: .top) { MediaScrollView (columnCountStages: $columnCountStages,...

0 Ответы

31 Просмотры

Последнее сообщение Anonymous
09 окт 2023, 19:27
Почему PDF вектора признаков соответствует гауссовой смеси?

Последнее сообщение Anonymous « 04 дек 2024, 05:29
Добавлено в форуме Python

Anonymous » 04 дек 2024, 05:29 » в форуме Python

Я пытаюсь выполнить задачу классификации изображений в наборе данных с
𝐿 классами. Сеть, которую я использую, разделена на экстрактор признаков и классификатор. Когда изображение передается через экстрактор признаков, извлекается вектор признаков, и...

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
04 дек 2024, 05:29
Почему PDF вектора признаков соответствует гауссовой смеси?

Последнее сообщение Anonymous « 04 дек 2024, 06:30
Добавлено в форуме Python

Anonymous » 04 дек 2024, 06:30 » в форуме Python

Я пытаюсь выполнить задачу классификации изображений в наборе данных с
𝐿 классами. Сеть, которую я использую, разделена на экстрактор признаков и классификатор. Когда изображение передается через экстрактор признаков, извлекается вектор признаков, и...

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
04 дек 2024, 06:30
Оптимизация кода для циклов For в моделях гауссовой смеси, параметризованных задачами

Последнее сообщение Anonymous « 12 дек 2024, 17:50
Добавлено в форуме Python

Anonymous » 12 дек 2024, 17:50 » в форуме Python

В настоящее время я разрабатываю TPGMM на основе работы Салинона ( Я имею дело с большими матричными операциями с использованием CuPy, как показано в коде ниже. Однако у меня возникли проблемы с векторизацией вложенных циклов for в функции EM, чтобы...

0 Ответы

17 Просмотры

Последнее сообщение Anonymous
12 дек 2024, 17:50
Как заставить все термины в 1-D Гауссовой модели смеси иметь такое же среднее значение?

Последнее сообщение Anonymous « 06 фев 2025, 16:04
Добавлено в форуме Python

Anonymous » 06 фев 2025, 16:04 » в форуме Python

У меня есть одномерный набор точек данных, из которых я хочу параметризировать плотность вероятности. У меня есть основания полагать, что модель гауссовской смеси была бы хорошим способом сделать это, поэтому я пытаюсь использовать класс...

0 Ответы

13 Просмотры

Последнее сообщение Anonymous
06 фев 2025, 16:04

Вернуться в «Python»