Стратегии управления памятью для локального вывода LLM в форке браузера на базе Chromium

Стратегии управления памятью для локального вывода LLM в форке браузера на базе Chromium ⇐ C++

1 сообщение • Страница 1 из 1

Anonymous

Стратегии управления памятью для локального вывода LLM в форке браузера на базе Chromium

Цитата

Сообщение Anonymous » 20 янв 2026, 03:20

В настоящее время мы разрабатываем Браузер Cronos, ответвление Chromium, которое интегрирует локальный LLM (UIKI) для автономной помощи.
Мы замечаем, что загрузка модели во VRAM влияет на процесс рендеринга тяжелых вкладок WebGL. В настоящее время мы используем общий буфер памяти между процессом вывода и средством рендеринга.
Вопрос: Кто-нибудь успешно реализовал стратегию «ленивой выгрузки» контекстов WebGPU в исходном коде Chromium C++, чтобы освободить VRAM, когда вкладка браузера требует приоритета? Мы изучаем gpu::SharedImageInterface, но документации недостаточно.

Подробнее здесь: https://stackoverflow.com/questions/798 ... ed-browser

1768868424

Anonymous

В настоящее время мы разрабатываем [b]Браузер Cronos[/b], ответвление Chromium, которое интегрирует локальный LLM (UIKI) для автономной помощи.
Мы замечаем, что загрузка модели во VRAM влияет на процесс рендеринга тяжелых вкладок WebGL. В настоящее время мы используем общий буфер памяти между процессом вывода и средством рендеринга.
[b]Вопрос:[/b] Кто-нибудь успешно реализовал стратегию «ленивой выгрузки» контекстов WebGPU в исходном коде Chromium C++, чтобы освободить VRAM, когда вкладка браузера требует приоритета? Мы изучаем gpu::SharedImageInterface, но документации недостаточно. 

Подробнее здесь: [url]https://stackoverflow.com/questions/79871599/memory-management-strategies-for-local-llm-inference-in-a-chromium-based-browser[/url]

Ответить

1 сообщение • Страница 1 из 1