GenAI и Salesforce CRM Analytics: почему LLM генерируют действительный Python, но неверный JSON информационной панели (б

GenAI и Salesforce CRM Analytics: почему LLM генерируют действительный Python, но неверный JSON информационной панели (б ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

GenAI и Salesforce CRM Analytics: почему LLM генерируют действительный Python, но неверный JSON информационной панели (б

Цитата

Сообщение Anonymous » 16 фев 2026, 23:01

В настоящее время я пишу дипломную работу на тему использования Генеративного искусственного интеллекта (LLM, например GPT-4o) для автоматизации создания информационных панелей в Salesforce CRM Analytics (CRMA). Я столкнулся с определенным техническим явлением, касающимся стабильности генерации кода, и хочу узнать мнение сообщества.
Сценарий:
Я создаю агент, который принимает запрос на естественном языке (например, «Показать Net APE по продукту») и генерирует соответствующий актив.
Проблема:
Я заметил огромное несоответствие в Производительность LLM зависит от целевого языка:

Python: Когда я прошу LLM сгенерировать код Python (например, для обработки данных или Streamlit), код почти всегда синтаксически правильный и надежный.
JSON панели мониторинга CRMA: Когда я прошу LLM сгенерировать JSON для виджета информационной панели (в частности, шагиагрегата), выходные данные являются действительным JSON с точки зрения синтаксиса. Однако его импорт в Salesforce приводит к "Белому экрану смерти" с ошибкой: Невозможно прочитать свойства неопределенного значения (чтение "длины").

Мой технический анализ:
После нескольких часов отладки я обнаружил, что механизм выполнения CRMA крайне неумолим в отношении неявных зависимостей, которые не являются строго частью стандарт JSON, но требуется механизмом рендеринга.
LLM постоянно «галлюцинирует» чистую структуру JSON, но пропускает скрытые пустые параметры.

Пример 1: Если в объекте запроса отсутствуют пустые массивы, такие как «filters»: [] или «joins»: [], виджет аварийно завершает работу.
Пример 2: Если параметры виджета не содержат "evenRowColor": null, средство рендеринга завершается с ошибкой.

Мое решение (гибридный подход):
Чтобы решить эту проблему для своей диссертации, я отошел от вероятностной генерации структуры JSON. Теперь я использую детерминированный шаблон Python (содержащий «золотую запись» рабочего JSON) и позволяю LLM сопоставлять только семантические значения (имена API). Это работает в 100% случаев.
Мои вопросы к экспертам:

Жесткость схемы: Существует ли общедоступная строгая схема (XSD/JSON Schema) для шаговагрегата, которая определяет эти «скрытые» обязательные поля? В стандартной документации, похоже, не подчеркивается, что пустые массивы обязательны для стабильности.
Толерантность к анализатору: Почему анализатор Salesforce JSON настолько более хрупкий по сравнению с интерпретатором Python? Известно ли это ограничение устаревшего формата XMD?
Agentforce / Copilot: Есть ли у кого-нибудь опыт использования встроенного Agentforce Salesforce в этом контексте? Использует ли он под капотом аналогичный «шаблоновый» подход, чтобы избежать этих синтаксических сбоев?

Я был бы признателен за любую техническую информацию или ссылки, которые могли бы помочь подкрепить выводы моей диссертации!
Спасибо!

Подробнее здесь: https://stackoverflow.com/questions/798 ... t-broken-d

1771272106

Anonymous

В настоящее время я пишу дипломную работу на тему использования [b]Генеративного искусственного интеллекта (LLM, например GPT-4o)[/b] для автоматизации создания информационных панелей в [b]Salesforce CRM Analytics (CRMA)[/b]. Я столкнулся с определенным техническим явлением, касающимся стабильности генерации кода, и хочу узнать мнение сообщества.
[b]Сценарий:[/b]
Я создаю агент, который принимает запрос на естественном языке (например, «Показать Net APE по продукту») и генерирует соответствующий актив.
[b]Проблема:[/b]
Я заметил огромное несоответствие в Производительность LLM зависит от целевого языка:
[list]
[*][b]Python:[/b] Когда я прошу LLM сгенерировать код Python (например, для обработки данных или Streamlit), код почти всегда синтаксически правильный и надежный.

[*][b]JSON панели мониторинга CRMA:[/b] Когда я прошу LLM сгенерировать JSON для виджета информационной панели (в частности, шагиагрегата), выходные данные являются действительным JSON с точки зрения синтаксиса. Однако его импорт в Salesforce приводит к [b]"Белому экрану смерти"[/b] с ошибкой: Невозможно прочитать свойства неопределенного значения (чтение "длины").

[/list]
[b]Мой технический анализ:[/b]
После нескольких часов отладки я обнаружил, что механизм выполнения CRMA крайне неумолим в отношении неявных зависимостей, которые не являются строго частью стандарт JSON, но требуется механизмом рендеринга.
LLM постоянно «галлюцинирует» чистую структуру JSON, но пропускает скрытые пустые параметры.
[list]
[*][b]Пример 1:[/b] Если в объекте запроса отсутствуют пустые массивы, такие как «filters»: [] или «joins»: [], виджет аварийно завершает работу.

[*][b]Пример 2:[/b] Если параметры виджета не содержат "evenRowColor": null, средство рендеринга завершается с ошибкой.

[/list]
[b]Мое решение (гибридный подход):[/b]
Чтобы решить эту проблему для своей диссертации, я отошел от вероятностной генерации структуры JSON. Теперь я использую [b]детерминированный шаблон Python[/b] (содержащий «золотую запись» рабочего JSON) и позволяю LLM сопоставлять только семантические значения (имена API). Это работает в 100% случаев.
[b]Мои вопросы к экспертам:[/b]
[list]
[*][b]Жесткость схемы:[/b] Существует ли общедоступная строгая схема (XSD/JSON Schema) для шаговагрегата, которая определяет эти «скрытые» обязательные поля? В стандартной документации, похоже, не подчеркивается, что пустые массивы обязательны для стабильности.

[*][b]Толерантность к анализатору:[/b] Почему анализатор Salesforce JSON настолько более хрупкий по сравнению с интерпретатором Python? Известно ли это ограничение устаревшего формата XMD?

[*][b]Agentforce / Copilot:[/b] Есть ли у кого-нибудь опыт использования встроенного [b]Agentforce[/b] Salesforce в этом контексте? Использует ли он под капотом аналогичный «шаблоновый» подход, чтобы избежать этих синтаксических сбоев?

[/list]
Я был бы признателен за любую техническую информацию или ссылки, которые могли бы помочь подкрепить выводы моей диссертации!
Спасибо!
 

Подробнее здесь: [url]https://stackoverflow.com/questions/79890440/genai-salesforce-crm-analytics-why-do-llms-generate-valid-python-but-broken-d[/url]