API Gemini Live не может справиться с мультимодальным текстом + аудио?Javascript

Форум по Javascript
Ответить
Anonymous
 API Gemini Live не может справиться с мультимодальным текстом + аудио?

Сообщение Anonymous »

Я пытаюсь использовать API Gemini Live и вернуть как аудио, так и текст. Почему это не работает? < /P>
Вот фрагмент кода. По сути, я устанавливаю ответные эмодалы как на текстовый, так и аудио в конфигурации, но я просто получаю эту ошибку: Geminiclient: Deploned: запрос содержит неверный аргумент. :

Код: Выделить всё

import { GoogleGenAI, Modality } from "@google/genai";

this.options = {
model: "models/gemini-2.0-flash-live-001",
...options,
};

const config = {
responseModalities: [Modality.AUDIO, Modality.TEXT],
systemInstruction: this.options.instructions,
};

this.session = await this.googleAI.live.connect({
model: this.options.model,
config: config,
callbacks: {
onopen: () => {
console.log("✅ GeminiClient: WebSocket opened");
},
onmessage: (message: any) => {
console.log("M");
},
onerror: (error: any) => {
console.error("🚨 GeminiClient: error:", error);
},
onclose: (event: any) => {
console.log("❌ GeminiClient: Disconnected: ", event.reason);
},
},
});
Согласно документам, эта модель может обрабатывать как текст, так и аудио как в вводе, так и в выводе:
https://ai.google.dev/gemini-api/docs/models

Подробнее здесь: https://stackoverflow.com/questions/797 ... text-audio
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Javascript»