Получение метаданных об использовании токенов из вызовов Gemini LLM в LangChain RAG RunnableSequence

Получение метаданных об использовании токенов из вызовов Gemini LLM в LangChain RAG RunnableSequence ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Получение метаданных об использовании токенов из вызовов Gemini LLM в LangChain RAG RunnableSequence

Цитата

Сообщение Anonymous » 30 сен 2024, 21:35

Я хотел бы, чтобы токен использовался моей цепочкой RAG каждый раз, когда она вызывается.
Что бы я ни делал, я не могу найти правильный способ вывода общее количество токенов модели Gemini, которую я использую.

Код: Выделить всё

import vertexai
from langchain_google_vertexai import VertexAI
from vertexai.generative_models import GenerativeModel

vertexai.init(
project='MY_PROJECT',
location="MY_LOCATION",
)

question = "What is the meaning of life"

llm = VertexAI(model_name="gemini-1.5-pro-001",)
response1 = llm.invoke(question)

llm2 = GenerativeModel("gemini-1.5-pro-001",)
response2 = llm2.generate_content(question)

Код: Выделить всё

response1

выше — это просто строка.

Код: Выделить всё

response2

— это то, что мне нужно, т. е. словарь, содержащий use_metadata, Safety_rating, Finish_reason и т. д. Но мне не удалось запустить мою цепочку RAG, используя этот подход.
Моя цепочка RAG это RunnableSequence (из langchain_core.runnables), а также я пробовал использовать обратные вызовы, поскольку цепочка не поддерживает класс vertexai.generative_models.GenerativeModel

Код: Выделить всё

from langchain_google_vertexai import VertexAI
from langchain.callbacks.base import BaseCallbackHandler
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.outputs import LLMResult
from langchain_core.messages import BaseMessage

class LoggingHandler(BaseCallbackHandler):

def on_llm_start(self, serialized, prompts, **kwargs) -> None:

print('On LLM Start: {}'.format(prompts))

def on_llm_end(self, response: LLMResult, **kwargs) -> None:

print('On LLM End: {}'.format(response))

callbacks = [LoggingHandler()]
llm = VertexAI(model_name="gemini-1.5-pro-001",)
prompt = ChatPromptTemplate.from_template("What is 1 + {number}?")

chain = prompt | llm

chain_with_callbacks = chain.with_config(callbacks=callbacks)
response = chain_with_callbacks.invoke({"number": "2"})

Это содержимое показано ниже

Код: Выделить всё

On LLM Start: ['Human: What is 1 + 2?']
On LLM End: generations=[[GenerationChunk(text='Human: What is 1 + 2?\nAssistant: 3 \n', generation_info={'is_blocked': False, 'safety_ratings': [{'category': 'HARM_CATEGORY_HATE_SPEECH', 'probability_label': 'NEGLIGIBLE', 'blocked': False}, {'category': 'HARM_CATEGORY_DANGEROUS_CONTENT', 'probability_label': 'NEGLIGIBLE', 'blocked': False}, {'category': 'HARM_CATEGORY_HARASSMENT', 'probability_label': 'NEGLIGIBLE', 'blocked': False}, {'category': 'HARM_CATEGORY_SEXUALLY_EXPLICIT', 'probability_label': 'NEGLIGIBLE', 'blocked': False}], 'citation_metadata': })]] llm_output=None run=None

Т.е. нет метаданных об использовании.
Есть идеи, как получить метаданные об использовании для каждого вызова цепочки RAG?

Подробнее здесь: https://stackoverflow.com/questions/790 ... unnableseq

1727721327

Anonymous

Я хотел бы, чтобы токен использовался моей цепочкой RAG каждый раз, когда она вызывается.
Что бы я ни делал, я не могу найти правильный способ вывода общее количество токенов модели Gemini, которую я использую.
[code]import vertexai
from langchain_google_vertexai import VertexAI
from vertexai.generative_models import GenerativeModel

vertexai.init(
project='MY_PROJECT',
location="MY_LOCATION",
)

question = "What is the meaning of life"

llm = VertexAI(model_name="gemini-1.5-pro-001",)
response1 = llm.invoke(question)

llm2 = GenerativeModel("gemini-1.5-pro-001",)
response2 = llm2.generate_content(question)
[/code]
[code]response1[/code] выше — это просто строка.
[code]response2[/code] — это то, что мне нужно, т. е. словарь, содержащий use_metadata, Safety_rating, Finish_reason и т. д. Но мне не удалось запустить мою цепочку RAG, используя этот подход.
Моя цепочка RAG это RunnableSequence (из langchain_core.runnables), а также я пробовал использовать обратные вызовы, поскольку цепочка не поддерживает класс vertexai.generative_models.GenerativeModel
[code]from langchain_google_vertexai import VertexAI
from langchain.callbacks.base import BaseCallbackHandler
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.outputs import LLMResult
from langchain_core.messages import BaseMessage

class LoggingHandler(BaseCallbackHandler):

def on_llm_start(self, serialized, prompts, **kwargs) -> None:

print('On LLM Start: {}'.format(prompts))

def on_llm_end(self, response: LLMResult, **kwargs) -> None:

print('On LLM End: {}'.format(response))

callbacks = [LoggingHandler()]
llm = VertexAI(model_name="gemini-1.5-pro-001",)
prompt = ChatPromptTemplate.from_template("What is 1 + {number}?")

chain = prompt | llm

chain_with_callbacks = chain.with_config(callbacks=callbacks)
response = chain_with_callbacks.invoke({"number": "2"})
[/code]
Это содержимое показано ниже
[code]On LLM Start: ['Human: What is 1 + 2?']
On LLM End: generations=[[GenerationChunk(text='Human: What is 1 + 2?\nAssistant: 3 \n', generation_info={'is_blocked': False, 'safety_ratings': [{'category': 'HARM_CATEGORY_HATE_SPEECH', 'probability_label': 'NEGLIGIBLE', 'blocked': False}, {'category': 'HARM_CATEGORY_DANGEROUS_CONTENT', 'probability_label': 'NEGLIGIBLE', 'blocked': False}, {'category': 'HARM_CATEGORY_HARASSMENT', 'probability_label': 'NEGLIGIBLE', 'blocked': False}, {'category': 'HARM_CATEGORY_SEXUALLY_EXPLICIT', 'probability_label': 'NEGLIGIBLE', 'blocked': False}], 'citation_metadata': })]] llm_output=None run=None
[/code]
Т.е. нет метаданных об использовании.
Есть идеи, как получить метаданные об использовании для каждого вызова цепочки RAG? 

Подробнее здесь: [url]https://stackoverflow.com/questions/79039958/getting-tokens-usage-metadata-from-gemini-llm-calls-in-langchain-rag-runnableseq[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Получение метаданных об использовании токенов из вызовов Gemini LLM в LangChain RAG RunnableSequence

Последнее сообщение Anonymous « 30 сен 2024, 18:04
Добавлено в форуме Python

Anonymous » 30 сен 2024, 18:04 » в форуме Python

Я хотел бы, чтобы токен использовался моей цепочкой RAG каждый раз, когда она вызывается.
Что бы я ни делал, я не могу найти правильный способ вывода общее количество токенов модели Gemini, которую я использую.
import vertexai
from...

0 Ответы

27 Просмотры

Последнее сообщение Anonymous
30 сен 2024, 18:04
Получение метаданных об использовании токенов из вызовов Gemini LLM в LangChain RAG RunnableSequence

Последнее сообщение Anonymous « 01 окт 2024, 20:44
Добавлено в форуме Python

Anonymous » 01 окт 2024, 20:44 » в форуме Python

Я хотел бы, чтобы токен использовался моей цепочкой RAG каждый раз, когда она вызывается.
Что бы я ни делал, я не могу найти правильный способ вывода общее количество токенов модели Gemini, которую я использую.
import vertexai
from...

0 Ответы

33 Просмотры

Последнее сообщение Anonymous
01 окт 2024, 20:44
Выполнение вывода LLM локально с помощью Python (LangChain/AutoGen/AutoMemGPT) с использованием модели LLM, размещенной

Последнее сообщение Anonymous « 05 дек 2024, 16:56
Добавлено в форуме Python

Anonymous » 05 дек 2024, 16:56 » в форуме Python

Я запускаю ehartford_dolphin-2.1-mistral-7b на машине RTX A6000 на RunPod с шаблоном TheBloke LLM Text Generation WebUI.
У меня есть 2 варианта: запуск webui на runpod или запуск шаблона вывода HuggingFace Text Generation на runpod
Вариант 1....

0 Ответы

61 Просмотры

Последнее сообщение Anonymous
05 дек 2024, 16:56
RunnableSequence вместо LLMChain выдает ошибку (обновление из устаревшего langchain)

Последнее сообщение Anonymous « 18 сен 2024, 08:12
Добавлено в форуме Python

Anonymous » 18 сен 2024, 08:12 » в форуме Python

Когда я впервые получу этот код
from langchain_community.llms import HuggingFacePipeline
from transformers import AutoTokenizer
import transformers
import torch

model= meta-llama/Llama-2-7b-chat-hf
tokenizer=AutoTokenizer.from_pretrained(model)...

0 Ответы

24 Просмотры

Последнее сообщение Anonymous
18 сен 2024, 08:12
Runnablesequence вместо LLMCHAIN выбрасывает ошибку (обновление от Depreacated Langchain)

Последнее сообщение Anonymous « 06 авг 2025, 09:49
Добавлено в форуме Python

Anonymous » 06 авг 2025, 09:49 » в форуме Python

Когда у меня есть этот код первым
from langchain_community.llms import HuggingFacePipeline
from transformers import AutoTokenizer
import transformers
import torch

model= meta-llama/Llama-2-7b-chat-hf...

0 Ответы

1 Просмотры

Последнее сообщение Anonymous
06 авг 2025, 09:49

Вернуться в «Python»