Как передать более двух значений в средство извлечения векторного хранилища Hyde Document Embedding? - Цифровое Кемерово

Как передать более двух значений в средство извлечения векторного хранилища Hyde Document Embedding? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Как передать более двух значений в средство извлечения векторного хранилища Hyde Document Embedding?

Цитата

Сообщение Anonymous » 22 июн 2024, 08:12

Я пытаюсь создать встраивание требования на основе гида и получить из него соответствующие документы. Затем эти соответствующие документы будут переданы в качестве контекста и исходного вопроса. Подсказка к гиду отличается от той, которую я использую для получения окончательного ответа
hyde_prompt_template =""" get the guidelines to this requirement {input}. Use the {guideline_name} which are in the context and think how these guidelines will be helpful to this requirement. print only the final output. """
` main_prompt = ""Вы профессиональный старший архитектор программного обеспечения, и вам необходимо найти соответствующие
руководства для подробного требования.
Создать рекомендации для приведенное ниже подробное требование в {input}.
Используйте руководящую информацию из {context} и дайте соответствующие рекомендации для {input} только из {context}.
Предоставляйте рекомендации только из контекста и не используйте ваши собственные знания
ДАЙТЕ ОКОНЧАТЕЛЬНЫЙ РЕЗУЛЬТАТ В ФОРМАТЕ НИЖЕ
Название рекомендации:
Рекомендации, которым необходимо следовать:
Название рекомендации взято из {guideline name>
"""
`
Я пытался передать более двух значений в приведенном ниже коде
from langchain.chains.hyde.base import HypotheticalDocumentEmbedder
from langchain.prompts import PromptTemplate
from langchain_openai import OpenAIEmbeddings, OpenAI, ChatOpenAI
from langchain.chains.llm import LLMChain
from langchain_community.vectorstores.faiss import FAISS

hyde_prompt_template = """
get the guidelines to this requirement {input}.
Use the {guideline_name} which are in the context and
think how these guidelines will be helpful to this requirement. print
only the final output.
"""
prompt = PromptTemplate.from_template(hyde_prompt_template )

llm_chain = LLMChain(llm=llm, prompt=prompt)

hyde_embeddings = HypotheticalDocumentEmbedder(
llm_chain=llm_chain, base_embeddings=base_embeddings
)

faiss = FAISS.load_local(folder_path="local path",
embeddings=hyde_embeddings,
allow_dangerous_deserialization=True
)

retriever = faiss.as_retriever()

retriever.invoke({"input": requirement, "guideline_name": "GDPR"})

Но я получаю ошибку ниже
KeyError Traceback (most recent call last)
Cell In[59], line 1
----> 1 retriever.invoke({"input": requirement})

File c:\GEN_AI\compliance-and-guidelines\venv\Lib\site-packages\langchain_core\retrievers.py:194, in BaseRetriever.invoke(self, input, config, **kwargs)
175 """Invoke the retriever to get relevant documents.
176
177 Main entry point for synchronous retriever invocations.
(...)
191 retriever.invoke("query")
192 """
193 config = ensure_config(config)
--> 194 return self.get_relevant_documents(
195 input,
196 callbacks=config.get("callbacks"),
197 tags=config.get("tags"),
198 metadata=config.get("metadata"),
199 run_name=config.get("run_name"),
200 **kwargs,
201 )

File c:\GEN_AI\compliance-and-guidelines\venv\Lib\site-packages\langchain_core_api\deprecation.py:148, in deprecated..deprecate..warning_emitting_wrapper(*args, **kwargs)
146 warned = True
147 emit_warning()
--> 148 return wrapped(*args, **kwargs)

File c:\GEN_AI\compliance-and-guidelines\venv\Lib\site-packages\langchain_core\retrievers.py:323, in BaseRetriever.get_relevant_documents(self, query, callbacks, tags, metadata, run_name, **kwargs)
321 except Exception as e:
322 run_manager.on_retriever_error(e)
--> 323 raise e
324 else:
325 run_manager.on_retriever_end(
326 result,
327 )

File c:\GEN_AI\compliance-and-guidelines\venv\Lib\site-packages\langchain_core\retrievers.py:316, in BaseRetriever.get_relevant_documents(self, query, callbacks, tags, metadata, run_name, **kwargs)
314 _kwargs = kwargs if self._expects_other_args else {}
315 if self._new_arg_supported:
--> 316 result = self._get_relevant_documents(
317 query, run_manager=run_manager, **_kwargs
318 )
319 else:
320 result = self._get_relevant_documents(query, **_kwargs)

File c:\GEN_AI\compliance-and-guidelines\venv\Lib\site-packages\langchain_core\vectorstores.py:696, in VectorStoreRetriever._get_relevant_documents(self, query, run_manager)
692 def _get_relevant_documents(
693 self, query: str, *, run_manager: CallbackManagerForRetrieverRun
694 ) -> List[Document]:
695 if self.search_type == "similarity":
--> 696 docs = self.vectorstore.similarity_search(query, **self.search_kwargs)
697 elif self.search_type == "similarity_score_threshold":
698 docs_and_similarities = (
699 self.vectorstore.similarity_search_with_relevance_scores(
700 query, **self.search_kwargs
701 )
702 )

File c:\GEN_AI\compliance-and-guidelines\venv\Lib\site-packages\langchain_community\vectorstores\faiss.py:530, in FAISS.similarity_search(self, query, k, filter, fetch_k, **kwargs)
510 def similarity_search(
511 self,
512 query: str,
(...)
516 **kwargs: Any,
517 ) -> List[Document]:
518 """Return docs most similar to query.
519
520 Args:
(...)
528 List of Documents most similar to the query.
529 """
--> 530 docs_and_scores = self.similarity_search_with_score(
531 query, k, filter=filter, fetch_k=fetch_k, **kwargs
532 )
533 return [doc for doc, _ in docs_and_scores]

File c:\GEN_AI\compliance-and-guidelines\venv\Lib\site-packages\langchain_community\vectorstores\faiss.py:402, in FAISS.similarity_search_with_score(self, query, k, filter, fetch_k, **kwargs)
378 def similarity_search_with_score(
379 self,
380 query: str,
(...)
384 **kwargs: Any,
385 ) -> List[Tuple[Document, float]]:
386 """Return docs most similar to query.
387
388 Args:
(...)
400 L2 distance in float. Lower score represents more similarity.
401 """
--> 402 embedding = self._embed_query(query)
403 docs = self.similarity_search_with_score_by_vector(
404 embedding,
405 k,
(...)
408 **kwargs,
409 )
410 return docs

File c:\GEN_AI\compliance-and-guidelines\venv\Lib\site-packages\langchain_community\vectorstores\faiss.py:154, in FAISS._embed_query(self, text)
152 def _embed_query(self, text: str) -> List[float]:
153 if isinstance(self.embedding_function, Embeddings):
--> 154 return self.embedding_function.embed_query(text)
155 else:
156 return self.embedding_function(text)

File c:\GEN_AI\compliance-and-guidelines\venv\Lib\site-packages\langchain\chains\hyde\base.py:57, in HypotheticalDocumentEmbedder.embed_query(self, text)
55 """Generate a hypothetical document and embedded it."""
56 var_name = self.llm_chain.input_keys[0]
---> 57 result = self.llm_chain.generate([{var_name: text}])
58 documents = [generation.text for generation in result.generations[0]]
59 embeddings = self.embed_documents(documents)

File c:\GEN_AI\compliance-and-guidelines\venv\Lib\site-packages\langchain\chains\llm.py:135, in LLMChain.generate(self, input_list, run_manager)
129 def generate(
130 self,
131 input_list: List[Dict[str, Any]],
132 run_manager: Optional[CallbackManagerForChainRun] = None,
133 ) -> LLMResult:
134 """Generate LLM result from inputs."""
--> 135 prompts, stop = self.prep_prompts(input_list, run_manager=run_manager)
136 callbacks = run_manager.get_child() if run_manager else None
137 if isinstance(self.llm, BaseLanguageModel):

File c:\GEN_AI\compliance-and-guidelines\venv\Lib\site-packages\langchain\chains\llm.py:196, in LLMChain.prep_prompts(self, input_list, run_manager)
194 prompts = []
195 for inputs in input_list:
--> 196 selected_inputs = {k: inputs[k] for k in self.prompt.input_variables}
197 prompt = self.prompt.format_prompt(**selected_inputs)
198 _colored_text = get_colored_text(prompt.to_string(), "green")

KeyError: 'input'

Подробнее здесь: https://stackoverflow.com/questions/786 ... -retriever

Реклама

1719033172

Anonymous

Я пытаюсь создать встраивание требования на основе гида и получить из него соответствующие документы. Затем эти соответствующие документы будут переданы в качестве контекста и исходного вопроса. Подсказка к гиду отличается от той, которую я использую для получения окончательного ответа
hyde_prompt_template =""" get the guidelines to this requirement {input}.  Use the {guideline_name} which are in the context and  think how these guidelines will be helpful to this requirement. print  only the final output. """
` main_prompt = ""Вы профессиональный старший архитектор программного обеспечения, и вам необходимо найти соответствующие
руководства для подробного требования.
Создать рекомендации для приведенное ниже подробное требование в {input}.
Используйте руководящую информацию из {context} и дайте соответствующие рекомендации для {input} только из {context}.
Предоставляйте рекомендации только из контекста и не используйте ваши собственные знания
ДАЙТЕ ОКОНЧАТЕЛЬНЫЙ РЕЗУЛЬТАТ В ФОРМАТЕ НИЖЕ
Название рекомендации:
Рекомендации, которым необходимо следовать:
Название рекомендации взято из {guideline name>
"""
`
Я пытался передать более двух значений в приведенном ниже коде
from langchain.chains.hyde.base import HypotheticalDocumentEmbedder
from langchain.prompts import PromptTemplate
from langchain_openai import OpenAIEmbeddings, OpenAI, ChatOpenAI
from langchain.chains.llm import LLMChain
from langchain_community.vectorstores.faiss import FAISS

hyde_prompt_template = """
get the guidelines to this requirement {input}.
Use the {guideline_name} which are in the context and
think how these guidelines will be helpful to this requirement.  print
only the final output.
"""
prompt = PromptTemplate.from_template(hyde_prompt_template )

llm_chain = LLMChain(llm=llm, prompt=prompt)

hyde_embeddings = HypotheticalDocumentEmbedder(
llm_chain=llm_chain, base_embeddings=base_embeddings
)

faiss = FAISS.load_local(folder_path="local path",
embeddings=hyde_embeddings,
allow_dangerous_deserialization=True
)

retriever = faiss.as_retriever()

retriever.invoke({"input": requirement, "guideline_name": "GDPR"})

[b]Но я получаю ошибку ниже[/b]
KeyError Traceback (most recent call last)
Cell In[59], line 1
----> 1 retriever.invoke({"input": requirement})

File c:\GEN_AI\compliance-and-guidelines\venv\Lib\site-packages\langchain_core\retrievers.py:194, in BaseRetriever.invoke(self, input, config, **kwargs)
175 """Invoke the retriever to get relevant documents.
176
177 Main entry point for synchronous retriever invocations.
(...)
191 retriever.invoke("query")
192 """
193 config = ensure_config(config)
--> 194 return self.get_relevant_documents(
195 input,
196 callbacks=config.get("callbacks"),
197 tags=config.get("tags"),
198 metadata=config.get("metadata"),
199 run_name=config.get("run_name"),
200 **kwargs,
201 )

File c:\GEN_AI\compliance-and-guidelines\venv\Lib\site-packages\langchain_core_api\deprecation.py:148, in deprecated..deprecate..warning_emitting_wrapper(*args, **kwargs)
146 warned = True
147 emit_warning()
--> 148 return wrapped(*args, **kwargs)

File c:\GEN_AI\compliance-and-guidelines\venv\Lib\site-packages\langchain_core\retrievers.py:323, in BaseRetriever.get_relevant_documents(self, query, callbacks, tags, metadata, run_name, **kwargs)
321 except Exception as e:
322 run_manager.on_retriever_error(e)
--> 323 raise e
324 else:
325 run_manager.on_retriever_end(
326 result,
327 )

File c:\GEN_AI\compliance-and-guidelines\venv\Lib\site-packages\langchain_core\retrievers.py:316, in BaseRetriever.get_relevant_documents(self, query, callbacks, tags, metadata, run_name, **kwargs)
314 _kwargs = kwargs if self._expects_other_args else {}
315 if self._new_arg_supported:
--> 316 result = self._get_relevant_documents(
317 query, run_manager=run_manager, **_kwargs
318 )
319 else:
320 result = self._get_relevant_documents(query, **_kwargs)

File c:\GEN_AI\compliance-and-guidelines\venv\Lib\site-packages\langchain_core\vectorstores.py:696, in VectorStoreRetriever._get_relevant_documents(self, query, run_manager)
692 def _get_relevant_documents(
693 self, query: str, *, run_manager: CallbackManagerForRetrieverRun
694 ) -> List[Document]:
695 if self.search_type == "similarity":
--> 696 docs = self.vectorstore.similarity_search(query, **self.search_kwargs)
697 elif self.search_type == "similarity_score_threshold":
698 docs_and_similarities = (
699 self.vectorstore.similarity_search_with_relevance_scores(
700 query, **self.search_kwargs
701 )
702 )

File c:\GEN_AI\compliance-and-guidelines\venv\Lib\site-packages\langchain_community\vectorstores\faiss.py:530, in FAISS.similarity_search(self, query, k, filter, fetch_k, **kwargs)
510 def similarity_search(
511 self,
512 query: str,
(...)
516 **kwargs: Any,
517 ) -> List[Document]:
518 """Return docs most similar to query.
519
520 Args:
(...)
528 List of Documents most similar to the query.
529 """
--> 530 docs_and_scores = self.similarity_search_with_score(
531 query, k, filter=filter, fetch_k=fetch_k, **kwargs
532 )
533 return [doc for doc, _ in docs_and_scores]

File c:\GEN_AI\compliance-and-guidelines\venv\Lib\site-packages\langchain_community\vectorstores\faiss.py:402, in FAISS.similarity_search_with_score(self, query, k, filter, fetch_k, **kwargs)
378 def similarity_search_with_score(
379 self,
380 query: str,
(...)
384 **kwargs: Any,
385 ) -> List[Tuple[Document, float]]:
386 """Return docs most similar to query.
387
388 Args:
(...)
400 L2 distance in float.  Lower score represents more similarity.
401 """
--> 402 embedding = self._embed_query(query)
403 docs = self.similarity_search_with_score_by_vector(
404 embedding,
405 k,
(...)
408 **kwargs,
409 )
410 return docs

File c:\GEN_AI\compliance-and-guidelines\venv\Lib\site-packages\langchain_community\vectorstores\faiss.py:154, in FAISS._embed_query(self, text)
152 def _embed_query(self, text: str) -> List[float]:
153 if isinstance(self.embedding_function, Embeddings):
--> 154 return self.embedding_function.embed_query(text)
155 else:
156 return self.embedding_function(text)

File c:\GEN_AI\compliance-and-guidelines\venv\Lib\site-packages\langchain\chains\hyde\base.py:57, in HypotheticalDocumentEmbedder.embed_query(self, text)
55 """Generate a hypothetical document and embedded it."""
56 var_name = self.llm_chain.input_keys[0]
---> 57 result = self.llm_chain.generate([{var_name: text}])
58 documents = [generation.text for generation in result.generations[0]]
59 embeddings = self.embed_documents(documents)

File c:\GEN_AI\compliance-and-guidelines\venv\Lib\site-packages\langchain\chains\llm.py:135, in LLMChain.generate(self, input_list, run_manager)
129 def generate(
130 self,
131 input_list: List[Dict[str, Any]],
132 run_manager: Optional[CallbackManagerForChainRun] = None,
133 ) -> LLMResult:
134 """Generate LLM result from inputs."""
--> 135 prompts, stop = self.prep_prompts(input_list, run_manager=run_manager)
136 callbacks = run_manager.get_child() if run_manager else None
137 if isinstance(self.llm, BaseLanguageModel):

File c:\GEN_AI\compliance-and-guidelines\venv\Lib\site-packages\langchain\chains\llm.py:196, in LLMChain.prep_prompts(self, input_list, run_manager)
194 prompts = []
195 for inputs in input_list:
--> 196 selected_inputs = {k: inputs[k] for k in self.prompt.input_variables}
197 prompt = self.prompt.format_prompt(**selected_inputs)
198 _colored_text = get_colored_text(prompt.to_string(), "green")

KeyError: 'input'
 

Подробнее здесь: [url]https://stackoverflow.com/questions/78655160/how-to-pass-more-than-2-values-in-hyde-document-embedding-vectorstore-retriever[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Пакет io.flutter.embedding.android не существует импорта io.flutter.embedding.android.flutteractient;

Последнее сообщение Anonymous « 29 авг 2025, 05:00
Добавлено в форуме Android

Anonymous » 29 авг 2025, 05:00 » в форуме Android

Получил Android 15 (API -уровень 35) или выше уведомление на консоли Google Play. Обновленный build.gradle File's CompilesDkversion и TargetSdkversion , а также версия Flutter для этой цели. После этого приложение не может быть построено, все...

0 Ответы

8 Просмотры

Последнее сообщение Anonymous
29 авг 2025, 05:00
Пакет io.flutter.embedding.android не существует импорта io.flutter.embedding.android.flutteractient;

Последнее сообщение Anonymous « 29 авг 2025, 09:58
Добавлено в форуме Android

Anonymous » 29 авг 2025, 09:58 » в форуме Android

Получил Android 15 (API -уровень 35) или выше уведомление на консоли Google Play. Обновленный build.gradle File's CompilesDkversion и TargetSdkversion , а также версия Flutter для этой цели. После этого приложение не может быть построено, все...

0 Ответы

22 Просмотры

Последнее сообщение Anonymous
29 авг 2025, 09:58
Пакет io.flutter.embedding.android не существует импорта io.flutter.embedding.android.flutteractient;

Последнее сообщение Anonymous « 31 авг 2025, 16:13
Добавлено в форуме Android

Anonymous » 31 авг 2025, 16:13 » в форуме Android

Получил Android 15 (API -уровень 35) или выше уведомление на консоли Google Play. Обновленный build.gradle File's CompilesDkversion и TargetSdkversion , а также версия Flutter для этой цели. После этого приложение не может быть построено, все...

0 Ответы

5 Просмотры

Последнее сообщение Anonymous
31 авг 2025, 16:13
Индексирование векторного хранилища в langchain

Последнее сообщение Anonymous « 08 дек 2023, 12:31
Добавлено в форуме Python

Anonymous » 08 дек 2023, 12:31 » в форуме Python

Мне нужно получить доступ к хранилищу векторов Langchain, используя index. Есть ли какой-нибудь способ для этого?

Мой вариант использования — выбор случайных документов из векторного хранилища. Одним из решений является создание случайного...

0 Ответы

42 Просмотры

Последнее сообщение Anonymous
08 дек 2023, 12:31
RateLimitError: код ошибки: 429 при запуске приложения RAG, состоящего из gpt-4oAPI, векторного хранилища шишек, AzureAI

Последнее сообщение Anonymous « 04 июл 2024, 16:34
Добавлено в форуме Python

Anonymous » 04 июл 2024, 16:34 » в форуме Python

Привет, в настоящее время я пытаюсь запустить приложение RAG (чат-бот с часто задаваемыми вопросами), которое состоит из двух пользовательских интерфейсов: один, в котором мы можем отдельно загружать файлы и хранить их внедрения в векторном...

0 Ответы

16 Просмотры

Последнее сообщение Anonymous
04 июл 2024, 16:34

Вернуться в «Python»

Programmiererforum