Почему поиск документа FAISS медленно и непоследователен на экземпляре EC2 T3.MICRO? - Цифровое Кемерово

Почему поиск документа FAISS медленно и непоследователен на экземпляре EC2 T3.MICRO? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Почему поиск документа FAISS медленно и непоследователен на экземпляре EC2 T3.MICRO?

Цитата

Сообщение Anonymous » 22 авг 2025, 14:01

Я строю систему вопросов и ответов документа, используя Faiss для поиска вектора на экземпляре AWS EC2 T3.Micro (1 VCPU, 1 ГБ ОЗУ). Мой индекс FAISS относительно невелик (8,4 МБ .faiss + 1,4 МБ .pkl файлы), но я испытываю несовместимые времена поиска - иногда быстро ( 60 -е годы).
Проблема
после загрузки Faiss index в память - документ, документ - документ, документ - документ, документ - документ, документ - документ, документ - документ, документируется. Несовместимо:
Быстрые случаи: ec2 экземпляр: t3.micro (1 vcpu, 1gb ram) < /p>
Хранение: EBS General Actule SSD (gp2) < /p>
faiss version: последняя через Langchain < /p>
index size: 8.4mb (index.faiss) + 1,4mb (index.) + 1.4mb (index.) + 1,4 м. /> Entgeddings: Openai Text-Embedding-Ada-002 < /p>
фрагмент кода < /strong> < /p>

Код: Выделить всё

# Load vector store (cached after first load)
if context_file_path not in VECTOR_STORE_CACHE:
vector_store_path = os.path.join(VECTOR_STORE_ROOT, context_file_path)
VECTOR_STORE_CACHE[context_file_path] = FAISS.load_local(
vector_store_path,
embeddings,
allow_dangerous_deserialization=True
)

# Retrieve documents
vectorstore = VECTOR_STORE_CACHE[context_file_path]
retriever = vectorstore.as_retriever(search_kwargs={"k": 3})
docs = retriever.get_relevant_documents(query)  # This can take 60+ seconds

Вопросы [/b]
Почему поиск Faiss будет непоследовательным для одного и того же запроса на одном и том же индексе в памяти? Производительность?Loading vector store for OL_IGSE_Biology into memory...
Vector store for OL_IGSE_Biology cached in memory.

Starting document retrieval for query: 'who are organisms?...'

Document retrieval completed in 66.19 seconds. Found 3 docs.
< /code>
Любое понимание будет высоко оценено. Я ожидал, что поиск документов будет последовательно быстрым с индексом в памяти такого размера, особенно после начальной нагрузки.

Подробнее здесь: https://stackoverflow.com/questions/797 ... o-instance

Реклама

1755860499

Anonymous

 Я строю систему вопросов и ответов документа, используя Faiss для поиска вектора на экземпляре AWS EC2 T3.Micro (1 VCPU, 1 ГБ ОЗУ). Мой индекс FAISS относительно невелик (8,4 МБ .faiss + 1,4 МБ .pkl файлы), но я испытываю несовместимые времена поиска - иногда быстро ( 60 -е годы). 
[b] Проблема  
после загрузки Faiss index в память - документ, документ - документ, документ - документ, документ - документ, документ - документ, документ - документ, документируется. Несовместимо: 
Быстрые случаи:   ec2 экземпляр: t3.micro (1 vcpu, 1gb ram) < /p>
Хранение: EBS General Actule SSD (gp2) < /p>
faiss version: последняя через Langchain < /p>
index size: 8.4mb (index.faiss) + 1,4mb (index.) + 1.4mb (index.) + 1,4 м. />  Entgeddings: Openai Text-Embedding-Ada-002 < /p>
 фрагмент кода < /strong> < /p>
[code]# Load vector store (cached after first load)
if context_file_path not in VECTOR_STORE_CACHE:
vector_store_path = os.path.join(VECTOR_STORE_ROOT, context_file_path)
VECTOR_STORE_CACHE[context_file_path] = FAISS.load_local(
vector_store_path,
embeddings,
allow_dangerous_deserialization=True
)

# Retrieve documents
vectorstore = VECTOR_STORE_CACHE[context_file_path]
retriever = vectorstore.as_retriever(search_kwargs={"k": 3})
docs = retriever.get_relevant_documents(query)  # This can take 60+ seconds
[/code]
 Вопросы [/b] 
Почему поиск Faiss будет непоследовательным для одного и того же запроса на одном и том же индексе в памяти? Производительность?Loading vector store for OL_IGSE_Biology into memory...
Vector store for OL_IGSE_Biology cached in memory.
🔍 Starting document retrieval for query: 'who are organisms?...'
✅ Document retrieval completed in 66.19 seconds. Found 3 docs.
< /code>
Любое понимание будет высоко оценено. Я ожидал, что поиск документов будет последовательно быстрым с индексом в памяти такого размера, особенно после начальной нагрузки.  

Подробнее здесь: [url]https://stackoverflow.com/questions/79743322/why-is-faiss-document-retrieval-slow-and-inconsistent-on-ec2-t3-micro-instance[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Почему поиск документа FAISS медленно и непоследователен на экземпляре EC2 T3.MICRO?

Последнее сообщение Anonymous « 22 авг 2025, 16:08
Добавлено в форуме Python

Anonymous » 22 авг 2025, 16:08 » в форуме Python

Я строю систему вопросов и ответов документа, используя Faiss для поиска вектора на экземпляре AWS EC2 T3.Micro (1 VCPU, 1 ГБ ОЗУ). Мой индекс FAISS относительно невелик (8,4 МБ .faiss + 1,4 МБ .pkl файлы), но я испытываю несовместимые времена...

0 Ответы

1 Просмотры

Последнее сообщение Anonymous
22 авг 2025, 16:08
Документ AI чрезвычайно медленный в экземпляре EC2 и в целом медленно

Последнее сообщение Anonymous « 01 май 2025, 15:02
Добавлено в форуме Python

Anonymous » 01 май 2025, 15:02 » в форуме Python

В моей локальной среде с использованием стандартного вызова API Process_request вызов запроса требуется от 8 до 20 секунд. В моей оболочке EC2 Python я смог запустить ее один раз, но потребовалось 34 секунды, что недопустимо для моего варианта...

0 Ответы

6 Просмотры

Последнее сообщение Anonymous
01 май 2025, 15:02
Документ AI чрезвычайно медленный в экземпляре EC2 и в целом медленно

Последнее сообщение Anonymous « 02 май 2025, 17:02
Добавлено в форуме Python

Anonymous » 02 май 2025, 17:02 » в форуме Python

В моей локальной среде с использованием стандартного вызова API Process_request вызов запроса требуется от 8 до 20 секунд. В моей оболочке EC2 Python я смог запустить ее один раз, но потребовалось 34 секунды, что недопустимо для моего варианта...

0 Ответы

6 Просмотры

Последнее сообщение Anonymous
02 май 2025, 17:02
Как удалить OpenJDK на Amazon EC2 Micro Enmence Running Redhat Linux

Последнее сообщение Anonymous « 18 апр 2025, 01:04
Добавлено в форуме JAVA

Anonymous » 18 апр 2025, 01:04 » в форуме JAVA

Недавно я установил OpenJDK на свой экземпляр Redhat. Теперь мне нужно пойти на Java JDK. Я видел несколько сайтов для замены, но ни один из них не работает для меня. Заранее спасибо ..

Подробнее здесь:

0 Ответы

5 Просмотры

Последнее сообщение Anonymous
18 апр 2025, 01:04
Как удалить OpenJDK на Amazon EC2 Micro Enmence Running Redhat Linux

Последнее сообщение Anonymous « 17 авг 2025, 05:03
Добавлено в форуме JAVA

Anonymous » 17 авг 2025, 05:03 » в форуме JAVA

Недавно я установил OpenJDK на свой экземпляр Redhat. Теперь мне нужно пойти на Java JDK. Я видел несколько сайтов для замены, но ни один из них не работает для меня. Заранее спасибо ..

Подробнее здесь:

0 Ответы

3 Просмотры

Последнее сообщение Anonymous
17 авг 2025, 05:03

Вернуться в «Python»

Programmiererforum