Как улучшить базовый LLM? - Цифровое Кемерово

Как улучшить базовый LLM? ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Цитата

Сообщение Anonymous » 03 окт 2024, 22:29

Я работал над базовым LLM, и каждый раз, когда я запускал код, полученный образец не имел смысла. Я получил вывод:

Однажды на оба ваших дома я возложил на него закон о вас, король короля Англии.

Однажды на оба ваших дома я положил ему закон о вас, короле короля Англии.

Однажды на оба ваших дома я положил ему закон о вас, короле короля Англии.

Однажды на оба ваших дома я возложил на него закон о вас, короле короля Англии.

Однажды на оба ваших дома я возложил на него закон о вас, короле короля Англии.

Однажды на оба ваших дома я положил ему закон. p>

Грамматика совершенно неправильная (без знаков препинания и заглавных букв), и предложение в целом не имеет смысла. Как я могу оптимизировать эту модель?
Это мой код:
import tensorflow as tf
from tensorflow.keras.preprocessing.sequence import pad_sequences
from tensorflow.keras.layers import Embedding, LSTM, Dense, Bidirectional
from tensorflow.keras.preprocessing.text import Tokenizer
from tensorflow.keras.models import Sequential
import numpy as np

path_to_file = tf.keras.utils.get_file('shakespeare.txt', 'https://storage.googleapis.com/download ... speare.txt')
with open(path_to_file, 'r') as f:
text = f.read()

tokenizer = Tokenizer()
text = text.lower().split("\n")
tokenizer.fit_on_texts(text)
total_words = len(tokenizer.word_index) + 1

input_sequences = []
for line in text:
token_list = tokenizer.texts_to_sequences([line])[0]
for i in range(1, len(token_list)):
n_gram = token_list[:i+1]
input_sequences.append(n_gram)

max_sequence_length = max([len(x) for x in input_sequences])
input_sequences = np.array(pad_sequences(input_sequences, maxlen = max_sequence_length, padding = 'pre'))
x = input_sequences[:, :-1]
y = input_sequences[:, -1]
embedding_dim = 256

y = tf.keras.utils.to_categorical(y, num_classes=total_words)
model = Sequential()
model.add(Embedding(total_words, embedding_dim))
lstm = Bidirectional(LSTM(256))
model.add(lstm)
model.add(tf.keras.layers.Dropout(0.2))
model.add(tf.keras.layers.Dense(total_words, activation = 'softmax'))
lr1 = 0.001
adam = tf.keras.optimizers.Adam(lr1)
model.compile(loss = 'categorical_crossentropy', optimizer = adam, metrics = ['accuracy'])
history = model.fit(x, y, epochs = 40, verbose = 1, batch_size = 128)

seed_text = "Once upon a time"
next_words = 20
for i in range(next_words):
tokens = tokenizer.texts_to_sequences([seed_text])[0]
token_list = pad_sequences([tokens], maxlen = max_sequence_length, padding = 'pre')
predicted = np.argmax(model.predict(token_list, verbose = 0), axis = -1)
output_word = ""
for word, index in tokenizer.word_index.items():
if index == predicted:
output_word = word
break
seed_text = seed_text + " " + output_word

print(seed_text)

Подробнее здесь: https://stackoverflow.com/questions/790 ... -basic-llm

1727983766

Anonymous

Я работал над базовым LLM, и каждый раз, когда я запускал код, полученный образец не имел смысла. Я получил вывод:

Однажды на оба ваших дома я возложил на него закон о вас, король короля Англии.

Однажды на оба ваших дома я положил ему закон о вас, короле короля Англии.

Однажды на оба ваших дома я положил ему закон о вас, короле короля Англии.

Однажды на оба ваших дома я возложил на него закон о вас, короле короля Англии.

Однажды на оба ваших дома я возложил на него закон о вас, короле короля Англии.

Однажды на оба ваших дома я положил ему закон. p>

Грамматика совершенно неправильная (без знаков препинания и заглавных букв), и предложение в целом не имеет смысла. Как я могу оптимизировать эту модель?
Это мой код:
import tensorflow as tf
from tensorflow.keras.preprocessing.sequence import pad_sequences
from tensorflow.keras.layers import Embedding, LSTM, Dense, Bidirectional
from tensorflow.keras.preprocessing.text import Tokenizer
from tensorflow.keras.models import Sequential
import numpy as np

path_to_file = tf.keras.utils.get_file('shakespeare.txt', 'https://storage.googleapis.com/download.tensorflow.org/data/shakespeare.txt')
with open(path_to_file, 'r') as f:
text = f.read()

tokenizer = Tokenizer()
text = text.lower().split("\n")
tokenizer.fit_on_texts(text)
total_words = len(tokenizer.word_index) + 1

input_sequences = []
for line in text:
token_list = tokenizer.texts_to_sequences([line])[0]
for i in range(1, len(token_list)):
n_gram = token_list[:i+1]
input_sequences.append(n_gram)

max_sequence_length = max([len(x) for x in input_sequences])
input_sequences = np.array(pad_sequences(input_sequences, maxlen = max_sequence_length, padding = 'pre'))
x = input_sequences[:, :-1]
y = input_sequences[:, -1]
embedding_dim = 256

y = tf.keras.utils.to_categorical(y, num_classes=total_words)
model = Sequential()
model.add(Embedding(total_words, embedding_dim))
lstm = Bidirectional(LSTM(256))
model.add(lstm)
model.add(tf.keras.layers.Dropout(0.2))
model.add(tf.keras.layers.Dense(total_words, activation = 'softmax'))
lr1 = 0.001
adam = tf.keras.optimizers.Adam(lr1)
model.compile(loss = 'categorical_crossentropy', optimizer = adam, metrics = ['accuracy'])
history = model.fit(x, y, epochs = 40, verbose = 1, batch_size = 128)

seed_text = "Once upon a time"
next_words = 20
for i in range(next_words):
tokens = tokenizer.texts_to_sequences([seed_text])[0]
token_list = pad_sequences([tokens], maxlen = max_sequence_length, padding = 'pre')
predicted = np.argmax(model.predict(token_list, verbose = 0), axis = -1)
output_word = ""
for  word, index in tokenizer.word_index.items():
if index == predicted:
output_word = word
break
seed_text = seed_text + " " + output_word

print(seed_text)
 

Подробнее здесь: [url]https://stackoverflow.com/questions/79051945/how-to-improve-basic-llm[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Выполнение вывода LLM локально с помощью Python (LangChain/AutoGen/AutoMemGPT) с использованием модели LLM, размещенной

Последнее сообщение Anonymous « 05 дек 2024, 16:56
Добавлено в форуме Python

Anonymous » 05 дек 2024, 16:56 » в форуме Python

Я запускаю ehartford_dolphin-2.1-mistral-7b на машине RTX A6000 на RunPod с шаблоном TheBloke LLM Text Generation WebUI.
У меня есть 2 варианта: запуск webui на runpod или запуск шаблона вывода HuggingFace Text Generation на runpod
Вариант 1....

0 Ответы

61 Просмотры

Последнее сообщение Anonymous
05 дек 2024, 16:56
В чем разница между цепью LLM и LLM в Лангчейне?

Последнее сообщение Anonymous « 27 авг 2025, 08:03
Добавлено в форуме Python

Anonymous » 27 авг 2025, 08:03 » в форуме Python

Это llm:
question=st.text_input( your question )
llm=OpenAI(temperature=0.9)
if prompt:
response=llm(prompt)
st.write(response)

Тогда, если нам нужно выполнить подсказку, мы должны создать цепочку LLM:
from langchain.prompts import...

0 Ответы

3 Просмотры

Последнее сообщение Anonymous
27 авг 2025, 08:03
Как улучшить/оптимизировать инструмент чата LLM с помощьюstreamlit

Последнее сообщение Anonymous « 10 май 2024, 01:50
Добавлено в форуме Python

Anonymous » 10 май 2024, 01:50 » в форуме Python

Инструмент интерактивного чата QA-Pilot, который использует модели Ollama (или openAI) для быстрого понимания и навигации по репозиторию кода GitHub или сжатым файловым ресурсам.
Он использовал Python +streamlit + chromadb, при загрузке страницы он...

0 Ответы

11 Просмотры

Последнее сообщение Anonymous
10 май 2024, 01:50
Как улучшить время выполнения запросов и улучшить индексацию в Ollama с помощью llama_index с использованием локальной м

Последнее сообщение Anonymous « 22 ноя 2024, 14:37
Добавлено в форуме Python

Anonymous » 22 ноя 2024, 14:37 » в форуме Python

Я работаю над чат-ботом, использующим LlamaIndex на основе Ollama LLM. У меня есть набор PDF-файлов, я создаю чат-бота, который будет читать эти файлы и отвечать на их запросы. Изначально я использовал эту модель

Settings.embed_model =...

0 Ответы

48 Просмотры

Последнее сообщение Anonymous
22 ноя 2024, 14:37
Как я могу улучшить свой код Python LeetCode Проблема 345 и как я могу улучшить сложность времени

Последнее сообщение Anonymous « 09 мар 2025, 11:17
Добавлено в форуме Python

Anonymous » 09 мар 2025, 11:17 » в форуме Python

Задача задачи:

Учитывая строку S, обратите за собой только все гласные в строке и вернуть ее. /> Пример 1:
input: s = icecream
output: acecreim
Объяснение:
гласные в s являются . При обращении гласных, S становится «Acecreim».
class...

0 Ответы

34 Просмотры

Последнее сообщение Anonymous
09 мар 2025, 11:17

Вернуться в «Python»