Как мне создать разницу между файлом и его неполным патчем? - Цифровое Кемерово

Как мне создать разницу между файлом и его неполным патчем? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Как мне создать разницу между файлом и его неполным патчем?

Цитата

Сообщение Anonymous » 04 июл 2024, 10:57

Я работаю над проектом, который требует от меня создания интерфейса между LLM и пользователем. LLM используется для генерации исправлений кода, и мне нужно вывести разницу между сгенерированным кодом и содержимым данного файла C. Проблема возникает, когда в сгенерированном коде есть эллипсы, обозначающие блок неизмененного кода, это нарушает различие.
До сих пор я пытался использовать расстояние Левенштейна, чтобы найти похожие строки и найти diff между ними, однако этот подход, похоже, не работает при добавлении новых строк. Вот как я это реализовал
import difflib
from rapidfuzz import fuzz

def compare_code_with_diffs(
original_code, fixed_code, similarity_threshold=0.7
):
def string_similarity(s1, s2):
# Remove spaces and convert to lowercase for a more robust comparison
s1 = s1.replace(" ", "").lower()
s2 = s2.replace(" ", "").lower()
return (
fuzz.ratio(s1, s2) / 100.0
) # Convert percentage to a float between 0 and 1

def find_matching_indices(A, B):
result = []
for i, a_item in enumerate(A):
best_match = None
best_similarity = 0
for j, b_item in enumerate(B):
similarity = string_similarity(a_item, b_item)
if similarity > best_similarity:
best_similarity = similarity
best_match = (j, b_item, similarity)

if best_match and best_similarity >= similarity_threshold:
result.append(
(i, best_match[0], a_item, best_match[1], best_similarity)
)

return result

def generate_diff(old_line, new_line):
differ = difflib.Differ()
diff = list(differ.compare([old_line], [new_line]))
return "\n".join(diff)

A = fixed_code.splitlines()
B = original_code.splitlines()
matches = find_matching_indices(A, B)

diffs = []
for match in matches:
if similarity_threshold < match[4] < 1.0:
diff = generate_diff(match[3], match[2])
diffs.append(
{
"fixed_index": match[0],
"original_index": match[1],
"similarity": match[4],
"diff": diff,
}
)

return diffs

Подробнее здесь: https://stackoverflow.com/questions/787 ... atch-of-it

Реклама

1720079838

Anonymous

Я работаю над проектом, который требует от меня создания интерфейса между LLM и пользователем. LLM используется для генерации исправлений кода, и мне нужно вывести разницу между сгенерированным кодом и содержимым данного файла C. Проблема возникает, когда в сгенерированном коде есть эллипсы, обозначающие блок неизмененного кода, это нарушает различие.
До сих пор я пытался использовать расстояние Левенштейна, чтобы найти похожие строки и найти diff между ними, однако этот подход, похоже, не работает при добавлении новых строк. Вот как я это реализовал
import difflib
from rapidfuzz import fuzz

def compare_code_with_diffs(
original_code, fixed_code, similarity_threshold=0.7
):
def string_similarity(s1, s2):
# Remove spaces and convert to lowercase for a more robust comparison
s1 = s1.replace(" ", "").lower()
s2 = s2.replace(" ", "").lower()
return (
fuzz.ratio(s1, s2) / 100.0
)  # Convert percentage to a float between 0 and 1

def find_matching_indices(A, B):
result = []
for i, a_item in enumerate(A):
best_match = None
best_similarity = 0
for j, b_item in enumerate(B):
similarity = string_similarity(a_item, b_item)
if similarity > best_similarity:
best_similarity = similarity
best_match = (j, b_item, similarity)

if best_match and best_similarity >= similarity_threshold:
result.append(
(i, best_match[0], a_item, best_match[1], best_similarity)
)

return result

def generate_diff(old_line, new_line):
differ = difflib.Differ()
diff = list(differ.compare([old_line], [new_line]))
return "\n".join(diff)

A = fixed_code.splitlines()
B = original_code.splitlines()
matches = find_matching_indices(A, B)

diffs = []
for match in matches:
if similarity_threshold < match[4] < 1.0:
diff = generate_diff(match[3], match[2])
diffs.append(
{
"fixed_index": match[0],
"original_index": match[1],
"similarity": match[4],
"diff": diff,
}
)

return diffs
 

Подробнее здесь: [url]https://stackoverflow.com/questions/78705760/how-do-i-generate-a-diff-between-a-file-and-an-incomplete-patch-of-it[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Юниттест Python: с патчем («a») как b против a = b

Последнее сообщение Anonymous « 26 июн 2024, 01:03
Добавлено в форуме Python

Anonymous » 26 июн 2024, 01:03 » в форуме Python

В чем разница между
with patch( module.func ) as mock_func:
...

по сравнению с
module.func = empty_func

За исключением части контекстного менеджера, которую, очевидно, легко воспроизвести и в последнем случае.

Подробнее здесь:

0 Ответы

11 Просмотры

Последнее сообщение Anonymous
26 июн 2024, 01:03
Кто-нибудь из 2012 года получил iso 4.0 eth0 generic_x86 с патчем Ethernet? Мне нужен этот ISO, даже если он старый

Последнее сообщение Anonymous « 16 июл 2024, 19:01
Добавлено в форуме Android

Anonymous » 16 июл 2024, 19:01 » в форуме Android

Я просматривал этот сайт но он закрыт, поэтому я добрался до машины обратного пути, а машина обратного пути не заархивировала ссылку на ISO. Я даже использовал ссылку без машины обратного пути. , и похоже, что iso удален. Мне нужен этот ISO-образ,...

0 Ответы

27 Просмотры

Последнее сообщение Anonymous
16 июл 2024, 19:01
Измешивание функции в Pytest с патчем не работает

Последнее сообщение Anonymous « 01 фев 2025, 23:06
Добавлено в форуме Python

Anonymous » 01 фев 2025, 23:06 » в форуме Python

Я записал тестовый файл status_update/tests/test_status_update.py , который имеет следующее содержимое:
from lib.sync_mdl_status import update_mdl_status

@patch('scripts.aws_secrets.fetch_aws_secret')
def test_status_updater_mdl(self,...

0 Ответы

16 Просмотры

Последнее сообщение Anonymous
01 фев 2025, 23:06
Ошибка: метка случая переключателя перечисления должна быть неполным именем константы перечисления

Последнее сообщение Anonymous « 16 май 2024, 09:22
Добавлено в форуме JAVA

Anonymous » 16 май 2024, 09:22 » в форуме JAVA

ошибка: метка регистра переключателя перечисления должна быть неполным именем константы перечисления
ошибка: повторяющаяся метка регистра

Не компилируется, помогите!

public class CardViewStyleSetting extends ThemedSetting {

public...

0 Ответы

116 Просмотры

Последнее сообщение Anonymous
16 май 2024, 09:22
Ошибка: метка случая переключателя перечисления должна быть неполным именем константы перечисления

Последнее сообщение Anonymous « 16 май 2024, 09:22
Добавлено в форуме Android

Anonymous » 16 май 2024, 09:22 » в форуме Android

ошибка: метка регистра переключателя перечисления должна быть неполным именем константы перечисления
ошибка: повторяющаяся метка регистра

Не компилируется, помогите!

public class CardViewStyleSetting extends ThemedSetting {

public...

0 Ответы

112 Просмотры

Последнее сообщение Anonymous
16 май 2024, 09:22

Вернуться в «Python»

Programmiererforum