Мне нужно сравнить два текста и вернуть различия в формате JSON. JSON должен содержать фрагменты неизмененного текста, а также фрагменты исходного и отредактированного текста. Вот пример входных данных и желаемого результата: Пример желаемого результата:
{
"chunks": [
{"text": "Known as the “King of Pop,” Michael Jackson was a "},
{"text": "bet-selling", "edit": "best-selling"},
{"text": " American singer, songwriter, and dancer. As a child, Jackson "},
{"text": "becamv", "edit": "became"},
{"text": " the lead singer of his family’s popular Motown group, the Jackson 5. H..."}
]
}
$text1 = "Known as the “King of Pop,” Michael Jackson was a bet-selling American singer, songwriter, and dancer. As a child, Jackson becamv the lead singer of his family’s popular Motown group, the Jackson 5. H...";
$text2 = "Known as the “King of Pop,” Michael Jackson was a best-selling American singer, songwriter, and dancer. As a child, Jackson became the lead singer of his family’s popular Motown group, the Jackson 5. H...";
Что я пробовал
Библиотека Jfcherng\Diff (https: //github.com/jfcherng/php-diff):
Я попробовал использовать библиотеку Jfcherng\Diff с пользовательским рендерингом для достижения желаемого результата. Однако он не обрабатывал неизмененные фрагменты текста должным образом и не разделял изменения на уровне слов должным образом.
Unix diff через Shell_exec:
Попытка использовать Unix diff через Shell_exec, чтобы сгенерировать различия и проанализировать выходные данные. Результаты были не в ожидаемом формате и включали дополнительные метаданные, не относящиеся к нашему варианту использования.
Разделение текста вручную:
Проверено вручную разбивать тексты на слова и сравнивать их, но такому подходу не хватало эффективности и точности.
Текущая реализация кода
Вот текущая реализация с использованием библиотеки Jfcherng\Diff:
Мне нужно сравнить два текста и вернуть различия в формате JSON. JSON должен содержать фрагменты неизмененного текста, а также фрагменты исходного и отредактированного текста. Вот пример входных данных и желаемого результата: [b]Пример желаемого результата:[/b] [code]{ "chunks": [ {"text": "Known as the “King of Pop,” Michael Jackson was a "}, {"text": "bet-selling", "edit": "best-selling"}, {"text": " American singer, songwriter, and dancer. As a child, Jackson "}, {"text": "becamv", "edit": "became"}, {"text": " the lead singer of his family’s popular Motown group, the Jackson 5. H..."} ] } [/code] [b]Два текста:[/b] [code]$text1 = "Known as the “King of Pop,” Michael Jackson was a bet-selling American singer, songwriter, and dancer. As a child, Jackson becamv the lead singer of his family’s popular Motown group, the Jackson 5. H...";
$text2 = "Known as the “King of Pop,” Michael Jackson was a best-selling American singer, songwriter, and dancer. As a child, Jackson became the lead singer of his family’s popular Motown group, the Jackson 5. H..."; [/code] [b]Что я пробовал[/b] [list] [*]Библиотека Jfcherng\Diff (https: //github.com/jfcherng/php-diff): Я попробовал использовать библиотеку Jfcherng\Diff с пользовательским рендерингом для достижения желаемого результата. Однако он не обрабатывал неизмененные фрагменты текста должным образом и не разделял изменения на уровне слов должным образом.
[*]Unix diff через Shell_exec: Попытка использовать Unix diff через Shell_exec, чтобы сгенерировать различия и проанализировать выходные данные. Результаты были не в ожидаемом формате и включали дополнительные метаданные, не относящиеся к нашему варианту использования.
[*]Разделение текста вручную: Проверено вручную разбивать тексты на слова и сравнивать их, но такому подходу не хватало эффективности и точности.
[/list] [b]Текущая реализация кода [/b] Вот текущая реализация с использованием библиотеки Jfcherng\Diff: [code]
Я хочу получить максимальный алфавитный порядок по подстроке, поэтому мне нужен метод сравнения.
Для функции сравнения
from functools import cmp_to_key
def compare(a,b):
print(a,b, a+b,b+a,a+b>b+a)
return (a+b)>(b+a) # first comparing function
По сути, я пытаюсь создать небольшой инструмент в Java, где я беру текст из какого -то пользовательского ввода, думаю об обычном текстовом поле и создаю с ним файл PDF.
До сих пор мне удалось по -настоящему быстро скрасить что -то, зная о...
Я хочу построить график своих данных, но на кривой есть края, поэтому я пытаюсь сгладить ее, используя
полином (пробовал разные степени), сплайн или экспоненциальные функции, но есть несоответствие с исходными данными.
Вот коды и графики:
Данные...
я использую версию сервера: 8.0.40-0ubuntu0.22.04.1 (Ubuntu)
я создаю один источник и одну реплику
i запустите реплики, и они работают нормально
но в определенной позиции они остановились и Replica_IO_Running: Нет, но Replica_SQL_Running: Да
SHOW...