Как предотвратить преобразование регистра в нижний регистр в параметре результата.
Для примера у меня есть данные в индексе с именем content.name < /p>
"GSMFN-NS60LS - AKI GS ASTRA MF NS60LS untuk mobil Toyota Innova, Yaris, All New Yaris, New Vios, New Corolla Altis, Honda Civic, All New Accord, CRV, All New CRV, Mazda 2, dll"
Я хочу сгенерировать предложение на основе введенного мной ключевого слова с токеном преобразования в нижний регистр. Это означает, что если я ищу эти данные по ключевому слову «GSMFN-NS60» или «gsmfn-ns60», они показывают результат.
Но я хочу, чтобы в качестве результата предлагались исходные данные (без конвертации). ).
Например, если я хочу сгенерировать предложение по ключевому слову-опечатке «GSMFN-NS6», предложенный вариант — «GSMFN-NS60LS» в исходном регистре, а не преобразован в нижний регистр.
>
Кроме того, если я хочу получить предложение с ключевым словом «toyoto», в результате будет показано «Toyota», а не «toyota».
Спасибо
У меня есть настройка конфигурации и эластичный поиск по индексу сопоставления, например: [code]{ "settings": { "index.max_ngram_diff": 15, "analysis": { "tokenizer": { "suggestion_tokenizer": { "type": "pattern", "pattern": "[^a-zA-Z0-9/\\-\\+\\,\\.]+" } }, "filter": { "edge_ngram_filter": { "type": "edge_ngram", "min_gram": 2, "max_gram": 17, "token_chars": [ "letter", "digit", "symbol", "punctuation" ] }, "custom_word_delimiter_graph": { "type": "word_delimiter_graph", "preserve_original": true, "split_on_numerics": false, "split_on_case_change": false, "split_on_punctuation": true }, "custom_word_delimiter_graph_name": { "type": "word_delimiter_graph", "preserve_original": true, "split_on_numerics": true, "split_on_case_change": false, "split_on_punctuation": true, "generate_word_parts": true, "generate_number_parts": true }, "stop_words_filter": { "type": "stop", "stopwords": [ "list-stop-words" ] }, "unique_filter": { "type": "unique" } }, "analyzer": { "name_suggestion_analyzer": { "type": "custom", "tokenizer": "suggestion_tokenizer", "filter": [ "lowercase", "asciifolding", "stop_words_filter", "unique_filter" ] } } } }, "mappings": { "properties": { "content": { "properties": { "name": { "type": "text", "fields": { "suggestion": { "type": "text", "analyzer": "name_suggestion_analyzer" } } } } } } } } [/code] И мой поиск по запросу выглядит следующим образом: [code]{ "suggest": { "text": "{{query}}", "name-suggestion": { "text": "{{query}}", "phrase": { "field": "content.name.suggestion", "size": 1, "gram_size": 3, "direct_generator": [ { "field": "content.name.suggestion", "suggest_mode": "always" } ], "highlight": { "pre_tag": "", "post_tag": "" } } } } } [/code] Как предотвратить преобразование регистра в нижний регистр в параметре результата. Для примера у меня есть данные в индексе с именем content.name < /p> [code]"GSMFN-NS60LS - AKI GS ASTRA MF NS60LS untuk mobil Toyota Innova, Yaris, All New Yaris, New Vios, New Corolla Altis, Honda Civic, All New Accord, CRV, All New CRV, Mazda 2, dll" [/code] Я хочу сгенерировать предложение на основе введенного мной ключевого слова с токеном преобразования в нижний регистр. Это означает, что если я ищу эти данные по ключевому слову «GSMFN-NS60» или «gsmfn-ns60», они показывают результат. Но я хочу, чтобы в качестве результата предлагались исходные данные (без конвертации). ). Например, если я хочу сгенерировать предложение по ключевому слову-опечатке «GSMFN-NS6», предложенный вариант — «GSMFN-NS60LS» в исходном регистре, а не преобразован в нижний регистр. > Кроме того, если я хочу получить предложение с ключевым словом «toyoto», в результате будет показано «[b]Toyota[/b]», а не «toyota». Спасибо
У меня есть рекурсивный алгоритм, который проходит через строку, символ по символу и анализирует его для создания деревьев, подобной структуре. Я хочу иметь возможность отслеживать индекс символов, в котором в настоящее время находится синтаксис...
Я получаю строку JSON из Интернета; как и большинство JSON, которые я видел, он включает длинные ключи, разделенные подчеркиванием. По сути, моя цель — десериализовать JSON в Java-объекты, но я не использую символы подчеркивания в Java-коде....
Сейчас я использую книгу «Автоматизируйте скучные вещи, чтобы изучить Python». Приложение A предлагает мне ввести этот код в мой терминал ( pip3 install --user –r automate-mac-requirements.txt --user ), но получаю ошибки, связанные с Pyzmail36....
Я использовал пробелы и был доволен этим. Все еще есть. Затем я заметил, что есть еще что-то, называемое переносом текста. Где-то в Интернете я видел, что последнее не поддерживается браузером. Однако это не входит в планы на будущее и не устарело...