Две, казалось бы, одинаковые строки дают разные результаты grep?Linux

Ответить Пред. темаСлед. тема
Anonymous
 Две, казалось бы, одинаковые строки дают разные результаты grep?

Сообщение Anonymous »

Я проверял, существует ли строка в tsv-файле, используя grep. Я дважды скопировал строку на клавиатуре. В первый раз команда grep не возвращает совпадений, во второй раз она возвращает 705 совпадающих строк. Я не вижу, чем строки отличаются друг от друга. У них разные контрольные суммы SHA при проверке с терминала, но идентичные контрольные суммы при проверке с помощью сценария bash.
Я искал строку «GO:0005739» в tsv-файле. Я скопировал эту строку на свою клавиатуру из онлайн-презентации Powerpoint в Microsoft Office 365. Затем я набрал:

Код: Выделить всё

grep "GO:0005739" test2.gff3
Это не дает никаких результатов. Сначала я думал, что строки просто нет в файле, хотя это было бы неожиданно. Я просмотрел файл в поисках других строк, например GO:0005762 и GO:0005763, а затем увидел строку GO:0005739, буквально записанную в записях моего файла. Ну, это странно, позвольте мне еще раз grep. На этот раз я печатаю:

Код: Выделить всё

grep "GO:0005739" test2.gff3
и это возвращает 705 совпадающих строк. Ну наверное какой-то персонаж странный из powerpoint? Я снова копирую то же самое из Powerpoint и снова запускаю grep, как и раньше, и теперь получаю 705 совпадений. Я понятия не имею, что происходит.
Я также скопировал две «разные» строки и запустил:

Код: Выделить всё

printf %s 'GO:0005739' | shasum -a 256
который печатает:

Код: Выделить всё

5fdb2994248a45016853bad4692c8c9a5892d91697f9b5ebb20ef4773ee6eaba  -
и

Код: Выделить всё

printf %s 'GO:0005739' | shasum -a 256
, который печатает: 5548fd969e5cb3acfc3db0c78e6dacdc2f0fcebc64ee64910a99ece74c9564eb  -
Я могу последовательно запускать эти две команды и получать разные контрольные суммы SHA со своего терминала, используя стрелку вверх, чтобы перейти к ранее выполненным командам и Я по-прежнему выдаю разные выходные данные grep при использовании каждой строки.
Странно то, что если я скопирую «две» команды из истории и запущу:

Код: Выделить всё

printf %s 'GO:0005739' | shasum -a 256
Я всегда получаю:

Код: Выделить всё

5548fd969e5cb3acfc3db0c78e6dacdc2f0fcebc64ee64910a99ece74c9564eb  -
Если я запускаю «две» команды из сценария bash, я также получаю ту же контрольную сумму SHA. Я также вставил «две» строки в http://asciivalue.com/, чтобы посмотреть, различаются ли коды ascii, но они оба идентичны. Кто-нибудь раньше сталкивался с чем-то подобным? Может быть, есть какой-то особый персонаж, к которому каждый раз относятся по-разному?

Подробнее здесь: https://stackoverflow.com/questions/784 ... ep-results
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «Linux»