Простой способ использования GAN (или аналогичного метода) для генерации правдоподобно звучащих английских «слов».Python

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Простой способ использования GAN (или аналогичного метода) для генерации правдоподобно звучащих английских «слов».

Сообщение Anonymous »

У меня есть такой корпус:

Код: Выделить всё

corpus = ['and', 'bug', 'buttons', 'aluminium', 'soda', 'fruit', 'bakery', 'writing', 'humanitarian']
Он намного больше, хотя и содержит тысячи английских слов.
Я хочу:
  • Обучите модель предлагать новые текстовые строки, которые звучат так, будто они могут быть английскими словами (на самом деле они могут таковыми, а могут и не быть, но все звучат как английские слова). Итак, если я запущу модель, я могу получить обратно ['кромулент', 'эмбиггинс', 'пещера', 'двухфурнатный', 'тухель', 'кремлинг']
  • Оцените предложенное слово в зависимости от того, насколько оно похоже на английский. Так, например, если бы я запустил эту функцию f для нескольких работ, я бы получил результаты ниже
.

Код: Выделить всё

f('cromulent') # This will return 0.9 as it is a good fake word.

f('azayataz') # This will return 0.4 as it is a pretty bad fake word and doesn't sound like English.

f('wtrpkmnxrt') # This will return 0 as it is an awful word.
Может ли кто-нибудь предложить простой и легкий способ сделать это? В идеале я пытаюсь найти что-то, что:
  • Относительно простое. Я понимаю, что современный уровень развития подобных проблем с ИИ, скорее всего, будет очень сложным. Если возможно, я надеялся, что есть простой способ добиться этого, даже если он работает значительно хуже, чем открытый искусственный интеллект, Google и т. д.
  • Реализуется на Python.< /li>
    Не полагается ни на какие источники данных или корпуса, кроме предоставленного мной корпуса. Это сделано для того, чтобы логику можно было легко адаптировать к другим языкам или корпусам.
Вопросы по теме:
  • Как определить, сгенерирована ли строка случайным образом или это английское слово? - Здесь запрашиваются настоящие английские слова (в этом случае вам просто нужен словарь), а не слова, звучащие по-английски. Кроме того, предлагаемые решения основаны на словарях или лингвистических правилах, а не на машинном обучении.
  • В этой ветке Reddit Ян Гудфеллоу (изобретатель GAN) предположил, что это невозможно, поскольку текст является дискретным, а не непрерывным. . Однако это было 9 лет назад, и в машинном обучении многое изменилось, так что, возможно, это уже не так.


Подробнее здесь: https://stackoverflow.com/questions/790 ... sounding-e
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «Python»