Как предварительно обрабатывать образцы кода для нейронной сети для обнаружения сгенерированного AI-кода? [закрыто]

Как предварительно обрабатывать образцы кода для нейронной сети для обнаружения сгенерированного AI-кода? [закрыто] ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Как предварительно обрабатывать образцы кода для нейронной сети для обнаружения сгенерированного AI-кода? [закрыто]

Цитата

Сообщение Anonymous » 07 июн 2025, 13:07

Я строю детектор плагиата для определения сгенерированного AI-кода на таких платформах, как Codeforces. Я скрещивал 1193 образцов кода, сгенерированных человеком и AI (Python, C ++, Java) для тех же проблем. Моя цель - обучить нейронную сеть (например, Codebert или LSTM), чтобы различить их. Я токенизировал код, используя токен-модуль Python, но не уверен, как обрабатывать многоязычный код или преобразовать его в такие функции, как ASTS или Enterdings. Как лучше всего предварительно обрабатывать эти образцы для модели бинарной классификации? Я использую Python и Pytorch, любые советы об извлечении функций или таких инструментах, как Tree-Sitter, помогут!

Подробнее здесь: https://stackoverflow.com/questions/796 ... rated-code

1749290834

Anonymous

 Я строю детектор плагиата для определения сгенерированного AI-кода на таких платформах, как Codeforces. Я скрещивал 1193 образцов кода, сгенерированных человеком и AI (Python, C ++, Java) для тех же проблем. Моя цель - обучить нейронную сеть (например, Codebert или LSTM), чтобы различить их. Я токенизировал код, используя токен-модуль Python, но не уверен, как обрабатывать многоязычный код или преобразовать его в такие функции, как ASTS или Enterdings. Как лучше всего предварительно обрабатывать эти образцы для модели бинарной классификации? Я использую Python и Pytorch, любые советы об извлечении функций или таких инструментах, как Tree-Sitter, помогут!  

Подробнее здесь: [url]https://stackoverflow.com/questions/79656833/how-to-preprocess-code-samples-for-a-neural-network-to-detect-ai-generated-code[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Модель нейронной сети в проблеме прогнозирования Pytorch для обнаружения аномалий в моделируемой ирригационной системе

Последнее сообщение Anonymous « 02 июн 2025, 20:20
Добавлено в форуме Python

Anonymous » 02 июн 2025, 20:20 » в форуме Python

Я работаю над своим окончательным проектом исследований, который обнаруживает аномалии в ирригационной системе.
Мы смоделировали ирригационную сеть в ограниченной среде, как вы можете видеть на фотографии ниже. Модель, которую мы создали
Существует...

0 Ответы

3 Просмотры

Последнее сообщение Anonymous
02 июн 2025, 20:20
Оценка времени как критерия завершения обучения последовательной нейронной сети Keras

Последнее сообщение Гость « 19 сен 2023, 23:31
Добавлено в форуме Python

Гость » 19 сен 2023, 23:31 » в форуме Python

Я разработал модель нейронной сети, показанную ниже, которая имеет два скрытых слоя с 19 узлами. Первоначальная активация — «тан».

Как видите, у меня было два первоначальных критерия обратного вызова. Первый из них основан на EarlyStopping, если...

0 Ответы

87 Просмотры

Последнее сообщение Гость
19 сен 2023, 23:31
Почему этот код возвращает ошибку о форме нейронной сети?

Последнее сообщение Anonymous « 24 окт 2023, 16:35
Добавлено в форуме Python

Anonymous » 24 окт 2023, 16:35 » в форуме Python

Когда я попробовал запустить этот код:-

импортировать панд как pd импортировать тензорный поток как tf из sklearn.model_selection импорт train_test_split набор данных = pd.read_csv ( /content/dataset/cancer.csv ) x = dataset.drop(columns = ) y =...

0 Ответы

68 Просмотры

Последнее сообщение Anonymous
24 окт 2023, 16:35
Почему этот код возвращает ошибку о форме нейронной сети?

Последнее сообщение Anonymous « 23 ноя 2023, 18:46
Добавлено в форуме Python

Anonymous » 23 ноя 2023, 18:46 » в форуме Python

Когда я попробовал запустить этот код:-

импортировать панд как pd импортировать тензорный поток как tf из sklearn.model_selection импорт train_test_split набор данных = pd.read_csv ( /content/dataset/cancer.csv ) x = dataset.drop(columns = ) y =...

0 Ответы

51 Просмотры

Последнее сообщение Anonymous
23 ноя 2023, 18:46
Проблема со слоем softmax в нейронной сети C++

Последнее сообщение Anonymous « 31 дек 2023, 20:25
Добавлено в форуме C++

Anonymous » 31 дек 2023, 20:25 » в форуме C++

Я реализовал простую нейронную сеть на C++. Кажется, он работает нормально для плотно связанных слоев, но у меня возникают проблемы при добавлении слоя softmax для классификации.

Сама функция softmax, которая генерирует значения активации на...

0 Ответы

42 Просмотры

Последнее сообщение Anonymous
31 дек 2023, 20:25

Вернуться в «Python»