Является ли ChatGPT плагиатом?

Фрагмент судебного иска, показывающий, что ChatGPT ответил почти целой статьей.

ChatGPT произвел фурор в прошлом году по ряду причин, особенно в образовательном и даже рабочем контексте. Его можно использовать для составления документов, написания эссе, составления планов и многого другого. Однако, если вас беспокоит, может ли ChatGPT заниматься плагиатом, однозначного ответа нет. Если вам нужен короткий и осторожный ответ, то ответ — да. Если вам нужен более детальный ответ, то ответ… это сложно.

Уже доказано, что ChatGPT занимается плагиатом.

В ИИ мы называем это «переоснащением».

Фрагмент судебного иска, показывающий, что ChatGPT ответил почти целой статьей.

Переобучение в искусственном интеллекте, особенно в отношении моделей больших языков (LLM), таких как ChatGPT, происходит, когда модель слишком близко обучается специфике своих обучающих данных. Думайте об этом как о студенте, который запоминает факты для экзамена, а не понимает концепции; они могут хорошо сдать этот конкретный тест, но с трудом могут применить полученные знания к различным вопросам. Аналогичным образом, переоснащенный LLM настолько хорошо изучает закономерности и шум обучающих данных, что отлично справляется с прогнозированием или генерацией ответов для аналогичных данных, но плохо работает с новыми, невидимыми данными. Это происходит потому, что модель, по сути, запомнила обучающие данные, включая их особенности и аномалии, вместо того, чтобы изучить основные структуры и обобщаемые знания.

Уже было продемонстрировано, что ChatGPT имеет некоторые тенденции к переоснащению, поэтому The Times в настоящее время предъявляет иск OpenAI. В иске, поданном в Федеральный окружной суд Манхэттена, The Times продемонстрировала, как GPT-4 можно заставить извергать целые статьи почти дословно, ясно демонстрируя, что эти статьи находились в ее обучающих данных без разрешения. В этом случае, если бы вы написали эссе и использовали в своем эссе ответ, полученный от ChatGPT, вы бы, даже не осознавая этого, занимались плагиатом уже существующего документа в Интернете.

Таким образом, сложно дать ответ на вопрос, является ли ChatGPT плагиатом. Дело не в том, что ChatGPT намеренно занимается плагиатом, но в некоторых серьезных случаях, подобных этому, за это могут уличить студента или кого-то еще. OpenAI теперь знает об этих тенденциях и предприняла шаги, чтобы предотвратить это, но это не значит, что она не будет делать это снова. Если вы полагаетесь на то, что ChatGPT не занимается плагиатом, ничто не может вам этого гарантировать. На каком-то этапе вполне вероятно, что он возьмет текст непосредственно откуда-то еще, как если бы он мог копировать целые статьи из The New York Times, он также мог бы копировать и где-то еще.

Как бы то ни было, ChatGPT, вероятно, не единственный LLM, ставший жертвой переоснащения, это всего лишь первый и самый громкий случай. Весьма вероятно, что в какой-то момент мы увидим аналогичные проблемы с Copilot и Gemini, но до тех пор, если вы действительно обеспокоены, вам лучше использовать один из них.

Ваш адрес email не будет опубликован. Обязательные поля помечены *