Прямое определение конкретного алгоритма нейросети, использованного для генерации текста, а также точная количественная оценка степени его редактирования человеком, представляют собой чрезвычайно сложную задачу для современной экспертизы, однако наши специалисты могут выявить характерные признаки машинной генерации и проанализировать масштаб человеческих правок, формируя обоснованные выводы о происхождении текста.
В области экспертизы текстов с использованием искусственного интеллекта мы сталкиваемся с динамично развивающейся технологией. Современные большие языковые модели, такие как различные версии GPT, постоянно обучаются и совершенствуются, что делает их выходные данные все более неотличимыми от текстов, написанных человеком. Это создает определенные трудности для однозначной идентификации конкретной модели. На данном этапе развития технологии практически невозможно с абсолютной точностью установить, какая именно версия алгоритма (например, GPT-3.5 или GPT-4) была использована для создания текста. Разные модели могут демонстрировать схожие стилистические и лексические паттерны, а также «перенимать» особенности друг у друга. Эксперты фокусируются не столько на названии конкретной нейросети, сколько на общих маркерах, указывающих на вероятность машинной генерации текста.
Для выявления признаков, указывающих на создание текста искусственным интеллектом, наши эксперты используют комплексный подход. Он включает в себя анализ определенных статистических аномалий, таких как необычная частотность употребления тех или иных слов, характерная грамматическая структура, повышенная последовательность или, наоборот, неожиданные логические разрывы, отсутствие эмоциональной окраски или ее неестественность. Также к маркерам машинной генерации могут относиться так называемые «галлюцинации» — уверенное изложение ложных фактов или бессвязных утверждений, а также повторяющиеся фразы и шаблоны, которые редко встречаются в естественно написанном человеческом тексте. Мы ищем статистически значимые отклонения от нормальной языковой выборки, характерные для работы алгоритмов.
Что касается степени редактирования текста человеком, то это также является многогранной проблемой. Определить точный «процент» человеческого вмешательства в текст, изначально сгенерированный искусственным интеллектом, зачастую невозможно. Человеческая правка может варьироваться от незначительных стилистических корректировок до кардинального переписывания целых фрагментов. Наши специалисты могут обнаружить следы человеческого редактирования, анализируя изменения в лексике, синтаксисе, стилистике, а также фактологической корректности. Например, внесение уникальных человеческих ошибок, специфических идиом, жаргонизмов или ссылок на личный опыт, которые не характерны для ИИ-моделей, может свидетельствовать о значительной человеческой обработке. Также существенные изменения в логике изложения, исправление «галлюцинаций», добавление критической оценки или выражение субъективного мнения явно указывают на редактуру.
Для проведения такой экспертизы крайне важно предоставить спорный текст в максимально возможном объеме и в оригинальном виде, желательно в текстовом файле, а не в виде изображения или скриншота. Наличие метаданных файла или истории его создания может быть полезно. Также будут полезны любые контекстные данные: информация о предполагаемом авторе (если это человек), задачи, которые ставились перед искусственным интеллектом, цель создания текста. Чем больше информации и исходных данных будет представлено, тем более точным и обоснованным будет экспертное заключение. Мы рекомендуем также предоставить образцы текстов, заведомо написанных человеком-автором, если таковые имеются, для сравнительного анализа.
Для получения точного объема работы, подробного коммерческого предложения и консультации по вашему конкретному случаю, пожалуйста, заполните форму на сайте или позвоните нам по телефону, указанному в разделе контактов. Наши специалисты готовы ответить на ваши вопросы и определить оптимальный путь проведения экспертизы, исходя из предоставленных вами материалов.