Кто из нас не помнит слова Юрия Энтина, написанные им более 30 лет назад: «…До чего дошёл прогресс — труд физический исчез, да и умственный заменит механический процесс…»? Однако только сейчас технологии действительно позволяют заменить умственный труд механическим процессом — точнее статистической обработкой данных с помощью методов глубокого машинного обучения, которую сейчас принято называть искусственным интеллектом. Итак, студент РГГУ Александр Жадан защитил дипломную работу, которая была написана за 23 часа при активной помощи проекта компании Open AI под названием ChatGPT. Впрочем, защитил он свою работу на троечку (удовлетворительно).
Из мира ChatGPT
Возможно, история началась с неудачи Microsoft с чат-ботом Tay, который компания выпустила в Twitter еще в 2016 году. Чат очень быстро начал обучаться языку общения естественных интеллектов, и, в результате, стал писать расистские и сексистские высказывания. Чтобы не вызывать ненужного ажиотажа компания Microsoft тогда отключила Tay от общения с миром в течении первого дня жизни. Разработчики учли этот неудачный опыт и, похоже, сделали следующие выводы: нельзя связывать экспериментальные технологии с брендом Microsoft; нельзя самому искусственному интеллекту перенимать опыт у людей; нельзя давать доступ к искусственному интеллекту всем подряд.
В результате сделанных выводов и родился ChatGPT, который формально разработала компания Open AI, однако располагается бот в облаке Azure и вряд ли был сделал без опыта экспертов Microsoft в разработке искусственного интеллекта. Кроме того, уже сейчас Microsoft обсуждает инвестиции до 10 млрд долл. в разработчика этого чат-бота, компанию Open AI, хотя с момента запуска сервиса — ноябрь 2022 года — прошло всего несколько месяцев. Причем Microsoft уже объявила об интеграции ChatGPT в свой поиск Bing, что как бы намекает на близкие отношения между компаниями. Впрочем, пока протестировать эту интеграцию достаточно сложно — вас ставят в лист ожидания на тестирование, и когда подойдет ваше время- неизвестно. И, да — россиянам ChatGPT совсем не рад, то есть подключиться к нему из России официально не получиться.
Впрочем, более серьезные изменения были сделаны на уровне технологий. Теперь никакого самообучения — ChatGPT реализован на базе уже проверенной предобученной библиотеки GPT-3.5, который дополнительно был обучен с учителем и с подкреплением. В обоих случаях использовались люди. Для обучения с учителем тренеры составляли диалоги как за работа так и за посетителя, на базе которых ИИ уже составлял собственные фразы. Качество сгенерированных ИИ реплик уже оценивали следующие эксперты, которые стимулировали ИИ с помощью подкрепления формировать развернутый ответ на поставленный вопрос. К тому же ChatGPT может писать коды программ на различных языках программирования, только важно правильно и корректно сформулировать вопрос.
Прорыв в спихотехнике
Весь процесс написания диплома Александр Жадан описал в своем Twitter. Заявленная тема диплома была «Анализ и совершенствование управления игровой компании», и на первом этапе студент попросил бота составить ему план диплома. Получив ответ, он направил составленный искусственным интеллектом план научному руководителю. Пришел ответ — доработать план в соответствии с правилами. Студент послал боту методичку по правильному составлению планов и попросил доработать текст в соответствии с ее требованиями. В результате, план был согласован.
Далее введение и теоретическую части удалось сгенерировать с помощью запроса по теме с дополнительными уточнениями. С основными частями — второй и третьей — были проблемы, поскольку в них требовался получение и анализ данных конкретной компании с подготовкой практических рекомендаций. Для этого была использована аналогичная дипломная работа, написанная про другую компанию. При этом ChatGPT изменил все названия, показатели и фактическую составляющую под указанную студентом компанию. При этом удалось добиться оригинальности диплома в 82%.
По словам автора на написание диплома с помощью ChatGPT ушло 23 часа, из которых около 15 часов потребовалось на общение с самим ботом, а ещё 9 часов заняло редактирование полученного текста. Дипломная комиссия и научный руководитель отметили некоторую несвязность изложение и нарушение логики русского языка, но поставили оценку «удовлетворительно». По результатам принятой работы руководство РГГУ предложило ограничить доступ к ChatGPT в образовательных организациях. Однако фактически доступ к технологии и так сильно ограничен — ChatGPT недоступен на территории Китая, Россия, Белоруссии, Афганистана, Венесуэлы, Ирана, Украины и некоторых других стран. Это ограничение самой компании Open AI, так что российском научному сообществу не чего бояться.
Приговор
Следует отметить, что искусственный интеллект — это такой же инструмент, как, например, очки, однако никому сейчас в голову не придет запрещать очки только потому что они помогают готовить дипломы людям с ограниченным зрением. Однако оказалось, что вся система научного знания хорошо автоматизируется с помощью механического процесса для умственной работы — искусственного интеллекта. Действительно, он позволяет адаптировать уже давно известные результаты под новые условия, затушевать отсутствие новизны с помощью многостраничных банальных рассуждений и цитат из классиков и тем самым симулировать бурную научную деятельность.
Беда в том, что именно так и работает современная наука. Именно такие материалы сейчас и готовит большинство естественных интеллектов, которые составляют как российское, так и мировое научное сообщество. Они компилируют тексты из фрагментов ранее опубликованных работ, сопровождая сборную солянку ссылками и цитатами, а потом добавляют небольшую изюминку своего опыта и выдавая полученное блюдо за что-то эксклюзивное и неизведанное. Случай с ChatGPT лишь показал, что подобную деятельность можно легко алгоритмизировать и имитировать, а Александр Жадан просто показал как это можно легко сделать с помощью существующих облачных сервисов.
В качестве рекомендаций для учебных и научных заведений хотелось быть предложить включить в состав дипломных, кандидатских, докторских и других комиссий специалистов по искусственному интеллекту, которые могли бы по артефактам текста понять, что перед ними сгенерированный, а не написанный вручную документ. Кроме того, в помощь комиссиям стоит разработать искусственный интеллект, который сможет разобрать ключевые элементы предлагаемой работы и оценить их новизну — похоже простой антиплагиат уже не справляется. Еще было бы неплохо сделать так, чтобы научная работа не требовала длинного перечисления банальных истин, а могла быть сформулирована в виде краткого документа на одну страничку, которую может прочитать и, главное, понять каждый участник защиты.