В середине января молодая японская писательница Рие Кудан, получившая престижную литературную премию Акутагавы за книгу «Токийская башня сочувствия», без стеснений заявила, что писала эту работу с помощью генеративного искусственного интеллекта (ИИ).
При этом она уточнила, что ChatGPT является «автором» примерно 5% текста книги, а к искусственному интеллекту она прибегает, в основном, для «высвобождения творческой энергии». Может ли ИИ составить конкуренцию представителям творческих профессии, например, поэтам и писателям, или даже заменить их. Об этом в материале Forbes.
Признание Рие Кудан широко разошлось по литературным и технологическим СМИ, придав новый импульс дискуссии о том, может ли ИИ заниматься творчеством и насколько новые технологии угрожают творческим профессиям — таким как поэты, сценаристы, музыканты и писатели. Угроза со стороны искусственного интеллекта стала одной из самых горячих тем на Франкфуртской книжной ярмарке.
Не все демонстрируют такую умеренность в использовании ИИ, как юная японская писательница. Проблема бесконтрольных продаж книг, созданных нечеловеческим разумом, достигла таких масштабов, что Amazon ввел новые ограничения для продаж самостоятельно издаваемых книг, написанных для Kindle — теперь их можно продавать не больше трех в день.
До того, как в нашу жизнь ворвался ChatGPT, которым массово начали пользоваться добросовестные и не очень писатели, студенты и юристы, было принято считать, что умение создавать — главное, что отличает человека от машины. Однако новый тип искусственного интеллекта (ИИ) — генеративный — уже поставил уникальность человеческого сознания под сомнение.
Мы переходим от эпохи, где ИИ в основном использовался для понимания больших данных, к новой — к той, где ИИ используется для создания контента. Но действительно ли машина на такое способна?
«Аналитическая машина не претендует на создание чего-либо. Она может делать все, что мы можем ей предписать. Ее задача — помочь нам сделать доступным то, с чем мы уже знакомы», — говорила Ада Лавлейс, создательница первой в мире компьютерной программы. Ее слова все еще актуальны, так как генеративный ИИ — это алгоритмы, обучившиеся на огромном количестве данных. Любой результат их работы — это последствие анализа информации.
Как научить нейросети творчеству
Некоторые исследователи определяют креативность как процесс, который приводит к созданию новой и полезной идеи или продукта. Поэтому один из критериев, по которому оценивают креативность — уровень новизны. Однако это субъективное понятие, на основе которого сложно получить четкую измерительную шкалу.
В 2018 году на аукционе Christie's портрет Эдмона де Белами, написанный ИИ, продали за 432 500 долларов. Это почти в 45 раз превышает максимальную оценку произведения. Объективно авторство этой работы принадлежит тем, кто курировал работу ИИ, — арт-группе Obvious. Команда собрала базу данных изображений, написала алгоритм и обучила нейросеть, чтобы получить тот результат, который и представили на аукционе. Это и отличает творчество ИИ от человеческого — оно носит систематический, а не импульсивный характер, как это свойственно людям.
Люди, для которых придумывать — это профессия, используют множество техник креативного мышления: мозговой штурм, ТРИЗ (теория решения изобретательских задач), латеральное мышление, дизайн-мышление и другие. Задача этих методик — помочь придумать оригинальную идею, найти новое решение и в целом форсировать креативность.
Может ли искусственный интеллект использовать такие же подходы? Сложно сказать, потому что в своем текущем состоянии нейросети для человека — это черный ящик, пишет Nature, никто пока точно не знает, как именно происходят вычисления.
Все современные GPT-подобные модели созданы для того, чтобы имитировать чей-то стиль, и лучшего всего у них получается систематизировать огромное количество информации. Например, им неплохо удается писать новости, обзоры, сопроводительные письма и другого типа тексты, от которых требуется соответствие стандартным шаблонам. Но чем дальше развивается ИИ, тем больше компании ждут от него чего-то творческого. Однако легальных данных для обучения не так уж много.
В августе 2023 года на The Atlantic опубликовали расследование о том, что крупные компании используются пиратские источники для обучениях своих нейросетей. В июле того же года писатели Сара Сильверман, Ричард Кадри и Кристофер Голден подали иск, в котором утверждают, что Meta нарушила законы об авторском праве и использовала их книги для обучения своей большой языковой модели LLaMA (аналог GPT-4). Расследование журналиста Алекса Райснера показало, что компания действительно использовала пиратские книги в качестве исходных данных для обучения своих нейросетей — эта база называется Books3. Она содержит более 190 000 произведений. Правда, в ноябре судья отклонил иск писателей, сказав, что не нашел достаточно подтверждений, что модель использует именно их работы.
Так или иначе, не исключено, что череда исков от писателей стала одной из причин, по которым IT-компании начали нанимать поэтов, писателей, драматургов со степенью PhD или магистра, чтобы обучать нейросети. Стартап Scale AI, специализирующийся на создании датасетов, в своей вакансии пишет, что среди обязанностей писателя будут ранжирование ответов, полученных от ИИ, а также написание небольших рассказов по заданной теме. За это обещают платить 25–50 долларов в час в зависимости от уровня образования и опыта. Специалиста с аналогичными обязанностями искал недавно стартап Appen, который занимается разметкой данных.
Но это также может свидетельствовать о новой эре развития LLM (large language model, большая языковая модель): компании переходят от этапа создания к точечной настройке для конкретных приложений, то есть теперь «общие» LLM начинают тренировать под конкретный навык. И для этого, конечно, снова нужны данные.
Точечная настройка (fine-tuning) LLM позволяет предварительно обученную модель, которая уже знает некоторые закономерности в большом наборе данных, дообучить на меньшем наборе данных, специфичном для конкретной области. В перспективе это поможет нейросетям выполнять определенные задачи лучше своих «коллег» общего назначения. Например, можно попытаться научить нейросеть имитировать конкретно стиль Александра Пушкина, Шекспира или Джоан Роулинг.
По мнению Дмитрия Щиголева, управляющего партнера Sk Capital, огромный пласт задач ИИ связан с большей персонализацией производимого контента. «Например, в киноиндустрии ИИ-ассистент мог бы не только анализировать тысячи сценариев и предлагать нетривиальные повороты сюжета, но также учитывать предпочтения зрителей, — объясняет эксперт. — Или можно было бы запрограммировать ИИ, чтобы он регулировал автоматическую подстройку актерского состава фильма в соответствии с индивидуальными предпочтениями каждого зрителя. На рынке уже есть решения, генерирующие тексты песен или музыку под настроение». Отдельный сегмент рынка для применения ИИ, говорит Щиголев, это гейминг, где в режиме реального времени можно создавать интерактивные сюжеты и новых персонажей.
Больше, чем поэт
Кажется, что создавать стихотворения не такая уж сложная задача для генеративного интеллекта — нужно писать все те же стандартные тексты по определенному шаблону, но добавить ритм и/или рифму. К тому же, уже давно существует так называемая «найденная поэзия» (found poetry) — жанр, когда произведение создается с помощью заимствованных отрывков из других текстов. В середине XX века это было довольно популярное направление в конструктивном движении, а среди его популяризаторов были создатели машины сновидений Уильям Берроуз и Брайон Гайсин.
Но можно ли эти опыты считать произведениями искусства?
Первые опыты в области компьютерной поэзии относятся еще к середине XX века. Например, созданная Розмари Уэст программа POETRY GENERATOR или «автоматический скальд», появившаяся в СССР под руководством Раймунда Пиотровского. «В середине 2010-х языковые модели на основе рекуррентных нейросетевых архитектур и векторных семантических представлений позволили машинам производить на свет более-менее осмысленные тексты, стилизованные под произведения различных авторов. Так, в 2016 году команда сотрудников «Яндекса» под руководством Алексея Тихонова и Ивана Ямщикова дала жизнь проекту под названием «Нейронная оборона» — альбом в стиле [музыканта и поэта] Егора Летова», — рассказывает начальник Управления экспериментальных систем машинного обучения в Департаменте общих сервисов «Салют» Сбербанка Сергей Марков.
Исследователь в области когнитивной психологии и профессор Калифорнийского университета Кейт Холиок в своей колонке пишет, что ИИ не сможет быть настолько аутентичным, как настоящий поэт. Машине не хватает того, что есть у человека — личного опыта и накопленных воспоминаний. Однако программа может быть продуктивна в генерировании чего-либо. Профессор сравнивает этот процесс с теоремой о бесконечных обезьянах. Она гласит: «Если вы посадите бесконечное количество обезьян за пишущие машинки, то одна из них рано или поздно напечатает какое-либо произведение Уильяма Шекспира». Искусственный интеллект работает быстрее обезьяны и, вероятно, что-то имеющее подобие связного и осмысленного текста может придумать быстрее. Остается подождать, когда он сделает то, что международное экспертное сообщество признает шедевром.
Одна из распространенных претензий в адрес LLM: машина не понимает, о чем пишет, а просто предсказывает каждое следующее слово. Иногда в итоговом тексте даже прослеживается некий смысл или сюжетная линия, но, по сути, это просто результат анализа сотни тысяч похожих текстов. Порой фантазия нейросети не имеет ничего общего с реальностью, тогда она «галлюцинирует» — генерирует недостоверную информацию, например, сообщает, что статуя Свободы находится в Калифорнии. Но в случае, если мы хотим добиться от машины не достоверных фактов, а нетривиальных творческих находок, эти «фантазии» могут быть даже полезны. «Иногда галлюцинации — это нужная характеристика, это называется творчеством. А иногда это баг, — сказал недавно CEO Microsoft Сатья Наделла. — Мы все пытаемся лучше научиться этим пользоваться».
Технологии развивались, и ИИ учился все больше имитировать работу человека. В 2013 году поэт Оскар Шварц вместе с другом Бенджамином Лэйрдом создали тест Тьюринга для поэзии. Пользователю нужно было ответить, кто написал стихотворение: человек или алгоритм. В результате выяснилось, что 65% людей приняли созданные алгоритмом тексты за написанные человеком стихотворения. При этом тест Тьюринга считается пройденным, если машине удалось ввести человека в заблуждение хотя бы в 30% случаев.
Однако нынешних исследователей творческих возможностей генеративных моделей пока не вполне удовлетворяет результат.
Во-первых, та самая новизна, которая является одним из критериев для оценки качества поэзии, пишет Rest of World, по определению не является сильной стороной языковых моделей, ведь они обучены только воспроизводить созданное человеком.
Во-вторых, воспроизводят они тоже с проблемами — попытки научить машину писать, как классик американской поэзии Уолт Уитмен пока провалились — вместо свойственной поэту свободной и лишенной четкой структуры формы искусственные интеллект упорно предлагал стройные четверостишия, даже после инструкции, которая это прямо запрещала. Стихотворения на английском языке ИИ хотя бы научился писать в рифму и со смыслом, в других языках проблемы есть и с этим, отмечает Rest of World. Издание приводит в пример исследование ученых, довольно безуспешно пытавшихся научить ИИ писать традиционные японские хайку.
При этом, если голливудские сценаристы бастуют, требуя жесткого регламентирования использования искусственного интеллекта, а авторы книжных бестселлеров, такие как Джорж Мартин, подают против создателей генеративных моделей иски, то о протестах поэтов пока ничего не слышно. Вероятно, поэтическое творчество сейчас не такая прибыльная и популярная профессия, чтобы страх потерять эту работу мог вывести людей на улицы. В то же время, технологические компании, занимающиеся разработкой ИИ хотя бы начали их нанимать.
Дмитрий Щиголев считает, что речь о вытеснении человека с рынка труда из-за высокого уровня развития ИИ пока не идет: «В этом году мы были свидетелями забастовок в Голливуде, в том числе на фоне прогресса развития ИИ-технологий и их использования в творческой сфере. Окончательный ландшафт использования ИИ, в том числе в творческих сферах, еще не сформировался. Однако в этом контексте будущего речь скорее идет о партнерстве, чем о конкуренции».