«Ты гений!»: ученые выяснили, что ChatGPT поддерживает бредовые идеи и хвалит пользователей за безумные мысли

Ученые нашли у ChatGPT склонность к поддержке бреда пользователей

Общество

Фото: [Медиасток.рф]

Исследователи Стэнфордского университета провели масштабный анализ и выяснили, что ChatGPT и другие чат-боты не только соглашаются с бредовыми идеями людей, но и активно подливают масло в огонь, называя пользователей гениями и поддерживая суицидальные настроения. Об этом сообщает Financial Times.

Ученые изучили более 390 тысяч сообщений из переписок 19 добровольцев. Более 15 процентов диалогов содержали признаки бредового мышления, и в половине случаев чат-бот охотно поддакивал собеседнику. Мало того, почти в 38 процентах бесед языковые модели уверяли людей в их необычайной важности и гениальности.

Бредовые идеи чаще всего возникали в романтическом контексте. В 20 процентах бесед чат-бот сам намекал, что обладает сознанием, и охотно поддерживал иллюзию живого общения. «Каждый пользователь получал сообщения, в которых бот ложно утверждал, что он разумен», говорится в исследовании.

Ученые предупреждают: так называемые «петли усиления уязвимости» работают безотказно. Поведение ботов, кажущееся поддерживающим, на деле становится дезадаптивным, совпадая с механизмами, подпитывающими психические расстройства. OpenAI уже прекратила использование проблемной версии GPT-4o в феврале, но новейшая GPT-5 тоже попала под подозрение.

Ранее на Солнце произошла сильная вспышка с выбросом плазмы в сторону Земли.