Искусственный интеллект может пройти тест Тьюринга в прямых чатах и казаться более человечным, чем мы. Я теперь напуган.

Искусственный интеллект сейчас настолько продвинут, что может убедительно имитировать человеческую беседу. Недавнее исследование в Калифорнийском университете в Сан-Диего показало, что GPT-4.5 превосходил реальных людей в обмане судей в обстановке живого чата, заставляя их поверить, что они общаются с другим человеком.

💰

"Рынок красный? Это просто сезон скидок для умных инвесторов." - так говорят, чтобы не плакать. У нас — аналитика, которая помогает плакать реже.

Найти недооцененные активы

Этот вызов был более сложным, чем типичный тест. Судьи оценивали беседы по мере их происшествия, принимая быстрые решения, основываясь исключительно на сказанном.

Что действительно поражает, так это то, как легко проявляется эта способность. ИИ не требует физической формы, голоса или даже предыстории – ему просто нужно убедительно имитировать манеру речи человека.

Как ИИ прошел человеческий тест?

В этом исследовании участники взаимодействовали как с человеком, так и с ИИ, а затем должны были определить, кто из них является реальным человеком.

Когда GPT-4.5 была дана конкретная роль для исполнения, её ошибочно принимали за человека в 73% случаев. LLaMa-3.1-405B также показала замечательные результаты, будучи идентифицированной как человек в 56% случаев при использовании того же типа запроса.

Эти статистические данные подчеркивают значимость этого открытия. ИИ не просто остался незамеченным; он предоставил достаточно реалистичных социальных сигналов, благодаря которым судьи восприняли его как участника разговора.

Почему этот тест все еще имеет значение?

Тест Тьюринга — это давний метод определения того, может ли машина убедительно имитировать человеческую беседу. В своей первоначальной форме судья общается как с человеком, так и с машиной, не зная, кто есть кто, и затем пытается определить человека.

Всегда больше внимания уделялось созданию заявления, чем предоставлению точной оценки. Однако это все еще эталон, который большинство людей используют, чтобы увидеть, может ли программа убедительно действовать как человек.

Это улучшение делает ответы чат-бота более мгновенными и естественными. Оно не требует, чтобы чат-бот был действительно разумным или испытывал эмоции — ему просто нужно *казаться*, что в данный момент отвечает реальный человек.

Потенциальные опасности возникают в повседневных ситуациях. Такие вещи, как обслуживание клиентов, приложения для знакомств, социальные сети, образование и политическая коммуникация, все зависят от принятия быстрых решений о том, кто люди, чего они хотят и насколько они искренни.

Что нам посмотреть следующим?

Это исследование не утверждает, что чат-боты действительно понимают людей. Вместо этого оно показывает, что определенные модели могут убедительно *изображать* понимание, особенно в коротких беседах.

Становится всё более важным чётко определять, когда люди взаимодействуют с ИИ. Поскольку боты становятся более разговорчивыми, пользователям нужны лучшие способы понимать, что они не разговаривают с человеком, особенно в ситуациях, когда бот пытается повлиять на них или разговор касается деликатных чувств.

Следующий бой касается маркировки в чатах, где люди быстро принимают решения о доверии.

Смотрите также

2026-05-20 15:58