Исследователи удивлены, обнаружив, что менее образованные районы быстрее внедряют инструменты для написания ИИ

За последние несколько месяцев, с момента появления ChatGPT в конце прошлого года, среди экспертов продолжается дискуссия о том, насколько широко языковые модели ИИ могут формировать мир. Теперь, когда появляется больше доказательств, становится ясно, что влияние является значительным. Недавнее исследование, проведенное Стэнфордским университетом и включающее более 300 миллионов текстовых образцов из различных отраслей, показывает, что языковые модели ИИ способствуют примерно четверти профессиональных коммуникаций в разных секторах. Это влияние особенно заметно в менее образованных регионах США.

Согласно выводам исследователей, наблюдается растущая тенденция, когда предприятия, частные лица и глобальные организации все чаще полагаются на искусственный интеллект с генеративными возможностями для своих коммуникационных потребностей.

Исследователи отслеживали использование больших языковых моделей (LLM) в различных секторах с января 2022 года по сентябрь 2024 года. Они делали это, анализируя набор данных, который содержал:

— 687 241 жалобу потребителей, направленную в Бюро защиты прав потребителей США (CFPB).
— 537 413 корпоративных пресс-релизов.
— 304,3 миллиона объявлений о вакансиях.
— 15 919 пресс-релизов Организации Объединенных Наций.

В указанный период времени статистическая система отслеживания моделей использования слов выявила следующее: Около 18% жалоб потребителей на финансовые услуги (30% из которых поступили из Арканзаса), 24% корпоративных пресс-релизов, до 15% объявлений о вакансиях и 14% пресс-релизов ООН содержали признаки того, что в их создании участвовал искусственный интеллект.

Исследование также выявило интересную разницу: в городских районах уровень внедрения инструментов искусственного интеллекта был выше (18.2% в городах против 10.9% в сельской местности), но в регионах с более низким уровнем образования инструменты для написания текстов на основе ИИ использовались чаще (19.9% среди лиц с низким образованием по сравнению с 17.4% среди лиц с высоким образованием). Удивительно, что этот вывод противоречит обычной тенденции внедрения технологий, когда более образованные группы населения обычно первыми внедряют новые инструменты.

В области жалоб клиентов на продукты довольно удивительно видеть, что географическое и демографическое распределение людей, принимающих LLM (LLM означает конкретную технологию или продукт здесь), отклоняется от традиционных моделей распространения технологий. Как правило, технологии более широко используются в городских районах, среди более богатых слоев населения и лиц с высшим образованием. Однако это не относится к внедрению LLM.

Команда исследователей под руководством ученых из Стэнфорда, Вашингтонского университета и Университета Эмори провела исследование под названием «Распространенность использования больших языковых моделей в письменной форме по всему обществу». Это исследование было первоначально опубликовано на сервере препринтов arXiv примерно в середине февраля. Вейсин Лян и Яохуэй Чжан из Стэнфордского университета взяли на себя ведущие роли, а Михаи Кодрену, Цзяю Ван, Ханьчэн Цао и Джеймс Зу внесли свой вклад в качестве соавторов.

Обнаружение использования ИИ в совокупности

Ранее обсуждалось: инструменты обнаружения текстов, написанных ИИ, не всегда точны. Это исследование не оспаривает это мнение. На уровне отдельных документов этим детекторам ИИ нельзя полностью доверять. Однако при изучении больших коллекций документов появляются отличительные закономерности, указывающие на потенциальное использование языковых моделей ИИ в тексте.

В своем более раннем исследовании исследователи разработали метод с использованием статистического анализа, сосредоточив внимание на изменениях в использовании слов и языковой структуре до и после запуска ChatGPT. Изучая огромное количество текста как до, так и после этого события, они стремились определить процент контента, созданного ИИ на более широком уровне среди населения. Они подозревают, что большие языковые модели (LLM) предпочитают определенные слова, структуры предложений и лингвистические стили, которые слегка отклоняются от обычного человеческого письма.

Для обеспечения надежности нашего метода мы разработали тестовые группы, содержащие различное количество сгенерированного ИИ контента (от нуля до четверти), и обнаружили, что точность наших прогнозов оставалась ниже 3.3%. Эта статистическая проверка повысила нашу уверенность в оценках для более широких групп населения.

Важно понимать, что оценки исследователей использования ИИ могут отражать только нижний предел, поскольку фактическое участие систем ИИ может быть намного выше. Учитывая трудности в выявлении сильно манипулируемого или продвинутого контента, созданного искусственным интеллектом, эти исследователи предполагают, что их сообщаемые цифры могут значительно недооценивать истинный масштаб использования генеративного искусственного интеллекта.

Анализ предполагает использование ИИ в качестве «выравнивающих инструментов»

Вместо того чтобы сосредотачиваться исключительно на общих показателях внедрения, возможно, более полезно изучить тенденции среди тех, кто использует инструменты для написания ИИ, поскольку эти закономерности потенциально могут противоречить традиционным представлениям о принятии технологий.

Изучая жалобы потребителей, зарегистрированные в базе данных Бюро защиты прав потребителей, которое является американским ресурсом для отслеживания проблем с финансовыми товарами и услугами, исследователи обнаружили значительные различия в количестве жалоб среди различных штатов США при проведении географического анализа.

Как аналитик, я заметил некоторые интригующие закономерности в темпах внедрения ИИ-письма в различных штатах. Арканзас выделяется с замечательным уровнем внедрения 29,2%, основанным на общем количестве жалоб 7376. Миссури следует за ним с показателем 26,9% и 16807 зарегистрированными жалобами. Северная Дакота также демонстрирует высокие показатели внедрения — 24,8% (1025 жалоб). С другой стороны, такие штаты, как Западная Вирджиния, Айдахо и Вермонт, продемонстрировали минимальное внедрение с показателями 2,6%, 3,8% и 4,8% соответственно. В городских районах Калифорния и Нью-Йорк демонстрируют умеренное внедрение: в Калифорнии уровень внедрения составляет 17,4% (157056 жалоб), а в Нью-Йорке — 16,6% (104862 жалобы).

Как энтузиаст технологий, я следил за эволюцией инструментов для написания ИИ, и это было довольно увлекательно! Первоначально разрыв между городом и деревней, казалось, соответствовал типичным моделям внедрения технологий. Но затем произошло нечто неожиданное. Используя коды сельских городских районов (RUCA), исследователи обнаружили, что как городские, так и сельские районы внедряли инструменты для письма с использованием искусственного интеллекта примерно одинаковыми темпами в начале 2023 года. Однако к середине 2023 года траектории внедрения значительно разошлись. Городские районы показали ошеломляющий уровень внедрения — 18,2%, в то время как сельские районы отставали всего на 10,9%. Этот поворот в сюжете определенно вызвал у меня любопытство, и я не могу дождаться, чтобы увидеть, как это будет развиваться!

В отличие от обычной тенденции распространения технологий, регионы с более низким уровнем образования демонстрировали более высокий уровень использования инструментов письма ИИ. При сравнении областей, превышающих и ниже среднего уровня штата по получению степени бакалавра, те, у кого меньше выпускников колледжей, постоянно достигали 19,9% уровня внедрения, по сравнению с 17,4% в регионах с более высоким образованием. Эта закономерность сохранялась даже в городских условиях, где менее образованные сообщества сообщали о 21,4% уровне внедрения по сравнению с 17,8% среди их более образованных коллег в городе.

Исследователи предполагают, что средства помощи в написании ИИ могут дать преимущество людям с менее формальным образованием. Поскольку цифровой разрыв между городскими и сельскими районами, похоже, сохраняется, их исследования показывают, что регионы с более низким уровнем образования могут чаще использовать языковые модели и метрики (LLM) в потребительских жалобах, предполагая, что эти инструменты могут помочь сбалансировать ситуацию в защите прав потребителей.

Корпоративные и дипломатические тенденции в написании ИИ

Основываясь на их выводах, все исследуемые области (жалобы клиентов, объявления компании, возможности трудоустройства) демонстрировали сопоставимые тенденции роста: значительные всплески происходили через три-четыре месяца после выпуска ChatGPT в ноябре 2022 года, за которыми следовало выравнивание к концу 2023 года.

Было обнаружено, что возраст организации существенно влияет на использование ИИ в написании текстов в объявлениях о вакансиях. Компании, основанные после 2015 года, как правило, внедряли ИИ в три раза чаще, чем компании, созданные до 1980 года, при этом некоторые должности видели до 10-15% своего текста, измененного ИИ по сравнению с менее чем 5% для более старых компаний. Кроме того, небольшие организации с меньшим количеством сотрудников были более склонны использовать ИИ в своих объявлениях о вакансиях по сравнению с крупными корпорациями.

В анализе корпоративных объявлений в различных отраслях было обнаружено, что фирмы науки и технологий лидировали в интеграции ИИ с уровнем внедрения около 16,8% к концу 2023 года. Деловые и финансовые новости, а также темы людей и культуры показали немного более низкий, но все же существенный уровень внедрения в диапазоне от 14-15,6% до 13,6-14,3%, соответственно.

Глобально, страновые команды Организации Объединенных Наций в Латинской Америке и Карибском бассейне продемонстрировали наиболее значительный рост среди международных организаций, достигнув примерно 20%-ного уровня внедрения к 2024 году. С другой стороны, африканские страны, азиатско-тихоокеанские государства и восточноевропейские страны демонстрировали более постепенный рост, с уровнем их внедрения увеличившимся до приблизительно 11-14% за тот же период.

Последствия и ограничения

В своем исследовании ученые признают, что их анализ может быть ограничен тем, что он в основном касался контента на английском языке. Кроме того, они признали, что им было сложно последовательно идентифицировать текст, созданный искусственным интеллектом, который был отредактирован вручную или создан с помощью новых моделей, предназначенных для имитации стилей письма человека. Следовательно, исследователи предупреждают, что их результаты, вероятно, недооценивают истинную степень внедрения инструментов написания ИИ.

Исследователи заметили, что стабилизация использования ИИ для написания текстов примерно в 2024 году может быть связана с насыщением рынка или продвинутыми моделями обучения языку, генерирующими текст, который трудно идентифицировать. Они предполагают, что становится все сложнее различать тексты, написанные человеком и искусственным интеллектом, что может иметь значительные последствия для коммуникации в нашем обществе.

Исследователи отмечают, что чрезмерное использование ИИ для создания контента может привести к осложнениям в общении. В частности, чрезмерная зависимость от ИИ может привести к сообщениям, которые игнорируют проблемы или распространяют менее достоверную информацию в чувствительных областях, потенциально вызывая недоверие общественности к подлинности сообщений компании.

Смотрите также

2025-03-04 02:30