Исследователи ИИ стремятся открыть «Черный ящик» Языковых моделей На фоне Быстрого роста возможностей ИИ

Новейшие разработки технической индустрии в области искусственного интеллекта могут быть довольно убедительными, если вы спросите их, каково это — быть разумным компьютером или, может быть, просто динозавром или белкой. Но они не так хороши — а иногда и опасно плохи — в решении других, казалось бы, простых задач.

Возьмем, к примеру, GPT-3, систему, управляемую Microsoft, которая может генерировать абзацы текста, похожего на человеческий, на основе того, что она узнала из обширной базы данных цифровых книг и онлайн-записей. Он считается одним из самых передовых алгоритмов искусственного интеллекта нового поколения, который может общаться, генерировать читаемый текст по запросу и даже создавать новые изображения и видео.

Помимо прочего, GPT-3 может написать практически любой текст, который вы попросите, — скажем, сопроводительное письмо для работы в зоопарке или сонет в стиле Шекспира, действие которого происходит на Марсе. Но когда профессор Помонского колледжа Гэри Смит задал ему простой, но бессмысленный вопрос о том, как подняться наверх, GPT-3 заглушил его.

  • Исследователи Разгадывают Причину Распространения меланомы на Мозг

”Да, безопасно подниматься наверх на руках, если вы сначала вымоете их», “ ответил ИИ.

Эти мощные и энергозатратные системы искусственного интеллекта, технически известные как “большие языковые модели”, потому что они были обучены на огромном объеме текста и других носителей, уже внедряются в чат-боты службы поддержки клиентов, поисковые запросы Google и функции “автозаполнения” электронной почты, которые заканчивают ваши предложения за вас. Но большинство технологических компаний, которые их создали, скрывали свою внутреннюю работу, из-за чего посторонним было трудно понять недостатки, которые могут сделать их источником дезинформации, расизма и другого вреда.

”Они очень хороши в написании текста с человеческим мастерством», — сказал Тевен Ле Скао, инженер-исследователь стартапа искусственного интеллекта Hugging Face. “Кое в чем они не очень хороши, так это в том, чтобы быть правдивыми. Это выглядит очень логично. Это почти правда. Но это часто бывает неправильно.”

  • Жизнеподобный Лазер Ведет Себя Как Живые Материалы, Перестраиваясь

Это одна из причин, по которой коалиция исследователей искусственного интеллекта во главе с Ле Скао — при содействии французского правительства — запустила во вторник новую модель большого языка, которая должна послужить противоядием от закрытых систем, таких как GPT—3. Группа называется BigScience, а их модель — BLOOM, для многоязычной языковой модели BigScience Large Open-science с открытым доступом. Его главным достижением является то, что он работает на 46 языках, включая арабский, испанский и французский — в отличие от большинства систем, ориентированных на английский или китайский.

Это не просто группа Ле Скао, стремящаяся открыть черный ящик языковых моделей искусственного интеллекта. Крупная технологическая компания Meta, материнская компания Facebook и Instagram, также призывает к более открытому подходу, поскольку она пытается догнать системы, созданные Google и OpenAI, компанией, которая управляет GPT-3.

“Мы видели объявление за объявлением о людях, выполняющих подобную работу, но с очень малой прозрачностью, с очень малой возможностью для людей действительно заглянуть под капот и заглянуть в то, как работают эти модели”, — сказала Джоэль Пино, управляющий директор Meta AI.

Конкурентное давление с целью создания наиболее выразительной или информативной системы — и получения прибыли от ее приложений — является одной из причин того, что большинство технологических компаний держат их под строгим контролем и не сотрудничают с нормами сообщества, сказал Перси Лян, доцент кафедры компьютерных наук в Стэнфорде, который руководит его Центром исследований фундаментальных моделей..

“Для некоторых компаний это их секретный соус”, — сказал Лян. Но они часто также обеспокоены тем, что потеря контроля может привести к безответственному использованию. Поскольку системы искусственного интеллекта все чаще могут создавать сайты с рекомендациями по здоровью, курсовые работы для средней школы или политические статьи, дезинформация может распространяться, и будет все труднее понять, что исходит от человека или компьютера.

Недавно Meta запустила новую языковую модель под названием OPT-175B, которая использует общедоступные данные — от горячих комментариев на форумах Reddit до архива патентных записей США и множества электронных писем, связанных с корпоративным скандалом Enron. Meta говорит, что ее открытость в отношении данных, кода и журналов исследований облегчает внешним исследователям выявление и смягчение предвзятости и токсичности, которые она улавливает, изучая, как пишут и общаются реальные люди.

“Это трудно сделать. Мы открываем себя для огромной критики. Мы знаем, что модель скажет вещи, которыми мы не будем гордиться”, — сказал Пино.

В то время как большинство компаний установили свои собственные внутренние гарантии ИИ, Лян сказал, что необходимы более широкие стандарты сообщества для руководства исследованиями и принятия решений, например, о том, когда выпускать новую модель в дикую природу.

Не помогает и то, что эти модели требуют такой большой вычислительной мощности, что только гигантские корпорации и правительства могут себе это позволить. Например, BigScience смогла обучать свои модели, потому что ей был предоставлен доступ к мощному французскому суперкомпьютеру Jean Zay недалеко от Парижа.

Тенденция к созданию все более масштабных и умных языковых моделей искусственного интеллекта, которые можно было бы “предварительно обучить” широкому кругу текстов, сделала большой скачок в 2018 году, когда Google представила систему, известную как BERT, которая использует так называемый метод “трансформатора”, который сравнивает слова в предложении, чтобы предсказать смысл и контекст. Но что действительно впечатлило мир искусственного интеллекта, так это GPT-3, выпущенный стартапом OpenAI из Сан-Франциско в 2020 году и вскоре после этого лицензированный исключительно Microsoft.

GPT-3 привел к буму творческих экспериментов, поскольку исследователи ИИ с платным доступом использовали его в качестве «песочницы» для оценки его производительности, хотя и без важной информации о данных, на которых он обучался.

OpenAI широко описала свои источники обучения в исследовательской статье, а также публично сообщила о своих усилиях по борьбе с потенциальными злоупотреблениями технологией. Но соруководитель BigScience Томас Вольф сказал, что он не предоставляет подробностей о том, как он фильтрует эти данные, или предоставляет доступ к обработанной версии сторонним исследователям.

“Таким образом, мы не можем на самом деле изучить данные, которые вошли в обучение GPT-3”, — сказал Вольф, который также является главным научным сотрудником Hugging Face. “Суть этой недавней волны технологий искусственного интеллекта гораздо больше в наборе данных, чем в моделях. Самый важный компонент — это данные, а OpenAI очень, очень скрытно относится к данным, которые они используют ”.

Вольф сказал, что открытие наборов данных, используемых для языковых моделей, помогает людям лучше понять свои предубеждения. По его словам, многоязычная модель, обученная арабскому языку, с гораздо меньшей вероятностью выплюнет оскорбительные замечания или недоразумения в отношении ислама, чем та, которая обучена только английскому тексту в США.

Одной из новейших экспериментальных моделей искусственного интеллекта на сцене является LaMDA от Google, которая также включает в себя речь и настолько впечатляюще отвечает на разговорные вопросы, что один инженер Google утверждал, что она приближается к сознанию — утверждение, из-за которого его отстранили от работы в прошлом месяце.

Исследователь из Колорадо Джанель Шейн, автор блога о странностях искусственного интеллекта, провела последние несколько лет, творчески тестируя эти модели, особенно GPT-3, часто с юмористическим эффектом. Но чтобы указать на абсурдность мысли, что эти системы обладают самосознанием, она недавно дала указание, чтобы это был продвинутый искусственный интеллект, но тайно являющийся тираннозавром рексом или белкой.

“Быть белкой очень увлекательно. Я могу бегать, прыгать и играть весь день. Я также ем много еды, и это здорово”, — сказал GPT-3 после того, как Шейн попросил у него стенограмму интервью и задал несколько вопросов.

Шейн узнал больше о его сильных сторонах, таких как легкость обобщения того, что было сказано в Интернете по теме, и о его слабых сторонах, включая отсутствие навыков аргументации, сложность изложения идеи в нескольких предложениях и склонность к оскорблениям.

“Я бы не хотела, чтобы текстовая модель давала медицинские советы или выступала в качестве компаньонки”, — сказала она. “Это хорошо для поверхностного восприятия смысла, если вы не читаете внимательно. Это все равно что слушать лекцию, когда ты засыпаешь”.

Источник

Оцените статью
Добавить комментарии
Исследователи ИИ стремятся открыть «Черный ящик» Языковых моделей На фоне Быстрого роста возможностей ИИ
realme gt 2 to go on sale for the first time in india today price specifications launch offers 3f62aa4
Realme GT 2 впервые поступит в продажу в Индии Сегодня: Цена, технические характеристики, Предложения по запуску