• Главная
  • Политика
  • Общество
  • Шоу-бизнес
  • Спорт
  • Авто
Чтение: Anthropic изучила «внутренний мир ИИ»: как языковые модели принимают решения
Поделиться
Уведомление Показать больше
Font ResizerAa
Font ResizerAa
  • Главная
  • Политика
  • Общество
  • Шоу-бизнес
  • Спорт
  • Авто
Search
  • Главная
  • Политика
  • Общество
  • Шоу-бизнес
  • Спорт
  • Авто
У вас есть существующая учетная запись? Войти
Подписывайтесь на нас
Технологии

Anthropic изучила «внутренний мир ИИ»: как языковые модели принимают решения

28.03.2025
2 мин. чтение

Anthropic изучила «внутренний мир ИИ»: как языковые модели принимают решения

Исследователи компании Anthropic придумали способ для изучения внутренних механизмов больших языковых моделей. Новый подход позволяет заглянуть в «черный ящик» ИИ и понять, как он принимает решения.

Исследователи использовали технику трассировки цепей, которая позволяет шаг за шагом отслеживать процессы принятия решений внутри большой языковой модели. Инженеры Anthropic использовали трассировку, чтобы наблюдать, как выполняет разные задачи большая языковая модель компании Claude 3.5 Haiku.

Инженеры рассказывают, что искали вдохновения в технологиях сканирования мозга, которые используют в нейробиологии. В результате им удалось создать «микроскоп», который можно направить на разные части модели во время работы. Эта техника выявляет компоненты, которые активны в разное время. Исследователи могут увеличивать масштаб различных компонентов и записывать, когда они активны, а когда нет.

Выяснилось, что языковые модели работают «даже более странно», чем считалось. Ученые обнаружили, что Haiku использует сложные, нелинейные стратегии. Например, при решении математических задач модель прибегает к непривычным промежуточным шагам, а при генерации стихов заранее «планирует» структуру текста, подбирая слова с учетом будущих строк.

Особый интерес вызвали наблюдения за механизмами так называемых «галлюцинаций» — случаев, когда модель генерирует недостоверную информацию. Исследователи пришли к выводу, что такие искажения возникают, когда отдельные внутренние цепочки начинают доминировать над компонентами, отвечающими за достоверность.

Мы, возможно, видим лишь несколько процентов того, что происходит внутри модели, но даже этого достаточно, чтобы заметить невероятно сложную внутреннюю структуру.
Джошуа Бэтсон, научный сотрудник Anthropic
Компания опубликовала две научные статьи по результатам наблюдений. В первой — подробно описан принцип изучения «внутреннего мира» ИИ. Во второй — первые результаты наблюдений.

ЧИТАЙТЕ ТАКЖЕ:





ПОМЕЧЕНО:Anthropicвнутренний мир ИИизучиламоделипринимаютрешенияязыковые
Комментариев нет Комментариев нет

Добавить комментарий Отменить ответ

Ваш адрес email не будет опубликован. Обязательные поля помечены *

ЛУЧШИЕ НОВОСТИ


СВЕЖИЕ НОВОСТИ

Программа Тверской области по модернизации коммунальной инфраструктуры одобрена на заседание президиума (штаба) Правительственной комиссии по региональному развитию
Политика
На Украине может закрыться крупнейший металлургический комбинат страны
Общество
«Ашан» направил заявку в Роспатент на регистрацию нового товарного знака
Общество
Астрономы нашли две планеты у звезды-близнеца Солнца
Технологии
Лукашенко предупредил об угрозе предмятежной ситуации в Белоруссии
Политика
Лиза Арзамасова впервые за долгое время заговорила о своих детях
Шоу-бизнес
Горячие соседи Приморья могут помириться
Политика
«Общественное»: Зеленский призвал делать на него ставки из-за Путина
Политика
В Китае нашли способ «обмануть» аналитиков, закупая СПГ без поднятия мировых цен на газ
Политика

Читайте также:

Технологии

В России запускают бакалавриат для создателей ИИ-технологий будущего

19.06.2024

Polestar 3 установил рекорд дальности поездки без подзарядки для внедорожников

14.08.2025
Технологии

Новая схема мошенников заражает смартфоны: как защитить себя и родственников

05.04.2025
Технологии

Нового рекорда на термоядерном синтезе добились в России

19.03.2025
Подписывайтесь на нас
Welcome Back!

Sign in to your account

Username or Email Address
Password

Забыли пароль?