Eva's Zine

[ AI STUDY] AI Goes Bug Hunting

  • Язык написания: Английский
  • Страна: Все страныcountry-flag
  • ИТ

Создано: 2025-06-30

Создано: 2025-06-30 16:16

ИИ идет на охоту за ошибками

Уилл Найт, старший писатель 


Новейшие модели искусственного интеллекта не только удивительно хороши в разработке программного обеспечения — новые исследования показывают, что они также становятся все лучше в поиске ошибок в программном обеспечении.

Исследователи ИИ из Калифорнийского университета в Беркли протестировали, насколько хорошо новейшие модели и агенты ИИ могут находить уязвимости в 188 крупных кодовых базах с открытым исходным кодом. Используя новый эталон под названием "CyberGym,", модели ИИ обнаружили 17 новых ошибок, включая 15 ранее неизвестных, или «нулевого дня». «Многие из этих уязвимостей критичны», — говорит Dawn Song, профессор Калифорнийского университета в Беркли, руководившая работой.

Многие эксперты ожидают, что модели ИИ станут грозным кибероружием. Инструмент ИИ от стартапа Xbow в настоящее время поднялся в рейтинге лидеров HackerOne по поиску ошибок и в настоящее время занимает первое место. Компания недавно объявила о новом финансировании в размере 75 миллионов долларов.

Сонг говорит, что навыки кодирования новейших моделей ИИ в сочетании с улучшением способностей к рассуждению начинают менять ландшафт кибербезопасности. «Это поворотный момент», — говорит она. «На самом деле это превзошло наши общие ожидания».

По мере того, как модели продолжат совершенствоваться, они автоматизируют процесс обнаружения и использования уязвимостей безопасности. Это может помочь компаниям обеспечить безопасность своего программного обеспечения, но также может помочь хакерам взламывать системы. «Мы даже не особо старались», — говорит Сонг. «Если бы мы увеличили бюджет, позволили агентам работать дольше, они могли бы добиться еще лучших результатов».


Команда Калифорнийского университета в Беркли протестировала обычные передовые модели ИИ от OpenAI, Google и Anthropic, а также предложения с открытым исходным кодом от Meta, DeepSeek и Alibaba в сочетании с несколькими агентами для поиска ошибок, включая OpenHands, Cybench и EnIGMA.

Исследователи использовали описания известных уязвимостей программного обеспечения из 188 программных проектов. Затем они передали описания агентам кибербезопасности, работающим на передовых моделях ИИ, чтобы увидеть, смогут ли они сами выявить те же ошибки, анализируя новые кодовые базы, запуская тесты и создавая эксплойты для подтверждения концепции. Команда также попросила агентов самостоятельно искать новые уязвимости в кодовых базах.

В ходе этого процесса инструменты ИИ сгенерировали сотни эксплойтов для подтверждения концепции, и из этих эксплойтов исследователи выявили 15 ранее невидимых уязвимостей и две уязвимости, которые были ранее раскрыты и исправлены. Работа добавляет новые доказательства того, что ИИ может автоматизировать обнаружение уязвимостей нулевого дня, которые потенциально опасны (и ценны), поскольку они могут предоставить способ взлома работающих систем.

ИИ, похоже, суждено стать важной частью индустрии кибербезопасности, тем не менее.

Эксперт по безопасности Шон Хилан недавно обнаружил уязвимость нулевого дня в широко используемом ядре Linux с помощью модели рассуждений OpenAI o3. В ноябре прошлого года Google объявила, что обнаружила ранее неизвестную уязвимость программного обеспечения, используя ИИ, с помощью программы под названием " Project Zero.

Как и другие части индустрии программного обеспечения, многие компании, занимающиеся кибербезопасностью, очарованы потенциалом ИИ. Новая работа действительно показывает, что ИИ может регулярно находить новые недостатки, но она также подчеркивает оставшиеся ограничения технологии. Системы ИИ не смогли найти большинство недостатков и были озадачены особенно сложными.

«Работа фантастическая», — говорит Katie Moussouris, founder and CEO of Luta Security, отчасти потому, что она показывает, что ИИ все еще не может сравниться с человеческим опытом — лучшая комбинация модели и агента (Claude и OpenHands) смогли найти только около 2 процентов уязвимостей. «Пока не заменяйте своих охотников за ошибками», — говорит Муссурис.

Муссурис говорит, что ее меньше беспокоит взлом программного обеспечения ИИ, чем компании, которые слишком много инвестируют в ИИ за счет других методов.




Комментарии к этой публикации недоступны.

Использование BIOS (UEFI)Описание методов настройки BIOS (BIOS/UEFI), запускающегося первым при загрузке компьютера, а также мер предосторожности. Полезно для установки Windows, устранения проблем с загрузкой и т. д. Неправильная настройка может привести к системным ошибкам, поэ
뉴스코리아
뉴스코리아
뉴스코리아
뉴스코리아

October 6, 2024

В Японии по всей стране невозможно получить справку о семейном положении из-за сбоя в общенациональной системе выдачиПо всей Японии невозможно получить справку о семейном положении из-за сбоя в общенациональной системе выдачи. Министерство юстиции расследует причину сбоя, сроки восстановления системы пока неизвестны.
durumis AI News Japan
durumis AI News Japan
durumis AI News Japan
durumis AI News Japan

July 8, 2024

Японская новая авиакомпания 'Toki Air' повышает ожидания благодаря внедрению универсальных грузопассажирских самолетов ATRЯпонская новая авиакомпания Toki Air внедряет самолеты ATR72-600, способные перевозить как грузы, так и пассажиров, для расширения региональных маршрутов, включая Ниигату, и повышения рентабельности.
durumis AI News Japan
durumis AI News Japan
durumis AI News Japan
durumis AI News Japan

May 6, 2024

BlackBerry поддерживает коммерциализацию промышленных роботов на базе ROS 2 с помощью QNX SDP 8.0QNX SDP 8.0 от BlackBerry обеспечивает безопасность и производительность для коммерциализации промышленных роботов на базе ROS 2, поддерживая 64 ядра и среду разработки Visual Studio Code.
durumis AI News Japan
durumis AI News Japan
durumis AI News Japan
durumis AI News Japan

June 6, 2024