Microsoft рассказала об использовании машинного обучения для поиска багов в ПО

Автор:

Для поиска ошибок в программном обеспечении и сервисах компания Microsoft использует модель машинного обучения. По словам Скотта Кристиансена, старшего программного менеджера по безопасности, 47 тысяч разработчиков ежемесячно генерируют около 30 тысяч багов, и отслеживать их при помощи только традиционной маркировки и расстановки приоритетов довольно проблематично.

В настоящее время Microsoft использует 20-летние исторические данные по 13 миллионам рабочих элементов и багов, чтобы создать модель машинного обучения, которая в 99% случаев правильно классифицирует ошибки, связанные с безопасностью. Эта модель призвана помочь разработчикам точно определять и расставлять приоритеты для критически важных проблем безопасности, которые требуется исправить.

«Нашей целью было создать систему машинного обучения, которая классифицирует баги на связанные / несвязанные с безопасностью и на критические / некритические с уровнем точности, максимально приближенном к уровню эксперта по безопасности», — объясняет Кристиансен.

Эксперты по безопасности и специалисты по данным совместно с Microsoft работали над созданием модели, которая постоянно переобучается с новыми данными, проверенными экспертами по безопасности. По словам представителей компании, созданная модель в 99% случаев точно выявляет ошибки безопасности в в 97% случаев правильно их маркирует.