Для поиска ошибок в программном обеспечении и сервисах компания Microsoft использует модель машинного обучения. По словам Скотта Кристиансена, старшего программного менеджера по безопасности, 47 тысяч разработчиков ежемесячно генерируют около 30 тысяч багов, и отслеживать их при помощи только традиционной маркировки и расстановки приоритетов довольно проблематично.
В настоящее время Microsoft использует 20-летние исторические данные по 13 миллионам рабочих элементов и багов, чтобы создать модель машинного обучения, которая в 99% случаев правильно классифицирует ошибки, связанные с безопасностью. Эта модель призвана помочь разработчикам точно определять и расставлять приоритеты для критически важных проблем безопасности, которые требуется исправить.
«Нашей целью было создать систему машинного обучения, которая классифицирует баги на связанные / несвязанные с безопасностью и на критические / некритические с уровнем точности, максимально приближенном к уровню эксперта по безопасности», — объясняет Кристиансен.
Эксперты по безопасности и специалисты по данным совместно с Microsoft работали над созданием модели, которая постоянно переобучается с новыми данными, проверенными экспертами по безопасности. По словам представителей компании, созданная модель в 99% случаев точно выявляет ошибки безопасности в в 97% случаев правильно их маркирует.