Работа в сотрудничестве с международным вычислительным центром для обнаружения в Департаменте операций безопасности моделей мошеннических инцидентов.

Безопасность — это самая важная проблема сегодняшнего дня, когда корпорации и правительства изо всех сил пытаются найти правильное решение, которое поможет командам по обработке данных и экспертам по безопасности устранять угрозы. Чтобы помочь экспертам по безопасности, нам нужно ввести еще один элемент, который будет использоваться для предварительного анализа информации, чтобы они могли принимать решения лучше и быстрее.

Что нам нужно здесь использовать, так это обучить элемент, способный автоматически расследовать инциденты и знать, куда они ведут, на основе важнейших характеристик, установленных бизнесом. Эта автоматическая работа есть не что иное, как система обработки машинного обучения.

Сотрудничество с Организацией Объединенных Наций

В сотрудничестве с ООН мы создали выдающуюся модель, которая может снизить утомляемость экспертов по безопасности и повысить ценность бизнеса в целом.

Мы разработали конвейер ML, чтобы выяснить, какая модель лучше работает для бизнеса и как эти модели могут повысить уровень точности за счет получения более высокой размерности из исходного набора данных.

Это сравнение в используемых моделях, среди прочего, включает SVC, XGBoost и сложные конфигурации нейронной сети с LSTM.

После всех процессов, описанных здесь, нам было интересно сделать этот вывод и окончательный анализ.

Была проведена интенсивная работа по подготовке набора данных из разных источников, и мы могли бы также спроектировать его и начать процесс обучения.

Помимо слабого набора данных, есть еще возможности для улучшения. Мы видим, что после выбора базовой модели мы нашли еще 3 модели, способные предложить лучшие решения. Максимальное рассчитанное значение имеет точность около 80%, что неплохо, учитывая предоставленные данные. Важно отметить, что эта точность будет возможна только в том случае, если мы предложим модели правильные функции. В этом случае были полезны анализ потока, времени и целевого кодирования.

Следующие шаги и будущие исследования

Есть еще некоторые идеи, которые можно добавить для будущих возможностей. Во-первых, было бы интересно получить больше данных, из которых мы могли бы получить больше разнообразия, из которого можно было бы лучше понять бизнес. Более того, предоставьте лучшую модель. Мы не могли полностью использовать особенности стран, которые было бы интересно изучить, поскольку геолокация может быть важной функцией для понимания того, является ли конкретный инцидент ложным срабатыванием или нет.

Области улучшений включают настройку конвейера создания временной пакетной модели цикла. Таким образом, модель можно обучать для разных периодов времени, а не только для указанных месяцев. Более того, таким образом проект будет обновлять свои параметры, чтобы поддерживать высокий уровень точности, пока бизнес меняется между новыми периодами времени.

Исраэль Льоренс ©

https://www.linkedin.com/in/israel-llorens/