Sercompe Enterprise Know-how предоставляет основные облачные услуги примерно 60 корпоративным клиентам, поддерживая в общей сложности около 50 000 пользователей. Таким образом, очень важно, чтобы базовая ИТ-инфраструктура бразильской компании Joinville предоставляла надежные услуги с предсказуемо высокой производительностью. Но в сложной ИТ-среде, включающей более 2000 виртуальных машин и 1 петабайт (что эквивалентно миллиону гигабайт) управляемых данных, сетевым администраторам было сложно сортировать все данные и оповещения, чтобы выяснить, что происходит, когда возникают проблемы. всплыло. И было трудно обеспечить, чтобы емкость сети и хранилища была там, где они должны быть, или когда делать следующее обновление.

Чтобы помочь справиться со сложностью и повысить эффективность работы инженеров службы поддержки, Sercompe вложила средства в платформу операций искусственного интеллекта (AIOps), которая использует искусственный интеллект для выявления основной причины проблем и предупреждения ИТ-администраторов до того, как небольшие проблемы перерастут в серьезные. Теперь, по словам менеджера по облачным продуктам Рафаэля Кардосо, система AIOps выполняет большую часть работы по управлению своей ИТ-инфраструктурой, что является большим преимуществом по сравнению со старыми ручными методами.
«Выяснить, когда мне нужно больше места или емкости — раньше это было беспорядок. Нам нужно было получить информацию из стольких разных точек, когда мы планировали. Нам никогда не давали правильный номер», — говорит Кардосо. «Теперь у меня есть полное представление об инфраструктуре и визуализация от виртуальных машин до последнего диска в стойке». AIOps обеспечивает видимость всей среды.
До развертывания технологии Cardoso была там, где оказались бесчисленные другие организации: запутанная сеть ИТ-систем со взаимозависимостью между уровнями оборудования, виртуализацией, промежуточным программным обеспечением и, наконец, приложениями. Любые сбои или простои могут привести к утомительному ручному устранению неполадок и, в конечном итоге, к негативным последствиям для бизнеса: например, веб-сайт, который не будет работать, и раздражающие клиенты.
Платформы AIOps помогают ИТ-менеджерам справляться с задачей автоматизации ИТ-операций, используя ИИ для быстрого получения информации о том, как работает инфраструктура — области, которые работают, и области, которые могут вызвать событие простоя. Заслуга в создании термина AIOps в 2016 году принадлежит Gartner: это широкая категория инструментов, предназначенных для преодоления ограничений традиционных инструментов мониторинга. Платформы используют алгоритмы самообучения для автоматизации рутинных задач и понимания поведения отслеживаемых систем. Они извлекают информацию из данных о производительности, чтобы выявлять и отслеживать ненормальное поведение в ИТ-инфраструктуре и приложениях.
По оценкам исследовательской компании BCC Analysis, мировой рынок AIOps вырастет с 3 миллиардов долларов в 2021 году до 9,4 миллиардов долларов к 2026 году при совокупном ежегодном темпе роста 26%.1 Аналитики Gartner пишут в своем апрельском «Руководстве по рынку платформ AIOps», что Увеличение скорости внедрения AIOps обусловлено цифровым преобразованием бизнеса и необходимостью перехода от реагирования на проблемы инфраструктуры к упреждающим действиям.
«Поскольку объемы данных достигают или превышают гигабайты в минуту в дюжине или более различных областях, человек больше не может анализировать данные вручную», — пишут аналитики Gartner. Систематическое применение ИИ ускоряет получение информации и обеспечивает проактивность.

По словам Марка Эспозито, директора по обучению компании Nexus FrontierTech, занимающейся технологиями автоматизации, термин «AIOps» произошел от «DevOps» — культуры и практики разработки программного обеспечения, направленных на интеграцию разработки и эксплуатации программного обеспечения. «Идея состоит в том, чтобы поддерживать автоматизацию и мониторинг на всех этапах, от разработки программного обеспечения до управления инфраструктурой», — говорит Эспозито. Недавние инновации в этой области включают использование прогнозной аналитики для прогнозирования и решения проблем до того, как они смогут повлиять на ИТ-операции.
AIOps помогает инфраструктуре уйти на второй план
По словам Саураба Кулкарни, руководителя отдела разработки и управления продуктами в Hewlett Packard Enterprise, сетевым и ИТ-администраторам, которых беспокоят стремительно растущие объемы данных и растущая сложность, может понадобиться помощь. Кулкарни работает над HPE InfoSight, облачной платформой AIOps для упреждающего управления системами центров обработки данных.
«ИТ-администраторы тратят уйму времени на планирование своей работы, планирование развертывания, добавление новых узлов, вычислительных ресурсов, хранилищ и всего прочего. А когда в инфраструктуре что-то идет не так, устранить эти проблемы вручную крайне сложно», — говорит Кулкарни. «AIOps использует алгоритмы машинного обучения для просмотра шаблонов, изучения повторяющихся действий и извлечения уроков из них, чтобы предоставить быстрые рекомендации пользователю». Помимо узлов хранения, каждая часть ИТ-инфраструктуры отправит отдельное предупреждение, чтобы можно было быстро решить проблемы.
Система InfoSight собирает данные со всех устройств в среде заказчика, а затем сопоставляет их с данными от клиентов HPE с аналогичными ИТ-средами. Система может точно определить потенциальную проблему, поэтому она будет быстро решена — если проблема возникнет снова, исправление может быть применено автоматически. В качестве альтернативы система отправляет предупреждение, чтобы ИТ-специалисты могли быстро устранить проблему, добавляет Кулкарни. Возьмем случай с контроллером системы хранения, который вышел из строя из-за отсутствия питания. Вместо того, чтобы предполагать, что проблема связана исключительно с хранилищем, платформа AIOps исследует весь стек инфраструктуры, вплоть до прикладного уровня, чтобы определить основную причину.
«Система следит за производительностью и может видеть аномалии. У нас есть алгоритмы, которые постоянно работают в фоновом режиме, чтобы обнаруживать любое ненормальное поведение и предупреждать клиентов до того, как проблема возникнет», — говорит Кулкарни. Философия InfoSight заключается в том, чтобы «заставить инфраструктуру исчезнуть», объединив ИТ-системы и все данные телеметрии в одном окне. Глядя на один гигантский набор данных, администраторы могут быстро выяснить, что не так с инфраструктурой.

Кулкарни вспоминает трудности управления большой ИТ-средой с прошлых мест работы. «Мне приходилось управлять большим набором данных, мне приходилось звонить стольким разным поставщикам и оставаться в ожидании несколько часов, чтобы попытаться выяснить проблемы», — говорит он. «Иногда нам требовалось несколько дней, чтобы понять, что происходит на самом деле».
Автоматизируя сбор данных и используя множество данных для понимания основных причин, AIOps позволяет компаниям перераспределять основной персонал, включая ИТ-администраторов, администраторов систем хранения и сетевых администраторов, объединяя роли по мере упрощения инфраструктуры и тратя больше времени на обеспечение производительности приложений. «Раньше в компаниях было несколько ролей и разные отделы, занимающиеся разными вещами. Таким образом, даже для развертывания новой области хранения пять разных администраторов должны были выполнять свою работу по отдельности», — говорит Кулкарни. Но с AIOps ИИ выполняет большую часть работы автоматически, поэтому ИТ-персонал и персонал службы поддержки могут посвятить свое время более стратегическим инициативам, повышая эффективность и, в случае бизнеса, который оказывает техническую поддержку своим клиентам, увеличивая прибыль. Например, Кардосо из Sercompe удалось сократить среднее время, которое его инженеры службы поддержки тратят на звонки клиентов, что отражает улучшение качества обслуживания клиентов и повышение эффективности.
Obtain the полный отчет.
Этот контент был подготовлен Insights, подразделением MIT Know-how Evaluate по пользовательскому контенту. Это не было написано редакцией MIT Know-how Evaluate.