«Билайн» в сотрудничестве с одним из отечественных производителей серверного оборудования ведет работу над улучшением решений, предназначенных для инференса – процесса выполнения задач уже обученными моделями искусственного интеллекта.
Оператор разрабатывает программное обеспечение для инфраструктуры, которое станет частью полного программно-аппаратного комплекса, рассказал «Ведомостям» заместитель гендиректора по IT «Вымпелкома» (бренд «Билайн») Антон Рубенчик. Этот комплекс в будущем позволит различным компаниям разворачивать у себя ИИ-модели. Планируется, что «Билайн» сможет размещать подобные серверы в собственных центрах обработки данных, предоставляя к ним доступ по модели аренды для корпоративных клиентов.
Речь идет о сотрудничестве с компанией OpenYard, которая специализируется на производстве серверного оборудования, сообщил изданию источник. Представитель OpenYard подтвердил факт ведения переговоров с несколькими операторами связи, включая «Билайн», однако детали обсуждений раскрывать не стал.
Как известно, обучение ИИ-моделей требует значительных вычислительных мощностей, в частности, использования тысяч графических ускорителей (GPU), однако на сегодняшний день в России пока не налажено производство оборудования такого уровня. Зато для последующего использования обученной модели – то есть на этапе инференса – требования к вычислительным ресурсам снижаются, и задействовать можно менее мощную технику.
В РФ разработкой оборудования, подходящего для инференса, занимаются «Сбер», «Яндекс», OpenYard, а также стартапы. При этом основой таких решений остаются чипы иностранного производства – в основном это американские GPU, попавшие в страну до 2022 года, включая продукцию Nvidia, AMD (серия Instinct MI), а также в меньшем объеме — Intel.
Антон Рубенчик также отметил, что на рынке наблюдается растущий интерес к аренде серверов с GPU, однако далеко не все клиенты готовы платить за такие ресурсы. По его словам, хотя инференс технически возможен и на обычных серверах, существующие решения пока не позволяют добиться сопоставимого с GPU-оборудованием качества работы.
Эксперты отмечают, что инициатива «Билайна» и OpenYard может вылиться в полноценную услугу по аренде серверных мощностей с поддержкой развертывания ИИ, востребованную на рынке. Потенциальными клиентами такого сервиса станут банки, телеком- и IT-компании, а также крупные промышленные предприятия, которым нужны решения для автоматизации, аналитики и цифрового контроля. Для компаний с тысячами сотрудников стоимость такой услуги может достигать 100–200 млн рублей в год, а с учетом планируемого роста мощности российских ЦОДов до эквивалента 70 000 GPU Nvidia A100 к 2030 году, инвестиции в эту инфраструктуру могут составить от $1,5 до $2 млрд. Электронная подпись: как не стать жертвой мошенников Как машинное обучение меняет ландшафт борьбы с мошенничеством в рекламной сфере NGFW: останется только один. Недостатки и дружественные решения