Американский разработчик чипов и вычислительная фирма Nvidia в среду заявили, что объединяются с Microsoft для создания “массивного” компьютера для интенсивной вычислительной работы с искусственным интеллектом в облаке.
Компьютер с искусственным интеллектом будет работать в облаке Microsoft Azure, используя десятки тысяч графических процессоров (GPU), самые мощные чипы Nvidia H100 и A100. Nvidia отказалась сообщить, сколько стоит сделка, но отраслевые источники сообщили, что каждый чип A100 оценивается примерно от 10 000 долларов (почти 8 14 700 рупий) до 12 000 долларов (почти 9 77 600 рупий), а H100 намного дороже.
“Мы находимся на том переломном этапе, когда искусственный интеллект приходит на предприятия, и становится реальным предоставление тех сервисов, которые клиенты могут использовать для развертывания искусственного интеллекта в бизнес-сценариях”, — сказал агентству Reuters Иэн Бак, генеральный менеджер Nvidia по Hyperscale и HPC. “Мы наблюдаем широкий всплеск внедрения искусственного интеллекта… и необходимость применения искусственного интеллекта для корпоративных сценариев использования”.
В дополнение к продаже чипов Microsoft, Nvidia заявила, что будет сотрудничать с программным обеспечением и облачным гигантом для разработки моделей искусственного интеллекта. Бак сказал, что Nvidia также станет клиентом облачного компьютера Microsoft с искусственным интеллектом и будет разрабатывать на нем приложения с искусственным интеллектом, чтобы предлагать услуги клиентам.
Быстрый рост моделей искусственного интеллекта, таких как те, которые используются для обработки естественного языка, резко повысил спрос на более быструю и мощную вычислительную инфраструктуру.
Nvidia заявила, что Azure станет первым публичным облаком, использующим свою сетевую технологию Quantum-2 InfiniBand со скоростью 400 Гбит /с. Эта сетевая технология связывает серверы на высокой скорости. Это важно, поскольку для интенсивной вычислительной работы с искусственным интеллектом требуются тысячи чипов для совместной работы на нескольких серверах.
© Thomson Reuters 2022