Москва, Россия — 2 апреля 2019 г.
Группа Тинькофф построила собственный суперкомпьютер в рамках стратегии AI First и развития платформы для машинного обучения и искусственного интеллекта.
Суперкомпьютер «Колмогоров» предназначен для быстрого обучения моделей на больших массивах данных, накопленных Тинькофф за все годы существования компании (13 лет). Быстрые соединения между вычислительными узлами позволяют эффективнее использовать вычислительные ресурсы для распределенного обучения на огромных массивах данных.
«Колмогоров» позволит намного быстрее решать такие связанные с машинным обучением и искусственным интеллектом задачи, как
Благодаря кластеру «Колмогоров» задачи по обучению нейросетей выполняются в сотни раз быстрее: например, для задачи по оптимизации исходящих звонков мы за сутки переобучили модель, предсказывающую вероятность продажи финансовых продуктов на всем объеме накопленных за 13 лет данных. Переобучение модели традиционными способами заняло бы, по нашим расчетам, около 6 месяцев. Использование кластера позволяет бизнесу быстрее и эффективнее проверять гипотезы, улучшать сервисы и выводить новые продукты на рынок.
Суперкомпьютер «Колмогоров» имеет пиковую производительность 658,5 терафлопс при вычислениях с плавающей точкой двойной точности (FP64). Система состоит из 10 узлов, оснащенных передовыми вычислителями NVIDIA Tesla V100 со специализированными тензорными ядрами для ускорения задач искусственного интеллекта. Вычислительные узлы суперкомпьютера Тинькофф объединены современной высокоскоростной сетью 100 Гигабит с поддержкой технологии RoCE (RDMA over Converged Ethernet). Сочетание передовых технологий позволило кластеру достичь производительности 418,9 терафлопс в тесте Linpack, что обеспечило выход системы в лидеры рейтинга самых быстрых суперкомпьютеров страны.
В «Колмогорове» установлены точно такие же ускорители, как и в самом быстром суперкомпьютере в мире Summit (
Кластер «Колмогоров» стал частью платформы Тинькофф для машинного обучения и искусственного интеллекта. Платформа включает в себя следующие элементы:
Вячеслав Цыганов, директор по информационным технологиям Группы Тинькофф, прокомментировал: «Тинькофф давно закрепил за собой статус одного из технологических лидеров российского бизнеса: объем наших задач, связанных с машинным обучением и искусственным интеллектом, растет. Данная платформа создана в рамках стратегии AI First, при которой все продукты, выпускаемые нами на рынок, содержат встроенный искусственный интеллект. Цель данной платформы — развивать культуру работы с данными, снизить порог входа в эту область для наших команд и сделать машинное обучение доступным для каждого аналитика и разработчика Тинькофф.
Мы не планировали строить систему с приставкой „супер“: в целом, это совсем небольшая часть нашей инфраструктуры, но полученные характеристики позволили кластеру войти в топ суперкомпьютеров России. Теперь мы предоставляем нашим командам доступ к одному из самых мощных суперкомпьютеров в России, что позволит нам значительно быстрее тестировать гипотезы, принимать решения и выводить продукты на рынок».
Дмитрий Конягин, руководитель направления
Похожие новости