Microsoft Translator улучшен с помощью Z-кода, состоящего из экспертных моделей
... для развертывания новых моделей Z-code/MoE на графических процессорах. NVIDIA разработала собственные ядра CUDA и использовала библиотеки CUTLASS и FasterTransformer для эффективной реализации слоев MoE на одном графическом процессоре V100. Эта реализация достигла 27-кратного улучшения пропускной ...
Изменен: 03.04.2022Путь: Публикации
Сортировать по релевантности | Отсортировано по дате