Тестирование вычислительной производительности чипа Ascend. Программа операторов может работать на всех платформах, но статистические показатели применимы только к Ascend310. Код предназначен исключительно для демонстрации измерения производительности вычислений.
Параметры: left_matrix[8, 128, 16] * right_matrix[8, 128, 16].
В этом репозитории содержатся файлы проекта оператора и код для тестирования модели одного оператора ACL. В итоге можно получить результат теста производительности вычислений XXXFLOPS, который показывает, насколько близко полученное значение к номинальному.
Обратите внимание, что необходимо найти путь к Ascend/atc/include в вашей среде и установить его как ASCEND_TENSOR_COMPLIER_INCLUDE. Пример: [export ASCEND_TENSOR_COMPLIER_INCLUDE=/usr/local/Ascend/atc/include].
Вы можете оставить комментарий после Вход в систему
Неприемлемый контент может быть отображен здесь и не будет показан на странице. Вы можете проверить и изменить его с помощью соответствующей функции редактирования.
Если вы подтверждаете, что содержание не содержит непристойной лексики/перенаправления на рекламу/насилия/вульгарной порнографии/нарушений/пиратства/ложного/незначительного или незаконного контента, связанного с национальными законами и предписаниями, вы можете нажать «Отправить» для подачи апелляции, и мы обработаем ее как можно скорее.
Комментарии ( 0 )