При выполнении операции vec_trans_scatter для транспонирования fp32 из формы (16,8) в (8,16), поведение отличается в зависимости от значения параметра repeat_times:
Кроме того, более логичным поведением было бы игнорирование rep_stride при repeat_times = 1.
dst_rep_stride = 16
src_rep_stride = 16
dstHighHalf = False
srcHighHalf = False
dst_list = [dst_ub[8 * i] for i in range(16)]
src_list = [src_ub[8 * i] for i in range(16)]
self.tik_inst.vec_trans_scatter(dstHighHalf, srcHighHalf, dst_list, src_list, repeat_times, dst_rep_stride, src_rep_stride)
Вышеуказанный код демонстрирует различное поведение при repeat_times = константе 1 и repeat_times = скаляру 1.
xxxx
Пожалуйста, соберите логи в соответствии со своим окружением, используя следующий метод. Если проблема связана с разработкой операторов, рекомендуется предоставить логи из тестов UT/ST и интеграционных тестов для отдельных операторов.Метод сбора логов:
Упакуйте логи в архив и прикрепите его как вложение. Если размер логов превышает ограничение для вложений, загрузите их на внешний облачный сервис и предоставьте ссылку.
Для получения логов обратитесь к wiki:
https://gitee.com/ascend/modelzoo/wikis/Как-получить-дневники-и-графики-вычислений?sort_id=4097825