岗位职责:
1. 负责NPU的AI算子编译器的开发,对接TVM/XLA等开源框架,实现算子的自动生成
2. 负责高性能的算子开发,以及目标网络模型的性能调测和优化
3. 协助芯片团队持续优化NPU的架构
任职要求:
1. 计算机科学、机器学习、统计学、应用数学等专业,本科及以上学历;
2. 熟练掌握C++,有Linux平台下的开发经验;熟悉MindSpore、Tensorflow、Pytorch等主流框架和自定义算子开发;
4. 有TVM/MLIR/XLA或者自研AI编译器相关开发经验者优先;
5. 熟悉CUDA算子开发经验者,有计算图层和算子层开发和优化经验者,有GCC、LLVM和Open64等开源编译器相关开发经验者优先。