崗位職責
在太初架構上建設和優化 Triton 編譯器,提升 AI 計算的性能和效率。
1. 在太初AI架構上適配和優化 Triton 編譯器;
2. 基于 MLIR + Linalg 框架,提升編譯器代碼執行效率;
3. 參與 圖優化、后端代碼生成、調度策略、指令優化、流水并行化 相關優化工作;
4. 研究和優化 Kernel 計算性能,降低計算開銷,提高吞吐率;
5. 研究算子融合(Op Fusion)、自動調優(Auto-Tuning)、代碼生成(CodeGen) 相關優化策略;
6. 與 硬件團隊、AI框架團隊(如 PyTorch) 協作,提升AI編譯器的支持能力;
7. 跟蹤 LLVM、Triton、TVM、XLA、TorchInductor 等 AI 編譯器前沿技術,優化編譯性能。
任職資格
1.優秀的學習能力,對 AI 編譯器、AI計算優化有濃厚興趣;
2.熟悉 C++/Python,具備編譯器或 AI 編譯優化開發經驗,熟悉 Triton 編譯流程;
3.熟悉 MLIR、Linalg等基礎設施;
4.具備ai編譯優化(如 TVM、XLA、TorchInductor) 經驗者優先;
5.熟悉 Kernel 計算優化、算子融合、自動并行化等高性能計算優化策略者加分。
加分項(優先考慮)
1.參與過 Triton、MLIR、IREE、XLA、TVM、TorchInductor 等編譯器的開發,或在 GitHub 提交過相關 PR
2.具備MLU/NPU/GPU 相關的編譯優化經驗。