AI Infra工程师 职位描述
- 模型部署、推理服务框架优化、计算资源调度以及与硬件协同优化,确保模型在生产环境中的高效稳定运行。
- 深入理解大模型结构(如Transformer, U-Net)与计算图,综合运用模型蒸馏、模型量化、剪枝、算子融合、内核优化(如CUDA/Triton Kernel开发)及计算图优化等技术,提升模型推理速度和效率。
- 持续追踪、评估并引入业界前沿的开源AIGC技术。负责对这些开源技术进行二次开发、性能优化和适配,以快速集成到现有生产系统中,保持技术领先性。
职位要求
- 本科及以上学历,计算机相关专业,3年以上相关经验
- 精通 C++ 和 Python,具备扎实的编程、数据结构和算法基础
- 对Stable Diffusion等主流AIGC模型有深入的原理理解和丰富的优化实践经验。熟悉并有能力深入定制diffusers, ComfyUI等开源推理框架。
- 熟练掌握至少一种主流深度学习框架(如PyTorch, TensorFlow)
工作地址:上海普陀区国浩长风城南座6楼