Website Luma AI
职位描述
我们正在寻找具有强大的 ML & 分布式系统背景的人才。与研究人员合作,扩展在数千 GPU 集群上训练下一代模型所需的系统。配置和优化我们的模型训练代码库,以实现同类最佳的硬件效率。构建系统,以便在大规模 GPU 集群上高效地分配工作。设计和实施方法,以便在出现硬件故障时稳健地训练模型。构建工具,帮助我们更好地了解最大型训练工作中存在的问题。在多模式 ML 流水线、高性能计算和/或底层系统方面的工作经验。对深入研究系统实现并了解其基本原理以提高其性能和可维护性充满热情。在构建稳定、高效的分布式系统方面拥有丰富经验。最好有高性能 C++ 或 CUDA 的工作经验。请注意,这个职位不适合应届毕业生。
offer要求 [offer requirements]
与研究人员合作,扩展在数千 GPU 集群上训练下一代模型所需的系统。配置和优化我们的模型训练代码库,以实现同类最佳的硬件效率。构建系统,以便在大规模 GPU 集群上高效地分配工作。设计和实施方法,以便在出现硬件故障时稳健地训练模型。构建工具,帮助我们更好地了解最大型训练工作中存在的问题。在多模式 ML 流水线、高性能计算和/或底层系统方面的工作经验。对深入研究系统实现并了解其基本原理以提高其性能和可维护性充满热情。在构建稳定、高效的分布式系统方面拥有丰富经验。最好有高性能 C++ 或 CUDA 的工作经验。请注意,这个职位不适合应届毕业生。
offer福利 [offer benefits]
该职位在加利福尼亚州的薪资范围为 180,000 – 250,000 美元/年;但是,根据工作相关的知识、技能、应聘地点和经验,提供的基本薪资可能会有所不同。我们还提供股票期权形式的具有竞争力的股权待遇和全面的福利计划。
