职位描述
本站申请链接
作为 Luma 数据团队的 MLE,您将负责提高我们的数据质量标准。数据是我们产品的重要基础,我们正在寻找能够确定数据和字幕的创新方法,然后在 PB 规模上实施处理解决方案的人才。优秀的候选人应具备出色的通用 python 工程技能以及行业 ML 经验、数据经验和对构建人工智能产品的热情。
offer要求
设计数据管道,包括寻找合适的数据源、刮擦、过滤、后处理、去重复和版本管理。该系统应坚固耐用并可扩展,以用于生产。
设计并实施框架,以评估我们的模型和数据的有效性。
与其他数据贡献者或消费者或两者密切合作,将他们的数据使用需求纳入各种任务和领域。
与人工标注供应商合作,完善收集高质量人工标注数据的程序和指南。
开展开放式研究,以提高所收集数据的质量,包括但不限于半监督学习、人在环机器学习以及根据人类反馈进行微调。
作为数据工程师、机器学习工程师或数据科学家,拥有 5 年以上相关经验或展示过具有重大影响的项目,每天处理大量数据。
对高质量数据的重要性有坚定的信念,并对应对相关挑战有强烈的工作动力。
具有在大型分布式系统中工作的经验。
具有较强的 Python 和 pytorch 通用技能
具有使用 SQL、Spark 或其他工具处理大量数据的经验。
请注意,此职位不适合应届毕业生。
offer待遇
此职位在加利福尼亚州的薪资范围为 18 万美元 – 25 万美元/年;但是,根据工作相关的知识、技能、应聘地点和经验,提供的基本薪资可能会有所不同。我们还提供股票期权形式的具有竞争力的股权待遇和全面的福利计划。