sigma 团队招聘 JD

/ 0评 / 0

阿里 sigma 团队招聘,感兴趣的同学联系  songchuan.zhou@alibaba-inc.com

Sigma是阿里集团众多业务的底层标准容器服务提供者。如果把阿里全部业务比作人体,Pouch容器就是一个个细胞,不同业务组成不同的组织和器官。Sigma就是控制这些细胞、组织和器官的神经系统。该岗位的主要职责就是维护这个神经系统的健康发展与演进,让其更稳定,更高效,更智能。这其中面临的很多挑战已经触及了工业实践的极限和学术研究的最前沿,具体包括:

职位描述

1. 如何保障Sigma系统能够快速高效地响应阿里几十个BU,数十个不同业务场景的资源分配和排布需求?如何对这些需求进行分析和抽象,如何不断优化和演进Sigma技术体系来更好的满足不断扩张的业务规模和机器规模?如何快速支持不断涌现并规模化使用的新硬件和新计算场景?

2. 如何在各种软硬件故障宕机的情况下(巨量机器基数下每天都会有)使sigma自身服务及其上的业务不受影响或影响降到最小?如何减少各种故障下的人工处理,技术支持及答疑?如何设计系统的防御机制应对天灾人祸(比如光缆被挖断,机房被水淹)等小概率极端场景,保证安全性和高可用?

3. 如何智能化地分析部署实例间的干涉影响,应用实时性能及资源负载,网络流量及物理能耗等关键指标,为上层的调度决策提供更好的依据?如何依据实时的数据反馈和分析计算,让Sigma做出更好的容器分配(Scheduling)、重新排布和组合决策(ReScheduling)从而为上层应用提供高质量SLA保障的同时,使集群整体的资源利用率达到最优?

4. 如何根据现有各种维度的数据预测和推演出服务器硬件采购、机型配比、网络架构、机房布局等最优的迭代策略?如何设计容器的收费策略和价格杠杆以使上层业务对资源的使用趋向最优,并不断提高自动化运维程度?

5. 如何将阿里内部的技术沉淀输出到公有云和私有云产品上,服务于更多的中小企业和传统企业?如何保持Sigma在资源调度和统筹上的领先性,如何布局各种新技术方向以及社区生态,才能占据领先的市场地位并主导未来10年的调度技术发展?

职位要求

除了技术之外没有任何限制;Base杭州、北京、深圳、硅谷甚至其他城市都可以商量。如果你有激情,有梦想,有兴趣迎接如上的挑战,所有要求都是弹性的:

1. 深入理解虚拟化和容器技术,熟悉linux底层cgroup、namespace等机制。熟悉调度领域的焦点问题,了解业界主要调度系统的运作方式,系统结构,设计理念。有实际大规模调度系统建设经验会是加分项。

2. 了解IDC规划、网络架构、服务器部署、CPU、内存、磁盘等硬件能力。熟悉离线计算、实时计算、流计算等计算模型。熟悉机器学习方法和数据分析挖掘

3. 具有快速理解和掌握大型复杂系统的能力;具有高效学习和把控新技术的能力。有系统架构经验,独立主导过重大产品架构演化及推进落地。对技术和业务有前瞻性的思考,能够主导调度领域方向性的决策并推进落地。

4. 优秀的表达能力,沟通能力和多团队协作能力;

发表评论

电子邮件地址不会被公开。 必填项已用*标注