TechOps/DevOps Engineer: SRE-应用运维方向

Shanghai

Full Time
Shopee logo
Shopee
Apply now Apply later

Posted 1 month ago

Shopee Tech Ops SRE(Site Reliabilitiy Engineering) 团队的使命是确保Shopee 24/7的高效和可持续性运转,从系统的可用性和效能出发,组建和维护大规模、高可用、高效能的分布式系统,是结合传统软件工程与系统运维形成的新体系。SRE团队需要深入Shopee各业务线,在于确保基础设施在快速演进的同时,具备高可用性以及扩展性,并从稳定性和效能的角度切入到业务研发,基础平台各部分组件(中间件、容器调度、缓存、对象存储等)的设计,OS的优化,数据中心和网络的优化,通过工程化和服务化手段来优化传统运维模式中低效,繁复的操作,并致力于建设完善的监控体系以提高故障处理效率。

岗位描述:

  • 负责应用系统资源(包括云和非云环境的系统、网络、存储等资源)的统筹规划和管控,提供稳定高效持续的应用系统资源交付能力,提高整体研发的效率,降低成本;
  • 负责海量系统高可用体系建设,如故障自动定位、自动恢复、自适应容灾等,保障业务持续可用;
  • 参与应用系统架构规划和设计,推动或主导关键技术演进,提升资源的弹性、可扩展和质量;
  •  负责各业务线的全链路压测,确保无单点,确保各组件的性能和可靠性;
  • 深入业务线,理解客户需求和业务需求,推动产品的可扩展性、稳定性和效能;
  • 自动化运维平台个组件的设计和开发。

岗位要求:

  • 全日制本科,2年以上工作经验,大型互联网公司或者大型IT企业应用运维经验者优先;
  • 熟悉Python、Shell或Go,熟练编写各种日常工具,熟悉Django、Flask或GIN框架;
  • 精通linux/unix操作系统,熟悉TCP/HTTP协议,熟悉性能调优,熟悉使用相关压测,监控等工具;
  • 熟悉多种开源组件:Ansible、SaltStack、KVM、Nginx、LVS、Jenkins、Git、Memcached、Redis、Mysql/SQL等;
  • 熟悉Docker技术和对应的PaaS体系架构。有容器、调度相关经验或了解Mesos、Docker、Kubernetes、等相关技术者优先;
  • 了解PaaS平台建设者或熟悉运维自动化体系建设;
  • 有单元化,异地多活容灾系统架构演化落地经验者优先;
  • 熟悉阿里云,腾讯云,AWS,GoogleCloud 运维者优先;
  • 优秀的沟通、表达与组织协作团队合作能力,适应多元化国际化工作环境,有一定英文能力,具备一定的创新能力。 
Job tags: Ansible AWS Docker Git Kubernetes MySQL Nginx Redis
Job region(s): Asia/Pacific
Job stats:  4  0  0
  • Share this job via
  • or