全域智慧就业资讯服务平台
全国
全国
安徽
北京
重庆
福建
甘肃
广东
广西
贵州
海南
河北
河南
黑龙江
湖北
湖南
吉林
江苏
江西
辽宁
内蒙古
宁夏
青海
山东
山西
陕西
上海
四川
天津
西藏
新疆
云南
浙江
400-633-0111

面向万亿参数大模型的PD分离解耦推理系统研究-A Star

面议

工作性质:全职

职位类别:校园招聘

招聘人数:若干

工作经验:应届生

最低学历:本科

来源:雷竞技raybet在线
岗位职责

在阿里云操作系统实验室,你将负责下一代MoE大模型推理系统的架构设计与核心实现。主要工作围绕Prefill-Decode分离(PD Disaggregation)与Expert Parallelism(EP)的端到端协同,持续优化Mooncake的KVCache系统,支撑千问、灵骏、PAI等阿里云关键AI业务。主要职责是:
1、深入理解并改进Mooncake、SGLang等开源推理框架;
2、设计Mooncake KVCache分层、弹性伸缩、故障自愈等核心模块,追求毫秒级延迟与极致吞吐;
3、结合最新硬件与操作系统能力优化大模型推理系统;
4、撰写顶会论文(SOSP/OSDI等),将创新回馈开源社区。

任职要求

1、计算机相关专业;
2、精通C++/Python/CUDA;
3、熟悉分布式推理系统,理解MoE、TP/PP/EP、NCCL、RDMA;
4、良好的英文读写与团队协作能力。

【加分项】
1、在OSDI/SOSP等顶会发表过论文;
2、主导或核心贡献过vLLM、SGLang、Mooncake、Dynamo等开源项目;
3、熟悉Kubernetes、Ray、KubeRay等云原生调度系统;
4、有GPU显存管理、KVCache、RDMA网络栈优化实战经验。

举报如发现虚假宣传、不良信息或收取财物等违法情况,请立即举报
看了此职位的人还在看 更多相似岗位
精选职位
请选择您要投递的简历
发送
确认此操作继续?
取消
确认

举报

关闭
+
上传截图
(最多可上传6张截图)
取消
确定

提示

关闭
您即将离开雷竞技raybet在线,进入597直聘投递个人简历,请保护好个人隐私安全。为方便您投递简历,可前去 个人中心下载简历后进行投递。
取消
前往投递
请扫码体验
收起

意见收集

关闭

您对雷竞技raybet在线有任何建议意见都可以给我们留言哦~

取消
确定
Baidu
raybet雷竞技官网地址