岗位职责
1. 参与AI模型服务平台的核心设计与开发,如模型推理服务平台核心能力搭建及各类管理功能;
2. 参与平台管理后台及相关配置界面开发,实现模型部署服务监控资源调度等功能的可视化管理,提升操作便捷性;
3. 持续跟进AI Infra及大模型应用相关开源项目,评估技术可行性,快速集成适配平台的轻量化技术方案;
4. 基于Docker/K3s环境,编写自动化脚本,完成裸金属服务器的环境检测系统初始化及模型运行环境的标准化配置。
岗位要求
1. 熟悉Python或Go编程语言,具备2年以上服务端开发经验,能独立完成后端模块开发API设计与调试,具备良好的系统设计与逻辑抽象能力;
2. 熟悉Docker容器化技术,了解K3s/Kubernetes基础使用,具备容器化环境下的开发部署与问题调试经验;
3. 了解大模型推理服务或AI应用的基本原理,有相关项目实践经验者优先;具备良好的工程习惯,能独立推进功能开发,并完成相关技术文档编写;
4. 具备较强的问题排查能力,能快速定位并解决开发部署过程中的环境代码相关问题。
加分项
1. 深入使用或研究过vLLMllama.cppFastChat等模型服务项目;具备GPU服务器运维CUDA环境配置或AI推理/训练环境调优经验;
2. 参与过平台型系统调度系统或资源管理类系统的设计与实现,有相关架构设计或核心模块开发经验;
3. 使用过RAGAgent或工作流相关框架(如DifyLangChain等),有大模型应用开发经验者优先;
4. 具备全栈开发能力,熟悉React/Vue等前端框架及现代前端工程化,能独立完成简单前端页面开发;
5. 熟悉Linux系统运维,,掌握Linux自定义镜像封装(适配GPU及模型运行场景)。
举报
1. 参与AI模型服务平台的核心设计与开发,如模型推理服务平台核心能力搭建及各类管理功能;
2. 参与平台管理后台及相关配置界面开发,实现模型部署服务监控资源调度等功能的可视化管理,提升操作便捷性;
3. 持续跟进AI Infra及大模型应用相关开源项目,评估技术可行性,快速集成适配平台的轻量化技术方案;
4. 基于Docker/K3s环境,编写自动化脚本,完成裸金属服务器的环境检测系统初始化及模型运行环境的标准化配置。
岗位要求
1. 熟悉Python或Go编程语言,具备2年以上服务端开发经验,能独立完成后端模块开发API设计与调试,具备良好的系统设计与逻辑抽象能力;
2. 熟悉Docker容器化技术,了解K3s/Kubernetes基础使用,具备容器化环境下的开发部署与问题调试经验;
3. 了解大模型推理服务或AI应用的基本原理,有相关项目实践经验者优先;具备良好的工程习惯,能独立推进功能开发,并完成相关技术文档编写;
4. 具备较强的问题排查能力,能快速定位并解决开发部署过程中的环境代码相关问题。
加分项
1. 深入使用或研究过vLLMllama.cppFastChat等模型服务项目;具备GPU服务器运维CUDA环境配置或AI推理/训练环境调优经验;
2. 参与过平台型系统调度系统或资源管理类系统的设计与实现,有相关架构设计或核心模块开发经验;
3. 使用过RAGAgent或工作流相关框架(如DifyLangChain等),有大模型应用开发经验者优先;
4. 具备全栈开发能力,熟悉React/Vue等前端框架及现代前端工程化,能独立完成简单前端页面开发;
5. 熟悉Linux系统运维,,掌握Linux自定义镜像封装(适配GPU及模型运行场景)。
举报
温馨提示
- 你可能感兴趣的职位
- 最近浏览记录
-
5-12K/月
-
10-15K/月
-
5-12K/月
-
5-12K/月
-
5-12K/月
-
6-8K/月
-
6-30K/月
-
12-20K/月
-
10-15K/月
-
7.5-9K/月
-
面议
- 公司规模:100-499人
- 公司性质:0
- 所属行业:电力、电气、自动化、热力、锅炉、照明、电池、电源、电缆、光电等
- 联系人:黄丹琪
- 手机:会员登录后才可查看
- 邮箱:会员登录后才可查看
- 邮政编码:
工作地址
- 地址:深圳市南山区粤海街道盈峰中心16楼





