Skip to content
💬 打招呼语

您好,我是褚成志,6年华为云原厂经验,主导DeepSeek-R1大模型多机推理部署(4节点集群),熟悉昇腾NPU调度优化、MindIE推理引擎调优、ModelArts在线服务运维。通过动态批处理、W8A8量化推理、HCCL RDMA协议优化,推理吞吐量提升约40%(达2500 tokens/sec)。具备K8s集群运维与异构算力资源管理经验,期待与您详聊。

褚成志简历

联系方式: 13868166992 | 邮箱: livecityccz@163.com
GitHub: https://github.com/initchu | 博客: https://www.cnblogs.com/chucz
求职意向: 大模型基础设施 / AI平台工程师 / MLOps工程师 | 期望城市: 杭州


核心优势

  • 大模型推理部署实战:主导DeepSeek-R1大模型多机推理部署(4节点集群),覆盖ARM环境准备、镜像制作、模型权重配置、分布式推理参数调优全流程,推理吞吐量达2500 tokens/sec,提升约40%
  • 昇腾NPU调度优化:熟悉昇腾910芯片环境配置与资源调度,通过动态批处理、W8A8量化推理、HCCL RDMA协议启用等手段优化推理性能,首token延迟降低约30%,显存占用显著降低
  • ModelArts与MindIE推理引擎:具备ModelArts在线服务部署、资源配比优化、芯片亲和性调度实战经验,熟悉MindIE推理引擎配置与性能调优,能完成模型权重目录config.json修改与分布式推理参数配置
  • K8s+Docker容器化AI服务:具备Kubernetes集群运维与控制器二次开发经验,熟悉AI推理服务容器化部署、HPA弹性扩缩容、RBAC权限管理,能构建高可用AI推理服务架构
  • 异构算力资源管理:管理资源池超8000台服务器,具备GPU/CPU/NPU异构算力资源调度优化经验,熟悉昇腾Profiler监控平台,能分析算子执行与通信耗时,定位性能瓶颈
  • 政务/电力行业AI落地:深度服务政务、电力行业AI项目,熟悉行业信创合规、等保要求及数据安全诉求,能快速输出贴合行业场景的AI基础设施解决方案

技术能力

  • AI基础设施:ModelArts、MindIE推理引擎、DeepSeek/盘古大模型部署、昇腾NPU(910/310)调度优化、HCCL通信库、OBS对象存储、SWR镜像仓库
  • 推理优化技术:动态批处理、W8A8量化推理、HCCL RDMA协议、昇腾Profiler性能分析、算子执行优化、显存管理
  • 容器与编排:Kubernetes(集群运维/控制器二次开发/HPA/RBAC)、Docker、CCE、Harbor、Helm
  • 异构算力管理:GPU/CPU/NPU资源调度、芯片亲和性调度、资源配比优化、算力池化
  • 云计算平台:华为云Stack(HCS)IaaS/PaaS、OpenStack、KVM虚拟化、分布式存储(OceanStor Pacific)
  • 可观测性:Prometheus/Grafana、ELK、AOM/APM、昇腾Profiler、告警编排
  • DevOps与自动化:Jenkins、GitLab CI/CD、Ansible、CodeArts、Python运维脚本开发、Shell
  • 开发技术栈:Java(Spring/SpringBoot/MyBatis)、Python、Shell、Golang(了解)
  • 中间件与数据库:Redis、Kafka、RocketMQ、MySQL、PostgreSQL、GaussDB
  • 安全合规:等保合规适配、零信任架构对接、Token鉴权、RBAC权限管理

工作经历

华为技术有限公司 | 技术服务专家(华为云TD) | 2019.08 - 至今 | 杭州

  • 大模型推理服务交付:主导DeepSeek-R1大模型多机推理部署,覆盖ARM环境准备、镜像制作与SWR上传、模型权重OBS存储配置、MindIE推理引擎调优全流程;优化ModelArts资源配比,启用芯片亲和性调度,推理吞吐量提升约40%(达2500 tokens/sec)
  • 昇腾NPU调度优化:通过动态批处理、W8A8量化推理、HCCL RDMA协议启用等手段优化推理性能,首token延迟降低约30%;部署昇腾Profiler监控平台,分析算子执行与通信耗时,定位性能瓶颈
  • AI平台运维与稳定性保障:完成ModelArts在线服务与客户侧应用集成对接及Token鉴权配置,保障政务场景业务零宕机运行;构建Prometheus+ELK全链路可观测性体系,实现AI推理服务故障快速定位
  • K8s集群运维与容器化:具备Kubernetes集群运维与控制器二次开发经验,主导多个政企业务系统容器化迁移改造,熟悉HPA弹性扩缩容、RBAC权限管理等核心场景
  • 大规模资源池管理:管理资源池超8000台服务器,稳定运行6000+虚拟机,具备异构算力(GPU/CPU/NPU)资源调度优化经验

杭州中恒云能源互联网技术有限公司 | 解决方案工程师 | 2017.06 - 2019.06 | 杭州

  • 集成边缘计算网关、IoT平台及行业应用,构建网关设备主动式运维体系,运维响应时间缩短40%
  • 参与能源互联网平台产品设计,服务国网、华能等电网客户

浙江新能量科技股份有限公司 | 软件工程师 | 2013.05 - 2017.06 | 杭州

  • 设计低功耗、高可靠嵌入式网关设备,实现传感器数据采集、规约转换及边缘计算功能

核心项目经验

衢州数据局DeepSeek大模型多机推理项目 | 产品技术经理 | 2025.03

基于HCS+ModelArts架构,完成DeepSeek-R1大模型多机推理部署与全链路性能优化,适配昇腾910硬件环境,交付政务场景高可用大模型推理服务。

  • 技术栈:ModelArts、MindIE、DeepSeek大模型(R1/V3)、昇腾芯片、Kubernetes、Docker、HCCL通信库、OBS、SWR、昇腾Profiler
  • 主导大模型交付全流程规划,包括ARM环境准备、镜像制作与SWR上传、模型权重OBS存储配置;修改MindIE及模型权重目录config.json文件,配置分布式推理参数与模型类型兼容
  • 优化ModelArts资源配比(CPU/内存/昇腾芯片),启用芯片亲和性调度与HCS850+1230补丁;通过动态批处理、W8A8量化推理、HCCL RDMA协议启用等手段优化推理性能
  • 部署昇腾Profiler监控平台,分析算子执行与通信耗时;完成MA在线服务与客户侧应用集成对接及Token鉴权配置
  • 成果:实现4节点集群推理延迟降低,吞吐量提升至2500 tokens/sec,显存占用降低;服务部署成功率达标,运维效率提升,保障业务零宕机运行,满足政务场景高并发调用需求

国网浙江省电力泛在电力物联网项目 | IoT产品技术专家 | 2020.03

国家电网泛在电力物联网ROMA20版本交付,构建覆盖物理网络、基础配置、服务部署及安全加固的端到端解决方案,支撑电力设备智能连接与云管边端协同运维。

  • 技术栈:IoT平台架构设计、边缘计算、大数据平台建设、云管边端协同、HCS8.X、云网规划、LVS/OBS、防火墙安全策略、Ansible自动化部署
  • 参与设计电力用户与电网企业设备智能连接方案,实现设备数据统一采集与共享;运用移动互联与人工智能技术优化电力设备智能感知与控制能力
  • 参与构建泛在电力物联网大数据平台,保障电力信息统一分析与业务贯通;主导网络拓扑规划与基础配置实施
  • 成果:实现IoT设备可信远程升级与容器化运维,设备运维效率提升50%;网络架构支撑日均百万级电力数据流转,数据共享延迟降低40%,系统稳定性提升至99.9%

国网浙江省电力禾城外网云 | 产品技术经理 | 2023.10

基于华为云Stack构建电力行业私有云平台,完成8.0.2→8.3.1版本迭代,部署500PM/5000VM资源池,支撑500+核心业务。

  • 技术栈:HCS8.0X、OpenStack、FusionStorage、SDN、KVM、CCE、ManageOne、MRS、DWS、DGC
  • 主导云平台架构设计与组网规划,完成云底座交付与版本演进;构建统一观测与告警编排体系,实现生产变更零事故
  • 成果:资源利用率提升30%,平台支撑48708核算力,稳定运行6000+虚拟机,完成600+问题闭环

第七一五研究所CodeArts & ROMA一体化开发平台 | 产品技术经理 | 2024.08

整合CodeArts DevOps工具链与ROMA集成能力,打造全链路数字化开放平台,支撑多团队协同与跨源数据互通。

  • 技术栈:华为云ECS/RDS/VPC/OBS、CCE、CodeArts(需求管理/代码托管/流水线)、ROMA Connect(FDI/MQS/APIC/LINK)
  • 主导华为云底座构建与CodeArts方案交付,规划云资源架构,构建DevOps自动化CI/CD链路,支持多形态应用部署
  • 成果:研发周期缩短50%,应用部署自动化率90%,支持300+人员协同,运维成本降低40%

衢州市警务云(容器+大数据)| 产品技术经理 | 2024.05

主导警务云容器+大数据省市级联贯通项目,实现与"浙警智治"2.0平台全域级联。

  • 技术栈:华为云ECS/CCE/RDS/OBS、Kubernetes、MRS(Elasticsearch)、零信任认证、ROMA业务总线
  • 主导规划交付云计算中心华为云底座、大数据平台及硬件基础设施;推进容器应用迁移上云,解决Elasticsearch兼容问题
  • 成果:构建25个云服务,实现与浙警智治2.0平台级联贯通,数据治理效率提升60%,应用上线周期缩短50%

教育背景

重庆大学 | 本科 | 电气工程及自动化专业

褚成志 · 简历中心