褚成志简历
电话: 13868166992 | 邮箱: livecityccz@163.com
GitHub: https://github.com/initchu | 博客: https://www.cnblogs.com/chucz
求职意向: AI交付专家 / 智算产品支撑 | 期望城市: 杭州
核心优势
- AI基础设施与大模型交付:负责政务、电力及金融行业大模型项目交付,掌握模型算力调度与MindIE推理引擎生产级部署,参与过30+云迁移项目
- 智能体与RAG架构实践:基于LangChain与Dify开发多模态Agent工作流,集成向量数据库与提示词优化策略,知识库问答准确率达到可用级别并通过业务验收
- 云原生与高可用架构:主导云平台底座规划设计,熟悉K8s资源隔离与多AZ容灾架构,保障核心业务变更零人为故障
- 售前方案与技术支撑:6年华为云技术服务经验,协同完成多个政企项目SRB/DTRB方案评审,熟悉金融行业监管合规要求与大模型API对接流程
- 异构算力与网络优化:近2年GPU/NPU/CPU混合资源池编排经验,通过HCCL RDMA与动态批处理提升大模型吞吐与低延迟响应
技术能力
- AI与大模型应用:大模型部署调优、RAG架构与知识库构建、LangChain/Dify智能体开发、Prompt工程、Python模型评估脚本
- 云原生与自动化:Kubernetes/CCE集群运维、Docker镜像构建、Ansible自动化部署、Prometheus可观测体系、CI/CD流水线
- 开发与技术栈:Java/Python开发、RESTful API设计与网关集成、Redis/Kafka消息队列、MySQL分库分表优化
- 云计算平台:华为云Stack(HCS) IaaS/PaaS架构设计、阿里云/腾讯云多云环境运维
- 中间件与数据库:GaussDB、PostgreSQL、RocketMQ、KVM虚拟化、数据中台组件
工作经历
华为技术有限公司 | 技术服务专家(华为云TD) | 2019/08 - 至今 | 杭州
- 作为NA客户业务第一责任人,牵头组织SRB/DTRB技术评审,前置识别架构与合规风险,完成交通银行等3家金融机构云方案落地
- 依据变更管控体系规范合作伙伴操作流程,落实双人复核授权;建立P1故障WarRoom响应机制,平均30分钟内定位根因并完成止血
- 构建ManageOne+APM全栈可观测平台,实现指标、日志、链路三位一体监控;严格落实IAM最小权限与K8s RBAC,保障操作全量留痕与交付一致性
杭州中恒云能源互联网技术有限公司 | 解决方案工程师 | 2017/06 - 2019/06 | 杭州
- 参与能源互联网平台产品设计与协议对接,支撑电网安全生产提效降本
- 设计硬件软件一体化方案,构建边缘网关主动式运维体系,实现故障预判与智能调度
浙江新能量科技股份有限公司 | 软件工程师 | 2013/05 - 2017/06 | 杭州
- 负责电力通信规约嵌入式开发,优化协议解析引擎使数据传输成功率提升至99%
- 设计低功耗高可靠网关设备,支持多工业协议边缘计算与规约转换
杭州新正软件技术有限公司 | 软件工程师 | 2011/01 - 2013/04 | 杭州
- 基于主流框架开发企业应用模块,优化权限控制与数据库查询提升接口响应效率
- 参与制定开发规范,提升代码复用率与团队交付效率
核心项目经验
衢州数据局DeepSeek大模型多机推理项目 | 产品技术经理 | 2025/03
基于HCS+ModelArts架构完成DeepSeek-R1多机推理部署,适配昇腾910环境交付政务高可用服务。
- 负责多机推理环境搭建,修改MindIE配置参数并启用HCCL RDMA协议,优化异构算力资源调度策略
- 采用动态批处理与W8A8量化推理技术重构模型加载流程,部署昇腾Profiler分析算子执行与通信耗时
- 推理吞吐量显著提升,首Token延迟大幅压缩,支撑日均5000+业务调用与政务场景高并发稳定运行
台州电信政务云平台建设项目 | 云产品技术负责人 | 2025/01
交付基于华为云Stack的政务云平台,满足信创及等保合规要求。
- 主导底座交付与资源规划,设计单Region多AZ高可用组网方案,部署跨区数据安全交换网闸
- 构建10万条政务知识库并接入RAG检索架构,优化向量检索路径将响应时间压缩至0.8s
- 部署三方备份系统与安全防护组件,制定驻场运维与版本升级SOP,计算资源超分比配置达3倍
衢州市警务云HCS建设项目 | 产品技术经理 | 2024/05
主导警务云底座与大数据平台省市级联贯通建设。
- 基于ROMA平台构建业务总线,推进核心应用容器化迁移并解决组件兼容问题
- 设计智能工单分发Agent工作流,集成5个AI服务实现多系统协同,完成省市服务目录鉴权互通
- 实现工单自动分发准确率达82%,构建25个标准化云服务,数据治理效率大幅提升并通过业务验收
某商业银行华为HCS灾备云项目 | 产品与技术工程师 | 2021/06
交付杭州生产与灾备双Region架构,支撑核心业务跨区高可用。
- 规划2.3万核vCPU与1.81PB存储资源,完成80余个核心系统部署,保障灾备环境可持续运行目标
- 设计RESTful API网关集成大模型服务,开发Prompt模板引擎与限流熔断机制
- 实现重点业务调用成功率≥99.97%,单节点支撑2000QPS并发,满足金融级低延迟要求
第七一五研究所CodeArts & ROMA一体化项目 | 产品技术经理 | 2024/08
整合DevOps工具链与ROMA集成能力,打造全链路数字化开放平台。
- 主导云底座构建与流水线配置,支持多形态应用自动化部署,定制分层培训覆盖开发测试运维角色
- 实现应用部署全流程自动化,研发周期从数周压缩至数天,有效降低跨团队协同与运维成本
- 输出标准化使用指南,推动工具链全面覆盖300+人员协同开发
浙能智云私有云建设项目 | 产品与技术工程师 | 2019/12
主导HCS双Region混合云一期交付,支撑核心业务云化迁移。
- 完成技术中台与数据中台底座规划,解决容器化迁移高阶组件使用难题
- 通过VRF实例与虚拟墙实现租户网络隔离,制定跨版本升级变更方案
- 实现计算存储网络全维度云服务化,提前完成交付节点并支撑业务稳定运行
国网浙江省电力禾城外网云 | 产品技术经理 | 2023/10
- 架构设计与组网规划,完成500PM/5000VM资源池交付;构建统一观测与告警编排体系,实现生产变更零事故,支撑48708核私有云算力规模。
- 制定平台演进路线,完成旧业务平滑迁移与统一服务治理,保障电力核心业务连续运行。
衢州市政务云国产化改造及上云交付项目 | 核心交付/迁移负责人 | 2023/12
- 牵头30+项应用改造需求梳理与分批上云部署;构建统一监控体系设置200+告警阈值
- 联合安全厂商落地虚拟化与数据安全防护措施,通过等保测评,保障20+政务应用平滑迁移。
教育背景
重庆大学 | 本科 | 电气工程及自动化专业
