褚成志简历
联系方式: 13868166992 | 邮箱: livecityccz@163.com
GitHub: https://github.com/initchu | 博客: https://www.cnblogs.com/chucz
求职意向: 云平台运维专家 / AI交付 / 解决方案 | 期望城市: 杭州
优势亮点
- 云底座交付与运维管理:6年华为云技术服务经验,负责华为云Stack/IaaS/PaaS解决方案规划与全生命周期运维,累计交付50+政企云项目,管理资源池规模超8000台核,具备多云环境迁移与容量规划能力。
- 高可用容灾与业务连续性保障:主导台州政务云单Region多AZ架构及商业银行灾备云交付,设计跨可用区网络隔离与分布式存储冗余方案,实现业务零宕机运行,灾备环境支持24小时持续切换。
- 自动化运维与监控体系构建:熟练使用Python/Shell开发自动化运维脚本与CI/CD流水线,构建Prometheus/Grafana全链路监控平台,设置200+项告警阈值覆盖核心故障场景,推动运维标准化落地。
- 云端安全与合规实践:负责等保合规体系建设与云端安全防护,制定漏洞修复SOP与WAF策略,管理SSL证书及账号权限;推动客户运维团队自维护能力提升至80%。
技术专长
- 云计算与虚拟化:熟悉华为云Stack全栈架构交付与运维;掌握阿里云、腾讯云控制台操作与基础网络/存储配置;熟练使用KVM虚拟化及FusionSphere桌面云技术。
- 容器与编排管理:掌握Kubernetes应用高可用部署、微服务治理及控制器二次开发;熟练使用Docker镜像构建与SWR管理;具备HCS 6.X/8.X容器化迁移实践经验。
- DevOps与自动化运维:熟练使用Python/Shell开发自动化运维工具;掌握Ansible批量配置管理与Jenkins/GitLab流水线搭建;具备Prometheus/Grafana监控告警编排能力。
- 中间件与数据库:掌握Redis、RocketMQ、Kafka等分布式中间件的性能调优与故障排查;熟悉MySQL、GaussDB容灾设计及ROMA数据集成方案。
- 安全与合规:熟悉等保合规体系搭建,掌握WAF策略配置、抗DDoS防护及零信任认证方案;熟练SSL证书、域名与账号权限管理;具备混沌工程演练与应急响应预案设计能力。
工作经历
华为技术有限公司 | 技术服务专家(华为云TD)
2019/08 - 至今 | 杭州
- 负责区域内华为云Stack云服务产品交付与全生命周期运维,主导IaaS/PaaS项目解决方案落地,保障项目基线、效率、成本及质量目标达成。
- 联合跨职能团队推动NA客户业务上云,持续进行服务扩容与架构优化,牵引30+客户完成云上业务迁移。
- 协同产品经理完成重点行业项目方案配置与评审,结合客户需求优化成本结构,支撑竞争性项目突破。
- 负责国家电网信息化建设项目,设计电力设备智能连接与数据共享方案,运用边缘计算技术提升运维效率。
杭州中恒云能源互联网技术有限公司 | 解决方案工程师
2017/06 - 2019/06
- 参与能源互联网平台产品设计、数据采集组网与协议开发对接,支撑电网企业安全生产提效降本。
- 设计“硬件+软件+培训”一体化方案,集成边缘计算网关与IoT平台,服务国网、华能等客户。
- 构建网关设备主动式运维体系,实现故障预判与智能调度,缩短运维响应时间,提升故障处理效率。
浙江新能量科技股份有限公司 | 软件工程师
2013/05 - 2017/06
- 负责电力行业通信规约嵌入式开发调试,优化协议解析引擎性能,提升终端设备并发接入能力与数据传输成功率。
- 设计低功耗高可靠嵌入式网关设备,实现传感器数据采集、规约转换及边缘计算功能。
杭州新正软件技术有限公司 | 软件工程师
2011/01 - 2013/04
- 负责企业级应用模块开发,优化权限控制与数据库查询性能,提升业务接口响应效率。
- 参与制定软件开发规范,提升模块代码复用率与团队开发效率。
项目经验
衢州数据局DeepSeek大模型多机推理项目 | 产品技术经理 | 2025/03
项目描述:基于HCS+ModelArts架构部署DeepSeek大模型多机推理环境,适配昇腾芯片,优化分布式通信与资源调度,交付政务场景高可用推理服务。
技术栈:ModelArts、MindIE、昇腾芯片、Kubernetes、HCCL通信库、OBS
项目职责:
- 主导ARM环境准备、镜像制作与权重OBS存储配置,调整分布式推理参数与模型类型兼容性。
- 优化ModelArts资源配比,启用芯片亲和性调度与动态批处理,通过量化推理与RDMA协议提升性能。
- 部署Profiler监控平台分析算子耗时,完成在线服务对接与Token鉴权配置。
项目业绩:推理吞吐量提升40%,首token延迟降低30%,支撑日均百万级请求稳定调用。
台州电信政务云平台建设项目 | 云产品与技术专家 | 2025/01
项目描述:交付基于华为云Stack的政务云平台,采用单Region多AZ架构划分管理区与业务区,保障政务数据安全与合规访问。
技术栈:华为云Stack、鲲鹏服务器、分布式存储、KVM、VPC、云防火墙、OBS
项目职责:
- 主导资源规划与架构设计,规划计算与存储资源池,设计跨可用区高可用组网方案,通过网闸实现跨区数据安全交换。
- 基于鲲鹏架构部署服务器集群与分布式存储池,配置不同IO需求的云存储,部署三方备份与安全防护系统。
- 制定驻场运维与版本升级方案,建立云资源全生命周期管理机制(申请/开通/释放)。
项目业绩:交付符合信创标准的云平台,计算资源超分比支持3倍灵活配置,系统运维效率提升50%。
第七一五研究所华为云CodeArts & ROMA一体化开发平台建设项目 | 产品技术经理 | 2024/08
项目描述:整合CodeArts DevOps工具链与ROMA集成能力,打造“研发-集成-部署-运营”全链路平台,支撑多团队协同与跨源数据互通。
技术栈:华为云、CCE、CodeArts、ROMA Connect
项目职责:
- 主导云底座构建与DevOps方案交付,规划云资源架构,搭建CI/CD自动化流水线,推进自动化运维工具链建设。
- 定制分层培训并输出使用指南,实现开发、测试、运维角色全覆盖;定期分析资源闲置情况并输出架构优化报告。
- 基于云监控工具构建数据跟踪体系,优化流水线配置,提升工具链使用效能。
项目业绩:应用部署自动化率达90%,研发周期缩短50%,运维成本降低40%。
衢州市警务云HCS | 产品技术经理 | 2024/05
项目描述:主导警务云省市级联贯通建设,构建适配治安管理与民生服务的智慧警务解决方案,实现与“浙警智治”2.0平台全域级联。
技术栈:华为云、CCE、大数据MRS、零信任认证、数据治理工具、业务总线
项目职责:
- 规划交付警务云计算底座及大数据平台,基于ROMA构建业务总线,实现本地计算、服务与数据资源统一管理。
- 推进容器应用迁移上云,解决Elasticsearch兼容问题;对接零信任体系完成服务目录同步与鉴权互通。
- 负责云端安全防护(漏洞修复、WAF策略),管理SSL证书与账号权限,支撑ISV业务容器化上云。
项目业绩:构建25个云服务实现级联贯通,数据治理效率提升60%,应用上线周期缩短50%。
衢州市政务云国产化改造及上云交付项目 | 核心交付/迁移专家 | 2023/12
项目描述:提供政务云国产化改造、上云交付及运维体系建设服务,涵盖云底座规划、资源扩容、应用迁移与安全集成。
技术栈:政务云IaaS/PaaS平台、统一监控体系、自动化运维平台、安全服务集成、CMDB、ITSM
项目职责:
- 牵头完成政务云底座新建规划设计,输出硬件清单与组网拓扑;梳理应用改造需求,分批完成核心政务应用上云部署。
- 制定33项核心运维流程,构建统一监控体系,对接自动化运维平台,设置200+项告警阈值覆盖故障场景。
- 设计租户面安全服务集成方案,落地网络安全与数据防护措施,制定漏洞扫描与应急响应标准化流程。
项目业绩:实现资源利用效率提升40%,运维团队自维护能力占比提升至80%。
国网浙江省电力禾城外网云 | 产品技术经理 | 2023/10
项目描述:基于HCS构建电力行业私有云平台,完成版本迭代与资源池扩容,支撑多部门核心业务稳定运行。
技术栈:华为云Stack、FusionSphere、分布式存储、SDN、ManageOne、CCE
项目职责:
- 负责云平台架构设计与组网规划,完成底座交付与版本演进;制定旧业务平滑迁移方案,优化VDC网络模型。
- 构建统一观测与告警编排体系,沉淀演练回切流程,开展容量治理;推进统一服务治理,提升关键链路稳定性。
- 协同跨产品线处置应急问题,保障高并发互联网平台运维背景下的业务连续性。
项目业绩:资源利用率提升30%,平台支撑6万+核算力与6000+虚拟机稳定运行。
某商业银行华为HCS项目 | 产品与技术工程师 | 2021/06
项目描述:交付灾备云架构,完成生产、开发测试及灾备Region部署,涵盖ARM与X86混合架构资源建设,支撑多系统稳定运行。
技术栈:华为HCS、ARM/X86混合架构、分布式块存储、IPv4/IPv6双栈、KVM、安全组
项目职责:
- 参与平台组网设计,规划生产与测试环境网络方案,分配计算、存储与网络资源。
- 协助容量评估与故障域可靠性分析,优化存储与网络冗余配置;参与安全防护体系构建,实现南北向/东西向访问控制。
- 配合DDoS防御与防病毒网关提升安全性,处理节点扩容与版本升级,保障核心业务稳定运行。
项目业绩:支撑千余业务虚机稳定运行,完善应急预案并开展切换演练,灾备环境满足24小时持续运行目标。
国网浙江省电力泛在电力物联网项目 | IoT产品技术专家 | 2020/03
项目描述:交付电力物联网端到端解决方案,构建覆盖物理网络、基础配置、服务部署及安全加固的架构,支撑设备智能连接与数据流转。
技术栈:IoT平台、边缘计算、大数据平台、HCS、云网规划、LVS/OBS、Ansible
项目职责:
- 参与设备智能连接方案设计,实现数据统一采集与共享;参与大数据平台建设,保障信息统一分析与业务贯通。
- 主导网络拓扑规划与基础配置实施,完成网段规划、VLAN分配及VRF隔离配置。
- 部署OBS节点网络与云专线,优化防火墙策略,清理无用配置并加固远程管理安全。
项目业绩:设备运维效率提升50%,网络架构支撑日均百万级数据流转,系统稳定性达99.9%。
浙能智云私有云建设项目 | 产品与技术工程师 | 2019/12
项目描述:建设双Region HCS混合云平台,构建IaaS+PaaS体系,支撑智慧电厂等业务云化迁移。
技术栈:华为云Stack、CCE、SDN/VXLAN、ROMA、大数据服务、虚拟墙
项目职责:
- 负责HCS LLD规划与技术/数据中台交付,解决容器迁移中高阶服务组件兼容问题,保障业务按期上云。
- 通过VRF实例与虚拟墙实现租户网络隔离;应对解决方案跨版本升级变更,优化资源闲置情况。
项目业绩:提前完成基础底座与中台交付,实现计算、存储、网络全维度云服务化,平台运行稳定。
教育背景
重庆大学 | 本科
电气工程及自动化专业
