Skip to content

褚成志 简历

icon:phone联系方式: 13868166992 | icon:email2邮箱: livecityccz@163.com
icon:githubGitHub: https://github.com/initchu | icon:blog博客: https://www.cnblogs.com/chucz
icon:fa-cloudflare求职意向: AI交付 / 云运维 / ICT服务 / 解决方案 | icon:fa-compass 期望城市: 杭州


优势亮点

  • 华为云解决方案架构规划与交付运维:6年华为云技术服务专家经验,精通华为云、桌面云、虚拟化、存储、网络、高阶服务等架构设计与交付运维,累计服务50+大中型政企云项目,管理资源池规模超8000台
  • 全栈运维体系建设:从私有云基础设施到应用层的运维,涵盖Iaas/Pass容器中间件/软开云工具链等云服务平台组件,深入实践私有云故障问题定位、性能测试优化、服务治理、告警治理、开发流水线、可观测性建设
  • 后端开发与分布式系统:具备Java企业项目开发经验,深入理解Mysql原理与性能调优,掌握Spring、SpringBoot、Mybatis等主流开发框架;熟悉Redis、Kafka、RocketMQ等中间件使用与优化
  • 物联网全链路技术实践:5年物联网开发经验,精通设备选型、通信组网、数据采集开发、边缘计算部署和可信方案设计
  • AI基础设施实践:负责政府电力行业和区域多个华为云大模型项目,在AI训练/推理环境建设、异构算力资源调度优化等方面有丰富实践经验
  • 运维合规管理:作为华为云TD负责区域和行业客户的原厂变更与合规管理,基于业务场景设计混沌联合演练与应急预案,优化监控策略、平衡SLA、成本与合规

技术专长

  • 云计算领域:华为云 IaaS / PaaS / AI / KVM / 桌面云等解决方案架构规划与运维,熟悉阿里云腾讯云等平台
  • 容器编排:Kubernetes应用高可用部署、发布、升级与微服务治理项目经验
  • 嵌入式:物联网关协议开发、数据采集、边缘计算部署架构,可信设计与设备监控
  • AI基础设施:大模型训练/推理环境建设经验,熟悉异构算力资源调度优化
  • 运维DevOps:使用Ansible进行自动化部署、配置管理和批量运维操作,提升运维效率;流水线设计与实施,掌握Jenkins、GitLab等平台工具的使用
  • 开发技术栈:掌握Spring等Java主流技术栈,Python运维脚本开发,了解Golang开发,K8s控制器二次开发,具备良好的代码规范意识和Git版本控制经验
  • 中间件:Redis、RocketMQ、Kafka、API网关、服务治理、数据集成Roma等分布式中间件的部署、配置优化和故障排查
  • 数据库:Mysql、PostgreSQL、数仓、Gauss等数据库的运行管理和性能优化和容灾设计
  • 可观测性:掌握Prometheus/Grafana等监控工具使用,贯通指标/日志/链路与告警编排

工作经历

华为技术有限公司 | 技术服务专家(华为云TD)

2019.08 - 至今 | 杭州

  • HCS云服务产品技术TD:统筹区域内华为云Stack云服务产品交付与运维,HCS/虚拟化/容器云等IAAS/PAAS云项目解决方案落地,保障项目基线、效率、成本及质量目标达成
  • 客户业务数字化转型推动和实践:针对区域内NA客户业务需求,持续进行服务扩容,推动客户业务上量,联合产品经理、客户经理、服务经理组建跨职能持续运营团队,成功牵引30+客户上云
  • HCS解决方案竞争力构建:协同产品经理完成重点行业项目解决方案配置报价与SRB、DTRB评审,结合客户需求与华为云产品能力优化方案成本竞争力,支撑强竞争性项目突破
  • 电网信息化项目专家:持续负责或参与建设多个国家电网信息化建设项目,设计电力设备智能连接与数据共享方案,运用移动互联、人工智能等技术提升电网智能化水平

杭州中恒云能源互联网技术有限公司 | 解决方案工程师

2017.06 - 2019.06

  • 参与能源互联网平台产品设计、数据采集组网、模块选型和协议开发对接等,支撑电网、发电企业安全生产提效降本
  • 设计"硬件+软件+培训"一体化方案,集成边缘计算网关、IoT平台及行业应用,服务国网、华能等电网客户
  • 构建网关设备主动式运维,实现设备故障预判与智能调度,运维响应时间缩短 40%,故障处理效率提升 35%。

浙江新能量科技股份有限公司 | 软件工程师

2013.05 - 2017.06

  • 负责GDW376.1/IEC104等电力行业通信规约的嵌入式开发调试,优化协议解析引擎性能,使能管系统终端设备并发接入能力提升,数据传输成功率提升至99%
  • 设计低功耗、高可靠嵌入式网关设备,实现传感器数据采集、规约转换及边缘计算功能,支持多种工业协议

杭州新正软件技术有限公司 | 软件工程师

2011.01 - 2013.04

  • 基于主流框架开发企业级应用模块,优化权限控制和数据库查询性能,提升业务接口响应效率
  • 参与制定公司软件开发规范,提升模块代码复用率和团队开发效率

项目经验

衢州数据局DeepSeek大模型多机推理项目 | 产品技术经理 | 2025/03

项目描述

基于HCS+ModelArts架构,完成DeepSeek-R1大模型多机推理部署与全链路性能优化,适配昇腾910硬件环境,搭建政务场景高可用大模型推理服务,支撑业务稳定调用与高效响应。

技术栈:ModelArts、MindIE、DeepSeek大模型(R1/V3)、昇腾芯片、Kubernetes、Docker、HCCL通信库、OBS、SWR、昇腾Profiler

项目职责

主导大模型交付全流程规划,包括ARM环境准备、镜像制作与SWR上传、模型权重OBS存储配置;修改MindIE及模型权重目录config.json文件,配置分布式推理参数与模型类型兼容;优化ModelArts资源配比(CPU/内存/昇腾芯片),启用芯片亲和性调度与HCS850+1230补丁;通过动态批处理、W8A8量化推理、HCCLRDMA协议启用等手段优化推理性能;搭建昇腾Profiler监控平台,分析算子执行与通信耗时;完成MA在线服务与客户侧应用集成对接及Token鉴权配置等。

项目业绩

实现4节点集群推理延迟降低,吞吐量提升至2500tokens/sec,显存占用降低;服务部署成功率达,运维效率提升,保障业务零宕机运行,满足政务场景高并发调用需求。

台州电信政务云平台建设项目 | 云产品与技术专家 | 2025/01

项目描述

为满足台州大数据局信创及等保合规要求,设计并搭建基于华为云Stack的政务云平台,提供计算、存储、网络等全栈IaaS服务,采用单Region多AZ架构划分管理区、业务区、OBS区独立网络分区,保障政务业务测试与运行的数据安全及合规访问。

技术栈:华为云Stack、鲲鹏服务器、分布式存储(OceanStorPacific)、KVM虚拟化、三层组网、VPC、云防火墙(CFW2.0)、OBS对象存储、云硬盘(SATA/SSD)

项目职责

主导需求分析与架构交付设计,规划1650核计算资源、4800GB内存及300T对象存储的资源配置;设计单Region多AZ组网方案,通过网闸实现跨区数据安全交换;基于鲲鹏架构搭建服务器集群与分布式存储池,配置不同IO需求的云存储;部署三方备份环境与安全防护系统,落实信创及等保合规要求;制定本地运维方案,配置驻场运维与版本升级服务。

项目业绩

成功搭建符合政务信创标准的云平台,实现计算资源超分比灵活配置(最大3倍),存储可用容量达352T,网络出口带宽满足业务峰值需求;系统运维效率提升50%,数据交互合规性100%,支撑政务业务稳定测试运行,达成平台业务上线目标。

第七一五研究所华为云CodeArts&ROMA一体化开发平台建设项目 | 产品技术经理 | 2024/08

项目描述

基于华为云基础设施平台,整合CodeArtsDevOps工具链与ROMA集成能力,打造“研发-集成-部署-运营”全链路数字化开放平台,支撑多团队协同与跨源数据互通,满足客户安全合规与高效交付需求。

项目职责

1、主导华为云底座搭建与CodeArts方案交付,规划云资源架构,构建DevOps自动化CI/CD链路,支持多形态应用部署 2、定制CodeArts分层培训,覆盖开发、测试、运维角色,输出使用指南,实现团队工具链覆盖 3、基于CodeArts效能洞察与云监控工具,搭建数据跟踪体系,输出优化报告提升工具使用效率。

项目业绩

研发周期缩短50%,应用部署自动化率90%,支持300+人员协同;CodeArts使用熟练度提升80%,运维成本降低40%

衢州市警务云HCS | 产品技术经理 | 2024/05

项目描述

响应“数字中国、智慧警务”战略及省级资源协同要求,主导衢州警务云(容器+大数据)省市级联贯通项目建设,突破传统警务资源分散、数据沉睡、运维不规范等痛点,构建适配治安管理与民生服务的智慧警务解决方案,实现衢州公安与“浙警智治”2.0平台全域级联贯通。

技术栈:华为云(ECS、CCE、RDS、OBS)、容器技术、大数据MRS(ElasticSearch、分布式数据库等)、零信任认证、数据治理工具、业务总线

项目职责

主导规划交付衢州市警务云计算中心华为云底座、大数据平台及硬件基础设施;基于华为ROMA平台搭建业务总线,实现本地计算、服务、数据资源统一管理;推进容器应用迁移上云,解决elasticsearch兼容问题;对接奇安信零信任体系完成业务总线自定义鉴权,实现省市服务目录同步与鉴权信息互通;支撑两卡业务等ISV业务部署,提供新业务容器化上云开发支持等。

项目业绩

构建25个云服务,实现与浙警智治2.0平台级联贯通,达成全省资源可见、可管、可调用目标;数据治理效率提升60%,应用上线周期缩短50%

衢州市政务云国产化改造及上云交付项目 | 核心交付/迁移专家 | 2023/12

项目描述

为衢州市政务云提供国产化改造、上云交付及运维体系建设全流程服务,涵盖云底座规划、资源扩容、应用迁移、安全集成与运维能力搭建,满足政务业务集约化管理与安全合规要求,满足政务云从“卖空间资源”到“服务+能力”的业务模式转变需求。

技术栈:政务云IaaS/PaaS平台、国产化替代技术、统一监控体系(MO平台)、自动化运维平台、安全服务集成、CMDB管理系统、ITSM工具等

项目职责

1、云底座规划与交付管理:牵头完成政务云底座新建规划设计,输出硬件配置清单与组网拓扑方案,同步推进IaaS服务分阶段扩容;针对政务应用特性制定国产化替代改造方案,评估应用与国产化平台兼容性,梳理30+项应用改造需求,明确迁移优先级,分批次完成核心政务应用上云部署。 2、运维体系与监控能力搭建:参考标准设计政务云运维体系,制定33项核心运维流程(含事件管理、变更管理、应急管理等)与50+个交付物清单,含《服务发布管理流程》《应急操作手册》等;搭建可观测统一监控体系,完成MO平台与自动化运维平台的对接配置,实现计算、存储、网络等资源及应用性能的实时可视化监控,设置200+项告警阈值,覆盖95%以上故障场景。 3、安全集成与规划:联合安全厂商设计租户面安全服务集成方案,落地网络安全、虚拟化安全、数据安全等防护措施,完成等保合规适配,制定安全巡检、漏洞扫描、应急响应等标准化操作流程SOP;参与二期项目规划,输出高阶资源池扩容方案,明确计算、存储、网络资源扩容规格,同步规划技术中台与PaaS云服务扩容细节,梳理待迁移政务应用的迁移方案,含迁移风险评估、资源需求测算及回滚预案制定。

项目业绩

1、完善了标准化政务云运维体系,实现资源利用效率提升40%,运维响应速度提高50%,故障处理时长缩短60%; 2、通过等保测评,成功支撑20+项政务应用平滑迁移; 3、助力客户实现政务云自维护能力,运维团队独立完成日常运维任务占比从30%提升至80%。

国网浙江省电力禾城外网云 | 产品技术经理 | 2023/10

项目描述

基于华为云Stack解决方案构建电力行业私有云平台,完成从8.0.2到8.3.1的版本迭代,部署500PM/5000VM资源池,支撑10+部门500+核心业务,涵盖电力物联网能管系统、能源大数据平台等关键业务,同时搭建安全隔离体系与统一运维监控机制,保障平台高可用与业务连续性。

技术栈:华为云Stack(HCS8.0X)、FusionSphereOpenStack、分布式存储(FusionStorage)、SDN网络、KVM虚拟化、ManageOne云管平台、容器平台(CCE)、应用平台(ROMAConnect)、中间件(DCS、DMS)、数据库RDS、数仓DWS、大数据MRS、数据中台DGC、安全防护体系(vFW/SG/FusionGuard)等

项目职责

云平台架构设计与组网规划,完成云底座交付与试运行和版本演进;新业务部署与旧业务平滑迁移,优化VDC建模网络模型;搭建统一观测与告警编排体系,沉淀平台演练回切流程,开展版本演进评审与容量治理;推进统一服务治理,提升关键链路稳定性,实现生产变更零事故;协同跨产品线处置应急问题等

项目业绩

资源利用率提升30%,MTTR显著下降,平台支撑48708核私有云算力规模,稳定运行6000+台虚拟机,完成600+问题闭环,实现网络安全隔离与业务可靠稳定运行,满足电力行业核心业务稳定诉求。

某商业银行华为HCS项目 | 产品与技术工程师 | 2021/06

项目描述

交付落地灾备云架构,完成杭州生产主Region、开发测试Region、灾备从Region部署,涵盖ARM与X86混合架构IAAS资源建设,需支撑4个以上业务部门、80余个系统、800余台虚拟机运行,同时解决资源分配、安全防护、运维效率等核心问题,保障银联前置系统、柜面冲正系统等重点业务稳定运行。

技术栈:华为HCS8.0.3云平台(ManageOne8.0.3、FusionSphereOpenStack8.0.3)、ARM/X86混合计算架构、分布式块存储(华为OceanStorPacific)、IPv4+IPv6双栈网络、KVM虚拟化、vFW/安全组、集中运维监控

项目职责

参与平台组网设计,明确生产环境双核心组网与测试环境单核心组网方案,规划计算2.3万核vCPU、存储1.81PB块存储、网络资源分配;协助进行资源池容量评估与故障域可靠性分析,监控主机/虚拟机,优化存储与网络冗余配置;参与安全防护体系搭建,通过vFW、安全组实现南北向/东西向访问控制,配合DDoS防御与防病毒网关提升安全性;完善运维组织分工与SOP,部署日志收集、巡检工具,处理存储节点隔离、漏洞等问题,推进节点扩容与版本升级演进。

项目业绩

支撑1000+业务虚机稳定运行,重点业务跨region高可用;完善应急预案并开展信息系统切换演练,灾备环境可持续运行24小时目标,大幅提升运维运营韧性

国网浙江省电力泛在电力物联网项目 | IoT产品技术专家 | 2020/03

项目描述

国家电网泛在电力物联网ROMA20版本交付,构建覆盖物理网络、基础配置、服务部署及安全加固的端到端解决方案,支撑电力设备智能连接、数据统一管理及云管边端协同运维,实现电网智能化水平与业务协同效率的双重提升。

技术栈:IoT平台架构设计、边缘计算、大数据平台建设、云管边端协同、HCS8.X、云网规划、LVS/OBS、防火墙安全策略、Ansible自动化部署

项目职责

参与设计电力用户与电网企业设备智能连接方案,实现设备数据统一采集与共享;运用移动互联与人工智能技术优化电力设备智能感知与控制能力,拓展数据来源范围;参与构建泛在电力物联网大数据平台,保障电力信息统一分析与业务贯通;主导网络拓扑规划与基础配置实施,完成25.X/172.28.X等网段规划、VLAN分配及VRF隔离配置;搭建OBS节点网络与云专线;推进优化加固配置,完成防火墙策略优化、无用配置清理及远程管理安全加固。

项目业绩

实现IoT设备可信远程升级与容器化运维,设备运维效率提升50%;网络架构支撑日均百万级电力数据流转,数据共享延迟降低40%,系统稳定性提升至99.9%,年运维成本降低30%。

浙能智云私有云建设项目 | 产品与技术工程师 | 2019/12

项目描述

浙能集团双Region华为HCS混合云平台一期建设,涉及HCS6.X和8.X过渡架构,构建“云网联动”的IaaS+PaaS,支撑智慧电厂、加油站系统等核心业务云化迁移,实现基础设施共建共用、数据资源汇聚共享及租户安全隔离。

技术栈:华为云Stack、容器技术(CCE)、SDN/VXLAN、基础服务/ROMA/DAYU/MRS/RDS等云服务、OBS对象存储、AC控制器、虚拟墙等

项目职责

HCS8.X平台LLD规划,主导技术中台、数据中台交付,容器迁移中解决高阶服务组件使用难题,保障业务按期上云;通过VRF实例与虚拟墙实现租户网络隔离;应对两次解决方案跨版本升级变更,后期版本收编与演进。

项目业绩

提前完成基础底座、技术中台、数据中台交付使用,支撑核心业务云化迁移;实现租户间隔离,计算、存储、网络全维度云服务化;跨版本交付场景下提前完成高阶服务上线,平台运行稳定,为后续大数据及AI平台建设奠定基础。


教育背景

重庆大学 | 本科

电气工程及自动化专业

褚成志 · 简历中心