Skip to content

褚成志 · 项目经历

华为云原厂技术服务专家 | 累计交付 50+ 政企云项目 | 杭州


一、衢州数据局 DeepSeek 大模型多机推理项目

角色: 产品技术经理   时间: 2025/03

项目描述

基于 HCS + ModelArts 架构,完成 DeepSeek-R1 大模型多机推理部署与全链路性能优化,适配昇腾 910 硬件环境,交付政务场景高可用大模型推理服务,支撑业务稳定调用与高效响应。

技术栈

ModelArts、MindIE、DeepSeek 大模型(R1/V3)、昇腾芯片、Kubernetes、Docker、HCCL 通信库、OBS、SWR、昇腾 Profiler

主要职责

  • 主导大模型交付全流程规划,包括 ARM 环境准备、镜像制作与 SWR 上传、模型权重 OBS 存储配置
  • 修改 MindIE 及模型权重目录 config.json,配置分布式推理参数与模型类型兼容
  • 优化 ModelArts 资源配比,启用芯片亲和性调度与 HCS 补丁
  • 通过动态批处理、W8A8 量化推理、HCCL RDMA 协议启用等手段优化推理性能
  • 部署昇腾 Profiler 监控平台,分析算子执行与通信耗时
  • 完成 MA 在线服务与客户侧应用集成对接及 Token 鉴权配置

项目成果

推理吞吐量提升约 40%,首 Token 延迟降低约 30%,满足政务场景高并发调用需求,业务零宕机运行。


二、台州电信政务云平台建设项目

角色: 云产品与技术专家   时间: 2025/01

项目描述

为满足台州大数据局信创及等保合规要求,设计并交付基于华为云 Stack 的政务云平台,提供计算、存储、网络等全栈 IaaS 服务,采用单 Region 多 AZ 架构,保障政务业务数据安全及合规访问。

技术栈

华为云 Stack、鲲鹏服务器、分布式存储(OceanStor Pacific)、KVM 虚拟化、三层组网、VPC、云防火墙(CFW 2.0)、OBS 对象存储、云硬盘(SATA/SSD)

主要职责

  • 主导需求分析与架构交付设计,规划计算、存储资源配置方案
  • 设计单 Region 多 AZ 组网方案,通过网闸实现跨区数据安全交换
  • 基于鲲鹏架构部署服务器集群与分布式存储池,配置差异化云存储
  • 部署三方备份环境与安全防护系统,落实信创及等保合规要求
  • 制定本地运维方案,配置驻场运维与版本升级服务

项目成果

成功交付符合政务信创标准的云平台,存储可用容量达 352T;系统运维效率提升 50%,数据交互合规性 100%,支撑政务业务稳定上线。


三、第七一五研究所 CodeArts & ROMA 一体化开发平台项目

角色: 产品技术经理   时间: 2024/08

项目描述

基于华为云基础设施平台,整合 CodeArts DevOps 工具链与 ROMA 集成能力,打造"研发—集成—部署—运营"全链路数字化开放平台,支撑多团队协同与跨源数据互通,满足客户安全合规与高效交付需求。

技术栈

华为云(ECS、RDS、VPC、OBS)、CCE、CodeArts(需求管理、代码托管、流水线等)、ROMA Connect(FDI、MQS、APIC、LINK)

主要职责

  • 主导华为云底座构建与 CodeArts 方案交付,规划云资源架构,构建 DevOps 自动化 CI/CD 链路
  • 定制 CodeArts 分层培训,覆盖开发、测试、运维角色,输出使用指南,实现团队工具链全覆盖
  • 基于 CodeArts 效能洞察与云监控工具,构建数据跟踪体系,输出优化报告提升工具使用效率

项目成果

研发周期缩短 50%,应用部署自动化率 90%,支持 300+ 人员协同;CodeArts 使用熟练度提升 80%,运维成本降低 40%。


四、衢州市警务云 HCS 项目

角色: 产品技术经理   时间: 2024/05

项目描述

主导衢州警务云(容器 + 大数据)省市级联贯通项目建设,构建适配治安管理与民生服务的智慧警务解决方案,实现衢州公安与"浙警智治"2.0 平台全域级联贯通。

技术栈

华为云(ECS、CCE、RDS、OBS)、容器技术、大数据 MRS(ElasticSearch、分布式数据库等)、零信任认证、数据治理工具、业务总线

主要职责

  • 主导规划交付警务云计算中心华为云底座、大数据平台及硬件基础设施
  • 基于华为 ROMA 平台构建业务总线,实现本地计算、服务、数据资源统一管理
  • 推进容器应用迁移上云,解决 Elasticsearch 兼容问题
  • 对接奇安信零信任体系完成业务总线自定义鉴权,实现省市服务目录同步与鉴权信息互通
  • 支撑两卡业务等 ISV 业务部署,提供新业务容器化上云开发支持

项目成果

构建 25 个云服务,实现与浙警智治 2.0 平台级联贯通,达成全省资源可见、可管、可调用目标;数据治理效率提升 60%,应用上线周期缩短 50%。


五、衢州市政务云国产化改造及上云交付项目

角色: 核心交付 / 迁移专家   时间: 2023/12

项目描述

为衢州市政务云提供国产化改造、上云交付及运维体系建设全流程服务,涵盖云底座规划、资源扩容、应用迁移、安全集成与运维能力构建,满足政务业务集约化管理与安全合规要求。

技术栈

政务云 IaaS/PaaS 平台、国产化替代技术、统一监控体系(MO 平台)、自动化运维平台、安全服务集成、CMDB 管理系统、ITSM 工具

主要职责

  • 云底座规划与交付管理:牵头完成政务云底座新建规划设计,输出组网拓扑方案;梳理 30+ 项应用改造需求,分批次完成核心政务应用上云部署
  • 运维体系与监控能力构建:制定 33 项核心运维流程与 50+ 个交付物清单;构建统一监控体系,设置 200+ 项告警阈值,覆盖 95% 以上故障场景
  • 安全集成与规划:联合安全厂商落地网络安全、虚拟化安全、数据安全防护措施,完成等保合规适配;制定安全巡检、漏洞扫描、应急响应标准化 SOP

项目成果

资源利用效率提升 40%,运维响应速度提高 50%,故障处理时长缩短 60%;通过等保测评,支撑 20+ 项政务应用平滑迁移;运维团队独立完成日常运维任务占比从 30% 提升至 80%。


六、国网浙江省电力禾城外网云项目

角色: 产品技术经理   时间: 2023/10

项目描述

基于华为云 Stack 构建电力行业私有云平台,完成版本迭代演进,支撑 10+ 部门 500+ 核心业务,涵盖电力物联网能管系统、能源大数据平台等关键业务,构建安全隔离体系与统一运维监控机制。

技术栈

华为云 Stack(HCS 8.0X)、FusionSphere OpenStack、分布式存储(FusionStorage)、SDN 网络、KVM 虚拟化、ManageOne 云管平台、CCE、ROMA Connect、中间件(DCS、DMS)、RDS、DWS、MRS、DGC、安全防护体系(vFW/SG/FusionGuard)

主要职责

  • 云平台架构设计与组网规划,完成云底座交付与试运行及版本演进
  • 新业务部署与旧业务平滑迁移,优化 VDC 建模网络模型
  • 构建统一观测与告警编排体系,沉淀平台演练回切流程
  • 推进统一服务治理,提升关键链路稳定性,实现生产变更零事故
  • 协同跨产品线处置应急问题,开展版本演进评审与容量治理

项目成果

资源利用率提升 30%,MTTR 显著下降;平台稳定运行 6000+ 台虚拟机,完成 600+ 问题闭环,实现网络安全隔离与业务可靠稳定运行。


七、某商业银行华为 HCS 灾备云项目

角色: 产品与技术工程师   时间: 2021/06

项目描述

交付落地金融级灾备云架构,完成生产主 Region、开发测试 Region、灾备从 Region 三地部署,支撑 4 个以上业务部门、80 余个系统、800 余台虚拟机稳定运行,保障银联前置系统、柜面冲正系统等重点业务高可用。

技术栈

华为 HCS 8.0.3(ManageOne、FusionSphere OpenStack)、ARM/X86 混合计算架构、分布式块存储(OceanStor Pacific)、IPv4+IPv6 双栈网络、KVM 虚拟化、vFW / 安全组、集中运维监控

主要职责

  • 参与平台组网设计,明确生产环境双核心与测试环境单核心组网方案,主导金融级多 Region 灾备架构设计与资源分配方案规划
  • 协助进行资源池容量评估与故障域可靠性分析,优化存储与网络冗余配置
  • 参与安全防护体系构建,通过 vFW、安全组实现南北向/东西向访问控制
  • 完善运维组织分工与 SOP,处理存储节点隔离、漏洞等问题,推进节点扩容与版本升级

项目成果

支撑 1000+ 业务虚机稳定运行,重点业务跨 Region 高可用;完善应急预案并开展信息系统切换演练,灾备环境可持续运行 24 小时,大幅提升运维运营韧性。


八、国网浙江省电力泛在电力物联网项目

角色: IoT 产品技术专家   时间: 2020/03

项目描述

国家电网泛在电力物联网 ROMA 2.0 版本交付,构建覆盖物理网络、基础配置、服务部署及安全加固的端到端解决方案,支撑电力设备智能连接、数据统一管理及云管边端协同运维。

技术栈

IoT 平台架构设计、边缘计算、大数据平台建设、云管边端协同、HCS 8.X、云网规划、LVS/OBS、防火墙安全策略、Ansible 自动化部署

主要职责

  • 参与设计电力用户与电网企业设备智能连接方案,实现设备数据统一采集与共享
  • 运用移动互联与人工智能技术优化电力设备智能感知与控制能力
  • 参与构建泛在电力物联网大数据平台,保障电力信息统一分析与业务贯通
  • 主导网络拓扑规划与基础配置实施,完成网段规划、VLAN 分配及 VRF 隔离配置
  • 推进防火墙策略优化、无用配置清理及远程管理安全加固

项目成果

实现 IoT 设备可信远程升级与容器化运维,设备运维效率提升 50%;网络架构支撑日均百万级电力数据流转,数据共享延迟降低 40%,系统稳定性提升至 99.9%,年运维成本降低 30%。


九、浙能智云私有云建设项目

角色: 产品与技术工程师   时间: 2019/12

项目描述

浙能集团双 Region 华为 HCS 混合云平台一期建设,构建"云网联动"的 IaaS + PaaS,支撑智慧电厂、加油站系统等核心业务云化迁移,实现基础设施共建共用、数据资源汇聚共享及租户安全隔离。

技术栈

华为云 Stack、CCE、SDN/VXLAN、ROMA/DAYU/MRS/RDS 等云服务、OBS 对象存储、AC 控制器、虚拟墙

主要职责

  • 主导 HCS 8.X 平台 LLD 规划,主导技术中台、数据中台交付
  • 容器迁移中解决高阶服务组件使用难题,保障业务按期上云
  • 通过 VRF 实例与虚拟墙实现租户网络隔离
  • 应对两次解决方案跨版本升级变更,完成后期版本收编与演进

项目成果

提前完成基础底座、技术中台、数据中台交付;实现租户间隔离,计算、存储、网络全维度云服务化;跨版本交付场景下提前完成高阶服务上线,为后续大数据及 AI 平台建设奠定基础。


共 9 个项目 | 涵盖 AI 大模型、政务云、金融云、电力云、IoT 等领域

褚成志 · 简历中心