bonujel

云平台开发工程师

云平台开发工程师,聚焦云数据库 PaaS,具备云上大规模分布式系统高可用平台研发与稳定性治理经验。主力语言 Golang,扎实 Linux / 网络与分布式基础;人工智能硕士,有 AI-Agent 落地到数据库诊断与运维链路的实践,硕士阶段长期研究区块链共识算法(SCI 一作),并在 Hyperledger Fabric 项目中参与链码与区块链系统工程实践。

 Redis 资源隔离与容量管理(Golang,Linuxcgroupv1,gRPC,SQLite) 面向云上Redis/RDS,构建进程级CPU/内存配额能力。 * 围绕“单实例拖垮整机”问题,设计并落地基于cgroupv1的资源限额模型,打通策略计算、在线下发与运 行时监控自愈的闭环; * 将零散控制逻辑沉淀为Cloud-Cgroup-Lib,统一控制器接口与错误语义,实现资源隔离从一次性方案到可 复用基础组件的升级。 Redis 高可用管控平台(Golang,gRPC,ZooKeeper,Camellia-Proxy) 负责6000+机器/多可用区Redis集群的高可用控制面与接入治理。 * 设计自研分布式Sentinel:基于ZooKeeper汇聚实例健康与拓扑信息,引入Quorum选主机制,收敛多哨 兵并发观测下的故障判定与切换决策; * 将主从切换拆分为“决策层+执行层”,通过Sentinel-AgentgRPC串联VIP漂移、Proxy路由热更等操作, 在大规模集群与并发变更场景下持续优化切换时延和数据一致性,总结Redis服务HA设计经验。 AI-DAS智能数据库诊断(Python,Golang,MCPProtocol,LangChain) 面向生产环境的AI-Agent数据库诊断系统,以告警为入口自动完成实例健康与性能诊断。 * 设计从“告警→工具采集→RAG检索→Agent推理→报告生成”的端到端链路,通过MCP工具统一封装 慢日志、执行计划、表结构与配置查询,单次诊断P95延迟控制在30s内; * 在迭代中将系统从单一慢日志分析演进为多信号融合诊断,构建诊断用例与评测指标,对RAG召回与Agent 策略持续调优,沉淀可迁移的“AI+数据库诊断”设计范式与个人方法论 


Experience: 2 years

Yearly salary: $80,000

Hourly rate: $45

Nationality: 🇨🇳 China

Residency: 🇨🇳 China


Experience

研究助理(实习)
中国金融学会金融科技委员会秘书处
2024 - 2024
围绕金融算力基础设施开展专题研究与跨机构合作,参与面向央行的战略研究报告编写工作。
技术开发(实习)
中国移动信息技术中心
2024 - 2024
从事区块链与大模型结合的技术研发,探索主链–侧链架构与基于 AI 的智能合约安全分析实践。

Skills

linux
redis
rust
golang
english
chinese-mandarin