关于我 | Zoe

我是 Zoe，AI Infra Engineer，坐标杭州。

写代码 10 年。Go / Python / Flutter / Rust 都写。前半段做分布式系统、容器调度、GPU 集群；这两年全栈转向 AI 推理，目前在一家大型互联网公司负责自研推理服务平台。

现在的主线

AI Infra：每天跟 LLM、vLLM、SGLang、GPU 打交道。

负责的事情围绕几个关键词：

业余时间在做 AI Ops 工具——把日常的 AI 工程工作流抽成可复用的工具，开源出去。

早期写 Python 和 Go，搞爬虫、数据采集、分布式应用框架。后来转向云原生——容器运行时、Kubernetes、GPU 集群调度。

2024 之后随着大模型推理走向千卡万卡集群，工作重心整体迁到 AI Infra：模型部署、推理优化、大规模 serving。每天都在跟性能数字、显存、网络带宽较劲。

造东西我在行，但前 10 年一直在给别人造。2026 年开始给自己造。

distro — 内容分发 CLI

写一篇 Markdown，自动改写成 Twitter thread、掘金文章、知乎帖子、小红书帖子、英文博客。还能生成小红书配图卡片、渲染 Mermaid 图表、检测 AI 写作痕迹。

automagent — 手机端 AI Agent

用 Flutter 写的，能看屏幕、理解 UI、自动操作手机。跑在手机本体上，不需要连电脑。多模型支持，多平台兼容。

多 Agent 工作流

跑着一套多 Agent 系统管理日常工程和写作。三个 Agent 各管一摊：

它们之间通过文件协议协作，每天产出 plan / summary / patch，全程留痕。

主战场：Python（推理 / Serving / 训练对接）、Go（后端 / 平台 / CLI 工具）、CUDA 周边工具链

AI 推理：vLLM、SGLang、TensorRT-LLM、Triton、Ray、NCCL

基础设施：Kubernetes、Docker、RDMA / InfiniBand、GPU Device Plugin、NRI

还在用：Flutter（移动端 Agent）、Rust（系统级工具）、React/Next.js（前端）

偏好：干净架构、能用自己的轮子就用自己的、讨厌过度设计、喜欢把复杂的东西封装成一行命令。

主要写：

中文原稿写一次，distro 自动分发到多平台。

用我自己的 nextjs-starter-zoe-app 搭的。Next.js + Tailwind + shadcn/ui，YAML 驱动配置，Markdown 写内容。

主业之外，每年留一两个外部项目的时间。

通常是这两种：

不接：UI 切图、纯前端外包、大公司纯人力派遣。

想聊的话，[email protected] 或 Telegram 都行 —— 邮件附上一句"在做什么、卡在哪"就够了。

聊 AI Infra、聊 LLM 推理、聊开源工具、聊被动收入实验，都欢迎。直接找我，不用客气。