杀疯了！GitHub 2.4万星的开源技能包，让AI Agent秒变科研博士

📅 2026年05月19日 · 资源

🧬 当你的 AI 编码助手突然听懂「用 Scanpy 跑单细胞聚类」

你有没有遇到过这种情况：你让 Cursor 或者 Claude Code 帮你写个数据分析脚本，它写得倒是挺利索，但你一提到 "用 DESeq2 做差异表达分析" 或者 "调用 RDKit 画个分子指纹图谱"，它直接愣住——要不就是胡编 API，要不就说 "我建议你查阅官方文档"。

说实话，这不是大模型不行，而是 缺少了领域知识的上下文。通用编程 Agent 知道 Python 语法，但它不懂生物信息学的工具链、不知道临床数据库的接口该怎么调、更搞不清 DiffDock 和 OpenMM 在药物发现流程中怎么衔接。

直到我最近在 GitHub 上翻到一个叫 Scientific Agent Skills 的项目——K-Dense-AI 团队搞的，短短时间狂揽 24,598 颗星，目前 v2.39.0，MIT 协议全开源。一句话概括它的价值：给你手头的 AI 编码 Agent 装上 138 个科研领域的「肌肉记忆」。

🚀 一句话安装： npx skills add K-Dense-AI/scientific-agent-skills 或 gh skill install K-Dense-AI/scientific-agent-skills，然后你的 Agent 就突然懂了所有科研工具怎么用。

🔬 138 个技能，覆盖整个科研 pipeline

这个项目不是随便攒了几个 prompt 就完事。它是实打实地把每个科研领域的关键工具做成 可复用技能包，Agent 装上后能直接调用正确的 API、写对的下游代码、甚至遵循领域最佳实践。

🧪 生物信息学 & 基因组学（21+ 技能）

这是最厚的部分，也是我觉得最惊艳的。Scanpy 单细胞分析、BioPython 序列处理、gget 一键查数据库、PyDESeq2 差异表达——这些生信人天天用的工具，Agent 装上技能后直接能写完整分析脚本。你只需要说 "帮我用 Scanpy 对这个 h5ad 做标准化和聚类"，它就能给出完整可运行的代码，连图例标注都给你配好。

💊 化学信息学 & 药物发现（10+ 技能）

RDKit 分子操作、DeepChem 深度学习分子建模、DiffDock 分子对接、OpenMM 分子动力学模拟。搞计算化学的同行应该懂——这些工具的 API 文档动辄几百页，现在 Agent 直接内置了最佳调用模式。

🏥 临床研究（8+ 技能）

对接 ClinicalTrials.gov 查临床试验、ClinVar 查变异临床意义、COSMIC 和 cBioPortal 查癌症基因组数据。以前写爬虫或者查 REST API 接口要半天，现在一句话搞定。

🩻 医学影像

pydicom 读写 DICOM 文件、PathML 病理图像分析。放射科和病理科方向的工具链也被覆盖了。

🤖 机器学习 & AI（16+ 技能）

PyTorch Lightning 训练框架、Transformers 大模型调用、scikit-learn 经典 ML、PyMC 贝叶斯统计。通用 ML 技能也有，但跟科研场景深度绑定——比如怎么做交叉验证在生物数据上、如何处理高维组学特征。

🔩 材料科学 & 物理

Pymatgen 材料基因组分析、Astropy 天体物理计算、Cirq 和 Qiskit 量子计算框架。从晶格结构到量子线路，覆盖面真的大。

📊 数据可视化 & 分析（16+ 技能）

Matplotlib 科研级绘图、GeoPandas 地理空间数据、NetworkX 网络分析。而且每个技能的 prompt 都优化过——生成的图表默认就是发表级的审美风格。

🧫 蛋白质工程

这个方向我格外关注。ESM（包括最新的 ESM3）蛋白质语言模型、Glycoengineering 糖工程。这几年蛋白质设计火得不行，有了这些技能包，Agent 可以直接用 ESM3 做蛋白质结构预测和序列设计。

🤖 实验室自动化

PyLabRobot 控制液体工作站、Benchling 实验数据管理、Protocols.io 实验协议共享。连湿实验的数字化工具都包了。

✍️ 学术写作 & 沟通（20+ 技能）

Paper Lookup（对接 PubMed / arXiv / bioRxiv）文献检索、Scientific Writing 论文写作辅助。写 Introduction 卡壳了？直接让 Agent 帮你检索相关文献并生成段落草稿。

🎯 研究方法论（12+ 技能）

Brainstorming 头脑风暴、Hypothesis Generation 假设生成、Grant Writing 基金申请写作。这是我觉得最有意思的一组——它不只是写代码，而是在帮你做科研思考。

⚡ 兼容所有主流 Agent 平台

项目兼容性非常广阔：Cursor、Claude Code、Codex CLI、Gemini CLI 全都支持。不管你在哪个生态里，装上就能用。而且安装方式极简：

# 方式一（推荐）：npx 全局安装
npx skills add K-Dense-AI/scientific-agent-skills

# 方式二：GitHub CLI
gh skill install K-Dense-AI/scientific-agent-skills

装完后你的 Agent 就拥有了科研领域的「肌肉记忆」——问它任何科学计算问题，它不再需要猜 API，而是直接调用最正确的工具链。

💡 我自己的使用体验

我拿它试了一个真实场景：从一个单细胞 RNA-seq 数据集做完整分析。我跟 Cursor（装了 Scientific Agent Skills）说了一句话："帮我下载这个 PBMC 数据集，用 Scanpy 做质控、标准化、PCA、UMAP 降维、Leiden 聚类，然后找出每个 cluster 的 marker genes。"

结果它直接生成了完整脚本——从 scanpy.read 读数据到 sc.pl.umap 出图一条龙，还在每一步加了详细的注释和质控阈值说明。完全不需要我去翻 Scanpy 的教程文档。这种体验说实话有点震撼——仿佛你的 Agent 突然读完了整个生信硕士课程。

🔗 谁适合用这个项目？

科研人员：经常用 Python/R 做数据分析的，能省掉大量查文档的时间
生信工程师：日常工作就是跑各种生信工具的，装上直接提效 2-3 倍
计算化学 / 药物研发：分子模拟和对接流程可以全自动化
AI 研究员：需要快速验证想法、写训练脚本的
硕博研究生：写论文、查文献、做数据分析一条龙

项目在 GitHub 上更新非常活跃，v2.39.0 已经是相当成熟的版本。而且 MIT 协议意味着你可以随便拿去用、改、甚至集成到自己的产品里。

我觉得这类「领域技能包」是未来 AI 编码 Agent 的重要方向——大模型本身是通用的，但真正让它落地到具体行业，需要这样的高质量技能库来做桥梁。Scientific Agent Skills 在这方面走在了前面。

⭐ 项目信息速览
📦 名称：Scientific Agent Skills
👤 作者：K-Dense-AI
⭐ GitHub Stars：24,598
🏷️ 版本：v2.39.0 · MIT License
🐍 语言：Python
🧩 技能数：138 个科研技能
🔧 兼容：Cursor / Claude Code / Codex CLI / Gemini CLI

📚 参考来源

K-Dense-AI/scientific-agent-skills - GitHub