4. 如何在Drylab中撰写优秀的提示?
提示
核心原则
具体性胜过简洁性。 一个格式良好的提示能为AI提供足够的上下文信息,以便不需要后续询问即可采取行动。可以把它看作是对一位熟练科学家的简报——告诉他们数据、目标和任何限制条件。
良好提示的结构
[你有什么] + [你想要什么] + [你想如何得到] + [任何限制]
分析任务
弱提示 vs 强提示
弱提示 | 强提示 |
|---|---|
"分析我的数据" | "加载 |
"做聚类" | "在AnnData对象上运行Leiden聚类,分辨率为0.5,绘制按聚类着色的UMAP" |
"做一个图" | "绘制 |
"运行差异表达分析" | "在 |
研究任务
弱提示 | 强提示 |
|---|---|
"寻找关于癌症的论文" | "寻找2022年后发表的关于KRAS G12D抑制剂在胰腺癌中应用的论文" |
"什么是BRCA1?" | "总结BRCA1在DNA双链断裂修复中的作用及其在乳腺癌中的临床意义" |
"寻找药物靶点" | "查询DrugBank中针对EGFR的FDA批准药物,并返回其作用机制和批准年份" |
按任务类型的提示模板
加载与探索数据
加载[文件路径或数据集名称]。显示前5行,行/列数量以及每列的数据类型。
统计分析
运行在[column name]列中,比较[group A]与[group B]的[test name]。使用[值]为显著性阈值,并使用[方法]进行多重检验校正。
可视化
绘制按[category]分组的[variable]的[plot type]。使用色盲安全的调色板,添加轴标签,并以PDF格式保存到输出文件夹。
数据库查询
在[数据库名称]中查询[基因/蛋白质/药物名称]。返回[特定字段:例如通路、相互作用、变异]。
流水线/工作流程
我有 [数据类型] 数据在 [文件路径]。运行 [pipeline name],使用 [key parameters]。将结果保存到 [输出路径]。
更好提示的7条规则
命名你的文件和列 — 说
data/expr.csv,列"log2FC",而不是"我的文件"陈述目标,而不仅仅是操作 — "我想识别肿瘤和正常之间差异表达的基因",给AI选择正确方法的上下文
指定阈值 — FDR截止值,最小细胞数,分辨率,聚类数量
提到输出格式 — "保存为PDF","返回一个表格","打印前10个结果"
说明生物体/基因组 — 人类,小鼠,GRCh38,mm10 — 这对数据库和流程至关重要
继续引用先前步骤 — "使用上一步过滤后的AnnData,运行PCA,组件数为50"
每个提示一个任务 — 如果你需要5件事,请按顺序询问,以便验证每个结果
何时添加更多上下文
当任务涉及时添加上下文:
自定义数据 — 描述列、格式、单位
科学决策 — 解释生物学问题
偏好 — 色彩方案,图像大小,统计检验偏好
约束 — 内存限制,时间限制,特定软件包版本
发送提示前的快速检查列表
[ ] 我是否指定了数据来源(文件路径,数据库,变量名称)?
[ ] 我是否说明了确切的目标?
[ ] 我是否包含了关键参数(阈值、方法、组名)?
[ ] 我是否指定了输出格式?
[ ] 这是一个集中的任务,还是我应该把它分成步骤?