4. 如何在Drylab中撰写优秀的提示?

提示

No headings found on page
核心原则

具体性胜过简洁性。 一个格式良好的提示能为AI提供足够的上下文信息,以便不需要后续询问即可采取行动。可以把它看作是对一位熟练科学家的简报——告诉他们数据、目标和任何限制条件。

良好提示的结构

[你有什么] + [你想要什么] + [你想如何得到] + [任何限制]

分析任务

弱提示 vs 强提示

弱提示

强提示

"分析我的数据"

"加载 data/samples.csv中的CSV文件,过滤掉 pvalue < 0.05的行,并绘制按log2FC着色的火山图"

"做聚类"

"在AnnData对象上运行Leiden聚类,分辨率为0.5,绘制按聚类着色的UMAP"

"做一个图"

"绘制 gene_expression 按 condition分组的箱线图,覆盖单个数据点,保存为PDF"

"运行差异表达分析"

"在 adata.obs['group']中,执行 treated vs control的Wilcoxon秩和检验DE,FDR < 0.05,log2FC > 1"

研究任务

弱提示

强提示

"寻找关于癌症的论文"

"寻找2022年后发表的关于KRAS G12D抑制剂在胰腺癌中应用的论文"

"什么是BRCA1?"

"总结BRCA1在DNA双链断裂修复中的作用及其在乳腺癌中的临床意义"

"寻找药物靶点"

"查询DrugBank中针对EGFR的FDA批准药物,并返回其作用机制和批准年份"

按任务类型的提示模板

加载与探索数据

加载[文件路径或数据集名称]。显示前5行,行/列数量以及每列的数据类型。

统计分析

运行在[column name]列中,比较[group A]与[group B]的[test name]。使用[值]为显著性阈值,并使用[方法]进行多重检验校正。

可视化

绘制按[category]分组的[variable]的[plot type]。使用色盲安全的调色板,添加轴标签,并以PDF格式保存到输出文件夹。

数据库查询

在[数据库名称]中查询[基因/蛋白质/药物名称]。返回[特定字段:例如通路、相互作用、变异]。

流水线/工作流程

我有 [数据类型] 数据在 [文件路径]。运行 [pipeline name],使用 [key parameters]。将结果保存到 [输出路径]。

更好提示的7条规则
  1. 命名你的文件和列 — 说 data/expr.csv,列 "log2FC",而不是"我的文件"

  2. 陈述目标,而不仅仅是操作 — "我想识别肿瘤和正常之间差异表达的基因",给AI选择正确方法的上下文

  3. 指定阈值 — FDR截止值,最小细胞数,分辨率,聚类数量

  4. 提到输出格式 — "保存为PDF","返回一个表格","打印前10个结果"

  5. 说明生物体/基因组 — 人类,小鼠,GRCh38,mm10 — 这对数据库和流程至关重要

  6. 继续引用先前步骤 — "使用上一步过滤后的AnnData,运行PCA,组件数为50"

  7. 每个提示一个任务 — 如果你需要5件事,请按顺序询问,以便验证每个结果

何时添加更多上下文

当任务涉及时添加上下文:

  • 自定义数据 — 描述列、格式、单位

  • 科学决策 — 解释生物学问题

  • 偏好 — 色彩方案,图像大小,统计检验偏好

  • 约束 — 内存限制,时间限制,特定软件包版本

发送提示前的快速检查列表
  • [ ] 我是否指定了数据来源(文件路径,数据库,变量名称)?

  • [ ] 我是否说明了确切的目标?

  • [ ] 我是否包含了关键参数(阈值、方法、组名)?

  • [ ] 我是否指定了输出格式?

  • [ ] 这是一个集中的任务,还是我应该把它分成步骤?

相关教程

科学正迈向新的飞跃。
加入我们,共同实现这一突破。

科学正迈向新的飞跃。
加入我们,共同实现这一突破。

科学正迈向新的飞跃。加入我们,共同实现这一突破。