您的浏览器不支持本演示,请用最新版 Chrome/Edge/Firefox。
同样读一篇论文,AI Agent 比对话框强在哪?
从「读懂」到「动手」
一条主线:说 → 做
对话框只会「说」——Agent 能「动手做」
对话框「说」,Agent「做」
- 对话框:读懂/讲解/画图,终究是说
- Agent:抓文献织网、翻知识库印证、跑二次分析复现
样例来源:得到·卓克老师那期
- 例子来自得到平台卓克老师栏目
- 一项历时三十年的黑猩猩研究
- 2026.4 发表于 Science
论文原图:时间 × 空间双维度
- 长期行为记录(时间)
- 一个个 GPS 坐标点(空间)
- 后续数据清理用上了 Claude
我的环境:AI Agent「Floatboat」
- 朋友少卿团队研发的通用 AI Agent 框架
- 文件浏览/网页操作拢进一个工具
- 关键:能自由挂最前沿模型,限制少
- 本次全程用它 + Opus 4.8 跑通
Q1:论文说了啥
- 拎出骨架:核心内容/结论/背景/争论/方法/三阶段
- 还主动提议做报告、笔记、PPT
Q2:用了哪些方法
- 三十年追踪+行为观察+GPS+遗传学
- 社会网络分析:Leiden/模块度/变点检测
Q3:哪里用到了 AI
- 核心算法≠大模型
- 生成式 AI(Claude):整理空间数据 + R 绘图排版
方法最漂亮处:三线殊途同归
- 行为观察 + 遗传学 + GPS 三条独立证据线
- 都指向 2015 同一个转折点
- 三路独立验证,结论格外可靠
上手:从「问」跨到「做」
- 用真实数据写 R,跑出 2018-2024 种群下降图
- 完整脚本带严丝合缝的注释
越界①静态:比论文那张更好
- 16.5 万个空间点
- 分裂前 / 分裂后 / 重叠度崩溃三面板
- 一个故事一下立起来
越界②动态:逐年演化眼睁睁看分裂
- MP4 + 循环 GIF
- 年份一年年往前,看着分裂怎么发生
- 这一段效果最好——静态图给不了
● 动图
越界③可解释性:过程全摊开
- 13 张单帧 PNG 可随手抽取
- 渲染脚本全公开
- 连 FFmpeg 缺编码器的坑都交代清楚
选择:好鞍还得配好马
- 自动模式把黑猩猩错说成倭黑猩猩
- 模型选择是人的判断,别让渡给框架
- 严肃任务用更好的模型才踏实
小结:模型 + 框架
- Agent = 模型 + 框架
- 模型自由选,框架越人性化越好
- 真正的本事不在读懂,在动手
← / → 或点击左右翻页 · 问答部分点进去钻入再退回 · 最后一页全景总览