SillyTavern 模型选择指南 — DeepSeek Tavern Pro 文档

选对模型效果翻倍！SillyTavern 模型选择指南 + 酒馆专属模型发布

酒馆教程 EP.07 | 模型选择 + DeepSeek Tavern V1 Pro 首发

一、同一张角色卡，不同模型 = 完全不同的体验

在之前六期教程里，我们完成了全套酒馆部署和角色卡制作。现在你手里已经有了精美的角色卡，但选错模型 = 一切白费。同一个角色，用 Claude 和用通用模型，效果判若两人。本期帮你一次选对，少花冤枉钱。

二、系列进度总览

本系列已更新至第七期，完整路线图如下：

期数	主题	状态
EP.01	SillyTavern 简介与安装部署	✓ 已完成
EP.02	界面导览与基础设置	✓ 已完成
EP.03	角色卡入门：从下载到对话	✓ 已完成
EP.04	世界书/知识库：让 AI 真正懂你的设定	✓ 已完成
EP.05	高级角色卡制作（上）：定义与排版	✓ 已完成
EP.06	高级角色卡制作（下）：正则与 Lore	✓ 已完成
EP.07	模型选择指南 + 酒馆专属模型发布	● NOW
EP.08	高级功能速览（系列收官）	即将更新

三、不同模型 = 不同作家

如果把模型比作作家，每个都有独特的"文风"和"性格"。了解它们的差异，才能物尽其用：

3.1 四大主流模型横向对比

模型	定位/文风	中文质量	性价比	推荐场景
Claude	文学作家 · 温暖 · 有人味	★★★★☆	★★☆☆☆	追求质感的长篇 RP
Gemini	精准记者 · 逻辑强 · 不胡扯	★★★☆☆	★★★★☆	解谜推理 · 需要逻辑
DeepSeek	诗意国文 · 中文天花板	★★★★★	★★★★★	日常 RP · 性价比之王
本地模型	能力有限 · 不推荐	★★☆☆☆	★★★★★	极致隐私 · 不花钱

四大模型文风对比示意

四、Claude Opus vs Sonnet：旗舰 vs 甜点

Claude 是当前 RP 圈公认的顶级模型。但 Opus 和 Sonnet 怎么选？

Opus - 顶级旗舰：Claude Opus：RP 天花板。对话有温度、有深度，能捕捉微妙情感变化。价格昂贵，但每一分钱都花在"灵魂"上。适合关键剧情、情感高潮。

Sonnet - 甜点级：Claude Sonnet：约 85% 的 Opus 实力，价格不到一半。日常 RP 完全够用，速度还更快。推荐作为主力模型。

总结：日常用 Sonnet，关键时刻切 Opus。

Claude Opus vs Sonnet 对比

五、Gemini + DeepSeek V4：逻辑之王 vs 中文之王

除了 Claude 之外，还有两个强力选手：

Gemini：逻辑能力最强。几乎不产生幻觉，适合需要严密推理的场景——解谜、侦探、法庭 RP。中文一般，但英文极强。

DeepSeek V4：中文天花板。古风、诗词、文艺向 RP 的不二之选。价格极低，对新手最友好。如果你预算有限，DeepSeek 就是最佳起步选择。

Gemini 与 DeepSeek V4 能力对比

六、🆕 酒馆专属模型：DeepSeek Tavern V1 Pro 首发

经过数月研发和测试，我们正式发布酒馆专属模型 —— DeepSeek Tavern V1 Pro。

这个模型基于 DeepSeek V4 Pro 基座，蒸馏了 Claude Opus 的创作力和 Gemini 的逻辑严谨性，专为 SillyTavern RP 场景优化。

三大核心能力

创作力突破：拥有接近 Opus 的文学创作力，能写出有温度、有质感的剧情和对话。不再"AI 味"十足。

上下文跟随：严格遵循角色卡设定和世界书约束，不会"自我发挥"偏离人设。复杂多角色场景也能稳。

内置越狱：内置 Jailbreak，开箱即用。无需额外配置预设，省去大量调试时间。

定价策略：几杯奶茶/月，远低于 Claude Opus。下周正式上线，敬请期待！

DeepSeek Tavern V1 Pro 能力展示（一）

DeepSeek Tavern V1 Pro 能力展示（二）

七、本地模型：免费，但代价不小

本地部署模型的核心卖点是免费 + 隐私，但实际体验有门槛：

7.1 本地方案对比

方案	模型推荐	硬件要求	体验评价
Ollama	Qwen 2.5 / Llama 3	8G+ 显存	简单易用，效果一般
KoboldCPP	Qwen / Llama	8G+ 显存	功能更强，配置复杂
TextGen WebUI	多种模型	12G+ 显存	功能最全，门槛最高

7.2 GPU 成本 vs API 成本

很多人觉得"本地 = 免费"，但算一笔账：一张 16G 显存的显卡（如 RTX 4060 Ti 16G）约 3000-4000 元。同等预算下，足以支付 DeepSeek API 3-5 年的使用费用。除非你已有高配显卡，否则并不省钱。

本地模型方案概览

八、混合策略：不同场景不同模型

最佳实践不是"只用最好的"，而是"在合适的场景用合适的模型"。推荐如下分配：

场景占比	推荐模型	原因
80% 日常	Sonnet / DeepSeek	够用 + 省钱 + 速度快
20% 关键时刻	Opus	关键剧情、情感高潮用最好的
解谜/推理	Gemini	逻辑最强，不胡扯
古风/诗词	DeepSeek	中文天花板
综合最佳	Tavern V1 Pro（即将上线）	覆盖大部分场景，一模型通吃

混合模型策略示意图

九、API 获取指南 + Tavern 定价

9.1 各模型 API 获取方式

模型	获取方式	门槛	支付方式
Claude / GPT	海外官网注册	需海外手机号 + 外币卡	Visa/MasterCard
Gemini	Google AI Studio	需 Google 账号	免费额度 + 信用卡
DeepSeek	国内官网注册	极低	支付宝/微信
Tavern V1 Pro	酒馆专属渠道	国内直接购买	支付宝/微信

对国内用户最友好的方案：DeepSeek（支付宝就能充）+ Tavern V1 Pro（酒馆专属，无需翻墙）。

9.2 Tavern V1 Pro 定价

Tavern V1 Pro 定价策略：

月费：几杯奶茶/月

对比 Claude：远低于 Claude Opus 官方价格

性价比：Claude Opus 创作力 + DeepSeek 中文水平 + Gemini 逻辑

API 获取渠道与 Tavern 定价

十、省钱技巧：花小钱办大事

以下几个技巧能帮你大幅降低 Token 消耗：

分层调用：草稿阶段用 DeepSeek（便宜），润色/高潮用 Claude（贵但值）

128K 足够：大部分 RP 场景 128K 完全够用，不需要盲目追求更大上下文

自动摘要：开启酒馆的自动摘要功能，将历史对话压缩为摘要，节省 40%+ Token

本地辅助：如果你的显卡有 16G+ 显存，本地模型可以零成本跑日常对话

省钱技巧速览

十一、Token 预算管理：精打细算

128K 上下文约等于 30000-50000 个中文字符。合理分配是关键：

组成部分	占比	说明
角色卡定义	~20%	角色背景、性格、外观等定义
世界书 / Lore	~15%	世界观、规则、额外知识
对话历史	~65%	实际的聊天内容，占比最大

管理要点：

角色卡定义精炼不冗余，每个 token 都要有价值

世界书按需激活，不要全量加载

定期清理或摘要过长的对话历史

Token 预算分配图

十二、模型切换教程：一键换模型

在 SillyTavern 中切换模型非常简单，三步搞定：

Step 1：点击顶部菜单"角色管理"

Step 2：选择"API 连接" → 在下拉菜单中切换 API 类型

Step 3：选择目标模型 → 确认切换

支持对话中途切换——比如日常用 DeepSeek 聊，到了关键剧情一键切 Opus，完全无缝。

模型切换操作步骤

十三、下期预告：EP.08 高级功能速览（系列收官）

这是本系列的倒数第二期。最后一期将带你快速过一遍酒馆的进阶功能：

变量系统与动态内容

多角色同时对话（Group Chat）

TTS 语音合成集成

SD/ComfyUI 图片生成集成

表情包与背景音乐系统

数据备份与迁移

八期满满干货，从零到精通。敬请期待收官之作！

如果这篇教程对你有帮助，请点赞、投币、收藏、分享支持一下！

私信发送"角色卡"可获取 10G 精选角色卡资源包

关注获取 EP.08 收官更新通知！

SillyTavern 基础教程系列 · EP.07 · 模型选择指南 | 知乎发布版