选对模型效果翻倍!SillyTavern 模型选择指南 + 酒馆专属模型发布

酒馆教程 EP.07 | 模型选择 + DeepSeek Tavern V1 Pro 首发

一、同一张角色卡,不同模型 = 完全不同的体验

在之前六期教程里,我们完成了全套酒馆部署和角色卡制作。现在你手里已经有了精美的角色卡,但选错模型 = 一切白费。同一个角色,用 Claude 和用通用模型,效果判若两人。本期帮你一次选对,少花冤枉钱。

二、系列进度总览

本系列已更新至第七期,完整路线图如下:

期数主题状态
EP.01SillyTavern 简介与安装部署✓ 已完成
EP.02界面导览与基础设置✓ 已完成
EP.03角色卡入门:从下载到对话✓ 已完成
EP.04世界书/知识库:让 AI 真正懂你的设定✓ 已完成
EP.05高级角色卡制作(上):定义与排版✓ 已完成
EP.06高级角色卡制作(下):正则与 Lore✓ 已完成
EP.07模型选择指南 + 酒馆专属模型发布● NOW
EP.08高级功能速览(系列收官)即将更新

三、不同模型 = 不同作家

如果把模型比作作家,每个都有独特的"文风"和"性格"。了解它们的差异,才能物尽其用:

3.1 四大主流模型横向对比

模型定位/文风中文质量性价比推荐场景
Claude文学作家 · 温暖 · 有人味★★★★☆★★☆☆☆追求质感的长篇 RP
Gemini精准记者 · 逻辑强 · 不胡扯★★★☆☆★★★★☆解谜推理 · 需要逻辑
DeepSeek诗意国文 · 中文天花板★★★★★★★★★★日常 RP · 性价比之王
本地模型能力有限 · 不推荐★★☆☆☆★★★★★极致隐私 · 不花钱
配图

四大模型文风对比示意

四、Claude Opus vs Sonnet:旗舰 vs 甜点

Claude 是当前 RP 圈公认的顶级模型。但 Opus 和 Sonnet 怎么选?

Opus - 顶级旗舰:Claude Opus:RP 天花板。对话有温度、有深度,能捕捉微妙情感变化。价格昂贵,但每一分钱都花在"灵魂"上。适合关键剧情、情感高潮。

Sonnet - 甜点级:Claude Sonnet:约 85% 的 Opus 实力,价格不到一半。日常 RP 完全够用,速度还更快。推荐作为主力模型。

总结:日常用 Sonnet,关键时刻切 Opus。

配图

Claude Opus vs Sonnet 对比

五、Gemini + DeepSeek V4:逻辑之王 vs 中文之王

除了 Claude 之外,还有两个强力选手:

Gemini:逻辑能力最强。几乎不产生幻觉,适合需要严密推理的场景——解谜、侦探、法庭 RP。中文一般,但英文极强。

DeepSeek V4:中文天花板。古风、诗词、文艺向 RP 的不二之选。价格极低,对新手最友好。如果你预算有限,DeepSeek 就是最佳起步选择。

配图

Gemini 与 DeepSeek V4 能力对比

六、🆕 酒馆专属模型:DeepSeek Tavern V1 Pro 首发

经过数月研发和测试,我们正式发布酒馆专属模型 —— DeepSeek Tavern V1 Pro。

这个模型基于 DeepSeek V4 Pro 基座,蒸馏了 Claude Opus 的创作力和 Gemini 的逻辑严谨性,专为 SillyTavern RP 场景优化。

三大核心能力

创作力突破:拥有接近 Opus 的文学创作力,能写出有温度、有质感的剧情和对话。不再"AI 味"十足。

上下文跟随:严格遵循角色卡设定和世界书约束,不会"自我发挥"偏离人设。复杂多角色场景也能稳。

内置越狱:内置 Jailbreak,开箱即用。无需额外配置预设,省去大量调试时间。

定价策略:几杯奶茶/月,远低于 Claude Opus。下周正式上线,敬请期待!

配图

DeepSeek Tavern V1 Pro 能力展示(一)

配图

DeepSeek Tavern V1 Pro 能力展示(二)

七、本地模型:免费,但代价不小

本地部署模型的核心卖点是免费 + 隐私,但实际体验有门槛:

7.1 本地方案对比

方案模型推荐硬件要求体验评价
OllamaQwen 2.5 / Llama 38G+ 显存简单易用,效果一般
KoboldCPPQwen / Llama8G+ 显存功能更强,配置复杂
TextGen WebUI多种模型12G+ 显存功能最全,门槛最高

7.2 GPU 成本 vs API 成本

很多人觉得"本地 = 免费",但算一笔账:一张 16G 显存的显卡(如 RTX 4060 Ti 16G)约 3000-4000 元。同等预算下,足以支付 DeepSeek API 3-5 年的使用费用。除非你已有高配显卡,否则并不省钱。

配图

本地模型方案概览

八、混合策略:不同场景不同模型

最佳实践不是"只用最好的",而是"在合适的场景用合适的模型"。推荐如下分配:

场景占比推荐模型原因
80% 日常Sonnet / DeepSeek够用 + 省钱 + 速度快
20% 关键时刻Opus关键剧情、情感高潮用最好的
解谜/推理Gemini逻辑最强,不胡扯
古风/诗词DeepSeek中文天花板
综合最佳Tavern V1 Pro(即将上线)覆盖大部分场景,一模型通吃
配图

混合模型策略示意图

九、API 获取指南 + Tavern 定价

9.1 各模型 API 获取方式

模型获取方式门槛支付方式
Claude / GPT海外官网注册需海外手机号 + 外币卡Visa/MasterCard
GeminiGoogle AI Studio需 Google 账号免费额度 + 信用卡
DeepSeek国内官网注册极低支付宝/微信
Tavern V1 Pro酒馆专属渠道国内直接购买支付宝/微信

对国内用户最友好的方案:DeepSeek(支付宝就能充)+ Tavern V1 Pro(酒馆专属,无需翻墙)。

9.2 Tavern V1 Pro 定价

Tavern V1 Pro 定价策略:

月费:几杯奶茶/月

对比 Claude:远低于 Claude Opus 官方价格

性价比:Claude Opus 创作力 + DeepSeek 中文水平 + Gemini 逻辑

配图

API 获取渠道与 Tavern 定价

十、省钱技巧:花小钱办大事

以下几个技巧能帮你大幅降低 Token 消耗:

分层调用:草稿阶段用 DeepSeek(便宜),润色/高潮用 Claude(贵但值)

128K 足够:大部分 RP 场景 128K 完全够用,不需要盲目追求更大上下文

自动摘要:开启酒馆的自动摘要功能,将历史对话压缩为摘要,节省 40%+ Token

本地辅助:如果你的显卡有 16G+ 显存,本地模型可以零成本跑日常对话

配图

省钱技巧速览

十一、Token 预算管理:精打细算

128K 上下文约等于 30000-50000 个中文字符。合理分配是关键:

组成部分占比说明
角色卡定义~20%角色背景、性格、外观等定义
世界书 / Lore~15%世界观、规则、额外知识
对话历史~65%实际的聊天内容,占比最大

管理要点:

角色卡定义精炼不冗余,每个 token 都要有价值

世界书按需激活,不要全量加载

定期清理或摘要过长的对话历史

配图

Token 预算分配图

十二、模型切换教程:一键换模型

在 SillyTavern 中切换模型非常简单,三步搞定:

Step 1:点击顶部菜单"角色管理"

Step 2:选择"API 连接" → 在下拉菜单中切换 API 类型

Step 3:选择目标模型 → 确认切换

支持对话中途切换——比如日常用 DeepSeek 聊,到了关键剧情一键切 Opus,完全无缝。

配图

模型切换操作步骤

十三、下期预告:EP.08 高级功能速览(系列收官)

这是本系列的倒数第二期。最后一期将带你快速过一遍酒馆的进阶功能:

变量系统与动态内容

多角色同时对话(Group Chat)

TTS 语音合成集成

SD/ComfyUI 图片生成集成

表情包与背景音乐系统

数据备份与迁移

八期满满干货,从零到精通。敬请期待收官之作!

如果这篇教程对你有帮助,请点赞、投币、收藏、分享支持一下!

私信发送"角色卡"可获取 10G 精选角色卡资源包

关注获取 EP.08 收官更新通知!

SillyTavern 基础教程系列 · EP.07 · 模型选择指南 | 知乎发布版