
Msty
本地优先 + 多模型并行的桌面 AI——Split Chats / Knowledge Stack / Agent Mode 三件套
Ollama / LM Studio 的『精品桌面应用版』——拒绝 CLI + 拒绝云上传 + 多模型同窗对比的最佳选择。Mac mini / Linux 私人 AI 服务器场景神器。要团队协作 + 云同步建议 Claude Team / ChatGPT Team。
TL;DR
Msty 是 privacy-first 桌面 AI 工作站,macOS / Windows / Linux 原生 app + 浏览器,独立开发者出品。差异点:内置 MLX (Apple) / llama.cpp / Ollama 三种本地推理引擎,无需 CLI + Hosted Models(OpenAI / Anthropic / Gemini)一窗体并存 + Split Chats 同问题多模型并行 + Knowledge Stack(per-conversation RAG)+ Prompt / Persona / Skills 三个 Studios + Agent Mode 多步执行。Free 本地无限 / Aurum $149·年 / Lifetime $349 / Enterprise $300/user·年。
适合:隐私敏感 + 不愿数据上云;Mac mini / Linux box 当私人 AI 服务器;想避开 Ollama CLI 的非工程师;多模型对比决策场景。不适合:硬件不行(7B+ 本地跑不动);要 BYO API + 极简(用 Typing Mind);要 mobile(无 iOS / Android 移动 app);团队协作(更适合 Claude Team)。
核心能力
- 三引擎本地推理:MLX(Apple)/ llama.cpp / Ollama 开箱即用
- Hosted Models:OpenAI / Anthropic / Gemini 一窗体接入
- Split Chats:同问题同时跑多模型 + side-by-side 对比
- Knowledge Stack:per-conversation RAG,文档 / URL / Obsidian vault / YouTube transcript
- Prompt Studio:变量 + 模板 + 测试
- Persona Studio:自定义角色 + 工具 + context
- Skills Studio:可复用能力包
- Agent Mode:多步执行 + 工具调用
- Flowchart 对话:分支可视化
- Real-time 数据:实时 web fetch
- Offline-first:零账号 / 零 telemetry / 零云依赖(Free)
- Cloud Sync(Aurum):跨设备同步对话
价格
- Free:$0 永久;本地全功能 + 云 API 接入 + Split Chats + Knowledge Stack
- Aurum:$149/年;cloud sync + 高级 Knowledge + Studio Desktop alpha + 优先支持
- Lifetime:$349 一次;Aurum 全部功能 + 终身更新
- Enterprise:$300/user·年;SSO + 私有部署 + 团队管理
Lifetime 在 2 年用回本,重度用户首选。Free 已经足够个人 90% 场景。
实测(macOS + Mac mini 私人 AI 服务器)
亮点:
- 装完立刻能用,无需 Ollama / llama.cpp / MLX 任何 CLI
- Split Chats 对比 GPT-5 + Claude + Qwen2.5 + Llama 3.3 一目了然
- Knowledge Stack 的 per-conversation 设计完美:每项目独立 RAG context
- Prompt / Persona / Skills 三 Studio 解决重复 prompt 痛点
- MLX 在 M1/M2/M3/M4 上跑得快
- 中文 Qwen2.5 / DeepSeek 走本地路径无外网依赖
- Free 永久免费 + 本地无限 = 真正 zero-cost 路径
- Lifetime $349 比 ChatGPT Plus 18 个月便宜
踩坑:
- 本地性能受硬件限制:M1 Air 跑 7B 慢,M3 Max / Mac Studio / 高端 GPU 更适合
- 插件 / Skill 生态比 Typing Mind / LM Studio 弱
- 桌面 only,无 iOS / Android
- llama.cpp 更新滞后官方上游 1-2 版本
- Knowledge Stack 大文档(>100MB)切分偶尔失败
- Agent Mode 仍在打磨,复杂任务稳定性不如 Claude
- Studio Desktop(Aurum alpha)测试中,bug 偶发
- 中文 UI 不完整,部分功能仍是英文
上手
- msty.ai → 下载 macOS / Windows / Linux → 安装
- Settings → Model Providers → Ollama 连本地(或直接装 Msty 自带 llama.cpp / MLX)
- 装 1-2 个本地模型:Qwen2.5 7B(中文)+ Llama 3.3 8B(英文)
- 加云模型:OpenAI Key + Anthropic Key
- 新建 chat → 试 Split Chats:+ 第二个模型 → 同问题并行
- Knowledge Stack → 上传项目文档 → 附加到 conversation
- 满意后 Free 用着,重度需要同步上 Lifetime $349
对比
| 维度 | Msty | Ollama | LM Studio | Jan |
|---|---|---|---|---|
| GUI | ✅ 颜值高 | ❌ CLI | ✅ | ✅ |
| 本地引擎 | MLX/llama.cpp/Ollama | Ollama | llama.cpp | llama.cpp |
| 云模型 | ✅ | ❌ | ❌ | 部分 |
| Split Chats | ✅ 旗舰 | ❌ | 部分 | – |
| Knowledge Stack | ✅ per-conv | ❌ | ❌ | 部分 |
| Studios | ✅ Prompt/Persona/Skills | – | – | – |
| 开源 | ❌ | ✅ MIT | ❌ | ✅ Apache 2.0 |
| 起价 | $0 | $0 | $0 | $0 |
| 终身 | $349 | – | – | – |
| 适合 | 桌面颜值 + 多模型 | CLI / Server | 模型市场 | 严格开源 |
避坑
- 硬件评估:M1 Air 8GB 只跑 3B-7B,M3 Pro / Max 跑 13B-30B 流畅
- Ollama 已装就连:避免重复下模型,连本地 Ollama 复用 model library
- Knowledge Stack 文档:单文档 <50MB 最稳,大文件先切分
- Persona vs Skill:Persona 是角色(完整 system + 模型);Skill 是能力包;不要混用
- Split Chats 三个模型够:4 个起每问 token 烧得快
- Aurum cloud sync 谨慎:隐私敏感场景仍用 Free 本地
- Studio Desktop alpha:稳定性不如 main 版本,重要工作不要全押
- 本地中文模型:Qwen2.5 7B / DeepSeek 7B 中文最优,Llama 3.3 8B 英文最优
- MCP server:当前不如 Claude Desktop 强,要 MCP 重度场景考虑 Claude Desktop / Crush
适合 / 不适合
- ✅ 隐私敏感 + 数据零云
- ✅ Mac mini / Linux box 私人 AI 服务器
- ✅ 不愿学 Ollama CLI 的非工程师
- ✅ 多模型对比决策场景
- ❌ 硬件不行(8GB RAM)跑不动 7B+
- ❌ 要 mobile 移动主力
- ❌ 团队协作 + 共享 workspace
- ❌ 要 MCP 工具栈深度(用 Claude Desktop / Crush)
相关阅读
来源
- Msty 官网 + Features(MLX / llama.cpp / Ollama / Studios)https://msty.ai/studio/features
- AI Chat Daily — Msty Review 2026(4.3/5 评分 + Lifetime)https://www.aichatdaily.com/tools/msty
- ML Journey — Msty Multi-model Comparison Guide https://mljourney.com/msty-the-local-llm-app-that-lets-you-compare-models-side-by-side
- AISO Tools — Msty Pricing 2026 https://aisotools.com/pricing/msty
| 计划 | 价格 | 限制 | 国内支付 | 备注 |
|---|---|---|---|---|
| Free | $0 | — | — | |
| Aurum | $149/年 | — | — | |
| Lifetime | $349 一次 | — | — | |
| Enterprise | $300/user·年 | — | — |
和 Ollama / LM Studio / Jan / AnythingLLM 怎么选?
Msty 强在『多模型 split chat 对比 + Knowledge Stack 灵活 per-conversation + UI 颜值』。Ollama 是 CLI + server,无 GUI 适合开发者。LM Studio 强在『模型市场 + 性能 profiling』。Jan 开源 + Apache 2.0 协议自由度高。AnythingLLM 强在 workspace + RAG agent。要桌面颜值 + 多模型对比 + 简单 RAG → Msty;要 CLI / server → Ollama;要模型市场 → LM Studio;要严格开源 → Jan。
Knowledge Stack 怎么用?
上传文档 / URL / 文本到 Knowledge collection,per-conversation 附加。和 AnythingLLM 的 workspace 区别:Msty 是 conversation 级,每对话独立 context,不会跨对话泄露。多项目并行场景非常顺。Aurum 解锁更大 / 更高级 Knowledge。
Split Chats 真的实用吗?
对,多模型决策场景非常有用:决定哪个模型适合任务(同问题看 GPT-5 / Claude / Llama 3 输出);本地 vs 云模型质量评估;事实问题模型分歧检测(多个模型给同样答案 = 更可信)。日常使用确实降低选错模型成本。
中国大陆能用吗?
本地模式完全离线可用(Ollama / llama.cpp / MLX 本地模型 + Qwen / DeepSeek 中文模型)。云模式接 OpenAI / Anthropic 需要海外网络 + 卡。Aurum 订阅需海外支付。最佳路径:本地 Free + Ollama + Qwen2.5/DeepSeek 中文,零订阅 + 零外网依赖。