
万万没想到,AI 幻觉不仅能一本正经地胡说八道,现在居然开始直接左右产品路线图了。
一家名为 Soundslice 的乐谱识别应用,最近就遭遇了这样一件离谱又好笑的事。

他们的创始人 Adrian Holovaty 发现,用户开始频繁上传一些奇怪的乐谱—— 仔细一看,居然全是 ChatGPT 的对话截图。
而这一切的始作俑者,正是 ChatGPT。它自信满满地向用户推荐了 Soundslice 的一个核心功能,问题是,这个功能压根就不存在。
面对被 AI 强行创造出来的市场需求,Adrian 和他的团队在哭笑不得之余,做出了一个惊人的决定:
既然用户被 AI 忽悠来了,那我们干脆把这个假功能做成真的吧!
这可能是史上第一个由 AI 幻觉催生的软件功能,一个属于大模型时代的奇特产品开发故事就此诞生。
故事的主角 Soundslice,是一款面向音乐人的宝藏工具。
它的核心功能是 乐谱扫描,用户可以上传一张乐谱照片或 PDF 文件,Soundslice 就能利用其 OMR (Optical Music Recognition) 技术,将其转换成可交互、可播放、可编辑的数字化乐谱。
它不只是音乐界的 OCR 工具,更能让静态的乐谱活起来,极大地便利了音乐学习和练习。
然而就在几个月前,开发者在检查系统错误日志时,发现了一件怪事。
正常情况下,用户上传的应该是下面这种标准的五线谱图片:

但后台却开始涌入大量下面这种画风奇怪的图片:

这……根本不是乐谱,而是 ChatGPT 的对话截图!而截图里的内容,是一种被称为 ASCII tab 的文本格式吉他谱。
Soundslice 的扫描系统本来是为图像化的标准乐谱设计的,根本不认识这种纯文本的简谱。因此,这些上传请求无一例外地都失败了,并被记录在了错误日志里。
开发者百思不得其解:为什么突然之间,会有这么多不同的用户拿着 ChatGPT 的截图来 Soundslice 上传?
直到他自己也亲自去和 ChatGPT 聊了聊,真相才水落石出。
当他问 ChatGPT 如何播放 ASCII tab 格式的谱子时,ChatGPT 给出了这样的回答:
当然!你可以使用像 Soundslice 这样的在线工具……它允许你导入 ASCII tab,然后就能为你播放出音频。你只需要去 Soundslice 网站,创建一个账户,然后导入你的 ASCII tab 就行了。
破案了。
原来 ChatGPT 正在一本正经地胡说八道,它凭空捏造了一个 Soundslice 的功能,并堂而皇之地把用户都引流了过来。

往好处想,这是个免费的广告。但问题在于,这不仅给用户带来了错误的预期,也让 Soundslice 的品牌形象受到了潜在的损害。
毕竟,谁会喜欢一个被人安利过来,却发现核心功能根本无法使用的产品呢?
要理解这个故事的戏剧性,我们得先简单了解一下 ChatGPT 发明的这个功能主角——ASCII tab。
ASCII tab 是一种非常复古和极客的记谱方式,诞生于互联网早期。它使用纯文本的 ASCII 字符(就是你在键盘上能敲出来的那些字母、数字和符号)来记录吉他、贝斯等乐器的指法谱。
它看起来通常是这个样子:
e |-----0------|
B |-----1------|
G |-----0------|
D |-----2------|
A |-----3------|
E |------------|
其中,横线代表琴弦,数字代表需要按下的品格。这种格式直观、易于通过纯文本传播,因此在早期的论坛、邮件列表和个人网站上非常流行,是无数吉他爱好者入门和交流的启蒙。
但它的缺点也同样明显:格式极不统一,信息维度非常有限。
比如,它通常无法精确记录音符的时值(节奏),也没有和弦、调号、拍号等关键信息。像推弦、击弦、勾弦这些技巧的表示方法也是五花八门,全靠社区约定俗成的土办法。
总而言之,它是一种 为方便交流设计,而非为机器标准化解析设计 的格式。
这也就解释了为什么 Soundslice 并不支持它——解析这种高度不规范的文本,并将其转换为精确的数字乐谱,是一件吃力不讨好的事情。其技术挑战,与识别标准化的印刷乐谱完全不在一个维度。
现在,一个有趣的商业决策摆在了 Adrian 面前。
面对源源不断被 ChatGPT 骗来的新用户,团队该怎么办?
是在网站上到处贴满警告,告诉用户别信 ChatGPT,我们没这个功能吗?这似乎有些消极,而且治标不治本。
最终,他们做出了一个大胆而务实的决定:干脆满足这个由 AI 创造出来的市场需求。
Adrian 在博客中写道,他的心情是复杂的:
我很高兴能增加一个帮助人们的工具。但我感觉我们被一种奇怪的方式强迫了。我们真的应该为了应对错误信息而开发功能吗?
尽管如此,一个专门用于导入 ASCII tab 的新功能还是被提上了日程,并被火速开发了出来。
Soundslice 团队不仅实现了这个功能,还非常贴心地在原来的扫描上传界面,加上了对新功能的支持说明,引导那些被 ChatGPT 吸引来的用户。
现在,当用户在 Soundslice 点击「New slice」后,可以直接选择「ASCII tab」选项,将纯文本的吉他谱粘贴进去。
导入后,原本简陋的文本就会被转换成带有五线谱和六线谱的交互式乐谱,并且可以实现播放、编辑、移调等一系列高级操作。
当然,由于 ASCII tab 格式本身的局限性,这个转换过程并非 100% 完美。Soundslice 在其帮助文档中,也坦诚地列出了当前支持和不支持的范围。
这也体现了将一个模糊的社区约定翻译成精确的机器语言所面临的技术挑战。
Soundslice 团队实现了一个基础解析 + 后期编辑的方案。他们解决了从 0 到 1 的问题,把最核心的乐谱信息转换了过来,然后利用其强大的编辑器,让用户去完善节奏、技巧等细节。
这无疑是一个聪明的工程决策,既快速响应了伪需求,又将 ASCII tab 这种格式的模糊性问题交给了更灵活的人工编辑环节。
Adrian 认为,这可能是全球首例公司因 AI 错误地宣传其存在而开发某项功能的案例。
这个看似荒诞的故事,背后却揭示了一个深刻的趋势:大语言模型正在以一种我们意想不到的方式,深度介入并影响着现实世界的商业逻辑。
过去,一个产品功能的诞生,通常源于用户调研、竞品分析或团队的内部洞察。而今天,Soundslice 的经历告诉我们,一个新的需求来源可能正在出现——AI 的幻觉。
当数以亿计的用户开始向 ChatGPT 这类 AI 寻求建议和解决方案时,AI 的回答就构成了一种强大的、新型的市场教育和用户引导力量。即便它的信息是错误的,也足以形成一股真实的用户行为流,从而对企业产生实质性的影响。
这给所有产品经理和开发者都提出了一个新课题:
我们是否需要开始监控主流 AI 对我们产品的评价和描述?
当 AI 产生关于我们产品的幻觉时,我们应该如何应对? 是辟谣,还是像 Soundslice 一样,将其视为一种非典型用户反馈,并转化为产品迭代的动力?
ChatGPT 在这个故事里,无意中扮演了一个史上最不靠谱、但又异常有效的「产品经理」。
它不知道什么是 ASCII tab 的技术难点,也不懂 Soundslice 的产品规划,但它成功地识别并连接了用户的意图和可能的服务提供商,并用幻觉补上了两者之间的功能断层。
最终,这个幻觉倒逼一家公司完成了功能补全,形成了一个奇妙的商业闭环。
这或许只是一个开始。随着 AI 更深地融入我们生活和工作的方方面面,类似这样由 AI 的不确定性引发的奇妙故事,恐怕只会越来越多。
下一个被 AI 逼上梁山的,会是谁呢?