非小号

24222

虚拟币

130

交易平台

64

钱包

¥6.86

USDT场外

59.7599%

BTC 占比

9Gwei

ETH Gas

资讯
行情
资讯 > 正文
如何让AI当预测市场的裁判?
律动 BlockBeats2026-01-23 15:15:00
原文标题:How AI judges can scale prediction markets: The case for locking LLMs into the blockchain to resolve
原文作者:Andrew Hall,a16zcrypto
编译:Peggy,BlockBeats

编者按:预测市场的价值不在于「下注」,而在于它能否持续输出可信的价格信号。但随着交易规模扩大,最容易被忽视、却最致命的瓶颈正在浮出水面:合约如何结算。从委内瑞拉大选的真假难辨,到地图、网站更新、代币投票带来的操纵与利益冲突,争议往往并非来自预测本身,而是来自「谁来裁决」。

本文作者 Andrew Hall(@ahall_research)提出一种更激进的思路:将特定版本的大模型与提示词写入链上,让 AI 成为可审计、可预期的裁判机制,用工程化手段替代人治与博弈。它未必完美,但或许是预测市场走向规模化必须迈过的一道门槛。

以下为原文:

去年,委内瑞拉总统选举的结果在预测市场上带来了超过 600 万美元的合约交易量。但当选票统计完成后,市场却陷入了一个几乎无法解决的局面:政府宣布尼古拉斯·马杜罗胜选;而反对派和国际观察员则指控存在选举舞弊。那么,预测市场的合约结算到底应该依据「官方信息」(马杜罗获胜),还是依据「可信报道的共识」(反对派胜出)?

在委内瑞拉选举这个案例中,观察者的指控五花八门:从认为规则被无视、参与者「钱被偷了」,到把用于处理争议合约的协议形容为一场高风险政治戏码中的「法官、陪审团和刽子手」;还有人直接称其「被严重操控」。

这并不是一个孤立的意外插曲,而是一个我认为会在预测市场规模化过程中反复出现的症状,甚至可能是最大的瓶颈之一:合约结算(contract resolution)。

这里的利害关系非常高。结算做对了,人们就会信任你的市场,愿意在里面交易,而价格也会成为对社会有意义的信号。结算做错了,交易体验就会变得令人沮丧、不可预测。参与者可能会慢慢离开,流动性面临枯竭风险,价格也不再反映对一个「稳定目标」的准确预测。相反,价格会开始体现一种混杂的东西:既包含事件真实发生的概率,也包含交易者对「扭曲的结算机制最终会如何裁决」的判断。

委内瑞拉的争议虽然曝光度较高,但在各个平台上,更隐蔽的失败其实经常发生:

乌克兰地图操纵事件说明,攻击者可以直接「玩弄」结算机制。一份关于领土控制权的合约规定,其结算将依据某一张在线地图。有人被指控编辑了这张地图,以影响合约的最终结果。当「真相来源」本身可以被操纵时,你的市场也就可以被操纵。

政府停摆合约事件说明,结算信息源可能带来不准确、至少是不可预测的结果。该合约规定,市场将依据美国人事管理局(OPM)网站显示「停摆结束」的时间进行结算。特朗普总统在 11 月 12 日签署了拨款法案,但不知何故,OPM 网站直到 11 月 13 日才更新。那些正确预测停摆会在 12 日结束的交易者,最终却因为网站管理员的延迟而输了。

泽连斯基西装市场则引发了有关利益冲突的担忧。合约问的是乌克兰总统泽连斯基是否会在某场活动上穿西装——一个看似琐碎的问题,却吸引了超过 2 亿美元的下注。当泽连斯基出席北约峰会时,穿着被 BBC、《纽约邮报》等媒体称为「西装」的服装,市场最初结算为「是」。但随后 UMA 代币持有人对结果提出争议,结算又翻转为「否」。

在这篇文章中,我将探讨如果把 LLM(大语言模型)与 加密技术聪明地结合起来,我们是否能创建一种可规模化的预测市场结算方式:它极难被操纵,并且能做到准确、完全透明、且可信中立。

这不仅仅是预测市场的问题

类似的问题也困扰过金融市场。国际掉期与衍生品协会(ISDA)多年来一直在信用违约掉期(CDS)市场中与「结算/认定」难题周旋——这类合约会在企业或国家发生债务违约时支付赔付。ISDA 在 2024 年的审查报告里对这些困难的描述相当坦率。他们的「认定委员会」(Determinations committees)由主要市场参与者组成,通过投票来判断是否发生了「信用事件」。但这一流程一直被批评为不透明、可能存在利益冲突、且结果不一致,这与 UMA 的流程非常相似。

根本问题是一样的:当巨额资金取决于对一个模糊事件「到底发生了什么」的认定时,任何结算机制都会成为被博弈和攻击的目标;而任何模糊性,都可能变成冲突的引爆点。

那么,一个好的结算机制应该长什么样?

一个好方案需要具备的特性

任何可行的方案,都必须同时满足几个关键性质:

抗操纵性
如果攻击者可以通过编辑维基百科、投放假新闻、贿赂预言机、或利用程序漏洞来影响结算,那么市场就会变成「谁最会操纵,谁就赢」,而不是「谁最会预测,谁就赢」。

合理准确性
机制必须在大多数情况下、绝大多数时间里给出正确结算。世界本就存在真实的模糊性,因此绝对准确是不可能的,但系统性偏差或明显错误会彻底摧毁可信度。

事前透明
交易者在下注之前就必须清楚结算会如何进行。在合约运行中途更改规则,等于破坏平台与参与者之间最基本的契约。

可信的中立性
参与者必须相信机制不会偏向任何交易者或任何结果。这也是为什么让持有大量 UMA 的人去裁决他们自己下注的合约如此成问题:即使他们做到了公平,利益冲突的「外观」也足以削弱信任。

人工委员会在某些特性上可以达标,但在另一些方面则很难——尤其是规模化情况下的抗操纵性与可信中立性。像 UMA 这样的代币投票系统,也存在「巨鲸主导」和利益冲突等一系列早已被讨论过的问题。

这就是 AI 可以介入的地方。

为什么用 LLM 当裁判

在预测市场圈子里,一个越来越受到关注的提案是:让大语言模型充当结算「裁判」,并在合约创建时,将具体模型与提示词(prompt)锁定到区块链上。

其基本架构大致如下:在合约创建时,做市方不仅用自然语言写明结算标准,还要明确指定将用于判定结果的 LLM(带时间戳的模型版本)以及将输入给它的完整 prompt。

这一规定会以加密方式提交并绑定在链上。一旦交易开始,参与者就可以检查整套结算机制——他们清楚知道由哪个 AI 模型做裁判、会收到什么 prompt、能访问哪些信息源。

如果他们不认可这套设置,就不参与交易。到了结算时,链上已承诺的 LLM 会使用已承诺的 prompt 运行,访问指定信息源,并给出裁决输出。这个输出直接决定谁拿到赔付。

这种方法可以同时满足多项关键约束:

强抗操纵(但并非绝对)
不同于维基百科页面或小型新闻网站,你没那么容易去「改写」一个主流 LLM 的输出。模型权重在承诺时就被固定。要操纵结算,攻击者要么腐蚀模型依赖的信息源,要么提前很久对模型训练数据进行投毒——相比贿赂一个预言机、或编辑一张地图,这类攻击成本更高、结果也更不确定。

更高准确性
随着推理型模型能力快速提升,并且在能够上网检索信息、补充证据的情况下,LLM 裁判应当能准确裁决许多市场。关于其准确性的实验也在持续推进中。

内置透明性
在任何人下注之前,整套结算机制都是可见、可审计的。没有中途改规则,没有「自由裁量」的临场判断,没有幕后协商。参与者清楚自己签下的是什么。

显著提升可信中立性
LLM 对结算结果没有经济利益相关性,它不能被贿赂,也不持有 UMA 代币。即便它存在偏差,那也是模型自身属性导致的偏差,而不是利益相关方临时做出的裁决。

当然,LLM 裁判也有局限性,我会在下面进一步说明。

LLM 裁判的局限

模型会犯错
LLM 可能误读新闻、编造事实、或在同类案例中使用不一致的裁决逻辑。但只要交易者事先知道自己下注对应的是什么模型,他们就能把这些「缺点」计入定价。若某个模型在处理模糊情形时有明确倾向,成熟交易者会调整策略。模型不必完美,它需要的是可预测。

操纵并非不可能,只是更难
如果 prompt 指定了某些新闻源,攻击者可能会试图在这些新闻源中「种文章」。在大型媒体上成本很高,但在小型媒体上也许可行——这会以另一种形式复现「地图编辑」的问题。因此 prompt 设计极其关键:依赖多源、冗余信息的机制,比依赖单点信息源更稳健。

投毒攻击在理论上存在
拥有足够资源的对手,可能尝试通过影响训练数据去偏置未来的裁决。但这要求在合约出现之前就提前行动,回报不确定且成本巨大,比起贿赂某个委员会成员门槛高得多。

LLM 裁判的多样化会带来协调问题
如果不同市场创建者承诺不同的模型与 prompt,那么流动性会被切碎。交易者难以横向对比合约,也难以跨市场汇总信息。标准化有价值,但允许市场试错、找到最好的 LLM prompt 组合也有价值。合理路径可能是两者结合:允许试验,同时建立机制让社区逐步收敛到经过验证的默认方案。

构建者该如何落地?

总结来说:AI 结算本质上是把一组问题(人类偏见、利益冲突、不透明)换成另一组问题(模型能力限制、提示工程难题、信息源脆弱性)。但后者可能更可控、更可工程化。那么,下一步可以怎么做?平台应当:

先在低风险合约上试验
用较低风险的市场测试 LLM 结算,建立成绩记录。哪些模型表现最好?哪些 prompt 结构更稳健?实际会出现哪些故障模式?

推动标准化
当最佳实践逐渐浮现,社区应当推动形成可作为默认选项的标准 LLM prompt 组合。这不会阻止创新,但有助于让流动性集中在「大家都理解规则」的市场上。

构建透明工具
例如开发界面,让交易者在下注前就能轻松检查结算机制全貌——包括模型、prompt、信息源。结算规则不应藏在冗长细则里。

持续治理
即便引入 AI 裁判,人类仍需做「元层决策」:哪些模型值得信任?当模型给出明显错误答案时如何处理?默认方案何时更新?目标并不是把人完全移出系统,而是把人从临时、逐案的裁决中抽离出来,转向系统化的规则制定。

预测市场有着巨大的潜力,能帮助我们理解一个嘈杂而复杂的世界。但这份潜力依赖于信任,而信任依赖于公平的合约结算。我们已经见过当结算机制失败时会发生什么:混乱、愤怒、交易者离场。我见过一些人因为某次结果「违背了他们下注的精神」,感到被欺骗,直接怒而退场,从此不再碰预测市场,哪怕他们曾经热爱这些平台。这意味着我们失去了一个释放预测市场价值、拓展其更广泛应用的机会。

LLM 裁判并不完美。但当它与加密技术结合时,它可以做到透明、中立,并对抗那些长期困扰基于人类的系统的操纵手段。在预测市场扩张速度快于治理机制迭代的时代,这或许正是我们需要的东西。

[原文链接]

","is_original":false,"link":"https://m.theblockbeats.info/news/61027","pic":"https://image.blockbeats.cn/file_v6/20260123/ce2c0e98-25bc-4cf0-9d2d-9984fb75ecc9.jpg?x-oss-process=image/quality,q_50/format,webp","column":"","create_time":"1769155200"},{"title":"IOSG创始人写给Crypto OG的一封信:不要让赌场吞噬了大教堂","description":"许多创业者和开发者的目标不止是发财,他们想做出改变世界的应用,想给历史留下印记。","content":"
原文标题:《不要让赌场吞噬了大教堂——写给中国 Crypto OG 的一封信》
原文作者:@jocyiosg,IOSG 创始人

Part 1: 谁留下来?更重要的是为什么留下

在去年我写过一个 AI 和 Crypto 人才流动的推,有人评论到:优秀的人去 AI 挺好的,参与建设一个必然发生的未来。

但最近一次播客对话让我意识到,这个判断还不够深刻。问题不仅是「谁留下来」,更根本的是「为什么留下来」和「留下来后生态能否支撑 revolution」。经历过牛熊、失败、现实与理想的摩擦后仍然留在行业内继续建设的人,才有可能引领币圈的 revolution。

我最近几个月聊了很多 2023~2025 年的加密创业者。许多华人团队在 2023 年前后只融资了五百万到七百万美元,在目前环境很难融到下一轮,这样的 runway 刚好活两年多到现在,然后步履蹒跚地上线交易平台。无数的空投和给出去的代币都砸向市场,代币价格一路走低,创业者给出的答卷是即将归零的代币、在加密行业失去 reputation,然后转身离开。

回望亚洲,愿意给早期创业者支持的投资人越来越少。没有投资人支持,就没有坚定的创业者愿意再踏入加密行业,整个行业生态进步无以为继——中美之间的加密战争如何竞争?

我在去年 4 月份写过一个推提到一个 portfolio 核心团队开始做 AI 应用创业的消息,行内最有声望的人才都在离开。直到今天,越来越多人做这种选择,这不是偶然现象,背后反映的是一个更系统性的问题:中美 Crypto OG 在赚到钱之后,选择了完全不同的路径。

Part 2: 美国 OG 如何「供养大教堂」

当美国 Crypto OG 赚到钱后,他们在思考什么?

Brian Armstrong:把 Coinbase 带上市成为美国首家主流 Crypto 交易平台后,创立 Research Hub,试图从根本上改变科学研究的激励机制。这不是简单的捐款,而是在重构整个知识生产体系。

Naval Ravikant:作为早期 Bitcoin 哲学家,不仅通过 AngelList 推广 ICO 并将 Bitcoin 作为全球众筹工具,还孵化 CoinList 为 token 发行提供合规框架,资助 Zcash 团队。他关于货币、加密经济学和去中心化的思想深刻影响了整个行业。

Chris Dixon:2013 年就领投 Coinbase B 轮,成为第一个公开全力押注 Crypto 的主流 VC。他将 a16z Crypto 从 2018 年的 3 亿美元发展到超过 70 亿美元,不仅投资项目,更建立 Crypto school 系统性培养行业人才。

Dan Robinson:在 Paradigm 不仅是投资者,更是建设者。他参与 Uniswap 早期开发,是 Uniswap V3 共同作者,在 Flashbots 早期阶段推动现代 MEV 拍卖模型发展,参与 Plasma 研究(现代 Rollups 前身),领投 Optimism 种子轮。这种深度的技术参与和思想输出,才是真正的生态建设。

Michael Saylor:将 MicroStrategy 转型为 Strategy,持有价值 670 亿美元的 Bitcoin(超过 3% 的总流通供应量),通过发行股票和低息债券的创新融资方式持续大规模 accumulate,成为 Bitcoin 机构化的标志性人物。

Barry Silbert:创立 DCG 并推出 GBTC 灰度比特币信托,成为传统投资者获得 Bitcoin 敞口的主要渠道,旗下 Genesis Trading 和 CoinDesk 成为行业基础设施。

Chainlink:创始人 Sergey Nazarov 在 Google 当过软件工程师,2017 年发明去中心化预言机网络,已支持超过 7 万亿美元交易量。经历多个牛熊周期早已财富自由,但仍亲力亲为远渡香港等地推广 Chainlink 标准,致力于通过 CRE 统一 DeFi 和传统金融,构建全球性的"互联网合约"生态系统。

Rune Christensen:2011 年接触 Bitcoin 后卖掉了自己在中国创办的英语教师招聘业务全力投入 Crypto。2015 年创立 MakerDAO 推出去中心化稳定币 DAI,成为 Ethereum 上首批也是最大的 DeFi 协议之一。过去 10 多年始终在 DeFi 治理一线,近年将 MKR 品牌重塑为 Sky,推出 Spark 协议,推动 DAI 与美债融合,成为加密与传统金融融合的先锋。

Arthur Hayes:创立 BitMEX 推出永续合约,将传统金融衍生品引入 Crypto 市场,资金费率机制成为行业标准。2022 年因违反银行保密法被判罚后获特朗普赦免,随后与 Guy 共同创立 Ethena 稳定币协议。过去几年 Arthur 一直在给行业输出自己的加密观点,从不停歇。

这些人的共同特点是什么?赚到钱后思考的不是如何退出,而是如何吸引最优秀的人才进入、如何改变世界的应用、如何建立系统性的生态支撑。他们不仅是投资者,更是建设者、思想领袖、公共品的贡献者。

Part 3: 中国加密 OG 系统性困境

反观中国 Crypto 圈,政策环境的根本差异导致长期投入的空间受限,大部分 OG 在早期的成功和一定财富积累后选择的是退出而非回馈。

历史叙事的缺失。美国 Crypto 从一开始就有「改变世界」的宏大叙事,从卡内基、洛克菲勒时代就有的公共品建设传统在 Crypto 领域得到延续。中国在这方面的文化积累相对薄弱。

我们缺乏系统性的人才培养机制(对比美国的 Crypto school),缺乏对加密人才和基础设施的长期投入(对比 YC/AllianceDao、Research Hub 这类项目),缺乏持续的思想输出和行业话语权(对比 Paradigm 的研究驱动、Naval 的哲学影响)。

这不是个人道德问题,而是历史叙事缺失、政策不确定性、文化基因差异等多重因素造成的系统性问题。

这种差异导致了什么?

许多创业者和开发者的目标不止是发财,他们想做出改变世界的应用,想给历史留下印记和被认可的。所有最优秀人才只要用心观察,他们也就不会回来了。

当 Web3 被简化为一个大赌场,当行业的主流叙事从「改变世界」退化为纯粹的财富游戏,最优秀的人才就会用脚投票。这不是他们不想赚钱,而是他们想要「有意义的赚钱」——在创造价值的过程中获得回报,而不是在零和游戏中收割他人。

当环境里所有人都不去追求真正的理想和价值时,这些人就会离开。叙事不是虚的,它会直接影响人才结构。当一个行业无法提供 compelling 的愿景和价值认同时,再多的金钱激励也留不住那些价值驱动的人才。

我们现在看到的恶性循环:

缺乏新的价值创造 → 市场只能在存量中博弈 → 存量博弈强化投机心态 → 驱赶走想做增量创新的人 → 更少的价值创造 → 市场更加依赖存量博弈

这就是中国币圈江湖投机时代的一个缩影。

Part 4: 即使在约束下,星星之火可以燎原

可能有人会说:环境不同,不能简单对比。这是对的。我不是要求中国 OG 做和美国 OG 一模一样的事。

也可能有人说:即使想做也做不了多少,何必徒劳。但我相信即使在约束环境下,支持开源开发者、办技术社区活动、投资早期初创技术团队,这些小的举措仍然有意义。系统性的努力会产生 compound effect。

还可能有人说:过度强调理想主义是虚伪的,Crypto 就是 financial innovation。但这不是非此即彼的选择。一个健康的生态需要有足够比例的人是 value-driven 的。如果完全由 purely financial-driven 的人主导,长期会陷入 zero-sum game,最终伤害所有人利益。这不是道德说教,而是 enlightened self-interest。

IOSG 过去的投资人有交易平台、矿工、早期的加密 OG,还有传统基金。我相信中国 OG 很多都是信奉理想主义和英雄主义的,并且愿意推动这个行业往前迈进的。正是在加密行业、特别是中国环境如此艰难的情况下,他们仍然愿意继续支持和帮助这个行业。

星星之火,可以燎原。我们也可以建立一个和美国一样强大的加密正反馈生态系统。

Part 5: 大教堂与赌场:巴菲特的警示

Warren Buffett 用这个隐喻来描述美国资本主义:In the next hundred years, make sure that the cathedral is not overtaken by the casino.(未来 100 年,确保大教堂不被赌场吞噬)。这个隐喻同样适用于加密市场:

加密货币和区块链取得了前所未有的成功。它是一座宏伟大教堂的结合体,这座大教堂创造了一个世界上从未见过的经济体系。同时,它旁边还附带了一个巨大的赌场。

诱惑非常大,尤其是现在,诱惑就是走进那家赌场。赌场里,大家玩得很尽兴,金钱流动频繁,但你也必须确保大教堂得到供养。

未来 100 年里,Crypto 必须确保这座大教堂不会被赌场吞噬。

比特币以太坊的大教堂依然宏伟壮丽,某些交易平台的大赌场夜夜笙歌。但如果赌场的繁荣不回馈给大教堂,那座创造真实价值的建筑就会逐渐荒废,最终整个生态都会失去根基。

Brian Armstrong、Vitalik、Chris Dixon 这些人做的事情,本质上就是在供养大教堂。他们在确保赌场的繁荣不会吞噬掉那座大教堂。

Part 6: 长期主义的唯一路径

回到我几个月前的判断,现在需要加上更深层的认知:

经历牛熊后留下的人确实有可能引领 revolution,但单纯「留下来」还不够。更重要的是「为什么留下来」和「生态能否支撑 revolution」。Revolution 需要整个生态系统支撑。美国 Crypto 持续发展不是因为人更能熬,而是因为建立了系统性回馈机制,让生态能自我更新、自我进化。

作为机构投资者,IOSG 也会继续主动承担改变的责任:

1. 系统性投资更多的一级初创团队,即使短期回报不明显

2. IOSG EIR 将支持和资助更多目前创业融资困境的企业家,建立更强大的人才培养机制

3. 持续输出和分享一线的行业研究和思考

4. 在项目投资选择上注重长期价值创造而非短期炒作

我们需要重新定义成功。零和游戏中的财富转移 vs 创造真实价值过程中的财富创造,数字可能相同但意义完全不同。

如果中国 Crypto 机构和有能力的参与者能在回馈机制上有所突破,可能成为改变生态的关键力量。这不仅是道德责任,更是长期利益的理性选择——只有健康的生态才能孵化伟大项目、吸引优秀人才、创造可持续价值。

这才是真正的长期主义,也是确保大教堂不被赌场吞噬的唯一路径。

原文链接