为什么稳定币数据比看起来更难搞懂
2025-06-18 22:28
金色财经
2025-06-18 22:28
订阅此专栏
收藏此文章
区块链数据面临着在其他行业中根本不存在的独特挑战。


撰文:Sebastian Melendez,Artemis

编译:善欧巴,金色财经


引言


稳定币是目前市场的焦点。几乎每天都有重大新闻传出。上周,Stripe 宣布将收购钱包服务公司 Privy,而 PayPal 则宣布将在 Stellar 上原生铸造 PYUSD。消息层出不穷,几乎让人应接不暇。随着越来越多公司进入这一领域,追踪和获取稳定币数据的需求日益增长。不过,从我们与客户的沟通中,人们始终反复问着四个问题:


  1. 稳定币到底被用来做什么?
  2. 谁在使用稳定币?
  3. 存在哪些机会?
  4. 稳定币在哪些国家或地区被使用?


我在 Artemis 的工作就是每天收集、整理并汇总稳定币数据,以便回答这些问题。今天,我们要揭穿一些「看似简单」的数据迷思,看看这些问题到底有多难解答。


迷思一:稳定币数据对所有人都是开放透明、随手可得的


独立访问链上数据的成本高得惊人,技术门槛也极高。虽然过去五年里,原始区块链数据的可访问性有所提升,但依然存在许多门槛。主流数据服务商如 Dune、Flipside、Allium 和 Goldsky 各有优势,但没有一家能覆盖所有关键区块链。


实际情况:


现在几乎每家公司都在推出自己的区块链,各有各的奇葩特性,让数据分析变得极其复杂。


如果你想全面了解自己的稳定币使用模式并发现潜在机会,你需要能够在所有相关链上进行全景分析,而不仅仅是当前部署的平台。随着多链策略的发展和分析需求的加深,数据基础设施的复杂度也随之增加。


以 PYUSD 为例:


一旦你集成了 LayerZero 的 OFT 跨链协议,要想真正看清全貌,你就得掌握:


  • Ethereum 的机制
  • Solana 的账户模型
  • LayerZero 的跨链逻辑
  • 以及 Berachain、Flow 等新兴链的结构


更糟的是,用户还可能将代币跨桥到更多平台,这使得数据问题成倍复杂化。


问题不只是你当前上线的链,还在于整个生态不断扩张,新增链层出不穷。这就引出了第二个问题:架构碎片化。


每条链的数据架构和格式都不一样


回忆一下 2000 年代早期,那时候你发一个文件给别人,不代表对方能打开。PowerPoint 打不开,视频缺少解码器,系统各自为政,一切都无法无缝协作。即使是小学生都被这些问题折磨过。


现在的区块链世界就和当年一样乱。


当前最活跃的链 —— Solana、Tron、Ethereum、TON、Stellar、Aptos —— 它们的数据架构天差地别。


举几个例子:


  • Solana:你得理解 token account 和 owner account 的概念
  • Ethereum:你要理解智能合约、EOA、ERC-20 标准
  • Aptos、Sui:使用面向对象模型,资产是可编程对象
  • Stellar、TON:架构完全不同,但稳定币使用量惊人


理解这些链上的活动意味着你得拆解一个越来越庞杂的技术网。


再看 PYUSD:


之前只需搞懂 Ethereum、Solana 和 LayerZero 的架构。但如今随着它登陆 Stellar,你还得理解:


  • Stellar 的智能合约平台 Soroban
  • Soroban 的虚拟机模型
  • 与以太坊完全不同的转账与余额管理逻辑


也就是说,你甚至得成为某条链的专家,才能访问和解析数据,更别说从中提炼出洞察了。


迷思二:只要拿到区块链数据,洞察就能自然而然产生


很多人以为:只要解决了数据访问问题,接下来就能轻松搞出用户洞察了。假设你搞定了访问权限,抓到了全链的余额、转账数据集,那么你得到了什么?


答案是:一堆噪音。


链上地址只是字母和数字的字符串,钱包余额经常不准确或具有误导性。原始区块链数据并不等于洞察,它只是一个凌乱的数据堆,需要经过极其复杂的清洗与加工,才能变得有价值。


现实是:要理解链上发生了什么,离不开上下文和链外数据


即使你费尽心力收集到了链上数据,你依然无法回答关键问题:谁在使用你的稳定币?他们在哪里?


你唯一能说的是:「我的稳定币被使用了。」这并不具备可执行性,也无法帮助你了解:用户行为、市场渗透情况、增长机会。若想实现这些洞察,你必须依赖链外上下文。而真正的问题是:你需要什么链外数据,如何获取?


应用程序和协议标签:标记链上活动没有单一的可靠来源。Flipside、Dune、开放标签倡议、区块浏览器、Arkham——它们都提供了一些信息,但每个信息都有各自的模式和有限的覆盖范围。为了回答诸如「这个地址使用什么应用程序?」或「我们看到了什么样的使用情况?」之类的基本问题,您需要统一这些零散的标签来源,并手动标记重要的钱包地址。如果不这样做,您就只能使用原始交易数据,而这些数据无法提供任何关于实际使用模式的信息。


地理位置:这才是关键所在——或许也是我最常被问到的问题:我的用户在哪里?我们利用时区启发式算法和先进技术来推断地理分布。更重要的是,我们与数据合作伙伴合作,获取专有的链下地理数据,从而帮助我们精准定位钱包最有可能来自哪个国家。


现实情况是,解决这个标签问题需要大量的资源和行业关系。你需要与主要的 L1 和协议建立合作伙伴关系,以构建全面的标签数据集。大多数团队没有足够的带宽或连接来手动处理这个问题——这就是为什么许多分析工作在获得原始区块链数据后就遇到了瓶颈。上下文层才是真正的工作开始的地方。


迷思三:区块链数据是直观且一致的


区块链远比表面看起来复杂得多。虽然过去几年,业界已经开始围绕代币转移的特定设计模式进行标准化,但情况并非总是如此。当桥接技术首次流行时,并没有用于追踪跨链活动的社区标准。这在尝试准确追踪余额和转账时造成了混乱——尤其是对于那些存在时间足够长、早于这些标准出台的代币而言。您需要了解每条链的具体历史和特性,才能获得准确的数据。


现实:区块链「数据库模式」一直在变化——你必须成为「链上历史学家」,才能获取精准数据


我们很容易忘记,这些生态系统都在不断变化。以 Solana 为例,它的架构(区块链的运作方式)和代币程序(代币的创建和转移方式)都进行了重大升级。


架构升级:Solana 首次上线时,该链并未将时间戳存储在长期存储中。这在尝试计算随时间推移的历史余额时造成了重大问题。Solana 在 2020 年修复了这个问题,但损害已经造成:如何在没有时间戳的情况下重建准确的历史余额?

代币计划升级:去年,Solana 推出了代币计划 2022,以解决原始设计中的碎片化问题,但这意味着您需要了解新旧代币计划的细微差别,才能准确跟踪可替代代币。


基于这一点,人们经常听到有人说区块链是不可变的、公开的、仅可追加的数据库。虽然现在普遍如此,但早期并非总是如此。乐观主义就是一个很好的例子——他们并非只是经历了一次创世事件就发布了。实际上,几个月后他们就完全重新上线了。


结果如何?没有任何关于原始 Optimism 链上所有代币转移的完整数据集。


这为什么重要?这些缺失的数据对于理解 OP 主网上主要稳定币(包括 USDC、USDT 和 DAI)的当前和历史活动至关重要。没有这些数据,你就无法获得完整的数据集,也无法计算准确的钱包余额。


构建准确的数据集需要成为一名区块链历史学家。理解每条链的细微演变,并解释所有这些历史差异,需要多年的努力。


结语


区块链数据面临着在其他行业中根本不存在的独特挑战。即便在名义上「开放透明」,但想要提炼出有意义的洞察,居然需要链外数据、整合十几家数据服务商、阅读散落在加密推特和官方文档里的上下文信息,再加上一支 10 人以上的工程团队。否则,你只是在盲人摸象,追逐一个以光速变化的幻影市场。

【免责声明】市场有风险,投资需谨慎。本文不构成投资建议,用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

金色财经
数据请求中
查看更多

推荐专栏

数据请求中
在 App 打开