我最近注意到,人工智能行业在存储方面正遭遇一场真正的危机,而且这并非夸大其词。企业以更快的速度生成数据,但传统的机房仓库已经跟不上,而中心化的数据中心在压力下也会直接崩溃。超过一半的组织都面临存储瓶颈,导致项目进展变慢;更糟的是,硬盘存储盘已经从市场上消失了。



不过,现在出现了真正的解决方案。分布式存储会将文件切成加密分片,并通过数千台分布在全球各地的独立设备进行分发。没有任何一家单一公司能够控制它,而且即使某些地区完全中断,系统也会保持运行。这不仅效率更高,而且便宜得多——有时比那些大型供应商的价格低80%。

在2026年1月,Filecoin 推出了其 On-Chain Cloud(链上云),并迅速吸引了正在寻找可编程且可验证存储的人工智能团队。智能合约会自动处理支付与修复,数据在整个生命周期内保持不可篡改。这是中心化云无法以相同价格做到的。

Storj 还增加了另一维度——提供与 S3 兼容的存储体验,即使数据分布在跨越大洲的范围内,也仍然感觉像本地存储。从最近节点进行拉取会显著降低时延。将视频库转成可搜索人工智能资产的 Axle AI 公司迁移到了 Storj,并看到了明显的性能提升。创业公司现在可以在几天内搭建生产线,而不是几个月。

至于 Arweave,它解决的是另一类问题:模型训练结束之后,训练数据会怎样?把数据当作永恒的数字黄金来对待。只要完成上传,文件就会永远可用:一次捐赠的费用就能资助永久复制。研究人员利用它来创建不可篡改的记录,从而确保每个数据集都能为基础模型的训练贡献可靠来源。

在速度与性能方面,0G Storage 提供了令人兴奋的方案。它采用了专为人工智能负载定制的两层结构:日志层能够以每秒超过 30 兆字节 的速率处理海量数据流。那里已经在去中心化的节点上训练了一个 1070亿 参数规模的完整模型。这表明分布式网络能够支持边缘级别的工作负载,而无需依赖中心化系统。

Altrove 这家做材料发现的创业公司也给出了实际结果。他们将业务迁移到 Storj,并使用分布式 GPU 计算,显著缩短了训练时间。团队现在专注于化学发现,而存储层负责备份与修复。他们不再等待初始化工单或盯着监控面板变红。

经济性更偏向分布式。训练会带来可预期的流量,但到 2027 年,推理将成为主要负载,而这就需要尽可能靠近用户的数据。真实应用——个人助理、自动驾驶车辆——需要低于 10 毫秒 的响应。当数据跨越海洋时,这几乎不可能。分布式网络会把计算切片放到靠近边缘的位置,使推理集群能够直接拉取上下文,而无需进行全球往返。

安全性通过端到端加密与加密证明内置完成。任何人都可以在不泄露内容的情况下验证数据的存在性与完整性。Filecoin 将这些校验直接集成进智能合约,只有在证明成功后才会释放付款。Storj 则加入删除编码与定期审查,以确保在数学层面保证的稳健性。

网络效应是真实存在的。每一块未使用的硬盘在有人运行节点程序时都会成为解决方案的一部分。增长是有机的——每一个新启动的人工智能项目都会把多余的算力转化为共享资源。新兴市场中的小型运营商通过贡献带宽获得合理的收入,创造经济机会,同时增强基础设施。

正在将冷数据迁移到分布式网络的公司,会看到节省迅速累积。过去每月花费数千美元的训练数据存储成本,如今变成了每存储 1GB 只需几美分。节省下来的差额会被团队重新分配到更多 GPU 或更大的数据集,从而加速他们的时间表。

开始测试这些配置的工程师表示,扩展曲线更平滑、突发中断更少。这让产品团队对能够直接访问数据的能力更有信心。而迁移看起来几乎是必然的——随着人工智能从实验室走向日常产品,并在同一时间被数以百万计的人使用,需求也会持续增长。

过去把分布式存储视作“实验品”的开发者,现在会把它当作任何包含大规模、动态数据集的默认选项。简洁的编程接口让更换供应商无需停机。可验证的证明为合规性提供了可落地的保障。而成本结构强调效率,而不是因为规模而受到惩罚。

这并不是遥远的未来——正在发生。小型团队已经实现了过去需要巨额预算才能获得的生产级速度与节省。技术与人工智能同步成熟,为未来十年的智能提供基础,无需持续进行再工程。
FIL-0.16%
STORJ-1.12%
AR-0.89%
0G-0.61%
查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论