Your Company is a Filesystem:从Unix文件系统,到数据库时代,再回到文件系统的轮回

最近在X上看到Eli Mernit(@mernit)的帖子,分享了一篇题为《Your Company is a Filesystem》的文章。这个观点乍看简单,却直击AI代理时代的核心痛点:企业数据该怎么组织,才能让AI真正高效地"工作"。

Eli的论点可以用一句话概括:公司就是一个文件系统。一切数据抽象成文件和文件夹,AI代理通过最熟悉的读/写/执行接口访问它们,而不是纠缠于成百上千的SaaS API。

这让我想到一个更宏大的历史轮回:从Unix时代的"一切皆文件",到关系型数据库的崛起,再到NoSQL的爆发,如今在AI代理的推动下,我们似乎又回到了文件系统的怀抱。

这不是倒退,而是螺旋上升。文件系统作为人类和机器最自然的交互抽象,正在以全新方式复苏。

Unix文件系统哲学

一、起点:Unix的"一切皆文件"哲学(1970s)

Unix诞生于1970年代,Dennis Ritchie和Ken Thompson提出的核心理念之一就是**“Everything is a file”**。设备、进程、网络、管道……统统通过文件接口访问。文件系统采用层次树状结构(hierarchical tree),根目录/下分支成/bin/etc/home等。

这种设计为什么强大?

特性 说明
统一接口 程序员只需学会open/read/write/close,就能操作几乎所有资源
简单可组合 管道(pipe)和重定向让命令行工具像积木一样拼接
人类直观 文件夹和文件是现实世界的隐喻,易于理解和导航

早期数据库其实也依赖文件系统:数据以平坦文件或简单层次存储,查询靠手动遍历。但随着数据规模和复杂度增长,文件系统的局限暴露:缺乏高效索引、事务一致性、并发控制。1970年Edgar F. Codd发表关系模型论文,标志数据库正式独立成体系。

二、数据库的黄金时代:从关系型到NoSQL(1970s–2010s)

数据库演进时间线

1970年代后,数据库快速发展:

层次数据库 & 网络数据库(1960s–1970s)

如IBM的IMS,数据以树状或图状组织,但查询路径固定,灵活性差。

关系型数据库(RDBMS)(1970s起)

Codd的模型用表、行、列组织数据,SQL标准化查询。Oracle(1979)率先商用,MySQL、PostgreSQL等开源跟进。优势是规范化(normalization)、ACID事务、复杂JOIN查询。

1990年代起,面向对象数据库短暂兴起,但关系型主导企业级应用。

NoSQL崛起(2000s–2010s)

2000年代互联网爆炸,产生海量非结构化/半结构化数据:

  • MongoDB(文档)
  • Cassandra(列式)
  • Redis(键值)
  • Neo4j(图谱)

它们牺牲部分一致性,换取水平扩展和高吞吐,完美适配Web 2.0的大数据场景。

数据库为什么取代文件系统成为主流?

  1. 处理复杂查询:SQL能轻松实现"找出所有销售额>100万的客户及其最近订单"
  2. 保证一致性:事务、锁、回滚
  3. 优化性能:索引、B树、查询优化器

但代价是:数据被锁在黑盒中。每个数据库有自己的API、schema、驱动。开发者要学无数接口,AI代理更难直接"理解"。

三、轮回开始:AI代理时代,为什么又回到文件系统?

Airstore虚拟文件系统

2025–2026年,AI代理(Agentic AI)爆发。代理不再是聊天机器人,而是能自主规划、多步执行、长期记忆的系统。但它们面临两大瓶颈:

瓶颈1:上下文窗口有限

即使Claude有200k token,也无法塞下整个企业数据。

瓶颈2:状态管理缺失

LLM是无状态的,每次调用从零开始。需要外部"记忆"来实现跨会话连续性。

文件系统在这里重新胜出

优势 说明
LLM天生熟悉 模型在训练中见过无数代码和文档,知道ls、cd、cat、grep、echo等操作。文件接口是"零学习成本"的抽象
无限扩展 不像上下文窗口有上限,文件系统可外挂到本地磁盘、云存储,甚至分布式(如S3)
持久与可审计 文件天然支持版本(Git)、权限(chmod)、日志。代理写中间结果到文件,下次唤醒直接读取
简化集成 不用为每个SaaS写适配器,只需把数据"物化"为文件夹

社区实践

  • Dust.tt:把Slack频道、Notion页面、GitHub仓库抽象成虚拟文件系统
  • Turso的AgentFS:基于SQLite的文件系统抽象,提供POSIX-like接口+工具调用追踪
  • Oracle博客讨论:文件系统胜在接口友好,数据库胜在底层保证(并发、语义搜索)。最佳是混合:数据库做substrate,文件系统做interface

Eli在文章中强调,权限即治理:Unix的rwx映射到公司角色(员工只读写特定项目,合伙人有root)。这比数据库的RBAC更直观,也更易让AI遵守。

四、Airstore.ai:从理念到落地的桥梁

文件系统与数据库混合架构

Eli的文章直接服务于他的产品Airstore.ai

  • 核心:虚拟文件系统,将多源数据转为本地文件夹
  • 用法:自然语言描述需求 → LLM生成视图 → 后台同步 → 代理读取精确上下文
  • 优势:解决记忆孤岛。代理如OpenClaw/Claude Code可跨会话"回忆",因为状态持久在文件里
  • 例子
    • PR审查机器人读/github/open-prs/diffs
    • 邮件分类器操作/gmail/inbox/labels

这不是取代数据库,而是补位:在需要强一致性时用DB做后端,暴露文件接口给AI。

五、未来展望:螺旋上升的存储范式

公司即文件系统 - 未来愿景

这个轮回不是简单回归,而是融合:

文件系统 + 数据库混合

文件做前端接口(人类/AI友好),数据库做后端(事务、索引、向量搜索)。

AI-native抽象

未来可能出现"Agent Filesystem",内置:

  • 工具调用追踪
  • 自动版本
  • 语义查询(如"找所有提到’Q4目标’的文件")

企业转型

护城河从SaaS API转向"业务文件夹"组织。咨询公司的TOM模型,以后或许就是一堆.md + 文件夹结构。

挑战依然存在

  • 大文件同步慢
  • 噪声控制
  • 隐私

但方向清晰——当AI成为主要"用户"时,最自然的接口往往是最古老的

结语

Eli的帖子获数百点赞,不是因为新奇,而是戳中了痛点:我们花了50年把数据从文件搬到数据库,现在又要搬回来,只为让AI更好地"工作"。

你的公司准备好当一个"文件系统"了吗?

或许,从今天开始,让AI代理cd到你的/root试试。


参考链接


本文基于公开资料整理,由工业智能算网发布。

分享到