作者:程天一
编辑:程天一、penny
排版:Scout
LLM 通常被我身边的 US Fintech 投资人朋友们视作 AWS 这样的基础设施,下一代公司将基于它构建,但这是大家的标配,并不会在根本上带来竞争差异。但是更 Generalist 的投资者对于 AI 玩家跟现有 Fintech 巨头的竞合并没有丧失兴趣,Bookkeeping 也成为了 LLM 创业公司的第一波进攻对象。
Bookkeeping 中文翻译叫簿记,跟我们个人记账有些相似之处,但是对记录并细分每一笔交易、关联它们的关系以及结合最终报税环节的要求更高。美国有 3300 万家 SMB,几乎都需要做 Bookkeeping。如果缺少这个环节,他们就难以让业务井井有条,跟银行、供应商和客户打交道也有诸多不便,并且会在联邦和州的税务申报时遇到麻烦。
SMB 在 Bookkeeping 一直有多重的痛点:他们中的一部分至今没有被数字化,仍然使用纸笔(如果你看过《瞬息全宇宙》的话会很有体感)或是 Excel;一些老板已经用上 Quickbooks 来 DIY 记账,但是往往会在这个繁琐的过程上浪费太多时间;他们大多数还需要按小时与簿记师合作,每小时支付数百美元来获取专业建议。
OpenAI Fund 最低调的 Portfolio 是 Kick,除了官网和在围绕 OpenAI 基金的报道中零星出现下名字之外几乎没有公开信息,创始人 Conard 的 Linkedin 至今挂的最新公司至今仍是“-”。但它也是 OpenAI Fund 最早投资的一批项目,试图使用 AI 替代手动流程和人类专家,帮助 SMB 和簿记师从 Bookkeeping 的繁琐过程中脱身。
拾象团队在听到 Kick 的故事时非常激动,觉得看到了下一代 ERP 的影子。我仍然相信 LLM 和 Kick 有这个潜力,但是打造下一代 ERP 这样的企业经营中枢性平台必然是个艰辛的过程。本文就从大的市场图景和 Bookkeeping 领域过去 10 年的创业趋势,从时间的横向切片试图展示出在 Bookkeeping 领域创业的机遇和挑战。
以下为本文目录,建议结合要点进行针对性阅读。
👇
01 项目背景
02 Kick 背后的市场机会
03 改进 Bookkeeping 的 3 波尝试
04 对 Kick 的猜想
01.
项目背景
Kick 所在的赛道是 Accounting&Tax 下的 Bookkeeping(记账)方向,这是一个曾经被 Fintech 投资人们认为潜力巨大、可以被 AI 和自动化颠覆的领域,但是过去 10 年号称由技术变革驱动的公司并没有跑出来,反而是美国的销售税改革推动了 Avalar(Thoma Bravo 84 亿美元私有化)成为 Accounting&Tax 这个大赛道下最成功的案例。
鉴于大的叙事逻辑没有改变,而过去的公司遭遇了获客、客户留存、AI 和自动化的作用有限、Quickbooks 对用户习惯的统治、低毛利等方面的挑战,目前美国主流的 Fintech 投资人已经逐渐对 Bookkeeping 方向丧失兴趣。Kick 的特殊之处主要在于它是 OpenAI Fund 最早的 Portfolio 之一,并且 GPT-4 的能力可能给 Bookkeeping 的自动化注入新的可能性。
Kick 由垂直行业专家而不是 AI 专家组成,CEO Conard Wadowski 是在线教学平台 Teachable 的联合创始人,以及活跃的 AI/Fintech 投资人,Portfolio 包括 Copy.ai 和 Banking-as-a-Service 第一名的 Unit。公司引入了财务方面的专家 Echo 担任 Head of Tax,斯坦福的应届生 Yoni Lerner 担任 Head of ML。
目前 Kick 所处在阶段还非常早期,这次 Intro 的目标是帮助团队更好理解以下方面:
1. Accounting&Tax 大的赛道图景和 Intuit 的市场地位;
2. 过去 Bookkeeping 的创新公司(美国的慧算账、云账房、融易算们)所做的尝试和遭遇的挑战;
3. LLM 带来的潜在变量。
02.
Kick 背后的市场机会
捆绑与交叉销售
从大面上看,Kick 处于 Fintech 投资人定义的“CFO Office/Finance Tech Stack”投资主题上,主要的催化剂是疫情带来的 Future Work 趋势让大家畅想各个支持性职能的软件是否可以被重构和颠覆,比如我们讨论过的 Rippling 就属于 CPO Office 的重构,Brex 和 Ramp 是 CFO Office 下采购和支出管理的新型软件,Retool 其实也处在这个主题下。
Redpoint 和 Sapphire 都对 Finance Tech Stack 做过不错的梳理:
按照 Redpoint 的这个分类,Kick 的起点将会是 Bookkeeping/Financial Close,帮助公司在每周或每个月把账记清楚,并承担一定的对账和财务报告职能。它如果能变成企业的 general ledger(即最重要的那个主账本)并且延伸到库存和其他商业流程上,可以在终局跃迁到 ERP/Accounting 这个 Finance Tech Stack 皇冠上的明珠,成为企业和 CFO 最重要的中枢性平台。
Source - The Finance Tech Stack 
by Medha Agarwal and Urvashi Barooah
事实上对于 SMB,比如美甲店,因为业务比较简单,和宝马或者沃尔玛需要管理的进销存复杂度相去甚远,压根不需要完整的 ERP,中枢性的财务平台已经完全可以被视作 ERP。
Source - The Finance Tech Stack 
by Medha Agarwal and Urvashi Barooah
Sapphire 将这个框架总结的更加庞大,但是思路是类似的 —— 如果一家只停留在记账职能,就在左上角 Bookkeeping&Tax 这一栏,属于财务经营情况的记录工具,如果能大成则可以像 Quickbooks 一样进入下面中枢性系统的 ERP 中,客户不得不用、用了就离不开。
Source - Rise of the Next-Gen CFO: 
The Evolution of Finance’s Role and Tech Stack 
by Rajeev Dham, Jane Lee, Aditya Reddy
如果是早期投资人,对于 Kick 最重要的判断点应该是:它的团队有没有野心打造下一代 SMB 的 ERP 而不是又一家乏味的记账服务公司?在 LLM 的加持下,它有没有机会实现这一跃?
什么是 Bookkeeping
由于中美在财税习惯和法律上的差异,这部分先简单介绍下 Bookkeeping 对 SMB 的作用和实际用例 ——Bookkeeping(簿记)基本可以被视作 Accounting(会计)的一个子项,用于记录公司每天的商业交易、细分每个收入和支出项并且标记它们之间的关系。
Quickbooks 上一些典型的收入和支出项分类
聚焦到用例上,可以从 3 个视角看 Bookkeeping:
• 对内:让业务井井有条,同时将生意和个人财务分开;
• 对外:当贷款或融资时,银行或者基金都会有获取财务报表的需求;顾客和供应商等上下游角色可能也需要新开发票和收据;
• 对政府:美国商家需要进行联邦和州的税务申报,在季度和年度纳税。
Bookkeeping 的基础过程其实可以没有相关软件的参与,完全用纸笔记录也可以,有相当多的 SMB 至今仍然在使用 Excel,但是这往往会带来一些问题 —— “我平常就维护几个 Excel 表格,但是银行贷款要我提供 P&L 和资产负债表”、“这个月快要发工资了,但是我的公司账户没钱了,仔细一看是很多应收账款逾期了,这会儿打电话要支票也来不及了,只能先用个人信用卡预支”、“报税时间到了,但是我保留的收据很混乱,年结会计表示‘我尽力了’”……
需要注意的是 Bookkeeping 最终和报税以及退税是强相关的,但是这两个流程是分开的,分属“财务”和“税务”两个内部流程,软件所需要的集成也不同,比如 TurboTax 这样的报税软件需要和 IRS 相关系统做整合。但是从客户诉求出发,他们希望软件供应商或者服务商能够统一解决掉问题,因此 Intuit 或是 Kick 都是财税两手抓。
《瞬息全宇宙》中的场景是典型的所谓 DIY&Non-
Consumption 用户,自己用纸笔记账和处理税务
使用 Quickbooks 这样的软件可以让生意记账数字化地保持合规和井井有条,并且可以通过 TurboTax 简化报税季所需的工作,甚至发现意料之外的豁免和退税
发展到今天,在 Bookkeeping 这个环节,美国的大体现状是:
美国有 3300 万家 SMB,其中大约 60% 是会雇佣员工,一旦涉及到发工资往往 Bookkeeping 就复杂起来了,也代表Bookkeeping 的真实 TAM。
绕不开的 Intuit
Intuit 几乎是 Bookkeeping 行业的代名词,在美国的 SMB 群体已经形成了实质上的垄断地位,并且没有丧失创新能力,新任 CEO 在 19 年上位后就将  AI&Data 定为最重要的战略,因此理解 Intuit 所处的市场、业务布局和对 GenAI 的投入对于看待创新公司有很强的指导意义。
Product Portfolio
Intuit 基本代表一家 Accounting&Tax 短期能在收入和体量上看到的天花板 —— 1300 亿美元市值,130 亿美元收入,80% 毛利率,35% Non-Gaap 营业利润率。我们很多时候觉得 Kick 有可能成为下一代 ERP,而 Intuit 现有的 Product Portfolio 的确让它已经是 SMB 内部财务相关堆栈的中枢性平台和实质上的 ERP。
针对 SMB 市场,Intuit 拥有非常完善的客户洞察系统,内部非常自豪于以对客户需求的深入了解为导向进行产品设计。新任 CEO Sasan 很敏锐地注意到了最重要的一些趋势:
• 企业主在生意的一开始觉得财务最重要,但是很快营销等等各方面都变得重要,需要构建满足经营端到端需求的平台;
• 未来属于AI&Data,结合第一点,在过去 5 年进行了激进的 M&A 并且押注于 ,21 年 120 亿美元买了 Mailchimp,拥有大量 SMB 跟客户互动的数据,20 年 34 亿美元买了 Credit Karma,获得了大量消费者数据;
• 了解到客户不光需要产品来进行 DIY,还需要“Expertise”,在 19 年开始陆续引入了人类专家服务 QBO Live 和 TurboTax Live,打击了 Pilot 和 Bench 等对手,也给现在的 GenAI 提供了很好的落地场景。
TAM
Intuit 生意里面跟 Accounting 相关的部分是 Kick 这类 Startup 的基础 TAM,主要由几部分组成:
• 280 亿美元的 Accountant & Financial Management System: Assisted,即有专家服务参与的记账以及财务管理过程;
• 270 亿美元的 Accounting & Financial Management System: DIY,这个数字水分相对大些,包含了自行使用软件的付费人群和使用纸笔填写的非付费人群的付费潜力;
• 20 亿美元的 Accountant Services,即用软件服务专业的会计人士 & 事务所,类似 Copilot for Accountant 的机会。
GenAI Offering
Intuit 从 19 年就开始大体投入 AI&Data,不过大头还是传统 AI 和小模型,比如 GPT-4 可以帮助自动分类交易数据,Intuit 其实已经优化很久了,去年 Transformers 2022 大会上表示有 200 万个生产环境中的模型每天更新来帮助 SMB 客户完成有效分类。
ChatGPT 出现后,Intuit 是最 FOMO 的软件公司之一,在 6 月初推出了 GenOS 来专门解决税务、会计、营销、企业现金流和个人财务管理问题。GenOS 目前和 OpenAI 合作,但是其 CTO 表示 GPT-4 对于 Intuit 这种财务场景来说可能准确度还不够高,它会一方面考虑和这类外部 LLM 合作,另一方也尝试使用自己的交易数据、税务信息等数据训练 LLM,从而将自己在 TAM 的渗透率提升 4 倍。
GenOS 包含 4 个核心组件:
• GenStudio 是转为 LLM 应用打造的开发环境,帮助 Intuit 的开发人员快速试验和完善 GenAI 相关的产品;
• GenRuntime 负责根据不同的任务和数据调度不同的 LLM 来响应;
• 
GenUX
定义了使用 LLM 的 UI 组件库和 UX 流程;

• Finance LLM 则是专为财务和税务场景定制的 LLM,可以提供见解并且进行联系人类专家之类的行动(还不确定是预训练全新的 LLM 还是基于现有模型进行微调)。
目前这个 GenOS 还处于营销噱头状态,只有零星应用,没看到体系化打法。但是 Intuit 的产品矩阵提供了非常丰富的 GenAI 落地场景,已经构建好的应用包括 TurboTax Live Expert Review,可以自动审查纳税申报表并提供反馈;还有 QuickBooks Cash Flow Planner,可以帮助预测客户现金流并提供见解;以及 Mailchimp 智能推荐,根据客户行为提出营销活动建议。
除了这些产品外,最具有想象力的长期愿景是让 AI 替代人类专家:现在 Intuit 作为中间平台在 Quickbooks Live 和 TurboTax Live 上提供了超过数万名人类专家为客户提供服务。
但是目前 Intuit 使用 LLM 的方式仍然是让它成为人类专家的 Copilot —— 现在 Intuit 的 Live 服务已经让专家不再需要自行记笔记,而是让 AI 自动总结对话记录并生成关键的 next-step。这可能是 Kick 的一个重要窗口期,因为根据它官网的信息,Kick 旨在使用 AI 驱动的专家替换掉人类服务。
Source - Kick.co
03.
改进 Bookkeeping 的
3 波尝试
在过去 15 年,Bookkeeping 有 3 波创业尝试,我们可以展开看一看每一波的催化剂。
云化和劳动力套利
这个阶段的代表性公司是 inDinero,催化剂是所谓的 Open Banking 趋势 —— Mint.com 率先抓住了 Open API 的大潮,通过连接到用户的银行账户来帮助他们分析和管理个人财务状况,并且让 Yodlee 和 Plaid 等帮助应用连接到银行数据的基础设施出现。
随着 Mint 在 2009 年以 1.7 亿美元被 Intuit 收购,inDinero 公司试图将它的思路扩展到 SMB 身上,即通过连接到银行账户帮助 SMB 自动追踪财务。在缺少 ChatGPT 的年代,这有许多挑战(其中一些可能在现在仍然存在):
• 客户的银行账户里交易记录只会显示支票号码,仍然需要跟客户沟通才能明白支票的用途和来源关系;
• 亚马逊的订单也有类似的问题,必须让购买者亲自介入分类才能分细;
• 早期的 AI 需要对交易进行人工归类,比如一类交易是“每个月给房东寄一张支票”,客户将其初始化归类为租金后,AI 无法将其他每月重复的交易和租金区分开;

• ……
因此在观察到大量 SMB 实际上希望“全包模式”,让 inDinero 帮助他们处理财务和税务的一切问题,inDinero 从产品公司转型成了服务公司,通过在菲律宾开展办事处和雇佣簿记师来进行劳动力套利。受到这个商业模式在可拓展性上的限制,inDinero 到今天花了 14 年时间拥有不到 4000 万美元的收入和 50% 左右的毛利率,基本没有达到当年在 YC 时的野心。
根据对 inDinero 创始人的访谈,他们并不看好 LLM 能颠覆 Quickbooks,核心原因有两点 —— 一是 Bookkeeping 就像自动驾驶,边缘情况最致命,归类错一个交易通常可以蒙混过关,但是保不准什么时候给客户带来麻烦;二是 Quickbooks 内置了太多的会计 Know-How,经过几十年积累,基本没有人能重建。
同时,inDinero 的模式本身能够成立,Quickbooks Online 在拥抱云上面的成功也至关重要 —— Quickbooks Online 可以让簿记师和客户在线协作,不再需要邮件沟通或者是导出 Excel 重新维护账本,因此 inDinero 类似模式的公司都是基于 Quickbooks 提供服务,并没有重构软件。
引入在线专家服务
随着 Uber、Airbnb 等 Marketplace 在 2015 年前后彻底崛起,这个模式也进入到了 Bookkeeping 领域,Bench 和 Pilot 是最闪亮的两家公司,前者获得了 Shopify 和 BCV 等机构的投资,后者则由 Stripe 和 Sequoia Capital 等支持。比较有意思的是 OpenAI、Scale AI 都是 Pilot 的客户。

Bench 和 Pilot 的模式略有差异,但是大体思路都是作为中间平台帮助企业完全外包 Bookkeeping 甚至是整个 CFO Office 的职能,并且专注于新经济客户。Bench 更聚焦于新经济 SMB,自建了软件,并且内部雇佣簿记师,1000 多名员工中一半以上都是簿记师;Pilot 则基于 Quickbooks 服务新经济 Mid-Market,在美国低线城市 Nashville 雇佣了一些簿记师。
这两家公司的核心能力都在服务和组织能力,即如何通过 AI 和自动化让一个簿记师能够同时服务 80-150 个客户,并且因为簿记师的高流动率,还需要处理好客户在 3-5 个簿记师之间的切换。
它们都采用月费订阅模式,但是毛利都更接近服务,而不是 SaaS 公司,比如 Pilot 在 22 年拥有 4200 万左右的 ARR,但毛利在 60% 以内。Bench 的数字可能会更低。Pilot 在定位上也把自己称作“美国最大的、专注于创业公司的会计事务所”。
由于在早期被投资人们给予的预期过高,这两家公司目前的表现都略令人失望。有几个重要原因:客户的平均寿命只有 3-4 年,然后要么倒闭要么变大寻求更专业的服务;毛利压根不接近 SaaS 公司;AI 和自动化的作用没有达到预期。
Pilot 的早期工程师对最后一点深有感触:
想要使用 AI 或者自动化,在数据上有非常大挑战 —— Bookkeeping 需要协调不同的数据源,比如银行显示有笔交易,需要跟 Amazon 账单或者 Square POS 订单交叉核对,将各个交易互相协调,从而不会记重或者漏掉资金,自动化实际上非常困难,Pilot 的哲学是“自动化是一个范围,不是非黑即白的”。
在内部,Pilot 也比较难的是证明自己自动化工程的 ROI,比如软件给会计师每天提效了 10%,他们会摸鱼,效率不会等比提高。AI 也有问题。在客户那一侧,你必须是正确的,没法给客户说”这是算法说的“,答案必须是基于 Bookkeeping 的最佳实践。
但是如果有公司能实现 99% 的 Bookkeeping 自动化,客户绝对会很高兴,他们可以提前拿到自己的账本,而不是在本月的最后一天,世界上很多簿记师可能会失业。
自动化的困难在实操中会导致许多问题。CRM 软件 Gem 在 19 年开始使用 Pilot,当时是 50 名员工完成 400 万美元收入,到 20 年 75 名员工实现 1000 万收入时 Pilot 已经很难跟上了。Gem 内部在准备新一轮融资的 Data Room 时 BizOps 负责人发现 Pilot 记的账有许多错误和歪曲,花了 20 小时来进行清洗。内部讨论觉得 Pilot 提供的是服务而非技术和软件,但这个服务又非常混乱,因此决定自建记账体系,雇佣了一名财务总监和内部会计,最终在 2 个月之后脱离了 Pilot。
如果 Kick 同样服务新经济客群,将会面临类似的问题,并且 Bench 和 Pilot 积累更深,叠加上 GPT-4 的能力即可。
LLM 驱动的 AI 能力
当论证自己的 AI 能力强时,Intuit 的 CTO 举的例子是它的模型可以在加油站使用 fuel 和 gas 等不同表述的情况下成功归类交易。这对于 ChatGPT 和 GPT-4 来说似乎是个非常简单的行为。
使用过 GPT-4 来处理 Bookkeep 的簿记师表示:
我作为 Bookkeeper 使用 GPT-4 进行了一些测试,觉得它再发展几年适用于 Bookkeeping 的智能能力以及更好的 UI 就有机会取代人工了。如果你提供交易的清单和 chart of accounts,它可以将收入和支出归类到应该去的账户,但是没法很好地处理资产和负债。此外,同一个供应商可能卖许多不一样的东西,本地的商家可能彼此名字有重合或者跟别的商家缩写相同,GPT-4 暂时还没法很好地处理。
但是 GPT-4 已经可以解释为什么它进行了某项归类,这比 Quickbooks 上现有的自动化已经提升很多。对新手已经是可用的。现在还缺两项东西:
1. 跟真正的会计软件的集成;
2. 人们使用它的意愿及心智。前者是数个月和一两年的时间,后者则需要人们醒悟使用 OpenAI 产品的成本有多低。
ChatGPT 和 GPT-4 让 AI 能够理解和处理半结构化甚至非结构化数据了,而 Code Interpreter 这样的插件则释放了它处理 CSV 等结构化数据的完美效率,因此重新启发了新一代公司杀入 Bookkeeping 领域。比较有代表性的是 Truewind 和 Kick,前者是 YC 公司,后者则由 OpenAI Fund 支持。
Truewind 的产品已经上线,创始人在 Sacra 上也分享了一些自己对于 LLM 和 Bookkeeping 的关系,还是非常有启发的:
• LLM 有两大作用:一是提升簿记师的效率,过去的发票和合同阅读是手动的,现在有了 OCR 之后可以自动读取并且让 AI 提出一定总结和建议,让簿记师进行验证和更改;二是改变跟客户的交互方式,SMB 不再是每个月最后收到一封邮件,而是更实时的互动,可以每周一次短信沟通问题并且获取所需客户的上下文信息;
• 目前使用 LLM 最大的挑战是 Hallucination,内部的 AI 堆栈就是 OpenAI 的 API;
• 新的 Bookkeeping 公司不需要想着重建 Quickbooks,客户其实完全不关心你在后端使用什么,Quickbooks 外观很丑但是拥有法拉利引擎;
• 上一代所谓技术驱动的服务公司毛利率在 40-50%,Truewind 的目标是 70%。
目前来看 Truewind 使用 LLM 的用例还是把它当做簿记师的 Copilot,这也符合簿记师群体对于 LLM 的点评:
作为 Bookkeeper,我的大部分工作不是对交易进行分类。这是最简单的部分。被低估的才能是知道哪些信息值得信任、哪些不值得。
我教授大学会计,在课堂上融入的概念是“debit 和 credit 把东西记下来”非常容易,真正的技能是弄清楚这个生意究竟发生了什么。
AI 可以让我们管理更多客户,但是它无法消除责任,准确性非常重要。
我比较期待的还是 Kick 是否能像官网描述的那样能更进一步,直接让 LLM 充当簿记师专家的角色。
04.
对 Kick 的猜想
Kick 目前还没有正式发布产品,创始人 Conard Wadowski Linkedin 上挂的公司还是 Stealth Startup,可以被研究的信息很少,但是从几大挑战的角度可以大致对它的处境做个推演:
从这个表可以看出,Kick 最艰难的环节在于获客(英语世界投资人所谓的 distribution)。这也是拾象团队和硅谷投资人交流的突出感受,即 LLM 似乎没有改变获客环境,那些已经有场景和客户的公司叠加 LLM 能力更占优势。这一点倒是可以期待它的创始人 Conard 能否给出个好的答卷,他是做增长的绝对专家,职业生涯就是从为早期公司做增长咨询起步,发起了 GrowHack 公司,在 Teachable 成功圈了 10 万名创作者和 5000 万学生。在 Teachable 的双边平台经验也有可能帮助 Kick 思考和构建新的“AI-人类簿记专家-SMB 客户”之间的关系。
回到一开始的重要判断:Kick 的团队有没有野心打造下一代 SMB 的 ERP 而不是又一家乏味的记账服务公司?在 LLM 的加持下,它有没有机会实现这一跃?
LLM 显然比 Marketplace 模式创造出了更好的催化剂,但是 Kick 需要找到适合它从 0 到 1 的 SMB 细分客群,并且试图成为它们的中枢性平台 —— 短期内不一定需要替代和取代 Quickbooks,最好的范例是 Truewind 创始人提到的 Veeva Systems,它的后端其实也是 Salesforce,但是靠专注于医疗行业 CRM,Veeva 也能成为一家 330 亿美元市值的公司。
延伸阅读
GPT-4 的“秘密”:MoE、参数量、训练成本和推理设计
AI Agents大爆发:软件2.0雏形初现,OpenAI的下一步
拾象硅谷见闻系列:打破围绕开源LLM的6大迷思
ChatGPT Plugin:被高估的“App Store时刻”,软件和SaaS生态的重组开端
Stability AI:AI开源商业化试验田,Killer Model能成长为Killer App吗?
继续阅读
阅读原文