11月25日,由创业黑马主办的“第15届创业家年会”在北京举办,年会主题为“AI给世界一个确定性”。会上,拓尔思创始人施水才以《大模型产业落地的实践》为主题发表了演讲。
施水才在演讲中表示,“烧钱做大模型已经成为过去,烧脑做AI应用正在当时”。他认为:大模型产业落地需要解决“合规可信、模型安全、数据质量、业务深度融合以及部署成本”等五大问题,未来大模型在千行百业的数字化转型和赋能中有非常广阔的市场。
以下为创业家&i黑马编辑过的演讲节选:
01
创业30年的三点体会
感谢创业黑马给我颁发“2023年度创业家”这个荣誉称号,我先分享下创业的感受和体会:
第一个体会是我怀疑自己还是创业者吗?我1993年就下海创业了,到现在30年,经过努力在2011年把公司带上了创业板。有一次开会时,一个券商老总看到我们的股票代码(300229)说:“施总,你还在工作呀?”他觉得我早应该退休了,打球的打球,润走的润走,有的公司甚至退市了,这引发了我的思考,真正理解什么是创业。我在母校西安电子科技大学做过一次演讲,标题叫《创业永远在路上》。创业是一种体验,我仍然把自己当作一个创业者,我认为创业永远在路上,它和财富没有什么关系,更多是兴趣和体验。
第二个体会是关于科学家和企业家在未来的商业公司里的地位。我不是著名的科学家,而是非主流教授下海,所以我的体会有两点:1、创业一定要all in。很多教授出来创业时,作为学者创业,不想放弃之前的东西,虽然我也有学校教授身份,但我120%的时间都在做公司业务。2、必须学会自我批判、自我否定。因为教授和科学家追求完美、非常执着。但作为企业家,要学会妥协。比如产品上要妥协,不能等做到100%再卖,否则会错过时间窗口;还需要跟用户妥协,甚至于还要跟友商妥协,因为这是一个商业生态。这里面不存在谁主导的问题,一位科学家要创业的话,自我否定、自我批判是非常重要的。
第三个体会是我们公司已经成立30年了,为什么还能活下来?最近跟很多领导和同行交流这个问题,我们也在反思,我们是不是没有战略。有一本书叫《为什么伟大不能被计划》,我们能活到今天,绝对不是没有战略。里面有几个重要的核心点:1、行稳致远,公司这么多年发展的比较稳。2、稳的同时不折腾,很多上市公司折腾一下,可能就把自己的公司折腾没了。3、不断去学习,思维不能僵化,在学习中持续创新。
以上是我在创业的这个历程中的一些感想。
02
IT产业发生的两个重大变化:
智能化,数据化
我们发展到今天,整个IT产业发生了两个重大的变化:一、从自动化到智能化。以前IT公司做流程也很重要,这是信息化,我们一直在做文本的信息化和自动化处理,到今天这个时代智能化处理已经成为生产力编个的关键。二、从IT企业发展到DT企业,大家所知道的数据要素,包括人工智能都是以高质量且大量的数据为基础。如果我们抓住了这两个变化,就可以穿越产业的发展周期。
03
大模型产业落地需解决的五大问题
有句话大家可能会感同身受:“烧钱做大模型已经成为过去,烧脑做AI应用正在当时。”截至目前中国已经有320个大模型,美国有100多个,在美国做AI应用正在蓬勃兴起。这两句话,对我们来说是有启发的。大模型在产业落地时,有五个方面的必须解决:1.合规、可信。2.模型本身的安全。3.训练数据的质量。4.业务的深度融合。5.部署大模型应用的成本。
第一点,大模型生成内容的合规可信问题。一个知名的媒体机关做价值观对齐,要做1万个对齐的句子,看看回答的问题对不对。有些大模型,为了保证结果不违反规定,选择不回答。如果大模型不回答问题,那还要大模型干什么?所以大模型生成的内容合规问题很重要,它泛化产生的幻觉,时间、地点对不上,如何解决?
第二点,安全问题。分成三个层面,一是模型本身的安全,因为模型可能会被攻击,比如数据投毒;二是数据安全,私域数据交给大模型学习,意味着我们的业务数据丢失,也是不行的。三就是个人隐私的数据安全问题。
第三点,高质量的数据是大模型效果的核心。现在有一种观点,用千亿参数加低质量数据训练的大模型,还不如用高质量数据加百亿参数训练的模型效果好,我是认同的。因为大模型的原理和方法,大家都清楚了,更重要的是数据、调优和工程化的能力。数据黑盒存在“三不”问题:数据的质量不高、实时性不够和覆盖率不全。
第四点,大模型的技术和业务是两张皮,很难创造价值。微软把所有的任务都转化为对话,把所有的任务都变成Copilot,所以在office里面它可以做个助手,但企业业务系统里面只有助手是不够的,必须解决大模型能力和业务两张皮的问题。
第五点,成本高。高成本下的回报在哪里?ROI有多少?
要解决这些问题,拓尔思也一直在探索,有几个探索点:
第一,要用一些方法来保障大模型生成内容的这个质量,使内容合规可信。一是中文特性增强的可控生成技术,包括安全围栏提示工程、知识注入等,还有大模型和知识图谱怎么结合,包括用知识增强这个方法,如何把搜索技术和大模型结合来提高生成内容的相关性和质量。另外用一些向量数据库来加持并实现多模态长期记忆和克服这个上下文的限制。
第二,安全。一定要强化数据安全的保护。
第三,高质量的数据。我们三大数据资产平台大概积累有 2000 亿条数据,每天日增大概2亿。现在这三个数据中心也都在服务于各行各业。我们为了验证数据质量对大模型的用处,在今年6月开展了一个行动:把我们的数据开放给各大基础模型研发的公司,看他们是否需要。经过一个多月时间,已经实现商业化收入的有将近10家,另外还有10家左右在合作使用。
第四,与业务的深度融合也是非常重要的。跟业务融合时,现在的基座大模型是什么并不是很重要,重要的是把所有这些都变成AI Agent。
第五,大模型到底是选择私有化部署还是SaaS服务,主要考虑成本问题和数据安全问题。大模型私有化部署时,工程化能力是大模型产业落地的重要保障。
04
拓尔思大模型的行业落地
拓尔思在6月29号的时候推出了拓天大模型,首先应用在媒体、金融和政务,最近又推出了舆情和公安等行业大模型应用。在媒体行业主要用大模型来做三件事:第一,成为内容生产环节的助手;第二,在内容搜索和推荐方面可利用大模型的知识增强能力;第三,在传播方面。拓天媒体大模型已在人民日报社部署使用。在金融行业,像信贷、投研、审批和客户服务,比如招商银行的消费者保护平台,用大模型的技术,从投诉分析到给出解决方案。另外跟平安银行做的审计大脑也使用了大模型技术。
在政务方面的实践也是一个非常大的市场,具体的应用场景包括政策研究,办公以及办事咨询助手等。在舆情方面,舆情报告的写作和分析助手,可以大大减少人工,这是它的一些应用亮点。在公安行业我们推出了分析、研判、执法和重大事件处理的一些应用。
未来大模型在千行百业的数字化转型和赋能中有广阔的市场,是大模型的主战场!
扫描下方二维码
报名参加黑马AIGC产业大课
↓↓↓
点击阅读原文,立即报名。
继续阅读
阅读原文