独家解密！B站up主用千亿级参数模型训练出的AI小姐姐，竟让骗子倒贴520

新智元报道

编辑：编辑部

【新智元导读】杀猪盘有套路，AI也有套路。AI对上骗子，用魔法打败魔法，让人拍手称快。

B站up主「图灵的猫」曾做过一期AI小姐姐大战杀猪盘骗子的视频，近日，这个视频已经突破了200万播放量！

作为B站知名科技区KOL，「图灵的猫」的视频一向人气很高。为什么这一期的流量尤其之高呢？

这是因为，用AI对话机器人让骗子一步一步露出马脚的过程，实在看得人大快人心！

你知道，全国有多少人收到过诈骗信息吗？4.38亿！

这个数字占人口总数的32%，相当于每三个人中，就有一人受到过诈骗信息的骚扰。

同时，随着技术的发展，诈骗分子的手段也越来越新奇，杀猪盘、网络兼职、疫情诈骗、虚拟投资诈骗层出不穷。

被诈骗的对象也不仅限于老人和小孩，有不少高知、白领、大学生，都是诈骗的受害者。

更有甚者，深陷网络杀猪盘的女性受害者，既破了财，精神上还遭受了极大打击，甚至付出了生命的代价。

诈骗分子玩的是哪些新套路？如何辨别新型诈骗手段？我们又该怎么利用AI技术护身防骗？

AI反诈论坛，教你利用AI技术，以魔法打败「魔」法！

此次论坛由新智元CEO杨静女士主持，邀请到浪潮信息算法研究员张辉博士，以及B站AI领域头部UP主「图灵的猫」共同参与讨论。

AI：没人比我更懂诈骗

很多人都觉得，受害人上当，是因为不够聪明。

可是，有那么多白领和高知，他们的知识修养和文化水平都不低，怎么还会上当呢？

张辉博士介绍说，人会受骗，是因为一个人再怎么渊博，也不可能拥有全面的知识，不可能了解所有的诈骗案例。

而再聪明的人，都难免有感情用事的时候。在某些氛围或场合下，就无法理智地做出判断。

可是谁能克服这些缺陷呢？

没错，AI就可以！

在反诈知识的储备上，它比人充分得多，因为经过大数据学习，它见过太多的诈骗案例。

而且，人虽然会感情用事，但AI在任何时刻都是理智的。

甭管是和什么人，在什么环境下聊天，AI统统一视同仁，既不会见钱眼开，也不会冲动做事。

所以，面对网络诈骗，AI可以充当人的助手，衍生人的能力，补足人的弱点。

杀猪盘：「虾仁」又「猪心」

诈骗案中，非常可恶的一种就是杀猪盘。杀猪盘的很多案例，看起来都触目惊心。

许多向往爱情的「乖乖女」，在婚恋网站上不幸跌进杀猪盘的陷阱，以为自己开启了一段爱情童话，殊不知自己在对方眼里不过就是待宰的「猪」。

设立人设，寻找猎物，剧本撰写，专职聊天，再到技术支持，专业骗钱等，杀猪盘的每个环节都有分工，施骗过程如同一条工业流水线。

这些受害人，轻则遭受几十万、上百万的财产损失，重则付出生命的代价……

2019年，海南一位24岁的女生结束了自己的生命，她在遗书上这么写道：「亲爱的爸爸妈妈，原谅女儿在今日选择结束自己的生命……被骗了20几万元无力偿还，挪用了爸爸6万7千元，借了十几万贷款，还欠朋友们几万元，你们养育我这么多年，我却做了这些对不起你们的事……我只能选择了结自己这一生……」

而和她一样的杀猪盘受害者，还有很多个。

面对这类案件，大家的第一反应往往都是受害人太过单纯，可怜又可笑。但如同我们在开头讲到的，这是一种偏见。

B站up主：用AI大战骗子

B站知名up主「图灵的猫」，曾经采用了浪潮的源技术，再用B站评论对AI进行微调，训练出来一个像魔法一样的反诈AI。这个视频在B站，已经获得了将近200万的播放量。

在论坛中，杨静女士向「图灵的猫」提问道：什么会有这样一个想法呢？

「图灵的猫」解释道，首先是因为，在最近几年，人工智能的对话模型进步非常大。

既然技术进步这么快，连骗子诈骗都开始用AI，那能不能发扬「科技向善」的理念，做一个可用的反诈AI呢？

经过调研以及和浪潮的合作，他和团队决定尝试做了一个反杀猪盘AI。

开始，他们用的是最初的API模型，虽然对话能力不错，但是在场景化的表达上，就不太好了。

骗子都是别有意图，跟骗子聊天，都是有剧本的。

为了让AI表现更自然，他们在B站、贴吧的热门评论中，找了很多语料，去给模型微调。

因为这些评论相当于回复和被回复的对话关系，就像我们平时在网上聊天一样，而基于这种关系，就可以更好地去发掘和利用它们，抽取出语言的形式，然后让AI模仿。

在测试中，这个AI的效果非常不错，视频在B站已经有了接近200万的播放。

「图灵的猫」认为，自己做的事最大的意义，就是提高公众对于杀猪盘的警惕，并且提供一种利用技术进行反诈的思路。

杨静女士接着提问道：那反诈AI是如何在与骗子的对话中，识别出杀猪盘的套路呢？

图灵的猫回答说，杀猪盘的套路都是有限的，很多骗子会用固定种类的借口来「杀猪」。

在AI的后台，就可以设立一个监控系统，一旦触发了某些关键词，就可以认为去观察和干预。

而对于不同关键词，骗子都是有一套逻辑的，我们就可以让AI反着这个逻辑，有一套对应的话术，诱导骗子露出马脚，帮助破案。

「小源」为何如此智能？

杨静女士向「图灵的猫」问出一个大家都很感兴趣的问题：怎么能让诈骗犯意识不到，与自己对话的是一个AI呢？

「图灵的猫」解释道：首先，「源1.0」模型本身的知识储备就非常大，而基于这个模型的知识储备，就可以做一些更深层的应用。比如，可以用一些短字数的评论去训练和引导AI，让它更加拟人。

如此一来，「小源」就区别于那些动辄发表长篇大论的长文本AI，可以用短句和分段表述，聊起天来就更加日常。

其次，在「杀猪盘」中，对于不同关键词，骗子都是有一套逻辑的。而我们恰恰可以让AI反着这个逻辑，为骗子准备一套话术。

比如他想骗你钱时，你就以其人之道，还治其人之身。

那在「图灵的猫」的项目中，浪潮的源1.0发挥了怎样的作用呢？

张辉博士解释道，源1.0在反诈AI中承担的是对话引擎，也就是说，对于对面聊天的这个人提出的任何问题，都是由源大模型给的答案。

源1.0是一个预训练模型，注重通用性的聊天，但是在反诈AI中，就要达到有目的的聊天，剧本式的聊天，场景化的聊天。

这时候，源1.0就可以很方便地外挂知识库，或者外挂语料库，这样，我们就可以实时更新知识、更新剧本、更新场景，开发出非常多人设稳定、自由交流通畅，而且能达到有目的对话的引擎或机器人。

项目地址：https://github.com/Turing-Project/AntiFraudChatBot

杨静女士又提问道：作为反诈AI的大脑和灵魂，源1.0大模型为什么在高频的闲聊和知识对话中，表现得如此智能？

张辉博士回答说，作为一个预训练的语言模型，源1.0之所以具备全才的大脑和有趣的灵魂，是因为学习了大量数据量，达到了5TB。

这5TB的高质量数据，来源于2017年到2021年之间，互联网开源的800多TB文本数据。在过滤筛选后，浪潮筛选出来了这5TB的精华。

而学习过大量文本数据以后，源1.0大模型已经具备非常好的语言知识和通用的领域知识，非常全才。

相比GPT-3，「源1.0」在参数规模上领先了40%，在训练数据集规模上领先了近10倍

为了支持开发者，浪潮已经建了源大模型开源开放平台。目前有2800多位开发者入驻了该平台，进行了各种有意思的上层AI应用。

此外，平台不仅开源了推理API，还开源了非常多的数据集代码，并且向开发者提供低代码或者零代码。

不需要具备算法专业的知识，就可以开发出非常多有意思的应用，浪潮也非常欢迎大家去试用。

模型官网：https://air.inspur.com/home

现在，源2.0大模型马上要发布了。

可以期待，在未来，我们的算法基础平台会进一步升级，面对骗子，我们能够「道高一丈」。

而杨静女士提问道：无论是源1.0，还是最近的ChatGPT，对话起来都接近真人。我们知道，很多金融机构和电商平台，都会配有自己的AI客服助手。而现在这些厉害的AI模型，会不会被犯罪分子利用呢？

张辉博士回答说，现在还无法杜绝所有人都不用，但至少可以做到以下三点——

第一，开放平台在从申请到审核到使用的流程中，都会有非常强的跟进措施，保障开发者开发的AI应用是经过审核的，是合情合理的。

第二，保证不合理的信息不出现，让生成的内容可控。

第三，目前已经上线的这些客服，主要的功能还是辅助用户进行流程性的咨询，比如如何退款，如何修改密码，而闲聊功能只占其中很小的一块。

总之，这些客服都是可控的，风险很小，无须担心。

炼丹五年，释放千亿参数的巨量模型

现在很多新模型的参数动辄就是千亿，而源1.0预训练大模型的基础模型是2547亿。

这么大的规模，性能的提升就会依赖超大的训练成本，因此源1.0训练了五年。

杨静女士提问道：炼丹五年，完全体AI的预训练需要至少八位数的算力成本，能不能给大家普及一下大规模算力的实现过程，以及智算普惠释放的新价值？

张辉博士回答，我们的大模型学习了五年的互联网文本，但是它的学习速度其实很快，并不需要像人那样，真的学习五年。

论文地址：https://arxiv.org/abs/2110.04725

训练中，使用了2000多块GPU卡，整个训练的时间是16天左右，学习了5TB互联网上的高质量文本数据。

当然，并不是每个企业都花费巨大的算力资源，来训练这样一个自用大模型。

算力大模型现在可以作为一个算法的基础设施，就相当于AI能力的发电厂。

这种预训练大模型，其实是一次训练、广泛赋能，就像接入电力一样。在浪潮的开放平台上进行注册，就像插入一个插座一样，经过非常简单的调用，就可以使用预训练大模型的AI能力。

一个科技向善的未来

在论坛最后，杨静女士提问对两位专家提问道：未来的诈骗方式还会如何演进？AI技术在反诈上又能演进出哪些反套路？

张辉博士回答说：未来，骗子肯定会不断翻新花样，而我们的反诈技术，也会越来越先进。那时候的AI反诈技术不仅会帮助警察，还会帮到普通人。我们可以饱含期待。

而浪潮作为一个有社会担当的企业，一直在强调科技向善、科技助善。

例如，浪潮有一个助盲的项目，通过多模态识别、视觉识别，让盲人听到声音，还能把这些图像识别的内容转化成语音，让他们自由地交谈。

「图灵的猫」表示，针对现在的疫情，AI或许可以为大家提供一些居家的健康监测，比如接触阳性的概率、平时的血氧饱和度、体温等。

把这些大数据汇总分析后，或许会对独居老人和小孩提供预警，甚至主动对社区、派出所、医院报警或者告警。

总之，随着未来AI技术的进步，这些产品会更变得更完善、更普及，保障更多弱势群体的生命安全和财产安全，然后惠及每个人，提高我们的生活质量。

其实在国外也有不少，我相信随着未来AI技术的再次进步，这些产品能够做到更完善更普及，对于更多弱势群体来保障他们的生命生活，然后是财产安全，最后是生活质量，以及最后普及到每个人身上。

参考资料：

https://www.bilibili.com/video/BV1qD4y1h7io/?spm_id_from=333.337.search-card.all.click

继续阅读

阅读原文