新智元报道  

编辑:编辑部
【新智元导读】杀猪盘有套路,AI也有套路。AI对上骗子,用魔法打败魔法,让人拍手称快。
B站up主「图灵的猫」曾做过一期AI小姐姐大战杀猪盘骗子的视频,近日,这个视频已经突破了200万播放量!
作为B站知名科技区KOL,「图灵的猫」的视频一向人气很高。为什么这一期的流量尤其之高呢?
这是因为,用AI对话机器人让骗子一步一步露出马脚的过程,实在看得人大快人心!
你知道,全国有多少人收到过诈骗信息吗?4.38亿!
这个数字占人口总数的32%,相当于每三个人中,就有一人受到过诈骗信息的骚扰。
同时,随着技术的发展,诈骗分子的手段也越来越新奇,杀猪盘、网络兼职、疫情诈骗、虚拟投资诈骗层出不穷。
被诈骗的对象也不仅限于老人和小孩,有不少高知、白领、大学生,都是诈骗的受害者。
更有甚者,深陷网络杀猪盘的女性受害者,既破了财,精神上还遭受了极大打击,甚至付出了生命的代价。
诈骗分子玩的是哪些新套路?如何辨别新型诈骗手段?我们又该怎么利用AI技术护身防骗?
AI反诈论坛,教你利用AI技术,以魔法打败「魔」法!
此次论坛由新智元CEO杨静女士主持,邀请到浪潮信息算法研究员张辉博士,以及B站AI领域头部UP主「图灵的猫」共同参与讨论。
AI:没人比我更懂诈骗
很多人都觉得,受害人上当,是因为不够聪明。
可是,有那么多白领和高知,他们的知识修养和文化水平都不低,怎么还会上当呢?
张辉博士介绍说,人会受骗,是因为一个人再怎么渊博,也不可能拥有全面的知识,不可能了解所有的诈骗案例。
而再聪明的人,都难免有感情用事的时候。在某些氛围或场合下,就无法理智地做出判断。
可是谁能克服这些缺陷呢?
没错,AI就可以!
在反诈知识的储备上,它比人充分得多,因为经过大数据学习,它见过太多的诈骗案例。
而且,人虽然会感情用事,但AI在任何时刻都是理智的。
甭管是和什么人,在什么环境下聊天,AI统统一视同仁,既不会见钱眼开,也不会冲动做事。
所以,面对网络诈骗,AI可以充当人的助手,衍生人的能力,补足人的弱点。

杀猪盘:「虾仁」又「猪心」
诈骗案中,非常可恶的一种就是杀猪盘。杀猪盘的很多案例,看起来都触目惊心。
许多向往爱情的「乖乖女」,在婚恋网站上不幸跌进杀猪盘的陷阱,以为自己开启了一段爱情童话,殊不知自己在对方眼里不过就是待宰的「猪」。
设立人设,寻找猎物,剧本撰写,专职聊天,再到技术支持,专业骗钱等,杀猪盘的每个环节都有分工,施骗过程如同一条工业流水线。
这些受害人,轻则遭受几十万、上百万的财产损失,重则付出生命的代价……
2019年,海南一位24岁的女生结束了自己的生命,她在遗书上这么写道:「亲爱的爸爸妈妈,原谅女儿在今日选择结束自己的生命……被骗了20几万元无力偿还,挪用了爸爸6万7千元,借了十几万贷款,还欠朋友们几万元,你们养育我这么多年,我却做了这些对不起你们的事……我只能选择了结自己这一生……」
而和她一样的杀猪盘受害者,还有很多个。
面对这类案件,大家的第一反应往往都是受害人太过单纯,可怜又可笑。但如同我们在开头讲到的,这是一种偏见。

B站up主:用AI大战骗子
B站知名up主「图灵的猫」,曾经采用了浪潮的源技术,再用B站评论对AI进行微调,训练出来一个像魔法一样的反诈AI。这个视频在B站,已经获得了将近200万的播放量。
在论坛中,杨静女士向「图灵的猫」提问道:什么会有这样一个想法呢?
「图灵的猫」解释道,首先是因为,在最近几年,人工智能的对话模型进步非常大。
既然技术进步这么快,连骗子诈骗都开始用AI,那能不能发扬「科技向善」的理念,做一个可用的反诈AI呢?
经过调研以及和浪潮的合作,他和团队决定尝试做了一个反杀猪盘AI。
开始,他们用的是最初的API模型,虽然对话能力不错,但是在场景化的表达上,就不太好了。
骗子都是别有意图,跟骗子聊天,都是有剧本的。
为了让AI表现更自然,他们在B站、贴吧的热门评论中,找了很多语料,去给模型微调。
因为这些评论相当于回复和被回复的对话关系,就像我们平时在网上聊天一样,而基于这种关系,就可以更好地去发掘和利用它们,抽取出语言的形式,然后让AI模仿。
在测试中,这个AI的效果非常不错,视频在B站已经有了接近200万的播放。
「图灵的猫」认为,自己做的事最大的意义,就是提高公众对于杀猪盘的警惕,并且提供一种利用技术进行反诈的思路。
杨静女士接着提问道:那反诈AI是如何在与骗子的对话中,识别出杀猪盘的套路呢?
图灵的猫回答说,杀猪盘的套路都是有限的,很多骗子会用固定种类的借口来「杀猪」  。
在AI的后台,就可以设立一个监控系统,一旦触发了某些关键词,就可以认为去观察和干预。
而对于不同关键词,骗子都是有一套逻辑的,我们就可以让AI反着这个逻辑,有一套对应的话术,诱导骗子露出马脚,帮助破案。
「小源」为何如此智能?
杨静女士向「图灵的猫」问出一个大家都很感兴趣的问题:怎么能让诈骗犯意识不到,与自己对话的是一个AI呢?
「图灵的猫」解释道:首先,「源1.0」模型本身的知识储备就非常大,而基于这个模型的知识储备,就可以做一些更深层的应用。比如,可以用一些短字数的评论去训练和引导AI,让它更加拟人。
如此一来,「小源」就区别于那些动辄发表长篇大论的长文本AI,可以用短句和分段表述,聊起天来就更加日常。
其次,在「杀猪盘」中,对于不同关键词,骗子都是有一套逻辑的。而我们恰恰可以让AI反着这个逻辑,为骗子准备一套话术。
比如他想骗你钱时,你就以其人之道,还治其人之身。
那在「图灵的猫」的项目中,浪潮的源1.0发挥了怎样的作用呢?
张辉博士解释道,源1.0在反诈AI中承担的是对话引擎,也就是说,对于对面聊天的这个人提出的任何问题,都是由源大模型给的答案。
源1.0是一个预训练模型,注重通用性的聊天,但是在反诈AI中,就要达到有目的的聊天,剧本式的聊天,场景化的聊天。
这时候,源1.0就可以很方便地外挂知识库,或者外挂语料库,这样,我们就可以实时更新知识、更新剧本、更新场景,开发出非常多人设稳定、自由交流通畅,而且能达到有目的对话的引擎或机器人。
项目地址:https://github.com/Turing-Project/AntiFraudChatBot
杨静女士又提问道:作为反诈AI的大脑和灵魂,源1.0大模型为什么在高频的闲聊和知识对话中,表现得如此智能?
张辉博士回答说,作为一个预训练的语言模型,源1.0之所以具备全才的大脑和有趣的灵魂,是因为学习了大量数据量,达到了5TB。
这5TB的高质量数据,来源于2017年到2021年之间,互联网开源的800多TB文本数据。在过滤筛选后,浪潮筛选出来了这5TB的精华。
而学习过大量文本数据以后,源1.0大模型已经具备非常好的语言知识和通用的领域知识,非常全才。
相比GPT-3,「源1.0」在参数规模上领先了40%,在训练数据集规模上领先了近10倍
为了支持开发者,浪潮已经建了源大模型开源开放平台。目前有2800多位开发者入驻了该平台,进行了各种有意思的上层AI应用。
此外,平台不仅开源了推理API,还开源了非常多的数据集代码,并且向开发者提供低代码或者零代码。
不需要具备算法专业的知识,就可以开发出非常多有意思的应用,浪潮也非常欢迎大家去试用。
模型官网:https://air.inspur.com/home
现在,源2.0大模型马上要发布了。
可以期待,在未来,我们的算法基础平台会进一步升级,面对骗子,我们能够「道高一丈」。
而杨静女士提问道:无论是源1.0,还是最近的ChatGPT,对话起来都接近真人。我们知道,很多金融机构和电商平台,都会配有自己的AI客服助手。而现在这些厉害的AI模型,会不会被犯罪分子利用呢?
张辉博士回答说,现在还无法杜绝所有人都不用,但至少可以做到以下三点——
第一,开放平台在从申请到审核到使用的流程中,都会有非常强的跟进措施,保障开发者开发的AI应用是经过审核的,是合情合理的。
第二,保证不合理的信息不出现,让生成的内容可控。
第三,目前已经上线的这些客服,主要的功能还是辅助用户进行流程性的咨询,比如如何退款,如何修改密码,而闲聊功能只占其中很小的一块。
总之,这些客服都是可控的,风险很小,无须担心。

炼丹五年,释放千亿参数的巨量模型
现在很多新模型的参数动辄就是千亿,而源1.0预训练大模型的基础模型是2547亿。
这么大的规模,性能的提升就会依赖超大的训练成本,因此源1.0训练了五年。
杨静女士提问道:炼丹五年,完全体AI的预训练需要至少八位数的算力成本,能不能给大家普及一下大规模算力的实现过程,以及智算普惠释放的新价值?
张辉博士回答,我们的大模型学习了五年的互联网文本,但是它的学习速度其实很快,并不需要像人那样,真的学习五年。
论文地址:https://arxiv.org/abs/2110.04725
训练中,使用了2000多块GPU卡,整个训练的时间是16天左右,学习了5TB互联网上的高质量文本数据。
当然,并不是每个企业都花费巨大的算力资源,来训练这样一个自用大模型。
算力大模型现在可以作为一个算法的基础设施,就相当于AI能力的发电厂。
这种预训练大模型,其实是一次训练、广泛赋能,就像接入电力一样。在浪潮的开放平台上进行注册,就像插入一个插座一样,经过非常简单的调用,就可以使用预训练大模型的AI能力。
一个科技向善的未来
在论坛最后,杨静女士提问对两位专家提问道:未来的诈骗方式还会如何演进?AI技术在反诈上又能演进出哪些反套路?
张辉博士回答说:未来,骗子肯定会不断翻新花样,而我们的反诈技术,也会越来越先进。那时候的AI反诈技术不仅会帮助警察,还会帮到普通人。我们可以饱含期待。
而浪潮作为一个有社会担当的企业,一直在强调科技向善、科技助善。
例如,浪潮有一个助盲的项目,通过多模态识别、视觉识别,让盲人听到声音,还能把这些图像识别的内容转化成语音,让他们自由地交谈。
「图灵的猫」表示,针对现在的疫情,AI或许可以为大家提供一些居家的健康监测,比如接触阳性的概率、平时的血氧饱和度、体温等。
把这些大数据汇总分析后,或许会对独居老人和小孩提供预警,甚至主动对社区、派出所、医院报警或者告警。
总之,随着未来AI技术的进步,这些产品会更变得更完善、更普及,保障更多弱势群体的生命安全和财产安全,然后惠及每个人,提高我们的生活质量。
其实在国外也有不少,我相信随着未来AI技术的再次进步,这些产品能够做到更完善更普及,对于更多弱势群体来保障他们的生命生活,然后是财产安全,最后是生活质量,以及最后普及到每个人身上。
参考资料:
https://www.bilibili.com/video/BV1qD4y1h7io/?spm_id_from=333.337.search-card.all.click
继续阅读
阅读原文