03 29
全球AIGC产业要闻

1、马斯克发布Grok-1.5 上下文128k硬刚GPT-4
2、阿里首次开源MoE架构大模型
3、Meta下月为智能眼镜添加AI功能
4、谷歌推出内容真实度AI检验系统
5、英伟达首次跻身全球半导体营收第二
6、AI21 Labs首推基于Mamba的量产级模型
7、昆仑万维开源数字智能体研发工具包
8、360智脑70亿参数模型将开源
9、合合信息Embedding模型获C-MTEB榜单第一
10、宁畅开放首个AI算力栈“NEX AI Lab”
11、金融类GPT受欢迎 或违反OpenAI使用政策
12、生成式AI助力解决耐药性细菌
13、美国AI芯片公司推出大模型AI Samba-CoE v0.2
14、美国要求政府使用AI更谨慎及透明

1、马斯克发布Grok-1.5 上下文128k硬刚GPT-4
今日,马斯克的xAI公司在官网上正式发布Grok-1.5大语言模型。Grok-1.5在HumanEval基准上得分74.1%,一举超过GPT-4;在编码和数学推理任务方面,Grok-1.5在MATH基准上取得了50.6%的成绩,在GSM8K基准上取得了90%的成绩,提升显著。此外,该模型可以处理更长、更复杂的提示,支持上下文长度达128k tokens,看齐GPT-4。Grok-1.5将在未来几天内向早期测试人员和X平台上现有Grok用户提供服务。
2、阿里首次开源MoE架构大模型
根据社交平台X,阿里昨日首次宣布开源MoE(混合专家)技术大模型Qwen1.5-MoE-A2.7B,这个模型以现有的Qwen-1.8B模型为基础。Qwen1.5-MoE-A2.7B激活参数为2.7亿,但在一系列基准评估中可以达到7B模型的性能。此外,与7B模型相比,它在训练成本和推理速度上具有显著优势。据官方评测显示,Qwen1.5-MoE-A2.7B在与最佳的7B模型相比取得了非常接近的性能。
GitHub地址:

https://github.com/QwenLM/Qwen1.5
Hugging Face地址:

https://huggingface.co/Qwen
3、Meta下月为智能眼镜添加AI功能
据《纽约时报》28日报道,Meta 将从下个月开始将AI功能引入Ray-Ban智能眼镜,包括翻译以及物体、动物和景象识别等功能。用户可以通过说“Hey Meta”指令激活智能助手,然后说出提示或提出问题。智能助手将通过眼镜框架内置的音箱做出响应。目前,用户体验新AI功能需要排队申请。
4、谷歌推出内容真实度AI检验系统
根据arXiv网站,谷歌DeepMind近期在研究中发现,在评估大语言模型生成的信息准确性时,AI系统可以超过人类事实检查员。谷歌于3月27日推出了一种名为Search-Augmented Factuality Evaluator(SAFE)的方法,使用大语言模型,将生成的文本分解为单个事实,然后使用谷歌搜索结果来确定每个事实的准确性。研究称SAFE可以实现“superhuman”的评级表现。但AI研究员Gary Marcus质疑superhuman的含义,认为其可能只指“比工资低的工人更好,而不是真正的人类事实检查员”。
论文地址:

https://arxiv.org/pdf/2403.18802.pdf
5、英伟达首次跻身全球半导体营收第二
根据行业分析机构Omdia近日公布的2023年半导体行业整体研报,该行业去年市场规模达5448亿美元(约合3.94 万亿元人民币),相较2022年下滑8.8%。凭借AI的火热,英伟达以491.61亿美元首次跻身全球半导体营收第二,相较去年提升134%,是2019年的4倍以上。由于宏观经济的变化,2023年半导体行业需求疲软但原件供应增加,市场形势发生逆转,凸显了半导体行业的周期性。
6、AI21 Labs首推基于Mamba的量产级模型
以色列AI初创公司AI21 Labs昨日在官网推出SSM-Transformer模型Jamba,据称是世界上第一个基于Mamba的量产级模型。通过利用传统Transformer架构的元素增强Mamba结构化状态空间模型,Jamba弥补了纯SSM模型的固有局限性。它提供了256k上下文窗口,在吞吐量和效率方面展现了显著的进步。目前,AI21 Labs并不打算将Jamba用于商业用途。该模型没有防止生成有毒文本的保障措施,也没有解决潜在偏见的缓解措施。经过微调、更安全的Jamba版本将在未来几周内推出。
7、昆仑万维开源数字智能体研发工具包
根据昆仑万维公众号,近日,昆仑万维2050全球研究院、新加坡南洋理工大学、苏黎世联邦理工学院研究团队联手开源了数字智能体全流程研发工具包AgentStudio,旨在为研究人员和开发者提供一个覆盖智能体完整开发流程的综合性平台,让开发者们能够轻松、高效、灵活地构建专属数字智能体。AgentStudio所提供的工具涵盖数字智能体开发的全部流程,是一个完全免费的开源项目。目前,AgentStudio相关论文、代码、数据、文档已全部公开。
论文地址:

https://arxiv.org/abs/2403.17918
GitHub地址:

https://github.com/SkyworkAI/agent-studio
8、360智脑70亿参数模型将开源
据新浪财经报道,360创始人周鸿祎近日在直播中透露,即将开源360智脑70亿参数模型,支持360k即50万字长文本输入。据了解,360k在国内目前开源的长文本能力中最长。周鸿祎透露,360智脑长本文能力目前已入驻大模型产品“360AI浏览器”,认为小模型速度快,用户体验也好,并且单机单卡就能跑起来,性价比更高。360AI浏览器已向用户免费开放100万字长文本处理功能。
9、合合信息Embedding模型获C-MTEB榜单第一
根据合合信息公众号,近期,合合信息发布了文本向量化模型acge_text_embedding(简称“acge模型”),获得MTEB中文榜单(C-MTEB)第一的成绩。MTEB是衡量文本嵌入模型(Embedding模型)的评估指标的合集,C-MTEB被公认为是目前业界最全面、最权威的中文语义向量评测基准之一。与目前C-MTEB榜单上排名前五的开源模型相比,合合信息本次发布的acge模型较小,占用资源少;模型输入文本长度为1024,满足绝大部分场景的需求。此外,acge模型还支持可变输出维度,让企业能够根据具体场景去合理分配资源。
10、宁畅开放首个AI算力栈“NEX AI Lab”
智东西3月29日消息,今日,宁畅发布“全局智算”战略,并在会上推出战略性新品“AI算力栈”,旨在有效解决大模型产业落地的全周期问题。国内首个AI算力栈——NEX AI Lab(Nettrix AI Open Lab)已在桐乡市成功落地。NEX AI Lab集成加速计算节点、全闪存存储节点,可为GPT、LLaMA、Stable Diffusion等AI模型,提供多元场景应用优化支持。目前,NEX AI Lab已开放预约试用,以支持用户体验大模型、数据科学、推荐系统等领域的解决方案工作流。
11、金融类GPT受欢迎 或违反OpenAI使用政策
据《金融时报》28日报道,OpenAI应用商店正吸引投资者和学生。然而,记者发现许多受欢迎的GPT可能违反了OpenAI的使用政策,该政策禁止未经专业人士审核的提供金融、法律或医疗建议的聊天机器人。自去年11月以来,OpenAI允许付费用户创建定制版ChatGPT。数据显示,能预测股票价格和规避抄袭检测的聊天机器人是最受欢迎的,一些最受欢迎的GPT用于教育。据报道,截至目前定制版GPT的吸引力有限,用户对其的访问量仅占ChatGPT网站桌面访问量的1.5%。
12、生成式AI助力解决耐药性细菌
根据国际顶刊Nature网站,斯坦福大学医学院和麦克马斯特大学研究人员利用AI生成技术解决对抗耐药性细菌菌株的问题,成果3月22日发表在Nature Machine Intelligence上。他们开发了用于合成分子的新模型SyntheMol,为六种新型药物创建了结构和化学配方。这些药物旨在杀死鲍曼不动杆菌的耐药菌株,从而解决耐药性细菌。
论文地址:

https://www.nature.com/articles/s42256-024-00809-7
13、美国AI芯片公司推出大模型AI Samba-CoE v0.2
据美国科技网站Venture Beat报道,美国AI芯片制造商SambaNova System在社交媒体平台X上发布AI Samba-CoE v0.2大模型,其运行速度为1s/330token,优于美国大数据软件公司Databricks的DBRX大模型。根据官方数据,在对大语言模型的测试中,AI Samba-CoE v0.2回答关于银河系425个字的答案只用了330.42秒。
SambaNova System于2021年筹集了6.76亿美元(约合48.8亿人民币)的D轮融资,估值超过50亿美元。它与英伟达等科技巨头和其他AI芯片初创公司竞争AI赛道。
14、美国要求政府使用AI更谨慎及透明
据路透社报道,美国政府昨日表示要求使用AI的联邦机构在12月1日之前采取“具体保障措施”,保证使用AI更加谨慎和透明。白宫要求政府机构发布AI用例清单,报告有关AI使用的指标,并在不构成风险的情况下发布政府拥有的AI代码、模型和数据。白宫计划聘用100名AI专业人员,以促进AI的安全使用,并要求联邦政府在60天内指定首席AI官员。

2024年中国生成式AI大会预告

继续阅读
阅读原文