近似低秩矩阵的奇异值分解与求逆
矩阵计算是信息处理最基础的计算任务,也是公认大数据计算的“七大巨人问题”之一。矩阵的低秩近似是矩阵计算中最为常用的技术之一,其目标是保留原矩阵主要特征的稀疏表示形式,以显著降低矩阵数据的存储空间和计算复杂度。
开展针对近似低秩矩阵的奇异值分解(SVD)与求逆算法的研究,对信息处理、大数据基础理论的发展有重要贡献,可推动相关核心技术的革新。
背景意义
矩阵基础计算理论的每一次进步,都会对大数据分析、信息与通信等相关产业产生广泛的影响,引发一系列的技术变革,大幅促进生产力的发展。
本赛题聚焦一类有特别重要意义的(近似)低秩矩阵奇异值分解(SVD)与求逆问题。 给定一个m×n 复矩阵,它的奇异值中有相当多部分等于或接近于零,并且其个最大的奇异值 的能量占比远大于99%:
问题的困难性在于,的秩和并不已知,而且所计算出的前个最大奇异值和奇异向量应具有较高的精度。在这样的约束下,我们希望设计尽可能快的矩阵SVD(近似SVD)与求逆算法。
赛题内容
对于给定的矩阵以及该矩阵非零奇异值个数所占比例的条件约束,本赛题要求参赛队开发快速高效的矩阵奇异值分解与求逆算法。
赛题描述
赛题共分为4个任务,以下描述任务设定:
1
任务1 :给定非满秩复矩阵,矩阵秩已知,且,求矩阵A的奇异值分解。在满足精度要求的前提下,比拼运算时间,时间越少,得分越高。
2
任务2给定非满秩复矩阵,矩阵秩未知,且,求矩阵A的奇异值分解。在满足精度要求的前提下,比拼运算时间,时间越少,得分越高。
3
任务3:给定满秩复矩阵,其中A的前p个奇异值满足:
求矩阵A的近似奇异值分解。在满足精度要求的情况下,比拼运算时间,时间越少,得分越高。
4
任务4给定非满秩复矩阵,矩阵秩未知,且,求的逆矩阵。在满足精度要求的前提下,比拼运算时间,时间越少,得分越高。
初赛与决赛任务相同,共提供四批数据集,初赛前的测试数据集,初赛数据集、决赛前的测试数据集,决赛数据集,数据集产生准则见数据集说明,每个任务的打分规则待大赛开启后见赛题说明的评测标准。
本赛题的主旨在于比拼矩阵奇异值分解及求逆的基础算法设计,希望参赛队伍尽可能地设计低复杂度算法,所以做如下要求:
     1:禁用目前商用软件及开源代码库自带的矩阵分解、矩阵求逆及矩阵(包含向量)的加减乘除操作,算法设计主体由各种标量运算组成。届时会向各参赛队伍公布代码格式及可用操作、可用函数的白名单,不在白名单内的操作与函数都将禁止使用,白名单将在比赛正式开始时公布。
      2:禁用混编、调用第三方库、调用动态链接、多核多线程等加速操作。
     3:各队伍上传代码,由主办方在统一的软硬件环境下执行,并统计各个队伍的运行时间,进行排名。
初赛和决赛代码提交截止后,将由主办方对成绩排名靠前的队伍进行代码审查,不满足上述规定的队伍将直接取消比赛资格,并从后续代码合规的队伍中按照排名向前递补。
数据集说明
01
数据集1:对应任务1,包含3组矩阵集,其中 200个, 200个, 200个,并且提供每个矩阵的秩,矩阵的秩在中随机均匀取值。
02
数据集2:对应任务2,包含3组矩阵集,其中 200个, 200个, 200个,矩阵的秩在中随机均匀取值。
03
数据集3:对应任务3,包含3组矩阵集,其中 200个, 200个, 200个。,其中在中随机均匀取值。
提供的数据集已按照最大奇异值归一,即,归一后奇异值范围为[0,1]。
04
数据集4:对应任务4,包含3组矩阵集,其中 200个, 200个, 200个,其中中随机均匀取值。
注:以上【数据集1-4】中的矩阵均为稠密阵。
大赛时间
大赛分为初赛和决赛两个比赛环节。
初赛时间:2022年8月初-10月07日
决赛时间:2022年11月1日-11月15日
参赛详情将于开赛前在大赛官网及官方公众号发布,敬请关注。
继续阅读
阅读原文