粤港澳大湾区（黄埔）国际算法算例大赛——近似低秩矩阵的奇异值分解与求逆

近似低秩矩阵的奇异值分解与求逆

矩阵计算是信息处理最基础的计算任务，也是公认大数据计算的“七大巨人问题”之一。矩阵的低秩近似是矩阵计算中最为常用的技术之一，其目标是保留原矩阵主要特征的稀疏表示形式，以显著降低矩阵数据的存储空间和计算复杂度。

开展针对近似低秩矩阵的奇异值分解（SVD）与求逆算法的研究，对信息处理、大数据基础理论的发展有重要贡献，可推动相关核心技术的革新。

背景意义

矩阵基础计算理论的每一次进步，都会对大数据分析、信息与通信等相关产业产生广泛的影响，引发一系列的技术变革，大幅促进生产力的发展。

本赛题聚焦一类有特别重要意义的（近似）低秩矩阵奇异值分解（SVD）与求逆问题。给定一个m×n 复矩阵，它的奇异值中有相当多部分等于或接近于零，并且其个最大的奇异值的能量占比远大于99%：

问题的困难性在于，的秩和并不已知，而且所计算出的前个最大奇异值和奇异向量应具有较高的精度。在这样的约束下，我们希望设计尽可能快的矩阵SVD（近似SVD）与求逆算法。

赛题内容

对于给定的矩阵以及该矩阵非零奇异值个数所占比例的条件约束，本赛题要求参赛队开发快速高效的矩阵奇异值分解与求逆算法。

赛题描述

赛题共分为4个任务，以下描述任务设定：

任务1 ：给定非满秩复矩阵，矩阵秩已知，且，求矩阵A的奇异值分解。在满足精度要求的前提下，比拼运算时间，时间越少，得分越高。

任务2：给定非满秩复矩阵，矩阵秩未知，且，求矩阵A的奇异值分解。在满足精度要求的前提下，比拼运算时间，时间越少，得分越高。

任务3：给定满秩复矩阵，其中A的前p个奇异值满足：

求矩阵A的近似奇异值分解。在满足精度要求的情况下，比拼运算时间，时间越少，得分越高。

任务4：给定非满秩复矩阵，矩阵秩未知，且，求的逆矩阵。在满足精度要求的前提下，比拼运算时间，时间越少，得分越高。

初赛与决赛任务相同，共提供四批数据集，初赛前的测试数据集，初赛数据集、决赛前的测试数据集，决赛数据集，数据集产生准则见数据集说明，每个任务的打分规则待大赛开启后见赛题说明的评测标准。

本赛题的主旨在于比拼矩阵奇异值分解及求逆的基础算法设计，希望参赛队伍尽可能地设计低复杂度算法，所以做如下要求：

1：禁用目前商用软件及开源代码库自带的矩阵分解、矩阵求逆及矩阵(包含向量)的加减乘除操作，算法设计主体由各种标量运算组成。届时会向各参赛队伍公布代码格式及可用操作、可用函数的白名单，不在白名单内的操作与函数都将禁止使用，白名单将在比赛正式开始时公布。

2：禁用混编、调用第三方库、调用动态链接、多核多线程等加速操作。

3：各队伍上传代码，由主办方在统一的软硬件环境下执行，并统计各个队伍的运行时间，进行排名。

初赛和决赛代码提交截止后，将由主办方对成绩排名靠前的队伍进行代码审查，不满足上述规定的队伍将直接取消比赛资格，并从后续代码合规的队伍中按照排名向前递补。

数据集说明

数据集1：对应任务1，包含3组矩阵集，其中 200个， 200个， 200个，并且提供每个矩阵的秩，矩阵的秩在中随机均匀取值。

数据集2：对应任务2，包含3组矩阵集，其中 200个， 200个， 200个，矩阵的秩在中随机均匀取值。

数据集3：对应任务3，包含3组矩阵集，其中 200个， 200个， 200个。，其中在中随机均匀取值。

提供的数据集已按照最大奇异值归一，即，归一后奇异值范围为[0,1]。

数据集4：对应任务4，包含3组矩阵集，其中 200个， 200个， 200个，其中在中随机均匀取值。

注：以上【数据集1-4】中的矩阵均为稠密阵。

大赛时间

大赛分为初赛和决赛两个比赛环节。

初赛时间：2022年8月初-10月07日

决赛时间：2022年11月1日-11月15日

参赛详情将于开赛前在大赛官网及官方公众号发布，敬请关注。

继续阅读