「TalentAI」将持续带来人工智能相关在招职位信息,欢迎正在找工作与看新机会的朋友关注,也欢迎企业伙伴与我们联系合作。
招聘团队
小红书-社区技术部-智能创作组,是小红书从事创新型项目研发的团队,主要从事计算机视觉、多模态相关方向研究和业务落地。目前团队共有10余位科研实习生,均为来自国内外知名高校的在读博士或硕士,从事虚拟数字人、多模态理解与生成方向的研究。
研究型实习生
岗位方向:多模态、AIGC、虚拟数字人
工作地点:北京与上海均可,优秀同学可支持远程
岗位职责:
1. 利用前沿计算机视觉、计算机图形学算法,研究数字人或多模态相关的课题;
2. 在顶级会议(CVPR/ICCV/ECCV/SIGGRAPH/3DV等)上发表学术论文;
3. 可与德国马普所研究人员进行合作研究。
研究内容:
1. 虚拟数字人方向(与马普所合作)
a. 通用三维场景/物体生成(https://github.com/nv-tlabs/atiss)
b. 三维场景与人体运动重建(https://mover.is.tue.mpg.de/)
c. 高保真三维数字人生成/重建(https://zhaofuq.github.io/humannerf/)
d. 有条件下三维人体运动生成和预测
i. 音乐-舞蹈生成(https://www.mmlab-ntu.com/project/bailando/index.html)
ii. 语音-手势生成(https://github.com/alvinliu0/ANGIE)
iii. 文本-动作生成(https://guytevet.github.io/mdm-page/)
e. 姿态可控的的图像或视频生成(https://github.com/yumingj/Text2Human
f. [工程方向] 虚拟引擎/Unity/Unreal驱动下人体运动动作生成
2. 多模态理解与生成(面向真实业务场景)
a. 多模态(图像/视频/语言)基础模型、自监督/弱监督预训练
i. 高效多模态表征预训练(BEiT-v3EVAFLIP)
ii. Instruct跨模态交互学习(InstructGPTChatGPT)
b. 可控的跨模态通用视觉内容生成
i. 知识增强的多模态生成预训练(ERNIE-ViLG 2.0)
ii. 文本到图像语义一致性增强(Stable Diffusion v2.1)
岗位要求:
1. 有较强的自我驱动力,热爱科研,熟悉以上任意领域的研究;
2. 熟练使用Python或C++,熟练至少一种深度学习框架,如:PyTorch;
3. 有发表过相关顶级会议或期刊(CVPR/ICCV/ECCV/NeurIPS/ICML/ICLR/TPAMI等)或者参与过知名开源项目的同学优先;
4. 实习时间大于六个月以上优先,北京/上海均可,优秀同学可支持远程;
如果你对以上职位感兴趣,请点击「阅读原文」或「扫描下方二维码」投递简历,我们将在 10 个工作日内反馈结果。
继续阅读
阅读原文