CVPR2021:字节跳动14篇论文入选,多项竞赛优势夺冠
2021-06-25 11:01:35爱云资讯阅读量:454
北京时间6月25日,在刚刚落下帷幕的CVPR2021上,字节跳动与合作院校的14篇论文入选,方向涵盖神经网络架构搜索、图像修复、行为识别等,并在移动目标检测、细粒度图像识别、视频分类等多个计算机视觉细分领域的竞赛中优势夺冠。
CVPR(Conference on Computer Vision and Pattern Recognition,计算机视觉模式识别大会)与ICCV、ECCV并称为计算机视觉领域三大顶级国际性盛会。近年来,CVPR的论文投稿量持续增加,CVPR2019的有效投稿为5160篇,CVPR2020年增长至6656篇。本届CVPR的论文有效投稿量再创新高,多达7500篇,接收率仅为23.7%,竞争十分激烈。
计算机视觉是一门研究如何使机器“看”的科学。英国机器视觉协会(BMVA)对机器视觉的定义是「对单张图像或一系列图像的有用信息进行自动提取、分析和理解」。 借助云计算等新技术的推动,在一些场景下,计算机系统快速检测视觉输入并做出反应的准确度甚至胜过人类。从工业质检到医学成像,计算机视觉技术可深度应用到各行各业,被视为人工智能实现的关键。
作为一家拥有多个现象级视频、图文类产品的科技公司,字节跳动持续在前沿计算机视觉领域进行研究及实践。近年来,字节跳动在CVPR等顶级学术会议及核心期刊的论文发表数量逐年增加。在神经网络架构搜索、目标检测等前沿领域,字节跳动技术团队的相关重磅论文被收录进CVPR2021口头报告(Oral)。
其中,“HR-NAS: Searching Efficient High-Resolution Neural Architectures with Lightweight Transformers”在神经网络架构搜索(NAS)领域,突破性地提出了一种新型网络框架。与此前的技术相比,新框架可以适用于图像分类、分割、检测等多种计算机视觉任务,较好地解决不同的计算机视觉任务对不同分辨率模型的需求。
“Sparse R-CNN: End-to-End Object Detection with Learnable Proposals”提出了基于可学习候选框的端到端的稀疏目标检测器。这一全新的检测范式既突破了当前目标检测领域主流方法的技术局限,又保证了检测的速度和精度。
另外,在图像修复这一实用性较强的领域,字节跳动此次也有两篇论文入选。标题分别为“Progressive Temporal Feature Alignment Network for Video Inpainting”和“Human De-occlusion: Invisible Perception and Recovery for Humans”。上述论文针对视频中常见的,涂抹掉任意区域/物体后填充自然背景,以及人像合照顺序替换、修补等问题,提出了更加优化的技术方案。
值得一提的是,在与学术会议同时进行的CVPR2021 workshop竞赛中,来自字节跳动的多支团队表现出众。其中,四支团队以绝对优势夺得了移动目标检测、细粒度图像识别、视频分类等前沿领域竞赛项目的冠军。
目前,字节跳动已将部分计算机视觉前沿技术落地应用在头条寻人、经典电影修复、物种识别等社会公益、文化和科普领域。
相关文章
- 字节跳动豆包大模型发布,火山引擎全栈 AI 服务助力企业智能化转型
- OFC 2024|锐捷网络携手字节跳动 揭晓800G LPO光模块动态实力
- 营销数字化可信产品入围名单公布 万兴科技字节跳动等旗下产品上榜
- 谷歌Bard聊天机器人再升级,字节跳动/微美全息奋起追赶引领AI革新浪潮
- 2023Q4 全球 AR / VR 头显出货量同比增长 130.4%:Meta、索尼、字节跳动排前三
- 达内教育10月就业报告:最高薪酬34000元,网络安全学员入职字节跳动
- 美摄诉字节跳动旗下产品代码抄袭案胜诉
- 美摄诉字节跳动旗下产品代码抄袭案胜诉,法院判赔600万
- 剪映智影万兴播爆等创新力突出 字节跳动腾讯万兴科技等上榜AIGC企业TOP30
- GOTC 2023出品人吴迪:字节跳动将持续投入Rust
- 峰米联合字节跳动旗下火山引擎研发 峰米X5搭载全新FengOS 3.0大屏操作系统
- 字节跳动公益“山里DOU是好风光”GMV破3亿,短视频助力乡村文旅商家疫后复苏
- 字节跳动VR品牌Pico推出运动配件 疑重点发力VR健身
- 贡献36项技术提案,北京字节跳动获中国音视频标准AVS年度产业技术创新奖
- 字节跳动发布企业社会责任报告:员工公益总时长近9万小时,捐款约2500万元
- AICC 2021 | 字节跳动王明轩:多媒体时代的机器翻译