中国移动自主开发大赛10强 智能图像转换神器“悟空”诞生记
2018-10-19 16:48:29爱云资讯1168
我们的团队
悟空团队由重庆公司12582基地的5名有激情有梦想的程序员小伙伴组成
产品经理、架构师曹旭:哈尔滨工业大学计算机专业硕士,负责算法研究、整体架构设计等
算法工程师周波:重庆大学计算机专业硕士,负责样本数据处理、模型训练
后端开发工程师袁文树:中国人民大学计算机专业学士,负责后端代码编写
前端开发工程师邱凯:重庆邮电大学计算机智能科学与技术学士,负责前端代码编写
测试工程师王锋:重庆邮电大学信号与信息处理专业硕士,负责UI设计、产品功能测试
一、创意与机遇的碰撞
为贯彻落实党的十九大精神和国家“大众创业、万众创新”工作要求,持续推动公司转型,实现全员创新常态化,中国移动集团公司、集团工会决定举办“中国移动2018 年(第四届)自主开发大赛”,本届大赛围绕公司“大连接”战略,以“人工智能”为主题,面向内部员工自主开发产品。
恰逢此时,一个小伙伴想把长辈老照片修复,却又找不到一款对口应用的感慨也在闲聊中产生,于是小伙伴们一拍即合,迅速组建了团队,创意与机遇的巧合碰撞,于是抱着值得一试的态度,第一代悟空便由此诞生了。
二、悟空诞生记
最开始的悟空,被定义为一个修复老照片的利器,专门针对性的修复陈旧老照片的各种问题。随着悟空的迭代,试用悟空后,对悟空提出功能需求的小伙伴也越来越多,UI小伙伴希望悟空是一个快速转化色彩风格的利器,能为具有重复性的UI图设计工作节省大量设计时间;运营小伙伴希望悟空是一个生成自定义风格图片的利器,能快速生成运营活动宣传图,提升活动效率和活动转化率。
最终,悟空被定义为一个面向普通大众人群、专业图像处理人员(如UI设计师,互联网产品运营人员等)的图像智能转换产品,提供老照片修复、图片去抖动、风格速换等功能,可满足大众人群的各种图像处理需求,并提升专业图像处理人员UI设计效率。
悟空的主体功能开发至今历时10个月,1月完成产品设计,2月完成WEB版开发,3月完成第一个模型训练,7月完成小程序开发,8月演进了模型,10月与和家亲达成了合作意向,为和家相册提供照片处理能力,预计2018年底将形成完整功能的开放能力,提供给各个产品使用。
三、智能图像转换产品
悟空专业
利用人工智能深度学习技术,采用了斯坦福大学的论文《基于感知损失函数的实时风格转换和超分辨率重建》《Perceptual Losses for Real-Time Style Transferand Super-Resolution》中提供的算法。针对不同模型的训练采用了不同的数据集,包括gopro、div2k、coco等开源数据集。基于Tensorflow平台,采用Python语言实现图像处理算法;基于JAVA语言,采用SpringMVC+Jsp实现后台及WEB界面开发。
悟空便捷
要进行图像转换,您只需:上传照片,选择场景,等待收货,即可。悟空全程智能计算,无需任何额外人工操作。
1、功能简介
悟空目前提供三大图像转换场景,分别是:
老照片修复:提供图像残缺修补、上色翻新、无失真放大功能,解决老照片部分缺失、泛黄褪色、不可放大等问题。
图片去抖动:在20s内实现对植物、人物等各种场景的模糊图片清晰化处理。
风格速换:面向大众人群和专业人群,提供一键换色,一键换风服务。
一键换色从用户上传的自定义图片中提取色彩特征,叠加到原始图片中,从而生成带有原始图片元素和自定义图片色彩特征的新图片,真正实现色彩随心变。
一键换风功能提供了多种预定义的风格模型,用户上传原始图片,选择风格模型,即可实现将模型里的风格特征叠加到原始图片上,生成新的个性风格图片。
2、使用场景
1)普通大众群体使用场景
中国60岁以上的老年人口数量达2.41亿,这个群体年轻时的黑白照片,洗印在老旧的相纸上,如今普遍褪色泛黄、部分缺失,需解决残缺、泛黄,无法放大的问题。
8、90年代的傻瓜相机无防抖功能,拍摄照片普遍模糊,需将抖动模糊的照片变清晰。
2)专业人群的使用场景
UI设计图风格快速转换
在春节、元宵、清明等传统节假日时,各类互联网产品均开展节假日线上营销,APP首页banner图、广告宣传图、活动引导图、活动详情页面等均需要带有节假日要素,针对电商类互联网产品、商品图也会打上节日风格标签,往往需要在短时间设计大量风格一致的设计图,设计师可将简单设计的原始图(包含内容要素,针对电商平台销售的商品可以直接用手机拍摄一张清晰地照片)上传本平台,选择对应的节假日风格,几分钟便可快速生成最终效果图。
待设计图+设计风格图
通过平台自动生成的设计图
特定场景的图片样式设计
针对夜景、动漫、抽象等风格的设计往往比传统节假日UI的设计更加困难,UI设计师需要在原始图片的基础上进行更复杂的色彩的处理,需要的设计时间更久、对设计师的水平要求更高。本平台可以基于曾经设计过的夜景、动漫、抽象等风格的图片(对于夜景等真实场景,可直接拍摄一张高清的效果较好的照片)进行模型训练,生成对应特定场景的模型,UI设计师可通过平台上传一张待设计图片、经过简单的选择对应场景,即可快速生成UI设计图。
待设计图+设计风格图
通过平台自动生成的设计图
3)其他场景
平台可逐渐沉淀各种各样的场景模型,丰富可转换的场景能力,最终作为能力提供API接口对外开放,如某款APP调用该接口能力可实现根据用户偏好自动转换页面风格、自动换肤等,用户体验更好。
四、悟空的未来 值得期待
为了便于推广,我们放弃了推出新APP的想法,转而专注于提供开放的SDK、restAPI等能力,为中移动各APP、WEB类产品提供图像转换服务,拓展产品的功能,助力各产品在竞争中脱颖而出。
如果你是一个产品团队,你可以使用悟空的开放能力,如果你是对图片处理有需求的人员,你可以使用悟空提供的WEB版或是小程序。
半决赛现场
悟空是当下人工智能时代,对极致高效理念的一次践行贯彻,我们希望悟空能成长为一个智能图像处理的专家,为中移动在图像处理领域AI能力的提升做出卓越的贡献。
相关文章
- 中国移动与东风汽车签署战略合作协议
- 中国移动人工智能可信监管治理北京市重点实验室亮相中关村论坛
- 中国移动政企事业部护航国家智慧教育平台“AI试验场”成功上线
- 中国移动与阿里巴巴签署战略合作协议
- 中国移动“新动力量”宣讲展现浙江AI创新力
- 文化传承+科技创新 中国移动咪咕闪耀网络视听大会
- 中国移动与中国旅游集团签署战略合作协议
- 中国移动牵头完成ITU-T SG13 6G需求、网络软化、天地一体立项
- 中国移动2024年营收10408亿元 净利1384亿元同比增长5%
- 中国移动国际召开“AI+时代全球发展论坛”重磅发布“AI+出海行业解决方案”及“大模型一体机”
- 中国标准再突破!中国移动牵头视频彩铃终端技术标准通过GSMA立项 持续推动视听体验全球化
- 中国移动咪咕公司拥抱AI+ 为内容生产、办公运营提质增效
- 变革通话体验,中国移动携手阿里云通义、华为打造“交互通话”新时代
- 中国移动“基于通信大模型的自智网络解决方案”荣获GSMA GLOMO双奖
- 中国移动“自智网络”创新实践荣获全球移动通信系统协会(GSMA)四项大奖
- MWC 2025丨中国移动“九州”算力光网-400G骨干网荣获“全光网络引领与AI使能奖”