Alphabet旗下DeepMind开源开发AI项目的元件函式库
2018-10-19 18:50:57爱云资讯944
TRFL(读作「truffle」),访问:
https://github.com/deepmind/trfl/
一般强化学习代理程式包含许多互动元件,像是环境和某个表示值(values)或政策(policy)的深度网路,以及该环境的学习模型、伪奖励函式或重播系统(replay system)。这些元件互动很巧妙,因而在大型运算图谱(computation graphs)中不易发现Bug。Open AI最近就分析强化学习代理程式最受欢迎的开源实作发现,10个代理程式有6个有很小的瑕疵被社区发现且经作者证实。
解决上述问题及协助研究的方法之一是将完整的代理程式实作开源出来。这些代理程式的程式码对复制研究很有用,但问题是难以修改和扩充。另一个方法则是将共通建构元件、经测试过的稳定实作提供出来,这些共通元件也可用于众多不同的RL代理程式。另一个好处是,将这些核心元件集结于单一函式库,加上一致化的API,将更容易和不同来源的想法结合。
TRFL函式库包括实作传统RL演算及更先进技术的函式。像是loss函式及其他运算都有实作于纯Tensorflow 之中。针对value-based及policy-base的强化学习,TRFL也都提供了相应的工具。
DeepMind表示,由于这个函式库广泛用于DeepMind开发上,因此他们会持续维护并新增功能,且可望继续释出给开源社区。
本项目势必受到开发人员的欢迎。根据近日GitHub的统计,Tensorflow是平台上第三大开源项目,仅次于微软VS Code和脸书React。
相关文章
- 报道称Alphabet将收购加拿大智能眼镜制造商North
- Alphabet财报前瞻:它用什么维持万亿美元市值?
- 继苹果微软和亚马逊后 Alphabet加入万亿市值俱乐部
- 谷歌云业务势头强劲 Alphabet二季度业绩超出预期
- Alphabet's Wing推出应用程序来管理无人机的空中交通
- 谷歌前CEO与云计算业务主管离开Alphabet
- 打响空中5G部署之战!Alphabet与软银共建空中网络基站
- 在盖茨的BEV基金的支持下,Alphabet拆分moonshot项目Malta独立发展
- 谷歌母公司Alphabet计划采取绝育手段,消灭全球蚊子
- 谷歌母公司Alphabet计划明年在芬兰推无人机送货服务
- Alphabet旗下DeepMind开源开发AI项目的元件函式库
- Alphabet为旗下事业注入AI元素从而创造新成长动能
- 获Alphabet等巨头科技公司支持的机构正在奋力争取网络中立的回归
- Alphabet推星球级安全平台:不与传统安全公司竞争
- Alphabet改组3年:谷歌赢了 其他业务却没那么顺
- 扩大云计算业务:Alphabet二季度资本开支几乎翻番