24小时联系电话:185 8888 888

要闻
您现在的位置: 首页 > 要闻 > Facebook的SlowFast视频分类器AI受灵长类动物眼睛启发
  • 零食新鲜化,来伊份的产品溯源里藏着这些秘密···

    零食新鲜化,来伊份的产品溯源里藏着这些秘密···

    发布时间:2023/07/03

    在“新鲜零食”的战略引领下,“主板零食第一股”来伊份迈入了企业发展的第23个年头,其传统的线下溯源活动“寻鲜之旅”也已经发展至第九届,本次再度启程将探索芒果之乡——百色,继续为用户展现以“青山绿水”铸“新鲜零食...

  • 雷科智途联合太平洋财产保险共同举办商用车AEBS防碰撞演示活动

    雷科智途联合太平洋财产保险共同举办商用车AEBS防碰撞演示活动

    发布时间:2022/01/04

    2021年12月16日,“安全出行·科技护航”-商用车自动紧急制动系统(AdvancedEmergencyBrakingSystem,简称“AEBS”)防碰撞演示在山东省青岛莱西市隆重举行。出席本次活动的领导和嘉宾有:莱西市应急管理局副局长李凌云...

  • 剑南春再传喜报,两年蝉联四次冠军

    剑南春再传喜报,两年蝉联四次冠军

    发布时间:2021/12/14

    2021年“双12”天猫年终购物节战报出炉,剑南春天猫平台官方旗舰店以超高人气和火爆的销量,勇夺天猫“双12”白酒品牌旗舰店交易指数第一名。 剑南春领跑榜单,两年蝉联四次冠军 剑南春在线上购物狂欢节上一直有着不...

  • 百年变局新机遇 第九届岭南论坛在广州举行

    百年变局新机遇 第九届岭南论坛在广州举行

    发布时间:2021/11/22

    11月21日,第九届岭南论坛在广州成功举办。本次论坛围绕“百年变局新机遇”主题,原中国银行业监督管理委员会主席刘明康,中山大学岭南学院教授、博导、广东省人民政府参事陆军,斯坦福大学教授、2001年诺贝尔经济...

  • 破记录的2万亿美元刺激计划中有什么?

    破记录的2万亿美元刺激计划中有什么?

    发布时间:2020/03/27

    经过几天的谈判,美国参议院今晚对第三项反对冠状病毒危机的法案进行投票。前两个法案着重于为医学研究提供资金并向病毒受害者提供经济支持,而“第三阶段”刺激法案则是对整个美国经济的大规模救助方案。这将花费...

  • 世界在煤炭支持上花费了半万亿美元

    世界在煤炭支持上花费了半万亿美元

    发布时间:2020/03/17

    全世界的国家有可能继续支持煤炭行业,而不是投资于成本更低,对环境更友好的风能和太阳能项目,从而浪费6400亿美元。 金融智囊团Carbon Tracker在周四发布的一份报告中说,全球60%的燃煤发电厂以比可再生能源替...

  • 您还不知道怎么毫无危险的投资?

    您还不知道怎么毫无危险的投资?

    发布时间:2020/03/13

    查看了许多财务平台,阅读有关加密货币、证券交易所的信息并没找到了答案? 我也处于过类似情况。我现在写出这篇文章,以帮助您与AlysDax公司一起开始工作! 前几天,我的朋友建议我AlysDax平台,哪个专为机构投...

  • MK FOREX提醒您:黄金:迈向短期阻力的路上

    MK FOREX提醒您:黄金:迈向短期阻力的路上

    发布时间:2020/03/02

    金价延续自1625美元/盎司开始的反弹 正常的RSI情况表明反弹将持续 关键的斐波纳奇回撤位,附近的上升趋势线限制了短线下跌 截至周四早间,金价在每盎司1,650美元附近。金价周三走出了U型走势。 黄金价格最近从162...

Facebook的SlowFast视频分类器AI受灵长类动物眼睛启发

发布时间:2019/11/06 要闻 浏览次数:848

 
灵长类动物的视网膜神经节细胞从感光器接收视觉信息,然后从眼睛传递到大脑。但是,并非所有单元的创建都是相等的-估计有80%的单元在低频下运行并识别精细的细节,而约20%的单元则对快速变化做出了响应。这种生物学上的二分法激发了Facebook AI Research的科学家去追求他们所谓的SlowFast。这是一种用于视频识别的机器学习架构,他们声称可以对动作分类和镜头中的检测达到“强大的性能”。
GitHub上提供了Facebook PyTorch框架PySlowFast的实现以及受过训练的模型。
正如研究小组在预印本论文中指出的那样,从统计学上讲,慢动作发生得比慢动作快得多,并且可以缓慢刷新对颜色,纹理和照明等语义的识别,而不会影响准确性。另一方面,以较高的时间分辨率(即,使用更多帧)来分析执行的动作(例如拍手,挥手,摇动,步行或跳跃)是有益的,因为它们的运动速度快于对象的身份。
这就是SlowFast的用武之地。它包括两条路径,其中一条以较低的帧速率和缓慢的刷新速度运行,经过优化,可捕获少量图像或稀疏帧提供的信息。相反,另一条路径以快速刷新速度和高时间分辨率捕获快速变化的运动。
研究人员断言,通过以不同的时间速率处理原始视频,SlowFast允许其两条途径发展自己的视频建模专业知识。较慢的路径会更好地识别帧中不变或变化缓慢的静态区域,而较快的路径会学会可靠地在动态区域中暂缓动作。
两条路径的信息融合在一起,从而使快速路径的数据通过整个网络中的横向连接馈入慢速路径。这允许慢速路径了解快速路径的结果,并且允许将结果串联到完全连接的分类层中。
为了评估SlowFast的性能,该团队在两个流行的数据集上测试了该模型:DeepMind的Kinetics-400和Google的AVA。前者包括来自成千上万个YouTube视频的短短10秒场景,至少400个视频中包含400种人类行为。另一方面,AVA包含430个15分钟带注释的YouTube视频以及80个带注释的视觉动作。
SlowFast在这两个数据集上均取得了最先进的结果,比Kinetics-400的最佳top-1得分高出5.1%(分别为79.0%和73.9%)和最佳的top-5得分高出2.7%(分别为93.6%和93.6%) 90.9%)。在AVA上,它还达到了28.3(mAP)的中值平均精度(与21.9 mAP的最新水平相比有实质性的提高)。有趣的是,但也许不足为奇,该论文的合著者指出,慢速通道的计算成本是快速通道的4倍。
研究人员写道:“我们希望这种SlowFast概念将促进视频识别的进一步研究……[我们已经证明] Fast通道可以通过减小其通道容量而变得非常轻巧,但可以学习有用的时间信息以进行视频识别。” 。 “时间轴是一个特殊的维度。本文研究了一种可对比沿该轴速度的架构设计。”

姓 名:
邮箱
留 言: