互联网科技/NEWS CENTER

谷歌推出AVA数据库:让机器识别视频中人类行为

发布时间:2017-12-30

  Google推出AVA数据库:使机器能够识别视频中的人类行为

  [网易智能快讯10月22日消息]计算机视觉正在成为科技公司的一大福音,为了让机器加快运转,完成目前为止的任务只能由人类来完成。几个月前,eBay宣布将增加新的搜索功能,允许用户使用现有的照片找到类似的物品,而在线服装零售商ASOS则参与其中。 Shutterstock上周发布了一个新的测试功能,允许用户根据自己的布局搜索库存照片。几天后,谷歌照片应用程序发布了一个新的宠物图像识别。总之,在计算机视觉领域,发展越来越激动人心。同时,我们可以看到,在人工智能领域的大量投资已经取得了丰硕的成果。目前,计算机视觉技术的进步主要集中在静止图像领域,而我们也开始看到计算机视觉技术在视频领域的成果。例如,俄罗斯当局已经将面部识别技术应用于全国的实时监控网络。 Pornhub也在做类似的事情来自动分类“成人娱乐”视频,包括识别特定性姿势的训练系统。另外,蓬勃发展的汽车行业在很大程度上依赖于机器对现实世界行为的理解能力,在此背景下,Google推出了一个新的视频数据库,希望借此推动计算机视觉识别图像研究的行为。 “原子视觉行为”的首字母缩略词“AVA”是用户可以在视频序列中操作的多个标签的数据库,视频中运动识别的困难主要在于视频中各种复杂的场景交织在一起,并发出多个动作谷歌软件工程师谷春辉和大卫·罗斯在一篇博文中解释说:“教会机器识别图像中的人类行为是开发计算机视觉的一个基本问题,但是对于个人视频搜索和发现,运动分析和手势应用程序(如接口)至关重要。 “”尽管在过去的几年里,图像分类和物体识别方面取得了令人振奋的突破,但鉴定人类行为仍然是一个重大挑战。 “从本质上讲,AVA是一个包含80个原子动作标记的YouTube网址的集合,涵盖了近58000个视频剪辑,涉及许多日常活动,如握手,踢,拥抱,亲吻,喝酒,演奏乐器,散步等等。数据库,谷歌希望能够提高机器的“社交视觉智能”,这样他们就能了解人们在做什么,并预测接下来会做什么。该公司说:“我们希望AVA的发布将有助于改善人类行为识别系统的发展,并将有机会对基于时空标签的复杂活动进行建模。” (来源:VentureBeat译者:机器人评论:秦欣)关注网易智能公众号(smartman163),获得人工智能行业最新报道。

大宝娱乐

2017-12-30

更多内容,敬请关注:

大宝娱乐官网:/

大宝娱乐新浪官方微博:@大宝娱乐

大宝娱乐发布微信号: