让计算机看懂世界靠谱吗?智能识别技术大行其道|欧冠投注网站

点击进入

智能识别技术表明,在世界互联网开发初期,计算机被网络带宽、数据存储等相关技术允许,信息传播大部分以单一模式的形式发生,如文字报道、图像博客等。进入大数据时代后,信息传播丰富多彩,有人不同时接受网络上的图像、视频、文本等多种模态信息。

例如,在网上看精彩的新闻报道时,不仅可以看到详细的文本描述,还可以看到记者现场拍摄的照片,甚至是相关的视频报道。(大卫亚设,Northern Exposure(美国电视),网络名言)这反映了网络数据从单一模式到多模态的变化。随着网络多模态数据的大量发生和传播,“无法控制”和“写得不好”这两个大问题也日益突出。“无法控制”是指多模态大数据中隐藏着大量恐怖、暴行等有害信息,极大地危害了国家安全和社会稳定,目前缺乏自动分析和识别技术。

“使用不良”是指现有技术通常是单模式分析和识别,信息有限的单模式数据不能有效利用多模式数据。使计算机能够理解世界,构建网络多模态大数据的有效监督和利用是当前亟待解决的根本问题。针对上述问题,北京大学彭宇信教授组反对国家自然科学基金、国家863计划、国家科学技术委托计划等,10多年来成功开发了技术。

点击进入

从视频图像概念检查、视觉目标检查、多模式数据分析和识别、网络舆论监测四个方面获得了各种根本性的技术突破和发明者创意。在2016年北京市科学技术奖投票中,“互联网多模态内容分析与识别核心技术及应用”项目获得一等奖。单模态分析和识别技术——单模态分析和识别是突破互联网多模态内容识别的基础和核心技术。

图像、视频和文本是单模信息最重要的形式,计算机如何自动分析和识别图像、视频和文本的内容成为研究和应用的问题。图像和视频通常包含意义概念,如篮球比赛、奥运会等。还包括视觉目标,如行人、汽车、旗帜等。“人类需要更容易识别和解释这些概念和目标,但对于计算机来说,数字图像由像素点组成,人类的意义概念和视觉目标与计算机看到的二进制值之间没有不可逾越的‘意义差距’。

”(威廉莎士比亚,Northern Exposure(美国电视),电脑)北京大学彭宇信说。由于图像、视频的语义概念比较抽象,视觉目标复杂多变,“奥运会”概念很难在视觉上准确定义,“旗帜”等目标没有相同的形式,计算机自动分析和识别非常困难。

欧冠投注网站

彭玉信团队为了解决图像视频概念测试问题,开发了基于注意力模型和增量深度自学的分类方法,一方面为了提高检测精度,需要找到图像的重要领域。另一方面,增量自学要在新概念减少过程中利用已经自学的科学知识,加快新的科学知识自学,通过动态搭配反对新概念检查。

该方法突破了特定概念的检测精度90%。针对简单场景下的视觉目标检测问题,发明了级联分类器与极角多种体约束相结合的判断方法,同时通过级联分类器,在海量数据中对可能包含特定目标的候选区域进行了缓慢检查,减缓了检测速度。

点击进入

相反,通过极角流形约束,对候选区域进行二次判断,提高检测精度。该方法在低分辨率、应力、透视等简单情况下提高检测效果,特定视觉目标检测精度突破90%。

以上述研究结果为基础,彭宇信教授团队参加了国际权威评价TRECVID的视频高层概念测试比赛,获得了第一名,参与团队还包括卡内基梅隆大学、牛津大学、IBMWatson研究中心等国际知名大学和研究机构。
文本内容分析中的热点话题检测和脆弱信息检索是网络舆论监测的两个主要应用领域。热门话题和易碎信息通常包括特定名称、地名、机构名称等实体信息,有效识别实体信息是文本内容分析的关键。

为了解决这些问题,项目组发明者开发了基于科学知识要素的多模态语义分析方法和基于情感观点的主题跟踪方法,有效地解决了网络内容语言规范性差、噪音低、时效性低、实体无法识别和利用的问题。在国际权威评价TREC2014年和2015年微博信息检索大会上获得第一名。【欧冠投注网站】。

本文来源:欧冠投注网站-www.adlib-english.com

相关文章

admin

评论已关闭。
网站地图xml地图