24小时联系电话:185 8888 888

要闻
您现在的位置: 首页 > 要闻 > 一种基于草图检索图像的新模型
  • 零食新鲜化,来伊份的产品溯源里藏着这些秘密···

    零食新鲜化,来伊份的产品溯源里藏着这些秘密···

    发布时间:2023/07/03

    在“新鲜零食”的战略引领下,“主板零食第一股”来伊份迈入了企业发展的第23个年头,其传统的线下溯源活动“寻鲜之旅”也已经发展至第九届,本次再度启程将探索芒果之乡——百色,继续为用户展现以“青山绿水”铸“新鲜零食...

  • 雷科智途联合太平洋财产保险共同举办商用车AEBS防碰撞演示活动

    雷科智途联合太平洋财产保险共同举办商用车AEBS防碰撞演示活动

    发布时间:2022/01/04

    2021年12月16日,“安全出行·科技护航”-商用车自动紧急制动系统(AdvancedEmergencyBrakingSystem,简称“AEBS”)防碰撞演示在山东省青岛莱西市隆重举行。出席本次活动的领导和嘉宾有:莱西市应急管理局副局长李凌云...

  • 剑南春再传喜报,两年蝉联四次冠军

    剑南春再传喜报,两年蝉联四次冠军

    发布时间:2021/12/14

    2021年“双12”天猫年终购物节战报出炉,剑南春天猫平台官方旗舰店以超高人气和火爆的销量,勇夺天猫“双12”白酒品牌旗舰店交易指数第一名。 剑南春领跑榜单,两年蝉联四次冠军 剑南春在线上购物狂欢节上一直有着不...

  • 百年变局新机遇 第九届岭南论坛在广州举行

    百年变局新机遇 第九届岭南论坛在广州举行

    发布时间:2021/11/22

    11月21日,第九届岭南论坛在广州成功举办。本次论坛围绕“百年变局新机遇”主题,原中国银行业监督管理委员会主席刘明康,中山大学岭南学院教授、博导、广东省人民政府参事陆军,斯坦福大学教授、2001年诺贝尔经济...

  • 破记录的2万亿美元刺激计划中有什么?

    破记录的2万亿美元刺激计划中有什么?

    发布时间:2020/03/27

    经过几天的谈判,美国参议院今晚对第三项反对冠状病毒危机的法案进行投票。前两个法案着重于为医学研究提供资金并向病毒受害者提供经济支持,而“第三阶段”刺激法案则是对整个美国经济的大规模救助方案。这将花费...

  • 世界在煤炭支持上花费了半万亿美元

    世界在煤炭支持上花费了半万亿美元

    发布时间:2020/03/17

    全世界的国家有可能继续支持煤炭行业,而不是投资于成本更低,对环境更友好的风能和太阳能项目,从而浪费6400亿美元。 金融智囊团Carbon Tracker在周四发布的一份报告中说,全球60%的燃煤发电厂以比可再生能源替...

  • 您还不知道怎么毫无危险的投资?

    您还不知道怎么毫无危险的投资?

    发布时间:2020/03/13

    查看了许多财务平台,阅读有关加密货币、证券交易所的信息并没找到了答案? 我也处于过类似情况。我现在写出这篇文章,以帮助您与AlysDax公司一起开始工作! 前几天,我的朋友建议我AlysDax平台,哪个专为机构投...

  • MK FOREX提醒您:黄金:迈向短期阻力的路上

    MK FOREX提醒您:黄金:迈向短期阻力的路上

    发布时间:2020/03/02

    金价延续自1625美元/盎司开始的反弹 正常的RSI情况表明反弹将持续 关键的斐波纳奇回撤位,附近的上升趋势线限制了短线下跌 截至周四早间,金价在每盎司1,650美元附近。金价周三走出了U型走势。 黄金价格最近从162...

一种基于草图检索图像的新模型

发布时间:2019/11/30 要闻 浏览次数:941

 
近年来,研究人员已经开发了越来越先进的计算技术,例如深度学习算法,以完成各种任务。他们一直试图解决的一项任务称为“基于草图的图像检索”(SBIR)。
SBIR任务需要根据人类用户绘制的草图在广泛的馆藏或数据库中检索特定对象或视觉概念的图像。为了使这项任务自动化,研究人员一直在尝试开发可分析人类草图并识别与草图相关或包含相同对象的图像的工具。
尽管其中一些工具取得了令人鼓舞的结果,但迄今为止,开发出在SBIR任务上始终表现良好的技术已证明具有挑战性。这主要是由于抽象草图和真实图像之间存在明显的视觉差异。例如,人类绘制的草图经常变形和抽象,这使得它们更难以与真实图像中的对象相关。
为了克服这一挑战,天津大学和中国北京邮电大学的研究人员最近开发了一种基于神经网络的体系结构,该体系结构可以学习区分性的跨域特征表示,以进行基于草图的图像检索(SBIR)任务。他们创建的技术发表在arXiv上的一篇论文中,该技术结合了多种计算技术,包括半异构特征映射,联合语义嵌入和共同注意模型。
研究人员在论文中写道:“关键的洞察力在于我们如何培养草图,自然图像和边缘图之间的相互和微妙的关系。” “半异构特征映射旨在从每个域中提取底部特征,其中草图和边缘图分支是共享的,而自然图像分支与其他分支是异类的。”
研究人员设计的模型是半异构三向联合嵌入网络(Semi3-Net)。除了半异构映射外,它还使用一种称为联合语义嵌入的技术。语义嵌入允许网络将来自不同域(例如,来自草图或照片)的特征嵌入到通用的高级语义空间中。 Semi3-Net还包含一个共同注意模型,该模型旨在重新校准从两个不同域提取的特征。
最后,研究人员设计了一种混合损耗机制,可以计算草图,边线图和自然图像之间的相关性。这种机制允许Semi3-Net模型学习在两个域之间不变的表示形式(即使用相机拍摄的草图和图像)。
研究人员使用Sketchy和TU-Berlin Extension的数据对Semi3-Net进行了培训和评估,这两个数据集在专注于SBIR任务的研究中被广泛使用。 Sketchy数据库包含75,471个草图和12,500个自然图像,而TU-Berlin Extension包含204,489个自然图像和20,000个手绘草图。
到目前为止,Semi3-Net在研究人员进行的所有实验中均表现出色,优于SBIR的其他最新模型。该团队现在正计划继续研究该模型并进一步提高其性能,甚至可能对其进行调整以解决需要连接来自不同域的数据的其他问题。
研究人员在论文中写道:“将来,我们将专注于将建议的跨域网络扩展到细粒度图像检索,并学习素描图像对的细粒度细节的对应关系。”