24小时联系电话:185 8888 888

要闻
您现在的位置: 首页 > 要闻 > 研究人员开发出可区分讽刺和假新闻的AI
  • 零食新鲜化,来伊份的产品溯源里藏着这些秘密···

    零食新鲜化,来伊份的产品溯源里藏着这些秘密···

    发布时间:2023/07/03

    在“新鲜零食”的战略引领下,“主板零食第一股”来伊份迈入了企业发展的第23个年头,其传统的线下溯源活动“寻鲜之旅”也已经发展至第九届,本次再度启程将探索芒果之乡——百色,继续为用户展现以“青山绿水”铸“新鲜零食...

  • 雷科智途联合太平洋财产保险共同举办商用车AEBS防碰撞演示活动

    雷科智途联合太平洋财产保险共同举办商用车AEBS防碰撞演示活动

    发布时间:2022/01/04

    2021年12月16日,“安全出行·科技护航”-商用车自动紧急制动系统(AdvancedEmergencyBrakingSystem,简称“AEBS”)防碰撞演示在山东省青岛莱西市隆重举行。出席本次活动的领导和嘉宾有:莱西市应急管理局副局长李凌云...

  • 剑南春再传喜报,两年蝉联四次冠军

    剑南春再传喜报,两年蝉联四次冠军

    发布时间:2021/12/14

    2021年“双12”天猫年终购物节战报出炉,剑南春天猫平台官方旗舰店以超高人气和火爆的销量,勇夺天猫“双12”白酒品牌旗舰店交易指数第一名。 剑南春领跑榜单,两年蝉联四次冠军 剑南春在线上购物狂欢节上一直有着不...

  • 百年变局新机遇 第九届岭南论坛在广州举行

    百年变局新机遇 第九届岭南论坛在广州举行

    发布时间:2021/11/22

    11月21日,第九届岭南论坛在广州成功举办。本次论坛围绕“百年变局新机遇”主题,原中国银行业监督管理委员会主席刘明康,中山大学岭南学院教授、博导、广东省人民政府参事陆军,斯坦福大学教授、2001年诺贝尔经济...

  • 破记录的2万亿美元刺激计划中有什么?

    破记录的2万亿美元刺激计划中有什么?

    发布时间:2020/03/27

    经过几天的谈判,美国参议院今晚对第三项反对冠状病毒危机的法案进行投票。前两个法案着重于为医学研究提供资金并向病毒受害者提供经济支持,而“第三阶段”刺激法案则是对整个美国经济的大规模救助方案。这将花费...

  • 世界在煤炭支持上花费了半万亿美元

    世界在煤炭支持上花费了半万亿美元

    发布时间:2020/03/17

    全世界的国家有可能继续支持煤炭行业,而不是投资于成本更低,对环境更友好的风能和太阳能项目,从而浪费6400亿美元。 金融智囊团Carbon Tracker在周四发布的一份报告中说,全球60%的燃煤发电厂以比可再生能源替...

  • 您还不知道怎么毫无危险的投资?

    您还不知道怎么毫无危险的投资?

    发布时间:2020/03/13

    查看了许多财务平台,阅读有关加密货币、证券交易所的信息并没找到了答案? 我也处于过类似情况。我现在写出这篇文章,以帮助您与AlysDax公司一起开始工作! 前几天,我的朋友建议我AlysDax平台,哪个专为机构投...

  • MK FOREX提醒您:黄金:迈向短期阻力的路上

    MK FOREX提醒您:黄金:迈向短期阻力的路上

    发布时间:2020/03/02

    金价延续自1625美元/盎司开始的反弹 正常的RSI情况表明反弹将持续 关键的斐波纳奇回撤位,附近的上升趋势线限制了短线下跌 截至周四早间,金价在每盎司1,650美元附近。金价周三走出了U型走势。 黄金价格最近从162...

研究人员开发出可区分讽刺和假新闻的AI

发布时间:2019/11/07 要闻 浏览次数:687

 
您如何区分讽刺和虚假新闻?通常可以归结为语义和语言上的差异,但细微差别可能很难发现。因此,乔治华盛顿大学,亚马逊AWS AI以及初创公司AdVerifai的研究人员研究了一种机器学习方法来对误导性语音进行分类。他们说,他们开发的AI模型优于基线,为研究其他语言功能奠定了基础。
他们的工作遵循了麻省理工学院计算机科学与人工智能实验室(CSAIL)的工作,该实验室于今年初设计了一个AI模型,该模型可以确定来源是准确的还是有政治偏见的。在随后的工作中,MIT CSAIL使用了世界上最大的事实检查数据集之一来开发可以检测错误陈述的自动化系统。
该论文的共同作者指出,为减少错误信息的传播而进行的努力有时会导致对合法讽刺作品的标记,特别是在社交媒体上。使事情复杂化的是,一些虚假的新闻传播者已开始伪装成讽刺网站。这些发展当然会威胁到合法发行商的业务,这些业务可能难以通过讽刺来货币化,但也影响了消费者的体验,他们可能会错过分类错误的内容。
研究人员假设,文本连贯性的度量可能有助于捕获故事句子之间的语义相关性。为此,他们使用了由Coh-Metrix实施的一组与文本统计相关的索引,该工具是生成语言和话语表示的工具。总共有108个,包括(但不限于)单词和句子的数量;指称内聚,指内容词在句子之间的重叠;各种文本可读性公式;和不同类型的连接词。
研究人员利用一种称为主成分分析的统计技术,将潜在的相关指标转换为不相关的变量(或主成分),并将其用于两个逻辑回归模型(对某些类别的概率进行建模的函数),并使用伪造和讽刺的标签对其进行依赖。变量。接下来,他们在一个包含283个虚假新闻故事和203个经手工验证的讽刺故事的语料库上评估了模型的性能。
研究小组报告说,在“重要”指标上进行训练的分类器的性能优于基线F1分数,F1分数是衡量假阳性和阴性率的指标。表现最佳的算法得分为0.78(满分为1),同时表明讽刺文章比假新闻更趋于成熟(且不易阅读)。
在未来的工作中,研究人员计划研究语言线索,例如荒谬,不协调和其他与幽默相关的特征。
他们写道:“总体而言,我们的贡献,以及提高的分类准确度和对假新闻与讽刺之间细微差别的理解,对打击虚假信息同时保护言论自由的微妙平衡具有重大意义。”

姓 名:
邮箱
留 言: