24小时联系电话:185 8888 888

要闻
您现在的位置: 首页 > 要闻 > 机器学习初创企业的4个错误
  • 零食新鲜化,来伊份的产品溯源里藏着这些秘密···

    零食新鲜化,来伊份的产品溯源里藏着这些秘密···

    发布时间:2023/07/03

    在“新鲜零食”的战略引领下,“主板零食第一股”来伊份迈入了企业发展的第23个年头,其传统的线下溯源活动“寻鲜之旅”也已经发展至第九届,本次再度启程将探索芒果之乡——百色,继续为用户展现以“青山绿水”铸“新鲜零食...

  • 雷科智途联合太平洋财产保险共同举办商用车AEBS防碰撞演示活动

    雷科智途联合太平洋财产保险共同举办商用车AEBS防碰撞演示活动

    发布时间:2022/01/04

    2021年12月16日,“安全出行·科技护航”-商用车自动紧急制动系统(AdvancedEmergencyBrakingSystem,简称“AEBS”)防碰撞演示在山东省青岛莱西市隆重举行。出席本次活动的领导和嘉宾有:莱西市应急管理局副局长李凌云...

  • 剑南春再传喜报,两年蝉联四次冠军

    剑南春再传喜报,两年蝉联四次冠军

    发布时间:2021/12/14

    2021年“双12”天猫年终购物节战报出炉,剑南春天猫平台官方旗舰店以超高人气和火爆的销量,勇夺天猫“双12”白酒品牌旗舰店交易指数第一名。 剑南春领跑榜单,两年蝉联四次冠军 剑南春在线上购物狂欢节上一直有着不...

  • 百年变局新机遇 第九届岭南论坛在广州举行

    百年变局新机遇 第九届岭南论坛在广州举行

    发布时间:2021/11/22

    11月21日,第九届岭南论坛在广州成功举办。本次论坛围绕“百年变局新机遇”主题,原中国银行业监督管理委员会主席刘明康,中山大学岭南学院教授、博导、广东省人民政府参事陆军,斯坦福大学教授、2001年诺贝尔经济...

  • 破记录的2万亿美元刺激计划中有什么?

    破记录的2万亿美元刺激计划中有什么?

    发布时间:2020/03/27

    经过几天的谈判,美国参议院今晚对第三项反对冠状病毒危机的法案进行投票。前两个法案着重于为医学研究提供资金并向病毒受害者提供经济支持,而“第三阶段”刺激法案则是对整个美国经济的大规模救助方案。这将花费...

  • 世界在煤炭支持上花费了半万亿美元

    世界在煤炭支持上花费了半万亿美元

    发布时间:2020/03/17

    全世界的国家有可能继续支持煤炭行业,而不是投资于成本更低,对环境更友好的风能和太阳能项目,从而浪费6400亿美元。 金融智囊团Carbon Tracker在周四发布的一份报告中说,全球60%的燃煤发电厂以比可再生能源替...

  • 您还不知道怎么毫无危险的投资?

    您还不知道怎么毫无危险的投资?

    发布时间:2020/03/13

    查看了许多财务平台,阅读有关加密货币、证券交易所的信息并没找到了答案? 我也处于过类似情况。我现在写出这篇文章,以帮助您与AlysDax公司一起开始工作! 前几天,我的朋友建议我AlysDax平台,哪个专为机构投...

  • MK FOREX提醒您:黄金:迈向短期阻力的路上

    MK FOREX提醒您:黄金:迈向短期阻力的路上

    发布时间:2020/03/02

    金价延续自1625美元/盎司开始的反弹 正常的RSI情况表明反弹将持续 关键的斐波纳奇回撤位,附近的上升趋势线限制了短线下跌 截至周四早间,金价在每盎司1,650美元附近。金价周三走出了U型走势。 黄金价格最近从162...

机器学习初创企业的4个错误

发布时间:2019/10/22 要闻 浏览次数:734

 
您听说过达尔文奖吗?跳上YouTube看看。通常是很有趣的东西。这是一种a舌的荣誉,旨在表彰人们做出最复杂的尝试来做自己认为很酷的事情。一个人带着受伤的熊自拍照,另一个人将喷气发动机拧到溜冰鞋上。这些大胆的举动会导致致命的错误,带来可怕的后果和滑稽的评论。剧透警报-不幸的是-他们都死了。您不希望您的创业公司因机器学习错误而“丧命”。
在过去的25年中,我见过成千上万次有人犯错误,但从未见过机器犯错误。如今,学习项目中的错误可能使公司损失数百万美元和数年的无用工作。因此,这里收集了与数据,指标,验证和技术有关的机器学习中最常见的错误。
1.数据
处理数据时出错的可能性很高。成功使用雷区要比使用数据集时不要犯错误容易。此外,可能存在几个常见错误:
未处理的数据。未处理的数据是垃圾,不会让您对所构建模型的充分性充满信心。因此,任何AI项目都应仅将预处理数据作为基础。
异常现象。检查偏差和异常的数据并消除它们。消除错误是每个机器学习项目的优先事项之一。数据可能总是不完整,不正确,或者某些信息可能会丢失一段时间。
缺少数据。也许,最简单的方法是进行10个实验并获得结果,但仍然不是最正确的一个。少量且不平衡的数据将导致得出的结论与事实相去甚远。因此,如果您需要培训网络以区分眼镜企鹅和眼镜熊,那么几只熊的照片将无法飞行。即使有成千上万的企鹅图片。
大量数据。有时限制数据量是唯一正确的解决方案。例如,这就是您如何获得将来人类行为的最客观画面。我们的世界和人类是不可预测的。通常,根据某人在1998年的行为来预测其反应就像阅读茶叶一样。结果完全一样,将与现实相去甚远。
2.指标
准确性是机器学习中的一项重要指标。但是,毫无意义地寻求绝对准确性可能会成为AI项目的一个问题。特别是如果目标是创建预测性推荐系统。显然,如果杂货在线超市提供购买牛奶的准确性,准确性可以达到令人难以置信的99%。我敢打赌,买家会接受它,并且推荐系统也会起作用。但恐怕他还是会买,因此这种建议毫无意义。以每天购买牛奶的城市居民为例,在这种系统中,重要的是个人的方法和商品的促销(这在以前的购物篮中是没有的)。
3.验证方式
一个学习字母表的孩子逐渐掌握了字母,简单的单词和成语。他在一定水平上学习和处理信息。同时,对科学论文的分析对于学步的孩子来说是难以理解的,尽管文章中的单词是由他学到的相同的字母组成。
AI项目的模型还可以从特定的数据集中学习。但是,该项目将无法尝试检查同一数据集上模型的质量。要估计模型,必须使用专门选择的用于验证训练中未使用的信息的验证片。通过这种方式,可以实现最准确的模型质量评估。
4.技术
在AI项目中选择技术仍然是一个普遍的错误,即使不是致命的,但也会导致严重的后果,从而影响项目截止日期的效率和时间。
难怪,由于其适用于任何任务的通用算法,您很难在机器学习中找到比神经网络更受炒作的主题。但是,对于任何任务,该工具都不是最有效,最快的工具。
最杰出的例子是Kaggle比赛。神经网络并不总是首屈一指。相反,随机树网络有更多获胜的机会;它主要与表格数据有关。
神经元通常用于分析视觉信息,语音和更复杂的数据。
如今,使用神经网络作为指导,这是最简单的解决方案。但是同时,项目团队应该清楚地了解哪种算法适合特定任务。
我坚信机器学习的炒作不会是虚假,夸大和毫无根据的。机器学习是另一种工程工具,它使我们的生活更简单,更舒适,并逐渐改变它以改善生活。
对于许多大型项目,本文可能只是对他们已经犯过的错误的怀旧回顾,但他们仍然设法生存并克服了通往产品公司的严重困难。
但是对于那些刚刚开始AI创业的人来说,这是一个了解为什么为什么不是最好的想法的事情,那就是用受伤的熊自拍照,以及如何不填充无休止的“死”初创公司名单。

姓 名:
邮箱
留 言: