24小时联系电话:185 8888 888

要闻
您现在的位置: 首页 > 要闻 > AWS SageMaker的新机器学习IDE尚无法赢得数据科学家的青睐
  • 零食新鲜化,来伊份的产品溯源里藏着这些秘密···

    零食新鲜化,来伊份的产品溯源里藏着这些秘密···

    发布时间:2023/07/03

    在“新鲜零食”的战略引领下,“主板零食第一股”来伊份迈入了企业发展的第23个年头,其传统的线下溯源活动“寻鲜之旅”也已经发展至第九届,本次再度启程将探索芒果之乡——百色,继续为用户展现以“青山绿水”铸“新鲜零食...

  • 雷科智途联合太平洋财产保险共同举办商用车AEBS防碰撞演示活动

    雷科智途联合太平洋财产保险共同举办商用车AEBS防碰撞演示活动

    发布时间:2022/01/04

    2021年12月16日,“安全出行·科技护航”-商用车自动紧急制动系统(AdvancedEmergencyBrakingSystem,简称“AEBS”)防碰撞演示在山东省青岛莱西市隆重举行。出席本次活动的领导和嘉宾有:莱西市应急管理局副局长李凌云...

  • 剑南春再传喜报,两年蝉联四次冠军

    剑南春再传喜报,两年蝉联四次冠军

    发布时间:2021/12/14

    2021年“双12”天猫年终购物节战报出炉,剑南春天猫平台官方旗舰店以超高人气和火爆的销量,勇夺天猫“双12”白酒品牌旗舰店交易指数第一名。 剑南春领跑榜单,两年蝉联四次冠军 剑南春在线上购物狂欢节上一直有着不...

  • 百年变局新机遇 第九届岭南论坛在广州举行

    百年变局新机遇 第九届岭南论坛在广州举行

    发布时间:2021/11/22

    11月21日,第九届岭南论坛在广州成功举办。本次论坛围绕“百年变局新机遇”主题,原中国银行业监督管理委员会主席刘明康,中山大学岭南学院教授、博导、广东省人民政府参事陆军,斯坦福大学教授、2001年诺贝尔经济...

  • 破记录的2万亿美元刺激计划中有什么?

    破记录的2万亿美元刺激计划中有什么?

    发布时间:2020/03/27

    经过几天的谈判,美国参议院今晚对第三项反对冠状病毒危机的法案进行投票。前两个法案着重于为医学研究提供资金并向病毒受害者提供经济支持,而“第三阶段”刺激法案则是对整个美国经济的大规模救助方案。这将花费...

  • 世界在煤炭支持上花费了半万亿美元

    世界在煤炭支持上花费了半万亿美元

    发布时间:2020/03/17

    全世界的国家有可能继续支持煤炭行业,而不是投资于成本更低,对环境更友好的风能和太阳能项目,从而浪费6400亿美元。 金融智囊团Carbon Tracker在周四发布的一份报告中说,全球60%的燃煤发电厂以比可再生能源替...

  • 您还不知道怎么毫无危险的投资?

    您还不知道怎么毫无危险的投资?

    发布时间:2020/03/13

    查看了许多财务平台,阅读有关加密货币、证券交易所的信息并没找到了答案? 我也处于过类似情况。我现在写出这篇文章,以帮助您与AlysDax公司一起开始工作! 前几天,我的朋友建议我AlysDax平台,哪个专为机构投...

  • MK FOREX提醒您:黄金:迈向短期阻力的路上

    MK FOREX提醒您:黄金:迈向短期阻力的路上

    发布时间:2020/03/02

    金价延续自1625美元/盎司开始的反弹 正常的RSI情况表明反弹将持续 关键的斐波纳奇回撤位,附近的上升趋势线限制了短线下跌 截至周四早间,金价在每盎司1,650美元附近。金价周三走出了U型走势。 黄金价格最近从162...

AWS SageMaker的新机器学习IDE尚无法赢得数据科学家的青睐

发布时间:2019/12/10 要闻 浏览次数:649

 
AWS的机器学习品牌AWS SageMaker周二宣布发布SageMaker Studio,该产品的商标为“ ML的IDE”。机器学习一直吸引着人们的注意力,并且由于其大量的计算工作量,它可以证明是在公共云争夺战中日益增长的决定性因素。那么,这个新的IDE对AWS和公共云市场意味着什么?
首先是大局(通过Studio的功能分析,其功能在下面跳过):SageMaker的市场份额微不足道已经不是什么秘密了(信息显示,2019年7月约为1100万美元)。 SageMaker Studio试图通过简化模型训练和维护工作量来解决数据科学家和机器学习(ML)开发人员的重要难题。但是,由于对AWS普遍存在长期的抱怨,因此其实施不力-学习曲线陡峭且复杂。
AWS显然采用了一种向公司IT出售的策略,而忽略了可以使数据科学家和开发人员的生活更加轻松的功能和UX。当他们发布的基础技术(例如Notebooks,Debugger和Model Monitor)试图使ML培训更容易时,实现的实现还有很多不足之处。
我自己尝试访问SageMaker Studio的经验是这个问题的缩影。我无法建立Studio。现有的AWS帐户无法将您登录到新服务;您需要一个新的AWS单点登录(SSO)。设置SSO很麻烦,出现了诸如“成员必须满足正则表达式模式:[\ p {L} \ p {M} \ p {S} \ p {N} \ p {P}] +”之类的无用错误消息,比开导更容易混淆。要使SageMaker Studio会话正常工作,还需要了解完整的SSO权限模型-本身就是一条陡峭的学习曲线。显然,我误会了它,因为我从未使它起作用。这是在三名AWS员工(其中一名是开发人员)的有用指导下进行的。
我对SageMaker的体验并非独一无二。同一则《信息》文章指出:“尽管使用AWS试图使客户更容易使用机器学习,但使用该技术从事客户项目的人却认为该服务在技术上很复杂。” SageMaker;如我们所见,它可以推广到所有AWS的云产品。同时,据报道其竞争对手Google Cloud具有更好的开发人员体验,更加“用户友好”,并且“最关心专业开发人员的需求”。
目前,投资者不必担心。选择复杂性而不是简单性可能是正确的选择,它着眼于财力雄厚的大型企业IT采购商的需求,他们强调可定制的细粒度安全性和功能检查表(截至今年5月,AWS有169种独立产品)。不幸的是,这是以陡峭的学习曲线和开发人员友好为代价的。尽管目前这可能是正确的策略,但Studio的复杂性使AWS面临克里斯滕森风格颠覆的可能性(请考虑创新者的困境)。 AWS的庞大规模(众所周知,它是最大的云提供商)具有许多优势-支持更广泛的产品,更大的认证开发人员基础,更大的规模经济能力-仅举几例。但是今年已经看到Zoom和Slack的IPO,这两家B2B公司通过赢得最终用户的青睐并强迫购买者的手来规避了传统的企业IT销售路径。类似的开发人员友好播放器能否取代AWS?
SageMaker Studio提供什么
现在让我们看一下Studio的功能:SageMaker作为Studio的一部分宣布了一些有趣的新功能:笔记本电脑,实验,调试器,模型监视器和AutoPilot。
SageMaker笔记本电脑试图解决人们学习数据科学的最大障碍:使Python或R环境正常工作并弄清楚如何使用笔记本电脑。 Studio为SageMaker环境提供了单击笔记本,可以直接与“笔记本即服务”类别中的Google Colab或Microsoft Azure笔记本竞争。但是SageMaker自2018年以来就拥有笔记本实例,尚不清楚Studio在这方面提供了哪些改进。
SageMaker Experiments为长期工作提供进度报告功能。这很方便,因为您通常无法知道作业将继续运行多长时间,或者它是否已在后台静默崩溃。对于基于云的作业,大数据集或GPU密集型项目,“实验”功能应该是一个有用的附加功能。但是,甚至早在2018年7月,它就已经存在(尽管可能以较少的视觉形式)。再次,目前尚不清楚该产品如何比其前辈更好。
SageMaker Debugger承诺简化调试过程。该功能的发布带有深入的解释,包括代码片段,其中显示了该工具如何帮助开发人员调试其他不透明的Tensorflow错误(它可以或将与其他ML工具一起使用)。
我与《数据科学手册》的作者Field Cady谈到了该工具的价值。他说:“调试机器学习模型,尤其是Tensorflor或PyTorch之类的复杂模型,是一个真正的痛点,当您可以进行多天的培训工作时,尽早发现错误确实会影响生产力。” “立即访问模型,即使尚未接受全面培训,也可以让您与培训本身并行解决这些集成问题。”总的来说,该功能看起来确实很新颖,并且确实解决了用户的实际痛点。
SageMaker Model Monitor监视SageMaker Endpoints上的模型是否存在数据漂移。这也许是Studio最令人兴奋的功能,因为它有助于提醒模型维护者输入数据(以及模型)的漂移。用今年reInvent会议的AWS首席执行官安迪·贾西(Andy Jassy)的主题演讲来解释,使用2005年住房数据进行训练的抵押贷款违约模型在2006年可能表现良好,但由于底层模型输入的变化,在2008年房地产泡沫破裂期间可能会失败。 。可以自动提醒模型维护者这些更改的系统非常有价值。在与Google AI平台和初创公司Algorithmia的正面对抗中,Model Monitor展示了在SageMaker Endpoints(AWS的模型托管服务)上标准化模型托管的明显好处。
SageMaker AutoPilot是AutoML类别的一部分,该类别自动从CSV数据文件训练ML模型。该产品与DataRobot竞争,后者去年9月在E轮融资中筹集了2.06亿美元。尽管这种工具有一些好处(它可能比让数据科学家执行此步骤便宜),但它可能也是迄今为止我们最常被误解的一类。当我与Cady讨论该工具时,他注意到了数据科学中肮脏的小秘密:尽管大多数宣传都集中在ML和培训工作的最后10%上,但90%的工作是更早的。 “当您拥有CSV时,您已经完成了90%的工作。大多数数据科学来自于思考使用正确的数据集是什么,要针对的正确结果变量是什么,数据中的偏见,然后将其合并在一起。”因此,尽管AutoPilot可以加速ML,但它并不能加快数据科学家的工作量。
底线
那么关于SageMaker Studio的所有这些告诉我们什么?这是一个混合包,其中一些功能似乎只是对旧产品的品牌重塑,而某些功能则可以解决新的合法客户痛苦点。甚至最好的新功能都是对现有产品的增量改进。为了实现变革,AWS必须专门解决SageMaker中更大的可用性问题,而更广泛地解决更大的AWS生态系统。
Christensen式的AWS中断可能吗?只有时间证明一切。通过诸如Notebooks,Debugger和Model Monitor之类的工具,AWS似乎试图赢得开发人员和数据科学家的青睐。但是到目前为止,这些尝试似乎还不够。
李天辉(Michael Tianhui)是李女士(Pragmatic Institute)的数据总裁兼数据孵化器(The Data Incubator)的创始人。