-
零食新鲜化,来伊份的产品溯源里藏着这些秘密···
发布时间:2023/07/03
在“新鲜零食”的战略引领下,“主板零食第一股”来伊份迈入了企业发展的第23个年头,其传统的线下溯源活动“寻鲜之旅”也已经发展至第九届,本次再度启程将探索芒果之乡——百色,继续为用户展现以“青山绿水”铸“新鲜零食...
-
雷科智途联合太平洋财产保险共同举办商用车AEBS防碰撞演示活动
发布时间:2022/01/04
2021年12月16日,“安全出行·科技护航”-商用车自动紧急制动系统(AdvancedEmergencyBrakingSystem,简称“AEBS”)防碰撞演示在山东省青岛莱西市隆重举行。出席本次活动的领导和嘉宾有:莱西市应急管理局副局长李凌云...
-
剑南春再传喜报,两年蝉联四次冠军
发布时间:2021/12/14
2021年“双12”天猫年终购物节战报出炉,剑南春天猫平台官方旗舰店以超高人气和火爆的销量,勇夺天猫“双12”白酒品牌旗舰店交易指数第一名。 剑南春领跑榜单,两年蝉联四次冠军 剑南春在线上购物狂欢节上一直有着不...
-
百年变局新机遇 第九届岭南论坛在广州举行
发布时间:2021/11/22
11月21日,第九届岭南论坛在广州成功举办。本次论坛围绕“百年变局新机遇”主题,原中国银行业监督管理委员会主席刘明康,中山大学岭南学院教授、博导、广东省人民政府参事陆军,斯坦福大学教授、2001年诺贝尔经济...
-
破记录的2万亿美元刺激计划中有什么?
发布时间:2020/03/27
经过几天的谈判,美国参议院今晚对第三项反对冠状病毒危机的法案进行投票。前两个法案着重于为医学研究提供资金并向病毒受害者提供经济支持,而“第三阶段”刺激法案则是对整个美国经济的大规模救助方案。这将花费...
-
世界在煤炭支持上花费了半万亿美元
发布时间:2020/03/17
全世界的国家有可能继续支持煤炭行业,而不是投资于成本更低,对环境更友好的风能和太阳能项目,从而浪费6400亿美元。 金融智囊团Carbon Tracker在周四发布的一份报告中说,全球60%的燃煤发电厂以比可再生能源替...
-
您还不知道怎么毫无危险的投资?
发布时间:2020/03/13
查看了许多财务平台,阅读有关加密货币、证券交易所的信息并没找到了答案? 我也处于过类似情况。我现在写出这篇文章,以帮助您与AlysDax公司一起开始工作! 前几天,我的朋友建议我AlysDax平台,哪个专为机构投...
-
MK FOREX提醒您:黄金:迈向短期阻力的路上
发布时间:2020/03/02
金价延续自1625美元/盎司开始的反弹 正常的RSI情况表明反弹将持续 关键的斐波纳奇回撤位,附近的上升趋势线限制了短线下跌 截至周四早间,金价在每盎司1,650美元附近。金价周三走出了U型走势。 黄金价格最近从162...
Mozilla使用“比实时更快”运行的英语模型更新DeepSpeech
发布时间:2019/12/06 商业 浏览次数:1182
由Mozilla的机器学习小组维护的DeepSpeech是一套语音转文本和文本转语音引擎,今天早上收到了更新(至0.6版),该更新结合了迄今为止最快的开源语音识别模型之一。在高级研究工程师Reuben Morais的博客文章中,他介绍了新功能和增强功能以及即将推出的其他聚光灯功能。
DeepSpeech的最新版本增加了对TensorFlow Lite的支持,TensorFlow Lite是Google的TensorFlow机器学习框架的一种版本,该框架针对计算受限的移动和嵌入式设备进行了优化。它已将DeepSpeech的程序包大小从98MB减小到3.7MB,并且将其内置的英语模型大小减小了-在流行的基准上具有7.5%的字错误率,并且接受了来自WAMU(NPR),LibriSpeech, Fisher,Switchboard和Mozilla的Common Voice English数据集-从188MB到47MB。此外,它还将DeepSpeech的内存消耗减少了22倍,并将启动速度提高了500倍以上。
这种更有效的英语模型-在Raspberry Pi 4的单个内核上“比实时运行”更快,并且比以前小50%(包括推理代码和训练有素的模型),可在Windows,macOS,和Linux以及Android。
DeepSpeech 0.6整体上具有更高的性能,这在某种程度上要归功于新的流解码器,该解码器可实现“一致的”低延迟和内存利用率,而与所转录音频的长度无关。此外,该平台的两个主要子系统-可以接收音频特征作为输入并输出字符概率的声学模型,以及将字符概率转换为文本成绩单的解码器-现在都可以流式传输了。 Morais说,这意味着不再需要精心调整的静音检测算法。
新的DeepSpeech在音频结束后260毫秒提供转录,比实现流解码器之前的速度快73%。至于音频文件在第2和3秒钟的中间成绩单请求,它们会在短时间内返回。
在性能方面,这还不是所有的改进。现在,得益于TensorFlow 1.14的升级和新可用API的采用,DeepSpeech的模型训练速度提高了两倍。此外,它能够以不同的采样率(例如,电话数据为8kHz)完全训练和部署模型,并且新的解码器可显示抄录中每个字符的时间和置信度元数据。
最后,DeepSpeech现在提供具有.NET,Python,JavaScript和C绑定的Windows软件包,其中第一个可在NuGet Gallery中获得,并可直接从Visual Studio安装。 DeepSpeech的存储库中提供了一个示例,其中包含演示从音频文件以及麦克风或其他音频输入设备进行转录的代码。
Mozilla在自然语言处理方面的工作扩展到前面提到的Common Voice数据集,该数据集最近通过18种语言的1,400个小时的语音更新得到了更新。 Mozilla称,它是同类最大的多语言数据集之一-远远大于八个月前公开发布的Common Voice语料库,该语料库包含来自20,000名英语志愿者的500个小时(400,000条录音),并且很快就会发布变得更大。该组织表示,通过Common Voice网站和移动应用程序正在积极进行70种语言的数据收集工作。