中信银行北京分行参加东湖街道金融赋能大会暨金融服务矩阵启动仪式

发布时间：2025/11/08

10月28日，“创享东湖·e企远航——东湖街道金融赋能大会暨金融服务矩阵启动仪式”在北京嘉瑞文化中心举办，标志着朝阳区首个“街道级”金融服务矩阵正式启动运行，预计每年可为辖区企业提供超百亿元规模的融资支...
振东制药达霏欣创新推出“内服外治”方案：焕活毛囊新生

发布时间：2025/07/29

近年来，随着生活压力加剧、作息不规律及环境因素影响，脱发、白发问题呈现年轻化趋势，成为困扰现代人的普遍健康难题。面对庞大的市场需求，传统单一治疗手段逐渐显露出局限性。近日，专注毛发健康领域22年的达...
中信银行北京分行精准服务“双循环”战略成功投资京东科技首单“出口转内销”ABS产品

发布时间：2025/07/11

近日，中信银行精准把握国家“畅通国民经济循环”战略机遇，成功投资京东科技发行的市场首单“出口转内销”主题ABS产品——“禾昱7-5资产支持专项计划”优先A级份额1.6亿元。本项目积极响应国家“稳外贸、...
零食新鲜化，来伊份的产品溯源里藏着这些秘密···

发布时间：2023/07/03

在“新鲜零食”的战略引领下，“主板零食第一股”来伊份迈入了企业发展的第23个年头，其传统的线下溯源活动“寻鲜之旅”也已经发展至第九届，本次再度启程将探索芒果之乡——百色，继续为用户展现以“青山绿水”铸“新鲜零食...

破记录的2万亿美元刺激计划中有什么?

发布时间：2020/03/27

经过几天的谈判，美国参议院今晚对第三项反对冠状病毒危机的法案进行投票。前两个法案着重于为医学研究提供资金并向病毒受害者提供经济支持，而“第三阶段”刺激法案则是对整个美国经济的大规模救助方案。这将花费...
世界在煤炭支持上花费了半万亿美元

发布时间：2020/03/17

全世界的国家有可能继续支持煤炭行业，而不是投资于成本更低，对环境更友好的风能和太阳能项目，从而浪费6400亿美元。金融智囊团Carbon Tracker在周四发布的一份报告中说，全球60%的燃煤发电厂以比可再生能源替...
您还不知道怎么毫无危险的投资？

发布时间：2020/03/13

查看了许多财务平台，阅读有关加密货币、证券交易所的信息并没找到了答案？我也处于过类似情况。我现在写出这篇文章，以帮助您与AlysDax公司一起开始工作！前几天，我的朋友建议我AlysDax平台，哪个专为机构投...
MK FOREX提醒您：黄金:迈向短期阻力的路上

发布时间：2020/03/02

金价延续自1625美元/盎司开始的反弹正常的RSI情况表明反弹将持续关键的斐波纳奇回撤位，附近的上升趋势线限制了短线下跌截至周四早间，金价在每盎司1,650美元附近。金价周三走出了U型走势。黄金价格最近从162...

Mozilla使用“比实时更快”运行的英语模型更新DeepSpeech

发布时间：2019/12/06 商业 浏览次数：1362

由Mozilla的机器学习小组维护的DeepSpeech是一套语音转文本和文本转语音引擎，今天早上收到了更新(至0.6版)，该更新结合了迄今为止最快的开源语音识别模型之一。在高级研究工程师Reuben Morais的博客文章中，他介绍了新功能和增强功能以及即将推出的其他聚光灯功能。
DeepSpeech的最新版本增加了对TensorFlow Lite的支持，TensorFlow Lite是Google的TensorFlow机器学习框架的一种版本，该框架针对计算受限的移动和嵌入式设备进行了优化。它已将DeepSpeech的程序包大小从98MB减小到3.7MB，并且将其内置的英语模型大小减小了-在流行的基准上具有7.5%的字错误率，并且接受了来自WAMU(NPR)，LibriSpeech， Fisher，Switchboard和Mozilla的Common Voice English数据集-从188MB到47MB。此外，它还将DeepSpeech的内存消耗减少了22倍，并将启动速度提高了500倍以上。
这种更有效的英语模型-在Raspberry Pi 4的单个内核上“比实时运行”更快，并且比以前小50%(包括推理代码和训练有素的模型)，可在Windows，macOS，和Linux以及Android。
DeepSpeech 0.6整体上具有更高的性能，这在某种程度上要归功于新的流解码器，该解码器可实现“一致的”低延迟和内存利用率，而与所转录音频的长度无关。此外，该平台的两个主要子系统-可以接收音频特征作为输入并输出字符概率的声学模型，以及将字符概率转换为文本成绩单的解码器-现在都可以流式传输了。 Morais说，这意味着不再需要精心调整的静音检测算法。
新的DeepSpeech在音频结束后260毫秒提供转录，比实现流解码器之前的速度快73%。至于音频文件在第2和3秒钟的中间成绩单请求，它们会在短时间内返回。
在性能方面，这还不是所有的改进。现在，得益于TensorFlow 1.14的升级和新可用API的采用，DeepSpeech的模型训练速度提高了两倍。此外，它能够以不同的采样率(例如，电话数据为8kHz)完全训练和部署模型，并且新的解码器可显示抄录中每个字符的时间和置信度元数据。
最后，DeepSpeech现在提供具有.NET，Python，JavaScript和C绑定的Windows软件包，其中第一个可在NuGet Gallery中获得，并可直接从Visual Studio安装。 DeepSpeech的存储库中提供了一个示例，其中包含演示从音频文件以及麦克风或其他音频输入设备进行转录的代码。
Mozilla在自然语言处理方面的工作扩展到前面提到的Common Voice数据集，该数据集最近通过18种语言的1,400个小时的语音更新得到了更新。 Mozilla称，它是同类最大的多语言数据集之一-远远大于八个月前公开发布的Common Voice语料库，该语料库包含来自20,000名英语志愿者的500个小时(400,000条录音)，并且很快就会发布变得更大。该组织表示，通过Common Voice网站和移动应用程序正在积极进行70种语言的数据收集工作。

上一篇: SpaceX用强大的老鼠发射Dragon货船，并为西雅图的Spaceflight运送棘手的货物

下一篇: 苹果表示，其超宽带技术是即使在禁用设置的情况下新型iPhone似乎仍可以共享位置数据的原因

相关推荐