统的维护 1 语音模型的维护语音模型的好坏是语音识别准确率的重要保证。对语音模型的优化和升级,将采取定期跟踪、采集、建模和优化、升级的过程。一般而言,升级的周期以二至三个星期为单位,前一星期进行语音的采集和建模,后两星期对升级的模型包进行跟踪测试并最终发布。上海基立讯信息科技有限公司 Jiliason Technologies, Inc. 语音模型维护小结上海基立讯号码清洗系统的语音模型维护机制可以保证系统的语音模型是在可控的范围内,可以保证系统识别准确率的稳定性和可提高性,整体号码清洗系统的准确率可以长期稳定的维持在一个相当高的水准, 而不用像类似信令分析等等无法稳定控制准确率。上海基立讯信息科技有限公司 Jiliason Technologies, Inc. 2 号码知识库的维护号码知识库建有相当的号码整理规则,并有庞大的手机号码局向表,这些数据和规则可以最大限度的保证对用户号码的正确预处理,以保证最终系统的整体识别准确率和报表数据的完整性。上海基立讯信息科技有限公司 Jiliason Technologies, Inc. 号码整理规则的维护基立讯号码清洗系统的号码整理规则已经可以对号码进行如下预处理: ?号码的拆分?特殊符号的过滤?特殊字符的过滤?不足位、超位号码、错误起始位的处理?号码的正确补位?号码的去重?外地号码的正确标识上海基立讯信息科技有限公司 Jiliason Technologies, Inc. 手机局向表的完善途径基立讯号码清洗系统的手机局向表已经包含有 24 万个左右的手机号段,覆盖大约 24 亿的全国范围的手机号码。这个局向表可以通过以下途径在现有基础上进一步完善: 完善途径说明定期数据库更新基立讯定期向第三方购买最新的号码局向表数据核实报表数据注意手机号码中没有区域名称的记录并完善核实录音内容注意记录那些“您拨的是外地号码”的录音并相应完善知识库