车联网名词注解系列
在过去一年的智能车联测试项目中,总有朋友提问:我们在文章中提到的很多名词,很难从字面理解是什么意思,有时候会让人摸不着头脑。正好借着这个各位居家“沉淀”自己的机会,我们就开启一个系列,挨个为大家注解那些晦涩难懂的专有名词,讲讲它们的含义、背景和意义,也备日后相关文章引用。这第一期,我们就先聊聊语音控制中的那些常见名词。
STT和TTS
互联网常识告诉我们:当两个字母/数字中间夹着一个“T”或者“2”时,它大概率指代“to”这个单词,例如:P2P、B2C、V2X,STT和TTS也是类似。
在部分技术文献中,这个环节也被称为ASR(Automatic Speech Recognition,自动语音识别),是融合了语言学、计算机科学以及电气工程领域知识和研究的一个复杂项目。
我们在宣传语中经常听到的“语音引擎”,通常就是指这五个环节的集合。在研发当中,尽管部分供应商具备完整的解决方案,但往往一辆车的语音控制系统会在不同环节选择不同的供应商,彼此通力合作,才达到最终的效果。
除了我们上文中解释过的词汇,NLP(Natural Language Processing,自然语言处理)是把用户的指令转化为结构化的、机器可理解的语言。
语音控制是一个复杂的涉及语言学、计算机科学、电器工程等学科,云端和本地融合的一项复杂功能,往往需要车企的电器部门和多个供应商同时合作,以达到最好的效果。对服务商而言,想提供最好的产品,需要在语言分析、指令集上常年累月的积累,想做好,真的不容易。
啥?连续说?免唤醒?
OneShot连续说和免唤醒
在过去一年对车载语音控制的测试中,有两个“高频词汇”
- 标签:
- 编辑:孙子力
- 相关文章