除新鲜出炉的搜狗听写之外,科大讯飞的云犀、思必驰的语音输入板等,都是能够将语音转换成文字的工具。此外,仅在中国,除去普通话,大方言就有八种,各小地区方言更是多不胜数。这其中所涉及到的语音识别、语义识别、深度学习、算法训练等多个人工智能技术,难度不可谓不大。
很显然,与一直致力于语音识别领域技术开发的企业相比,搜狗在专业程度及行业经验方面都有不做。而除去这些专业性企业和产品之外,当下很多输入法及搜索工具也有类似的功能,搜狗并没有赋予搜狗听写具有差异化竞争力的功能。在市场逐渐开拓的当下,搜狗想要凭借搜狗听写搏得一方市场,显然不容易。
在语音转化文字方面,除去偏C端的工具外,专业性系统或软件也有很多,例如科大讯飞的听见智能会议系统。在大多数的专业性会议,主办方都会聘请的专业速记人员。而与前几年相比,现今的速记工作已经有了更多人工智能的参与。
只是这其中存在着一个的现象,当前的语音转写技术并不能一力承担整场专业性会议,还需要有专业速记员全程盯着,实时进行纠错没有识别出的内容、标点等。
科大讯飞负责会议现场速记的一位专业速记员表示,在以科大讯飞听见智能会议系统为主导、没有纯正方言的情况下,正常会议速记工作的人工参与率是5%-10%。
不过,在人工智能相关技术不够成熟的当下,这样的人工参与率已经是很低的了。虽然目前我们并不能做到完全智能,但仅就速记AI领域来说,有了专业速记员的配合,不仅能够保证速记内容的,还能为提供更为直观的现场反馈,为技术的进一步发展助力。