语音转写文字 方言也能转写 录音笔原来可以这么玩
前段时间,老罗直播带货了一款搜狗录音笔,有人借势把它吹得神乎其神,也有人质疑它的实用性,这让我很纳闷儿,到底该信谁的?想来想去还是决定自己入手一支,亲自验证一下这东西到底咋样,也顺便给读者一个更加中立、客观、公正的答案。
首先要说的是,为了压缩成本,我选择了更便宜的搜狗AI录音笔E1,毕竟写这篇内容是不赚钱的。老罗带货的那款S1虽然更高端,但是对我来说有点贵,考量再三还是放弃了。
搜狗AI录音笔E1的核心卖点有两个:一个是降噪功能,一个是转写功能。前者主要是为了录制更高质量的声音,后者则是为了能更快更准地转出文字。我重点验证的就是这两个方面。
降噪:3个地方分别测试,验证降噪效果到底行不行
为了更加真实地了解搜狗AI录音笔E1的降噪效果,我分别在三个不同的地方模拟了录音。
1.商场测试:首先我和搭档来到附近一个人流较大的商场,那个商场里面的声音很杂,人流走动的声音、广播里的音乐、中央空调的风声、摊位的卖货声等,各种声音夹杂在一起,听起来非常吵。测试时搭档手持录音笔即兴讲话,她没有念稿,也没有事先准备,想到什么就说什么。
录制结束后我立即听了一下。老实讲,这款搜狗AI录音笔E1在商场里的录音听起来确实要比普通录音设备好很多,当时我们用手机录制了同样的声音,对比起来差别明显。手机就是将所有声音都录进来了,听起来一团糟,而搜狗AI录音笔E1的声音就像是在室内采访一样,质量非常高,人声很清晰。
但是,它和想象中那种干干净净的人声并不一样,周围的噪音虽然大部分被过滤了,但是还是可以听到,只不过搭档的讲话声明显比噪音更强更清晰而已。
2.街头测试:然后我们来到大街上,站在马路边验证一下效果。大街比商场的噪音要多得多,车声、风声、商店的叫卖声、人来人往的声音等,各种声音都有。搭档还是手持搜狗AI录音笔E1,即兴讲话。
在街头的录音效果其实也是很不错的,只是录音里明显能听到更多的环境音,比如车的喇叭声、人的叫喊声等。但是搭档的讲话声还是特别清晰、质量很高。
不过,我发现有一种噪音搜狗AI录音笔E1过滤效果一般,那就是其它人的讲话声。比如,我们在测试的时候有一家店铺放的“九块九”推销广告,音量很大,这种声音就被录下来了。我猜搜狗录音笔的降噪机制是:只要是人声就收录进来,其它声音会过滤掉。这比较适合在开会时使用,每个人发言都能被清晰记录,但是如果街头采访某一个人,还是要尽量避开其他人(或者其他人声)。
3.家里测试:最后我们回到家里,模拟人为噪音。我让搭档在吹风机旁边讲话,然后把吹风机打开,就像下图一样:
在这种情况下,搜狗AI录音笔E1对吹风机的噪音过滤是很出色的,相比于商场和街头的录音来说,这种降噪效果非常直观。明明听起来很吵了,但是录音后吹风机的声音几乎没有了,只有讲话声。其实这也很容易理解,吹风机的噪音频率是固定的,这样过滤起来自然要比商场里和大街上简单很多。
●小结:本想着再去大学校园里蹭一节课,试试在课堂上的效果,无奈疫情原因至今没有开学,所以作罢。总的来看,搜狗AI录音笔E1的降噪效果非常明显,至少能给个90分吧!它能把人声以外的绝大部分声音都过滤掉,这个打消了我的顾虑。但是,它的降噪能力并没有网上说得那么邪乎,有人说“达到了录音棚级别的效果”,我觉得还有点距离。如果真的那样录音棚般的无损,恐怕搜狗AI录音笔E1至少要再加价1000块。
特别提醒的是,使用搜狗AI录音笔E1时必须手动选择降噪模式才能降噪,网上有些人黑它降噪效果不好,很可能是拿过来直接就按录音键了,没有手动选择降噪模式,这个锅不能让搜狗AI录音笔E1背。
转写:速度、准确度测试,验证转写能力行不行
关于语音转写文字,我最关心2个问题:转写速度和准确度。
1.转写速度:搜狗AI录音笔E1号称“录音1小时转写5分钟”,我用它事先录制好一个1小时的讲课录音,然后从转换开始计时。
这个录音长度是1小时多一点,最终转写完用了5分零2秒,和官方说的非常接近,我最初怀疑这可能是巧合,于是我又录制了一个49分多的录音,最终转换时间是4分21秒。如此看来,搜狗AI录音笔E1的“录音1小时,转写5分钟”其实是靠谱的,它的转写速度真的非常快!
不过,有一个细节很容易被忽视。从录音到文字的转写过程,中间还涉及到上传到加密云端和音频解码两个步骤,如果算上这两个步骤的话,那么同样是1小时的录音,总时间要多出2分钟左右。
2.转写准确度:为了感受一下准确度,我先是照着网上的一篇新闻念了一遍,然后又模拟了谈话。首先要说的是,我本人东北口音,普通话不是特别标准,但是感觉还可以。
我念的新闻稿全文275个字,转写完成后,文字内容和新闻稿一字不差!只是漏了一个逗号。而且我录制了三次,每次都是那个逗号漏掉(刻意停顿也不行),其它地方全都是对的,这准确度我服气!
不过我觉得念新闻稿可能太简单了, 所以我就录了一些我和搭档的闲聊,果然,比之前念新闻稿要差了一些。错字方面还是很少的,只有两个同音字和一个名字转错了。标点符号错的比较多,有的疑问语气没有识别出来,用逗号代替了问号,还有几处标点符号丢失。不过,总的来说上下句通顺、语音的中心意思也比较清楚。
●小结:经过多次测试体验,我可以很负责地说,搜狗AI录音笔E1的转写速度非常快,1小时的录音,5分钟真的可以转完。准确度上,即使在发音没那么标准的条件下,也能把90%的意思转写清楚,有些场景下还可以接近完美地转写文字,比如朗读文章、录制网课等。但是在录制一些多人会议的时候,特别是口音不标准、口头禅多的情况下,东一句西一句,这时候转写效果确实要打折扣。它容易转错的地方主要有以下几个方面:同音字、人名和地名、口头禅、标点符号等,其中标点符号是最容易转错的,需要后期修改。但总的来看,它能够大大提高后期文稿的整理效率,所以有人质疑它的实用性,一棍子打死,我觉得不够客观。
总结:
通过自己的反复测试体验,我对搜狗AI录音笔E1的两个核心卖点已经心里有数了。网上有人吹捧,有人黑它,可能是出于各种各样的目的。但从我自己的感受来说,我觉得搜狗AI录音笔E1好用,值得买。
首先是对于那些单纯追求录音质量的人来说,降噪后的录音质量真的很高。其次是对于记者、老师、学生、行政白领这样的群体来说,采访、备课、录课、备忘,说说话就能快速转文字,而且准确度非常高。但是,它并不是全能的,原来我以为它能把很多人参加会议录音转写得分毫不差,但受各种各样的因素影响,实际转写的文字需要手动修改标点等地方,和我想象的有一些差距。但是平心而论,能做到这个程度其实已经很不赖了。
总结起来就一句话:搜狗AI录音笔确实很好,但也要考虑好3个问题:什么人用、怎么用、干什么用。它只是一个工具而已,过分吹捧它、黑它都是不客观的。