乍看话题感觉博主想问的是「手机可以取代录音笔吗?」

这个话题感觉有些似曾相识,似乎在问:「手机拍照能媲美单反吗?」 但是该话题下大多都是回复一些「别人拍摄的优质作品」,而忽略了在同样的构图下,拥有大感测器的单反和手机拍出来的照片有什么区别。

如果是这样的话,我先把话题扯远一点

不知道从什么时候开始,手机变得无所不能,替代一切。

从纯粹的打电话发简讯到如今的社交娱乐、购物、刷脸支付、IOT,以及「国家力量」介入的eID数字身份证和电子货币,手机功能日渐强大,惊叹科技发展迅速。

直到有一天,有个人让它飘了,让不少人出现了常理认知偏差,那个人赋予了手机吊打单反的参数,让富士等老牌厂商都瑟瑟发抖,用超越PC级散热的实力,让酷冷都为之点赞,让ZOL都惊叹某款手机与万元游戏本对战毫不逊色,让用户为之沸腾。

在如此浮躁的互联网环境下,作为消费者应该要明白自己的根本需求是什么,到底想要解决什么问题,这样才能购买到最适合自己的产品。

我们回到话题本身「手机为什么不能替代录音笔」,或者换个更直接一点的说法:我花了1W+ 买了 iPhone 11 Pro Max 在录音方面究竟比专业的录音笔差在哪里?相信在大多数人认知中,这款手机已经可以代表了目前市面上你能见到的最好的手机录音设备。

我们先来看手机

全面,你想要的功能几乎都能找到。其次,以前出门是钥匙、钱包、手机,现在出门什么都可以不带,手机是必带,所以手机的最大优势是就是全面和出门必带属性。

我们聚焦到录音上,从iPhone 6s开始,iPhone麦克风增加到了4个,4个麦克风配合可以实现一定的主动降噪能力。在录音时,这4个麦克风还不是同时工作的…这还只是1W+的iPhone,又多少钱是用在音频上,用在麦克风上?其它手机品牌又能达到什么效果呢?

图片来源@ Referline

DXOMARK Audio测试

在DXO音频测试中,iPhone 11 Pro Max 录音也仅68分,这个分数在手机当中并不算好。主要低的分数在力度、空间感、音损和背景上。这还是在实验室测试的情况下,如果放在生活中使用,效果会更加的糟糕。

在实际使用中,比如在相对安静的房间里录个旁白音,也得需要用软体拉一拉。同时录制时候也得需要把飞行模式打开,以防来个微信或者电话,这样的话势必会有不便捷之处。在听课、听讲座都需坐在靠前列或者把手机放在讲台才能录清楚。脑暴开会时更恨不能把手机怼到对方脸上,只要你不尴尬,这些都是用手机录音麻烦的地方。

所以答案很明确,偶尔用,非专业,能忍耐,那么手机录音可以满足你能「录」的需求。

我们再回到录音笔

其实早些时候,录音笔大市场确实处于一种下滑萎靡趋势,是「存量市场」,传统录音笔除了在「存储空间」上更新以外,再无更多的创新内容能够触发已有录音笔人群的「更新换代」,另一方面非「专业、高频」需求的用户被智能手机代替,就是上边所提到的简单需求用户。但是你要知道,录音笔使用最多的人群是媒体、商务、教育或者是科研工作者、法律领域等,传统录音笔行业也一直处在一种基本稳定的发展趋势,手机对录音笔行业影响真的没有想像中的那么大。

那么对传统录音笔冲击最大的是什么呢?

是智能录音笔的出现,是对录音笔行业的一次重新定义,一次洗牌。

智能录音笔都有哪些优势?

目前智能录音笔能做的仅有几家,讯飞、搜狗、飞利浦等。因为这个领域并不像PC那样,可以从各品牌买来硬体堆上,再刷上一个公版系统就好,而是需要有专业的「语音技术」支持。我这里以头部品牌讯飞为例,前不久刚刚发布了新一代录音旗舰产品SR702。

SR702 有如下特点:

  1. 录音实时转文字:据官方数据显示,联网情况下转写正确率高达98%,离线准确率也达到了95%
  2. OCR文字提取:配备800W像素摄像头,可拍照提取文档、PPT、或者图片中的文字,而且识别准确率也相当不错,同时还支持视频录制自动生成字幕的功能
  3. 旗舰级麦克风配置:2 颗定向+ 6 颗矩阵麦克
  4. 多语种识别:多语种转写包含12种方言、8种语言以及2种少数民族语转写
  5. 易用的编辑:录音的同时可以支持标记内容;通过自主研发的空间-时间感知多通道神经网路与传统信号处理深度结合的降噪演算法(SSA-IME)相结合,在多人交谈时,精确区分各个音频捕捉到目标说话人将内容转写并分段呈现;,同时还可过滤一些语气词,还有非人声和无声片段,方便后期编辑,提升编辑、出稿效率。

以上5点是讯飞SR702的核心优势,其是独家首发的离线转写功能,可以实现在没有网路的情况下仅靠设备本身即可完成转写,解决用户在无网路环境下对想要保密信息进行记录转写的痛点。OCR文字提取的加入,也让录音笔的功能更加聚合,体验进一步提升。

在大的会场、或者教室等场景使用,定向麦克风收音就格外重要。定向麦克风一般只有专业录音笔才会配备,比如售价3999元的索尼 D100。而SR702同样采用的是旗舰级别配置,2颗直径10mm的哈曼向麦克最远收音可达15米,可以说是录音笔品类中拾音距离最远的产品,搜狗旗舰录音笔S1也仅有10米远。6颗矩阵麦克风主要起到近场收声的作用,可以清楚记录不同位置的发声,降低声音的重叠。

对于经常外出采访的记者来说,多语种识别功能相当于身边跟著精通12种中文方言和8种语言以及少数民族语言的助力,转写、沟通都不再是难事。

了解完以上智能录音笔的功能,每一个点都具有让你事半功倍的能力。其实还有更多的易用、加分的功能,比如多端同步,编辑、分享等;比如音乐模式,这是很多智能录音笔所缺失的,因为场景及需求对录音笔的拾音有著较高的要求比如还原性、采集能力、录音产生的底噪等;比如在工业设计上,SR702采用了3.5英寸屏幕、3D陶瓷背板设计,很有美感。

买设备送服务,同时购买设备还附送专属的会员服务,以及3年20GB云空间服务,这些都是加分项。

科大讯飞AI智能录音笔SR702终身免费转写 中英文边录边京东¥ 3699.00去购买?

我们从新回到话题本身,手机是否可以取代音笔。其实在我看来手机并没有取代什么,有的人说手机替代了日历、手表、替代了计算器,音乐播放器,真的吗?手机只不过是让那些轻度需求,可买可不买的人不用买而已。虽然手机很先进,有很多功能,蚕食了部分轻度市场。但在专业领域,还需要交给专业设备。


我只用过搜狗录音笔,相比于手机录音,录音笔有几个优点:

  1. 用于多人对话(包括同时发言)的会议环境时,每个人声非常清晰;录音笔录出来的结果很好地过滤了环境音(比如频繁翻阅材料的声音),至少这种环境音没有影响到人声的清晰度。
  2. 体积小,非常隐蔽;(ps:有些会议会收手机,但是很少会搜身呀
  3. 可自动转为文字。虽然事后仍需要一定时间来编辑和校对文字,但是仍然比从零开始听写一段录音要方便点;文字识别能力的准确率差不多在80%左右吧。考虑到我用于测试的会议中有位发言者有严重口音,我觉得这个准确率还是可以接受的!
  4. 自动翻译功能,反应很快,可以考虑作为即时翻译用。当然太专业的辞汇和口音太重的情况翻译不准。我自己畅想了一下,旅游用来做个基本翻译还是可以的。
  5. 容量大,不需要考虑内存的问题。
  6. 不会因为接听电话而受影响,当然录音过程中也不会影响你使用其他手机功能。
  7. 覆盖距离很适中。我参加仲裁庭开庭时,最远的人大概有5米,录音中可以清晰地听到他们的发言。

===========我是更新的分界线========

我注意到这个问题下搜狗自己来做广告了。。。不过他们推的那个啥S1实在是太难看了!也完全没有隐蔽性啊!

我买的是好像是C1。这个样子(从网上找的图,请无视广告文字。。。)


一、硬体配置层面:录音笔相比于手机具有哪些专业的硬体配置?

我作为一名研究生,由于参与导师的看项目,常常需要前往各个地方进行调研。调研的形式多种多样,比如问卷、访谈、座谈等都是比较常见的形式。但人记录的效率始终是有限的,所以我们往往会借助外部的工具来提高数据收集,资料整理的效率,录音笔就是典型的调研生产力工具。

或许有的同学会觉得使用手机录音就行了,其实不然,由于调研的环境往往差距较大,可以是环境舒适的会议室,也可能是环境嘈杂的田间地头,很多时候你无法控制录音的环境变数,只能去主动适应。

手机的录音麦克风主要是隐藏式设计,原本就是用于通话或者视频声音信息的采集,而非专业的录音工具。所以手机录音的效果容易受环境的干扰,并且手机录音的码率规格比较低(iPhone 甚至都不能设置规格)。录音效果不佳又会导致复听难度大,特别是遇到喜欢讲方言的采访对象,那就只能"打猜猜"。

科大讯飞AI智能录音笔SR702终身免费转写京东¥ 3649.00去购买?

而录音笔则会设计专业的定向麦克风和矩阵麦克风,比如我手上这台讯飞智能录音笔 SR702 就在顶部设计了 2 颗直径 10mm 的定向麦克风,正面的中框部分则是 6 颗矩阵麦克风,用于拾取其他方向的人声。而且讯飞为其加入了 Focus++ 智能降噪技术,根据场景主动识别人声,同时降低环境音干扰,让拾音更加清晰。

在录音距离方面,因为缺乏定向录音设计,手机录音往往就跟人耳一样,离得远声音小。而专业的录音笔,如讯飞 SR702 通过定向麦克风+深度定制的 VoiceCube 声立方技术,最远拾音距离达15m,能够轻松应对各种商务场景。

为了方便不同的录音场景,讯飞 SR702 内置了多种录音方式,比如会议模式、演讲模式、采访模式、通用模式、备忘模式、音乐模式等。讯飞 SR702 的录音格式为 AAC / WAV,在码率方面,音乐模式能到达 48KHz/768kbps,其他模式为 32KHz/512Kbps,而节电模式是 16KHz/256Kbps,尽可能的实现了录音规格同需求的匹配。

在外观方面,讯飞 SR702 搭载了一块 3.5 英寸的 720P 屏幕(445PPI),这在录音笔中算是豪华配置了。中框机身选用了航空铝材,录音笔的背面是 3D 陶瓷背板,触感温润,握持舒适。硬体配置方面,搭载了八核处理器(主频2.0GHz)、拥有 3GB 内存+ 32GB 快闪记忆体 + 20GB 云存储组合(购买附赠三年云空间),2600mAh息屏状态下可持续录音12.5小时,基本上接近一台中档入门手机的配置了。

讯飞录音笔的侧面分布著按键,左侧是录音键以及音量+-键,右侧则是电源键和 Nano-Sim 卡插槽(支持 4G 全网通),可以放入 4G 手机卡便于连入 4G 蜂窝网路,也可以接入 2.4GHz 与 5GHz 无线网路,多种网路连接方式能够保证录音笔在各种环境中都能接入伺服器,实现准确高效的转写。


二、场景体验层面:好的录音笔应当具备哪些优异的功能?

第一部分,我们主要聊了手机和录音笔在专业硬体方面的差异,第二部分我们重点来看看功能方面的差异。

1??【录音对比】:首先我们来看看录音对比,我在安静和嘈杂两种环境中测试讯飞 SR702 和 iPhone 11 Pro 的录音效果,朗读的是《沁园春·长沙》。

在安静的环境中,iPhone 和 讯飞 SR702 之间的差距并不明显,无论是频谱图还是录音质量都比较接近。

《沁园春·长沙》(无噪音)Geek研究僧的视频 · 172 播放

但是我试了下在 85-95dB(A) 的环境中再录了一遍,首先从频谱图上来看,iPhone 11 Pro 已经糊成一片,讯飞 SR702 基本还能看清说话时的轮廓。

从有噪音时的录音对比视频可以看出,iPhone 录音噪音很大,但仍能听清人声,讯飞 SR702 听到的噪音相对少了一些,人声会更加突出一些。

《沁园春·长沙》(有噪音)Geek研究僧的视频 · 104 播放

2??【录音转写】:录音文件只是第一步,接下来需要把录音文件转化为可以直接阅读编辑的文本资料,所以就需要转写。过去我们常常是通过人工的方式复听+转写,得益于技术的进步,如今已经可以通过语音识别技术直接将音频转化为文本内容。在手机上只能借助第三方软体,比如讯飞听见、搜狗听写、有道云笔记、Noted等等,基本上都属于付费应用。

而讯飞 SR702 这样的专业级录音笔,不仅内置了录音转写这项功能,而且支持实时转写,这是什么概念?等于你可以在录音时,检查转写的内容与被录音者想要表达意思是否相符,现听现改。

想像一下,在课堂里、会议上、访谈中只需要点击录音,简单记录下主体框架。借助录音转写就能够复盘填充出完整的课堂笔记/会议纪要/访谈资料,就问你们厉不厉害。

下面就是一段我口述录音的转写过程,可以看到讯飞智能录音笔 SR702 在录音实时转化为文字时,识别的转化速度和准确性都相当不错,而且录音还具备离线转写功能,如果遇到网路信号差的场景或者具有保密需求的场景都可以离线转写。

如果没有来得及联网转写,也可以后台转写服务。后台撰写在录音上传云空间后,24小时内完成转写。选择"加速转写",只要在 5-10 分钟内就能完成转写,也可以通过网路分享给其他人。

这款录音笔也号称拥有 98% 的录音转写准确率,实际感觉上语速中等,没有出现人名、发音不标准的情况外基本都是正确,这点和讯飞自己的语音识别技术积累是分不开的。所以我又给讯飞 SR702 加大难度,上了半佛老师的新视频。可以看到,虽然半佛老师语速太快,讯飞听成了「半bo」,但总体的内容完整度还是相当不错,改改拿来当文案足够了。

然后我还挑了一个视频,遍数「不知妻美刘强东,悔创阿里杰克马,一无所有王健林」,总体来看,王总的发音比较难辨识,小马哥和强东哥的录音区分度都相当的高。

至于文本内容与发言人的各自对应关系,这还涉及到一个区分的功能,所以讯飞智能录音笔 SR702 加入了对录音语义自动分段,还能够规整口语、过滤非人声、标记书签,甚至区分讲话人,筛选重点内容,这样就不怕遗失重要领导的讲话内容了。

不过因为实际录音中会有吵杂的背景噪音,并且人声之间会有相近之处,还是会存在串台词的情况,在录音笔中只能对系统区分的讲话人进行统一命名,而不能单独命名。导出的转写内容也没有像录音笔端那样区分了说话人,我觉得这是讯飞后续可以考虑强化的体验部分。

此外,讯飞 SR702 还提供了外语、方言以及专业领域转写的功能,之前我和老师去一个县级市调研,领导们操著一口当地的方言,当面都要猜他们讲的什么内容,更别说后面复听录音了,简直就是噩梦级的转写体验。现在有了讯飞 SR702,我觉得就不用怕之前那种情况了。

3??【OCR对比】:OCR 功能也是相当重要的生产力功能,对于学生党和行政工作人员而言帮助颇大。比如你看到一段无法复制的文献/书籍/手写稿时,就可以通过 OCR 功能把它拍下来转换成文字内容,不用如过去一般,一个字一个字的敲。

手机的 OCR 功能同样需要借助第三方 APP,诸如扫描全能王,而讯飞 SR702 则是把 OCR 功能集成在菜单中,通过一颗 800 万像素数字变焦摄像头+闪光灯,可以有效的拍摄文本内容,便于提高识别精度。

从对比的效果来看,讯飞 SR702 和扫描全能王相比,在中文的识别上不相伯仲,但扫描全能王的英文内容还加入了空格,讯飞录音笔却忽略了,我觉得这是后期需要重点改进的方向。

5??【其他功能】:讯飞智能录音笔还有一项看起来非常厉害的功能,就是中英互译。SR702 结合讯飞TTS语音合成技术,可以通过边录边译的方式实现中英互译。比较遗憾的是在翻译完成后,不能将内容通过语音合成的方式发音出来。

虽然不能播放语音,但文本的形式对于英语学习者也很有帮助,比如我在刷生肉时,就可以用讯飞SR702 辅助,如果遇到听不懂的内容,就用它翻译一段,提升理解。

此外,讯飞SR702 还具备语音助手功能,可以通过语音开关录音,并能够选择录音的模式等,不过我感觉存在感不强,还是那个双击侧面按键开始录音的模式比较高效一些。


三、如何评价讯飞智能录音笔 SR702 的使用体验?

经过本文的对比展示后,相信大家已经对手机和录音笔之间的差距有了一个清晰的认知,首先是在硬体层面,手机只能借助隐藏式的麦克风来简单录音,讯飞 SR702 则拥有专业级的录音麦克风硬体+讯飞智能录音演算法,可以更加准确高效地满足专业化录音需求,并且能够消除手机无法处理的环境噪音以及远距离录音场景。

除了录音的专业性差距外,在功能性方面,手机需要借助第三方付费 APP 才能够实现录音转写、OCR、边录边译等,而且在准确性上也参差不齐,取决于软体供应商的水平,并且软体与软体之间没有打通。讯飞作为软体出身的品牌,通过 SR702 录音笔进一步打通了功能之间的壁垒,实现了录音信息的最大化整合和利用。这是手机所无法企及的,只能期待专业级的第三方 APP 同手机深度定制才能达到这种效果,然而目前尚未见到系统级的应用出现。

讯飞 SR702 已经拥有了很高的集成度,所以专业的事情还是交给专业的工具来完成。并且目前讯飞为用户提供了专属会员(终身免费转写、翻译等),激活之日起,还赠送 3 年 20GB 云空间服务,基本上属于一步到位,没有太多额外的开销,省心省事,这点是我非常看重的。这些年学习我也没有少买那些电子词典一类的辅助工具,基本上都是硬体成本+软体付费的套路,用的让人心累。

当然讯飞 SR702 也有几点值得改进,首先是是录音笔实时转写功能目前还不能直接保存,只能作为观看辅助,希望在后续能够加入保存功能。其次是录音转写的文本信息目前不能直接在录音笔中编辑,需要后期的处理,这对于资料整理多了一项导出的步骤,多人录音的区分度和可编辑性上也有待加强,希望它能够直接对文本内容进行编辑,打通从录音到文本的最后一公里。

分享到此结束,感谢您的耐心观看,我是Geek研究僧,一枚爱好评测的研究生。


我觉得录音笔单独存在的原因主要有2个:

1.手机硬体方面不是专门为了录音设计

比如:手机自带的麦克风录音效果达不到要求

索尼的有两个麦克风,每个和拇指差不多大小;手机麦克风估计只有索尼录音笔麦克风的1/20大小,他们的收音效果能一样么?

比如:专业的电路设计带来更高的信噪比

做个简单的比喻,手机就好比磁带,再怎么搞也无法突破磁带效果的极限,录音笔好比CD,在设计上(原理上)天生就比磁带音质好。

2.软体方面,录音也需要很多专业功能

比如:更好、更高码率的录音格式支持

比如:专业滤波器、限幅器

比如:高品质的降低环境噪音、突显人声等专业演算法


用过科大讯飞的999和1999款录音笔,2019年9月购买,大小会议有10几场,主要应用场景就是转写(主要吐槽转写)

先说优点:1.如果是日常场景对话,没有嗯嗯啊啊什么的,感觉准确率能有95%,可这场景太少了,基本都是开会用。2.行业会议,看转写结果能回忆个大概其实还是蛮有价值。实际上准确率80应该是有的,直接用肯定不行,实际体验不佳,差10%以上会对理解产生不小影响,在使用过程中如工控,it系统辞汇大半识别不对,对于外行来讲,现场听都似是而非,看转写的结果就是灾难性的,可用性低。如果你本身很懂,连猜带看那价值就高不少。3.看了下文的高赞回答,律师行业应该比较适用,毕竟都是日常会话居多。如果是大数据,工控领域就惨了。缺点:1.神奇的电量:有两次要开会发现不能开机了,周四用1次(满电到94),关机状态下,下周四再用就无法开机了,电量0,以前以为是误操作,试了2次都这样,换了1999的机器系统也升级基本没改善。录音本身不费电,但关机过夜很费电...2. 准确性:it类,工业类会议,再加上2,3个发言人,结果可用性低,需要大量的人为修正,有时还不如自己手动方便。3.转写效率:标称1小时录音5分钟,但这东西上传云后没准,快的时候20分钟半小时,慢的时候上午的会,晚上下班到家还没出结果,不过一般当天都能出(登录帐号后下载word版本)。不知道现在有没有改善。(这条不算缺点)4. pc端登录,我记得有个边听边改的页面,对照录音位置和文字,结果就是一个退格键能毁所有。简直反人类,希望现在改进了。4. 费用:买机器送1年的转写免费,不知道现在的活动,付费转写20分钟8块的样子,一次费用30+。不会再用,结果不可用还收费不便宜。5. 会员期间,非录音笔录音,外部上传录音撰写收费,(如果有方法,欢迎指正)6.录音质量:都是在会议室录音,录音外放后没觉得比水果手机有明显的差别。实发场景:10人桌的会议室,发言人声音小,录音笔在对角一样无法转写。(耳朵能识别小声的录音笔不行)

==================

补充:

用它开了10个会+吧,大概有点发言权,隐蔽性不提了,肯定不如手机+飞行。999的可以放在衬衫口袋,1999的大了一截衬衣口袋放不下。行业会议,如果是业内人士,看转写结果能回忆个大概其实还是蛮有价值的(注意word动辄20-30页的无脑分段也很蛋疼,但绝对比听90分钟的录音效率高很多)。刚京东看了下,现在买机器,应该是终生免费机器转写了。附在用设备图一张

1999元款

推荐阅读:
相关文章