


作家|江宇
剪辑|漠影
智东西5月15日报说念,昨日,豆包输入法macOS版说明上线,用户终于不错在电脑上径直“张嘴打字”了。

和传统输入法里的“语音转笔墨”功能不同,此次豆包输入法主打的,是一整套AI语音输入材干。
其背后禁受的是豆包App同款语音模子,重心强调“边说边出字”“中英文混说”“智能纠错”和“长文本输入”等材干。
面前,豆包输入法维持在职意对话框中及时语音转笔墨,且莫得时长罢休,相宜长案牍、演义、会议纪录等执续输入场景。
同期,它还维持中英文混说、多种方言识别,无需手动切换输入法,可自动识别语言。
在AI材干部分,豆包输入法加入了“智能纠错”和“个性化牵挂”功能,其能够自动修正部分口吻词、语病和口误,并破坏记取用户的改词风气,让语音输入越用越准。
此外,豆包输入法还维持轻声识别和抗噪材干,在办公室、咖啡店、藏书楼等环境中,也能进行低音量输入。交互模式上,则提供“长按”和“免按”两种决策。

某种进程上,AI语音输入正在成为新的输入趋势。往时,语音输入更多如故手机上的“临时替代决策”,但跟着Vibe Coding等场景越来越晋升,好多用户开动长技术“和电脑话语”。
面前,市面上一经出现了微信输入法、智谱AI输入法(小凹)以及Typeless等AI语音输入产物,其中不少一经开动收费。比较之下,豆包输入法面前免费推出,这偶然也会成为它吸援用户的一大上风。
那么问题来了:豆包输入法,的确好用吗?
此次,咱们从延时、华文准确率、中英文混说、方言识别、智能纠错以及个性化牵挂几个维度,对它进行了实测。
一、普通话险些边说边出,粤语还在等AI“补功课”
语音输入最中枢的问题,其实唯有一个:跟不跟得上东说念主话语。
在普通话场景下,豆包输入法举座线路如故比较表露的。不管是短句、长句,如故中英文混说,基本王人能作念到“边说边出字”。
主不雅感受下来,它的首字蔓延不祥会略高于1秒,完好意思句子的生成蔓延平日会戒指在1秒以内。况兼在邻接长文本输入经过中,它的举座卡顿感并不彰着。
但到了方言场景,尤其是粤语等复杂方言,体验就会大不相通。它不像普通话那样一句话刚说完坐窝就能识别,反而是“先听一遍,再靠AI后处理”。
好多时候,前半句险些没识别出来,背面才开动通过凹凸文少量点修正。部分长句以致会出现高出5秒以上的完好意思句蔓延。
原句(粤语):哗,露面作念乜倏得间落咁大雨嘅?係啰,明明头先仲好地地。死火,我赶住出去呀。不外依家大风大雨,好易湿身㗎。唔使惊!我带咗遮同埋雨褸添。王人係你够介意!
对应普通话:“哇,外面若何倏得下这样大雨?便是啊,明明刚才还好好的。厄运了,我赶着要出去呀。蕭汉过面前风大雨大,很容易湿身的。无谓怕!我带了伞还有雨衣呢。如故你够灵巧!”

比如在咱们的测试中,第一句“哇,露面作念乜倏得间落咁大雨?”其实被完好意思识别了出来,准确度是莫得问题的。
但到了后半段,识别扫尾就开动出现较大偏差,大部老实容王人莫得正确识别出来。
东北话的线路则彰着更褂讪一些。在咱们的测试里,除了“旮沓”等个别词汇出现问题以外,其余内容大体王人能正学问别。
原句(东北话):哎呀妈呀,咱东北这旮沓老好了,那雪下的老迈了,跟棉花套子似的。冻梨啃一口,甜津津的,拔凉拔凉的。铁锅炖大鹅,那香味老厉害了。

闽南语则基本属于“艰巨模式”。面前识别效用仍较差,好多句子险些无法正确转写。
虽然,这自身亦然统共行业里最难的问题之一。不同方言之间,口音、连读和词汇各异本来就很大。要是你自身会说方言,偶然也不错我方碰庆幸,它到底能听懂些许。
二、甄嬛传名处所没翻车,但番邦东说念主名如故有点难
华文准确率,是这类产物另一个中枢材干。
此次,咱们特地选了两个“难题”。
第一个,是《甄嬛传》“滴血认亲”名处所。因为文言式抒发、东说念主物称谓、停顿节律和长句结构,自身王人比较复杂,对语音识别其实很不友好。
原话:臣妾要告讦熹贵妃私通,絮叨后宫,罪拦阻诛。宫规森严,祺贵东说念主不得言三语四。臣妾若有半句虚言,华体会体育app官网便叫五雷轰顶,永不超生。我还认为是什么毒誓呢,死活之事谁又能知啊?可见祺贵东说念主不是诚意的了。臣妾以瓜尔佳氏一族起哲,若有半句虚言全族无后而终。

但履行测试下来,豆包输入法的线路比预期更褂讪。它在长文本输出经过中,能够执续进活动态修正。包括东说念主称、断句、标点,以致部分误读内容,王人会在后续识别经过中不休挪动。
最终扫尾里,文言抒发、标点标记和举座句意莫得伪善。这种“边识别边回改”的机制,近乎不错行动AI写稿经过中的及时润色。
第二个测试,则是科技新闻场景。咱们读了一段对于“马斯克诉奥尔特曼案第三周庭审”的内容,重心测试它对番邦东说念主名的识别材干。
这一部分难度更高。因为好多英文东说念主名自身就存在多种华文译法,况兼华文互联网里也莫得调处模范。
原话:马斯克诉奥尔特曼案插足第三周,被告方要津证东说念主接踵出庭,微软CEO萨提亚·纳德拉、OpenAI聚拢独创东说念主兼前首席科学家伊利亚·苏茨克维,以及OpenAI基金会董事会主席布雷特·泰勒作证。此前在第二周庭审中,马斯克方主导举证,OpenAI前CTO米拉·穆拉蒂、前董事海伦·托纳、塔莎·麦考利、前职工罗茜·坎贝尔,以及非谋利惩处巨匠戴维·希泽等证东说念主的证词和庭审材料接续浮出。

履行扫尾里,部分名字能够正确识别,但也出现了译名不调处的问题。比如“戴维·希泽(David Schizer)”并莫得被识别成常见译名,部分番邦东说念主名中间的分隔点“·”也出现缺失。
日常聊天问题不大,但要是是新闻写稿、法律文献或说明场景,后续如故需要东说念主工再查对一遍。
三、中英文混说准确率很高,“外企黑话”也能听懂
要是说方言是艰巨模式,那中英文混说,则是豆包输入法面前完成度较高的一部分。
不管是东说念主名、英文缩写,如故多样办公场景的常用语,它王人能较褂讪地识别出来。况兼,它对于中英文切换时的断句和标点处理,也比传统输入法当然好多。
原句:Jennifer,晚上跟Global的会议改到翌日清晨7点,你牢记reschedule一下。还有换个大点的meeting room,因为FinanceEric and HR的Susie也要参加,还有提前把要讲的topic再go through一遍。远程跟Laura说下,会上维护记下meeting minutes。so far我就念念起这样多,要是有新的update我再跟你sync。

好多时候,用户输出并不需要刻意减速语速。举座主不雅感受下来,中英文混说场景的准确率,不祥率一经不错褂讪达到95%以上。
对于外企办公的东说念主来说,这部分功能其实是比较实用的。
四、能计帐口吻词,但暂时还不会“主动润色”
比较识别材干,“智能纠错”其实是此次最让东说念主期待的功能之一。它波及一个问题:AI到底应该“诚恳纪录”,如故主动让AI帮你改。
从履行测试来看,豆包输入法面前举座偏上前者。比如一些简便口吻词,像“嗯”和“呃”之类,它确乎不错自动计帐。
但更复杂的白话化重叠、逻辑逾越或者临时改句,它面前还不会主动帮你重写。
举例们在测试时说:“我念念11点……分散,是11点半,请李铭喝咖啡。”

最终输出里,“11点”并不会被自动删掉,而是完好意思保留了用户原来的修改经过。
包括一些讲话经过中不休反复修改句子的情况,它也不会主动整理成更开放的书面语言,尽量保留原话。

面前,市面上一些AI语音输入产物,如Typeless和智谱AI输入法(小凹),一经开动粉饰“自动润色”“自动改写”等功能。它们会主动删除谣言、重组句子,径直帮用户优化抒发。
比较之下,豆包输入法现时的战略会更保守一些,强调对原始抒发的保留。
五、改错一次之后,它就会记取你的写法
个性化改词,是此次体验里最实用的功能之一。
比如在东说念主名场景里,语音识别频繁会碰到同音字问题。
第一次输入时,系统可能会给出伪善写法。这时候,用户只需要手动修改一次。比及第二次再语音输入一样的东说念主名时,豆包就会优先禁受用户之前修改后的版块。

遥远使用后,这种“牵挂”亦然是彰着感知到的。除了东说念主名以外,一些公司名、产物名或者固定术语,也存在肖似情况。这类高频独到名词,其实是好多东说念主日常语音输入里最容易反复修改的部分。
结语:不需要键盘了?偶然咱们更需要一个麦克风
比较键盘输入,语音输入最大的上风,其实一直王人是“更快”。
而在AI材干加入之后,语音输入也不再仅仅简便“转笔墨”了。及时修正、自动断句、凹凸文牵挂,以及更高的识别准确率,王人开动让它变得更实用。
2026世界杯比赛买输赢中国官网与此同期,语音输入的使用场景也在扩大。
往时,好多东说念主只会在开车、走路时偶尔使用语音输入。但面前,跟着轻声识别、抗噪等材干出现,办公室、咖啡店、藏书楼等环境,也开动能够正常使用。
某种进程上,AI语音输入法正在从头改动东说念主与电脑的输入样式。偶然将来好多东说念主念念打字,第一响应不是找键盘华体会体育app官网,而是先找麦克风。