智能降噪、獨立4G聯網、63個語種隨意切換,搜狗AI錄音筆“玩花招”
功能方面,搜狗S1幾乎考慮到了用戶的所有需求。
近幾年來人們手中的錄音設備經歷了質的變革,在傳統錄音筆的多模態錄音、播放以及編輯的基礎上,越來越多的廠商也賦予了設備“AI”能力,并基于此能力為錄音筆開發多樣化功能。
就在前不久,國內AI錄音筆賽道重度玩家之一的搜狗在線上發布了最新兩款產品,分別是S1和E1。發布會后,鎂客網也拿到了一部“S1”,并進行了數天的深度測評:
3.5寸大屏+納米注塑工藝,風格硬朗、便于攜帶
拿到產品包裝盒,S1的機身造型赫然映入眼簾,而在包裝盒背面,則以文字和圖片的形式簡單囊括了S1的四大特色功能,包括麥克風陣列超強拾音、錄音準確轉文字、根據語義智能提取重點以及語音翻譯。
S1整體包裝以黑色為主,除了S1機身之外,另外還有充電器、Type-C接口充電(數據)線、保護套、防風罩等配件,以及一份說明書。
S1整機重146g,拿在手上較為輕巧,一只手便能實現全部機身操作,可以如同手機一般揣到兜里,做到隨用隨拿。機身內存為64G,電池容量2450mAh,從0%充電至100%僅需2個半小時,能夠持續錄音10個小時以上,對于多數用戶而言已經綽綽有余。
機身主色調為黑、灰,機身正面配有一個3.5寸觸摸顯示屏,便于部分功能調用、實時查看語音實時轉錄和翻譯的進度和內容;背面由樹膠打造,經磨砂打磨處理,上面印有搜狗的logo,也貼上了防滑膠墊;邊框采用納米注塑工藝和6系鋁材質。S1整體看起來,帶給人一種干練、硬朗的商務感。
機身頂部設計為鏤空樣式,配備2顆哈曼駐極體指向麥克風,大屏左右兩側對稱分布了6個小細孔,內置6顆全向麥克風,形成8麥陣列,實現360°拾音。機身底部為Type-C端口和揚聲器。
其他方面,機身左側排列有電源建、音量調節鍵、3.5mm耳機插孔和SIM卡槽。卡槽的加入讓S1也能夠實現4G聯網,讓用戶在沒有WiFi的場景中也能夠實現錄音的上傳、轉寫、翻譯等等。
而在機身右側,除了錄音開始/暫停鍵,S1還擁有了一個全新功能鍵“M鍵”,通過短按、長按,用戶可啟用重點標記、語音助手等功能。
智能降噪、遠程拾音,多場景針對性進行錄音
作為一款錄音筆,S1最為基本的功能就是“錄音”,但這件事并不是那么簡單就能做好。
1對1采訪時,聲源方向是相對單一的,人們一般會將錄音設備的麥克風指向聲源,但周遭的雜音會往往帶來一定的干擾;會議過程中的聲源則是多方向的,最終錄音文件中的人聲有的清楚有的模糊,音質不一……
在“錄音”方面,傳統錄音筆在過程中會將所有的聲音都收錄進去,其中聲源的距離、方向以及周遭的雜音均會帶來影響,為后期整理增加難度。這方面,S1針對性的提供了4種錄音模式,覆蓋場景包括會議、采訪、聽課、音樂。
基于clairVoice8麥克風陣列算法,S1能夠針對不同場景的錄音需求進行智能調整,以實現360°拾音或定向拾音,打造一個好的收音效果。經實際測試,10米范圍內,S1在安靜或雜聲較小的環境內的錄音還是清晰的,轉寫準確率也處于高水平。
與此同時,S1還運用了pureVoice AI降噪算法,提供三種降噪模式:真實音質(保留真實人聲和環境音)、人聲增強(過濾環境音,顯著增強人聲)、純凈人聲(深度刪除環境音,僅保留人聲),讓用戶在使用過程中能夠依據自身需求進行選擇。
選定錄音模式和降噪方式之后,用戶短按REC鍵即可一鍵開始錄音,過程中可隨時更換語種,以及暫定或繼續錄音。當錄音結束并保存本地之后,用戶可點擊機身屏幕主頁面的“錄音文件”查看錄音情況,若先前忘記選擇降噪方式,用戶也可點擊錄音詳情頁下方的“降噪方式”,打開“純凈人聲降噪”以聽取降噪處理之后的錄音。
為了測試降噪效果,筆者一手拿正在運作的吹風機(與S1距離60-70公分),一手拿S1進行錄音(會議模式,機身距離嘴部約50-60公分)。依據測試成果,在80-101分貝干擾聲的環境中,S1經降噪處理后的錄音依舊存在少許雜音,不過人聲部分聽起來相當清楚,最終的轉寫效果即使受到了一點干擾,但已能夠滿足基本需求。
實時轉寫、翻譯,告別難懂方言和外語小白
相比于傳統錄音筆,AI錄音筆最大的特色在于語音識別與轉寫、中外文互譯。
在實時轉寫方面,目前S1除普通話外還支持10種方言和9種外語,覆蓋粵語、東北話、南京話、英語、日語、法語等。
需要注意的是,過程中每當息屏或是連續轉寫10分鐘后,系統會判定用戶未關注轉寫內容而暫停轉寫。若用戶還需繼續使用該功能,記得手動在錄音界面發起繼續轉寫。
針對實時轉寫功能,鎂客網以一段24分鐘時長的采訪錄音進行測試,原始錄音文件以中文為主,間雜少量英文詞匯的全拼及縮寫,測試結果顯示實時轉寫的速度延遲小,但在識別準確度上還存在些許誤差。
在錄音結束后,用戶也可以選擇在錄音詳情頁將該文件全部轉寫成文字。本次測試用的24分鐘錄音轉寫共用時3分30秒,轉寫準確度較實時轉寫有所提升。
S1官方介紹稱可準確識別財經貿易、醫療、IT 科技、政法、文化體育這5大領域的專業術語,實際測試中,不管是實時轉寫,還是錄音完成后進行的轉寫,涉及專業詞匯的轉寫都比較準確。值得注意的是,基于新增的M鍵,搜狗為S1增添了一些人性化功能,包括一鍵標記重點,便于系統基于NLP等技術提煉重點,用于后期查閱和快速定點回聽。
若用戶急需在眾多保存的錄音中找到某一段,也可長按M鍵喚醒智能語音助手,經由語音交互找出自己想要的錄音記錄。
鎂客網在使用過程中也發現,只要該錄音在結束后進行了轉寫,系統便會自動提煉摘要。與重點標記一樣,系統智能提煉摘要的目的也是方便用戶后期查閱和快速定點回聽,只不過精準度還需多加提升。
另外基于聲紋識別等技術,用戶在錄音完成轉寫之后,可以點擊錄音詳情頁面左下角的“智能整理”功能,隨即S1將對錄音中的說話者進行區分,讓用戶能夠以一種更為直觀的方式看到錄音內容,也方便了之后的整理等工作。
翻譯方面,S1提供兩種模式,分別是對話翻譯和同聲傳譯,前者能夠提供63種語言交傳互譯服務(包括63個語種、13種外語口音、9種離線語言),覆蓋全球200多個國家和地區,后者目前僅支持中英互譯。
在對話翻譯模式中,REC鍵和M鍵將各自承擔一種語言的錄入工作,屆時用戶需長按以錄入對應語音,繼而系統會自動讀出對應內容的翻譯結果。對于兩個語言不通的交流者而言,利用錄音筆進行逐個轉寫或許會耗費些時間,但能有效避免交談過程中因語音來回交叉而帶來的錯亂問題,保證內容的準確性。
相比于對話翻譯,同聲傳譯不需要用戶在過程中長按某個鍵,點擊屏幕頂端即可調換翻譯方向。若中途需要暫停/繼續,只需短按一下REC鍵即可。
從測試結果來看,在發音正常的情況下,S1的識別和翻譯準確度接近完美,些微差錯也在可接受范圍內。
此外所有的錄音文件和轉寫內容,用戶可以通過微信小程序掃碼、藍牙連接手機APP后實現云端上傳下載,以及多人共享。
總結
眾所周知,錄音筆市場一直都是相對小眾的,主要受眾群體集中在新聞媒體、政府、事業單位等。依據中國報告網數據,國內錄音筆市場呈現行業發展緩慢、替代風險大等特點,一句話概括,因為手機等數碼產品的沖擊等因素,國內錄音筆市場長時間處于“供過于求”的境遇,年度產量基本維持在400多萬臺左右,一度出現小幅下滑現象。長年以來,這一硬件品類的市場由索尼、愛國者等廠商所霸占。
就在近幾年,隨著語音識別、自然語言處理等AI語音技術的逐步發展,錄音筆的AI化趨勢也是不可逆的。數據顯示,經過近幾年的產品研發和推廣,AI錄音筆已經占據整個市場份額的35%,這其中,搜狗是其中的重度玩家之一。
基于搜狗AI錄音筆S1的深度體驗來看,自最初的單一語音轉寫服務,AI錄音筆的功能發展至今已經較為多元化,傾向于人性化等,覆蓋了轉寫、翻譯等多個方面,而這些功能也挑動了用戶心中那根敏感的神經,滿足了多種需求。
如果套用主播風格來為這款搜狗AI錄音筆下定義的話,那就是:買它、買它、買它!
最后,記得關注微信公眾號:鎂客網(im2maker),更多干貨在等你!
硬科技產業媒體
關注技術驅動創新
