國家市場監(jiān)督管理總局主管

中國消費者協(xié)會主辦

維護消費者合法權益,引導消費者合理消費

當前位置:首頁 > 科技
漢王科技發(fā)布首款智能語音應用“漢王語音王”
2024-08-09 16:20 本文來源:中國消費者報•中國消費網 作者:武曉莉

中國消費者報北京訊(記者武曉莉)8月8日,漢王科技2024新品發(fā)布會圓滿舉行,致力于讓所有人都可以無障礙地進行語言記錄、交流溝通的首款智能語音應用——漢王語音王APP發(fā)布。

據介紹,漢王語音王是基于漢王自研多模態(tài)天地大模型,自主研發(fā)的一款集AI語音記錄、智能翻譯與同聲傳譯于一體的智能語音旗艦應用,支持AI精準轉寫、拍錄同步(自動裁邊)、話稿整理、智能總結及不間斷實時翻譯等功能,用戶可以即聽即用,幫助跨越語言障礙,提高日常辦公、學習、會議、旅游等場景的應用效率和便捷性。

AI語音記錄精準識別拍錄同步。漢王語音王支持實時語音轉錄和語音文件轉錄兩種方式,具備錄音速記、拍錄同步(自動裁邊)、語音轉文字、說話人精準識別、智能總結、AI話稿整理等多種智能功能。漢王科技自研高精度語音識別模型,具備高準確率、多語言支持、動態(tài)修正和自然交流等特點。在行業(yè)廣泛使用的開源中文語音識別數據集上測試,錯誤率低至1.94%,處于領先水平。

漢王語音王可以自動修正錯誤文本,內容規(guī)整后無須二次編輯,還支持自動生成標題、總結記錄要點等。拍錄同步功能則是在錄音轉寫的同時拍照,通過強大的原研OCR技術,在錄音類產品中首創(chuàng)照片自動裁邊和內容智能排版功能,為用戶直接提供一份聲、圖、文并茂的多媒體記錄文檔。

在會議、頭腦風暴等多人對話場景中,準確分離出每個人的身份以及內容具有極大挑戰(zhàn),聲紋識別成為關鍵。漢王科技聲紋識別技術具備在不限定用戶說話內容的情況下,最短2秒準確識別說話人的能力。漢王科技解決了場景中的各種環(huán)境噪聲和回響,以及說話人語速和情感變化等復雜情況下的識別準確性問題,在復雜場景下能夠提供穩(wěn)定的準確識別率。同時,引入聚類算法等實現了結合聲紋和語義特征,進一步提高識別的準確性。

當整理好會議紀要、演講內容等后,漢王語音王能與電紙本一鍵分享,將語音文本一體化傳輸到電紙本上進行高效閱讀辦公操作,實現多端互聯(lián)、共享的應用生態(tài)。

對話翻譯即時捕捉自然準確。具備實時翻譯和語音合成兩大能力,可以精準捕捉每一句對話,即時翻譯,讓大家可以跨越語言界限,適合辦公、教育和旅游等場景下無障礙交流溝通。

基于漢王自研天地大模型的對話翻譯,具備更好的語義理解和上下文聯(lián)系能力,以及自適應語言風格和行業(yè)領域,提供更準確和自然的翻譯內容,表達更清楚、交流更順暢。漢王科技自研的語音合成系統(tǒng)不僅具有卓越的多音字準確識別能力,還能處理各種復雜多變的語音現象。漢王科技自研高自然度聲學模型,并引入了恒Q變換等多項先進技術,讓合成語音能更加高效和精準地還原人類語音特性。

漢王語音王同聲傳譯功能具備長時段不間斷即時翻譯能力,實時雙語對照文字記錄,更能準確表達專業(yè)術語和詞句表達。加上配錄同步功能,跨越語言的障礙,幫助用戶輕松解決超長時間國際會議、學術研討的內容記錄難題。


責任編輯:溫馨寧