語(yǔ)音識(shí)別常見(jiàn)問(wèn)題集
發(fā)布時(shí)間:2019-04-20 | 點(diǎn)擊次數(shù):0 次
1.基礎(chǔ)問(wèn)題
1.1 使用方式
問(wèn):語(yǔ)音識(shí)別模塊怎么使用?
答:只要接上電源,說(shuō)對(duì)應(yīng)的命令則可以使用。
問(wèn):語(yǔ)音識(shí)別模塊可以自己制作燒錄詞條嗎?
答:識(shí)別模塊目前不能自行制作更換,需要我們對(duì)音頻進(jìn)行采集制作、修音調(diào)試等,再進(jìn)行詞條訓(xùn)練,最終才會(huì)達(dá)到一個(gè)比較好的識(shí)別效果。
1.2識(shí)別距離與識(shí)別率
問(wèn):語(yǔ)音識(shí)別的識(shí)別距離和識(shí)別率是多少?
答:在相對(duì)安靜和沒(méi)有回聲的環(huán)境下:
1. WTK6900A芯片最好的識(shí)別距離是1米以內(nèi),識(shí)別率為90%以上;
2. WTK6900B芯片最好的識(shí)別距離是2米以內(nèi),識(shí)別率為90%以上;
3. WTK6900C芯片最好的識(shí)別距離是3米以內(nèi),識(shí)別率為90%以上;
4. 識(shí)別距離越遠(yuǎn),識(shí)別率會(huì)慢慢下降。
問(wèn):什么是識(shí)別率,誤識(shí)別,錯(cuò)識(shí)別
答:識(shí)別率是指在相同的環(huán)境,相同的距離情況下,識(shí)別IC可以識(shí)別的次數(shù)占總次數(shù)之比;
誤識(shí)別是指在沒(méi)有說(shuō)出預(yù)先設(shè)定的詞條,由于噪聲,識(shí)別IC識(shí)別成功
錯(cuò)識(shí)別是指輸入語(yǔ)音指令1(即詞條1)卻識(shí)別成語(yǔ)音指令2
例如:有2條指令:請(qǐng)打開(kāi)燈,請(qǐng)關(guān)閉燈
在安靜的環(huán)境下,距離識(shí)別模塊的聲音輸入端(咪頭)1米內(nèi)的距離,一共輸入100次語(yǔ)音指令(請(qǐng)打開(kāi)燈 50次,請(qǐng)關(guān)閉燈 50次),如果請(qǐng)打開(kāi)燈有46次能識(shí)別,請(qǐng)關(guān)閉燈有45次能識(shí)別,則總識(shí)別率為(46+45)/100*100%=91%
問(wèn):聲音比較嘈雜,不能識(shí)別怎回事?
答:語(yǔ)音識(shí)別的過(guò)程是聲音波形的對(duì)比,我們輸入的環(huán)境太過(guò)于嘈雜,會(huì)對(duì)聲音輸入產(chǎn)生干擾,就像在嘈雜的環(huán)境中,我們聽(tīng)不清對(duì)方講話一樣。
暫時(shí)沒(méi)有很好的解決辦法,若是你可以承受較高成本,我們可以增加一些降噪電路或者麥克風(fēng)陣列電路。
問(wèn):定制詞條收費(fèi)是怎樣的?
答:定制詞條會(huì)收取一定的誠(chéng)意金,根據(jù)詞條內(nèi)容決定是否定制,每條詞條大概500元左右,批量累計(jì)到一定數(shù)量,誠(chéng)意金可充當(dāng)貸款
問(wèn):在汽車(chē)駕駛室 使用情況如何,在有背景音樂(lè)場(chǎng)合可以嗎?有人在說(shuō)話 我能控制嗎?在油煙機(jī)抽風(fēng)是可以用嗎?
答:你所說(shuō)的場(chǎng)合都是具有噪聲的環(huán)境,當(dāng)輸入指令的時(shí)候,這些噪聲會(huì)隨著指令一起傳輸?shù)竭漕^中,影響了識(shí)別,特別像抽油煙機(jī)機(jī)這種噪聲非常大的環(huán)境下,識(shí)別率會(huì)下降的比較厲害,因?yàn)榇藭r(shí)的噪聲或許已經(jīng)比人的聲音大了,所以這些有噪聲的環(huán)境特別需要按照實(shí)際使用的情況測(cè)試,驗(yàn)證是否能符合你的要求。
問(wèn):為什么女聲和童聲會(huì)難識(shí)別,男聲的比較容易識(shí)別
答:語(yǔ)音識(shí)別有一個(gè)語(yǔ)音庫(kù),識(shí)別的時(shí)候會(huì)和這個(gè)語(yǔ)音庫(kù)進(jìn)行對(duì)比,當(dāng)前版本的語(yǔ)音庫(kù)是沒(méi)有童聲的,所以會(huì)難識(shí)別;至于女聲,音頻頻率較高,而人聲主要頻率是低頻,所以也會(huì)難識(shí)別點(diǎn);如果要想這兩部分人群相對(duì)較好識(shí)別需要添加這兩部分人群的錄音。
問(wèn):當(dāng)我和別人在旁邊聊天的時(shí)候,會(huì)誤觸發(fā)
答;只要通電,語(yǔ)音識(shí)別是一直處于工作狀態(tài)中的,會(huì)一直識(shí)別聲音,如果產(chǎn)生了相似的波形,就會(huì)誤識(shí)別的,因此語(yǔ)音識(shí)別是需要在相對(duì)安靜的環(huán)境下使用的,誤觸發(fā)不能完全避免,只能降低。
問(wèn):為什么我說(shuō)家鄉(xiāng)話,也會(huì)識(shí)別成功
答:語(yǔ)音識(shí)別的識(shí)別過(guò)程是對(duì)比聲音的波形的,不能區(qū)分你當(dāng)前所說(shuō)的是什么語(yǔ)種,當(dāng)你說(shuō)話的聲音波形與語(yǔ)音庫(kù)里面的聲音波形相似,就會(huì)識(shí)別成功了
1.3識(shí)別的語(yǔ)種
問(wèn):可以做多國(guó)語(yǔ)言嗎
答:可以識(shí)別32種,中文,英語(yǔ),日語(yǔ)等等,但你要錄制這個(gè)國(guó)家的命令詞條,每個(gè)命令詞條至少要錄制20個(gè)人,男、女、老少都有最好。請(qǐng)用手機(jī)錄音,并在唯創(chuàng)微信小程序上面錄音即可。
問(wèn):自己家人有方言,可以做識(shí)別控制嗎?
答:可以,但是識(shí)別率沒(méi)有普通話的好,不建議使用方言控制。
問(wèn):可以同時(shí)識(shí)別三種語(yǔ)言嗎?例如,中文,英文,日語(yǔ)
答:不行!
1.2如何與MCU通訊
問(wèn):語(yǔ)音識(shí)別模塊有預(yù)留接口與我們的單片機(jī)通訊嗎?
答:識(shí)別IC會(huì)預(yù)留標(biāo)準(zhǔn)UART串口,相關(guān)指令可以參考說(shuō)明書(shū)
問(wèn):我的單片機(jī)為5V供電,可以和識(shí)別模塊通過(guò)串口相連嗎?
答:WTK6900芯片只支持3V,單片機(jī)5V供電需要加入電平轉(zhuǎn)換電路;
WTK6900B與WTK6900CS可以支持。
問(wèn):請(qǐng)問(wèn)我們可以自己修改波特率嗎?只能支持9600嗎?
答:波特率是程序里面設(shè)置的,出廠后用戶不能更改的;WTK6900芯片目前只能支持9600,WTK6900B和WTK6900C在出廠前可以設(shè)置其他波特率
1.4電氣參數(shù)
問(wèn):供電多少?
答:典型電壓值:3.3V,,此時(shí)識(shí)別效果是最好的
問(wèn):工作電流多大,能否休眠,休眠的話電流多大
答:WTK6900A工作電流為7ma(不帶負(fù)載),WTK6900B工作電流為12ma(不帶負(fù)載),WTK6900C工作電流為24ma(不帶負(fù)載),芯片休眠后無(wú)法識(shí)別,所以芯片一直都在工作狀態(tài),不會(huì)進(jìn)入休眠;深度休眠功耗一般≤10ua
1.5器件選擇
問(wèn):咪頭的參數(shù)選擇
答:咪頭的選擇需要結(jié)合產(chǎn)品的需求,如果產(chǎn)品是需要接收全方面的聲音,如臺(tái)燈,從各個(gè)角度輸入語(yǔ)音指令都能識(shí)別,則可以選擇全指向咪頭,目前我司使用的咪頭型號(hào)是 9767P 電容式咪頭,靈敏度為55-57;如需要抗噪能力強(qiáng)一點(diǎn),并且識(shí)別聲音是單向的,那么可以選擇單指向咪頭
問(wèn):?jiǎn)沃赶蜻漕^與全指向咪頭有什么區(qū)別?
答:全指向咪頭:是指360度都可以收得到聲音,收音范圍廣,同時(shí)也易吸收到周?chē)h(huán)境帶來(lái)的雜音;
單指向咪頭:只有一個(gè)角度范圍內(nèi)才可以收得到聲音,收音范圍有限,不易吸收外界帶來(lái)的雜音,聲音相對(duì)全指向咪頭會(huì)清晰很多
問(wèn):喇叭的參數(shù)選擇
答:一般使用8Ω/0.5W的喇叭
問(wèn):你們使用的穩(wěn)壓芯片參數(shù)是多少?我可以使用自己的穩(wěn)壓芯片嗎?
答:我司使用的是型號(hào)是UP0108,輸出的電流為300MA;因?yàn)檫@款芯片我們相對(duì)熟悉,建議還是使用這款芯片比較好,因?yàn)槿绻娫床环€(wěn)會(huì)影響到識(shí)別的。
1.6詞條
問(wèn):最多可以裝得下多少詞條
答:1.WTK6900A可以放48字以內(nèi);
2. WTK6900B可以放30字以內(nèi);
3. WTK6900C可以放80字以內(nèi);
問(wèn):詞條為開(kāi)燈,關(guān)燈這些可以嗎?
答:詞條太短,容易誤觸發(fā),建議添加一個(gè)喚醒詞,每次先喚醒后再識(shí)別開(kāi)燈,關(guān)燈
2.特定行業(yè)問(wèn)題
2.1燈具類
問(wèn):識(shí)別模塊控制燈需要輸出什么信號(hào)?
答:識(shí)別模塊識(shí)別成功后通過(guò)IO口輸出PWM信號(hào),用來(lái)控制LED燈的開(kāi)關(guān)以及調(diào)節(jié)亮度
問(wèn):識(shí)別芯片PWM輸出頻率是多少?
答:1.WTK6900A 芯片PWM輸出的頻率是250Hz,亮度分別是95%-65%-35%-5%
2.WTK6900B芯片PWM輸出頻率為3KHz,亮度為100%-84%-68%
-52%-36%-20%
問(wèn):我們的燈是24V 15W,能直接把模塊接在板子上面嗎?
答:不同調(diào)光模塊支持的電壓以及功率不同,我們最大可提供24V 100W的調(diào)光板
問(wèn):調(diào)光板型號(hào)是什么?
答:調(diào)光板名稱:WTK6900調(diào)光板,可以配合WTK6900CS-B01的模塊控制RGB燈條,支持紅外控制。
問(wèn):你們的板可以控制220V的燈嗎?
答:目前不支持,識(shí)別IC只是輸出高低電平控制MOS管的導(dǎo)通閉合而已,如果要接220V的燈,需要外加繼電器,識(shí)別IC通過(guò)控制MOS來(lái)控制繼電器,從而來(lái)控制燈的開(kāi)與關(guān);
3.現(xiàn)有模塊功能
3.1標(biāo)準(zhǔn)模塊WTK6900B02 V2.03
問(wèn):WTK6900B02 V2.03模塊有P1和P2兩塊板子,哪一塊板子上面有語(yǔ)音識(shí)別功能的呢
答:WTK6900B02 V2.03-P2
問(wèn):WTK6900B02 V2.03-P2模塊可以單獨(dú)使用嗎?
答:可以,不過(guò)測(cè)試的時(shí)候需要焊接電源線和咪頭
問(wèn):WTK6900B02 V2.03-P1模塊是用來(lái)做什么的,我可以不要嗎?
答:WTK6900B02 V2.03-P1模塊是模擬U盤(pán)的功能,用來(lái)更換詞條的,多個(gè)P2模塊配一個(gè)P1模塊即可,如果不需要更換詞條則可以不需要使用P1
問(wèn):WTK6900B02 V2.03-P2模塊和WTK6900B01有什么區(qū)別呢?
答:WTK6900B02 V2.03為WTK6900B01的升級(jí)版,將詞條放在Flash中,增加了可更換詞條的功能
問(wèn):WTK6900B02 V2.03-P2模塊和WTK6900B01詞條是一樣的嗎?
答:是一樣的,默認(rèn)出廠詞條都是珠光亮紅版的詞條
問(wèn):WTK6900B02 V2.03-P2模塊要如何更換詞條呢?
答:我們有更換詞條的演示視頻,可以發(fā)您參考一下
3.2燈板模塊WTK6900M01 V2.02
問(wèn):最多可以控制多少路燈呢?
答:如果是使用IO,最多可以控制5路;如果您有MCU,識(shí)別IC識(shí)別成功后可以通過(guò)串口給您MCU數(shù)據(jù),然后MCU再去執(zhí)行相應(yīng)的動(dòng)作
問(wèn):觸摸IC是怎么與識(shí)別IC通訊的呢
答:通過(guò)IO連接,觸摸IC的輸出信號(hào)接在識(shí)別IC的IO上
問(wèn):觸摸按鍵按下是高電平還是低電平呢?
答:按下是高電平
問(wèn):我們可以自己修改觸摸按鍵的靈敏度嗎?
答:可以的,觸摸按鍵電路中有一個(gè)電容C11是調(diào)節(jié)觸摸靈敏度的,容值的范圍是0-75PF,容值越大,靈敏度越低
目前板子上面的是10PF
問(wèn):我可以直接將燈并在你們的M01的板子上面嗎?
答:M01板子的M0S管旁邊預(yù)留了端子,上面的絲印標(biāo)著LED+,LED-,可以直接并聯(lián)燈;但是我們的燈是5V 5W以內(nèi)的,所以并聯(lián)的燈也是要符合這個(gè)要求
問(wèn):我們可以將咪頭引線出來(lái)嗎?有什么影響呢?
答:可以引線,不過(guò)引線建議不超過(guò)30CM,我們測(cè)試如果超過(guò)30CM影響會(huì)比較大;如果有屏蔽線,使用屏蔽線影響會(huì)小點(diǎn)