所謂語音合成芯�,又稱中文TTS芯片,是指一種專�(yè)的語音芯片,它可以通過串行通信接口�UART�SPI等方�,與主控CPU�(jìn)行數(shù)�(jù)通信,接收CPU傳送的文本信息,以合成語音的方式,�(qū)動發(fā)聲器�(fā)�,其特點是:高集成度,帶串行通信接口以及需要一定的外圍電路的支持(�晶振電路等)�
所謂語音合成芯片,又稱中文TTS芯片,是指一種專�(yè)的語音芯�,它可以通過串行通信接口如UART和SPI等方式,與主控CPU�(jìn)行數(shù)�(jù)通信,接收CPU傳送的文本信息,以合成語音的方�,驅(qū)動發(fā)聲器�(fā)聲,其特點是:高集成�,帶串行通信接口以及需要一定的外圍電路的支持(如晶振電路等�。目前國�(nèi)市場上的中文語音合成芯片(非語音芯片,就是不需要燒錄而通過上位機控制)主要有兩家:一為北京宇音天下科技有限公司(主要產(chǎn)品:SYN6188、SYN6288和SYN6658);一為安徽的科大訊飛公司(主要產(chǎn)品XFS3031,XFS4040和XFS4041)�
伴隨著各種家用電器設(shè)�,車載設(shè)備的功能增加,設(shè)備的操控性越來越�(fù)�;人機交互設(shè)計在系統(tǒng)�(shè)計中的地位越來越重要。受到系�(tǒng)成本、體積等多方面的限制,應(yīng)用開�(fā)人員可以選擇的人機交互設(shè)計方法并不多。利用語音合成芯片來增強人機交互性能的方法又重新開始受到�(yīng)用開�(fā)人員的重�� 語音合成芯片的核心技�(shù)是語音數(shù)�(jù)壓縮。這項技�(shù)在二�(zhàn)前就開始被研�,但其轉(zhuǎn)化為芯片并被實際�(chǎn)品采用卻是在70年代�。由于受到存儲器容量的限�,當(dāng)時比較流行的是參�(shù)合成方式,這是一種模擬人體發(fā)聲器�,建立數(shù)�(xué)模型,并以此作為參數(shù)�(jìn)行壓縮合成的方法。但是這種方法的實際使用效果并不能滿足人們的要求,終在市場上受到�(rèn)可的是基于ADPCM(Adaptive differential PCM)技�(shù)的語音壓縮合成方�。OKI公司�70年代就從事ADPCM的研究開�(fā)工作,并不斷�(jìn)行改�(jìn),相繼推出了具有更大壓縮率和更高音質(zhì)的OKI ADPCM、OKI ADPCM2方式。OKI語音芯片的音�(zhì),的性能得到了客戶的�(rèn)��25年的累計出貨量達(dá)到了4億�� 高音�(zhì)語音合成芯片增強人機交互性能 在使用語音合成芯片時,令�(yīng)用開�(fā)人員頭痛的問題是如何在有限的存儲器當(dāng)�,放入更多的語音�(shù)�(jù)。通常的做法是將播放內(nèi)容中重復(fù)出現(xiàn)的地方�(jìn)行切�,在需要利用的時�,對這些重復(fù)�(nèi)容�(jìn)行復(fù)�。雖然這個做法可以解決問�,但一般在使用�(dāng)�,如果有大量需要復(fù)用的語音段出�(xiàn)�,將會使播放控制程序非常冗長。而且在不同的地方�(jìn)行復(fù)用時,音�(diào)、語速等都會有微妙變化,這些變化如果不加以區(qū)分處�,就會在播放時造成不自然和失真。因此在播放不同�(nèi)容時需要適�(dāng)加入不同的延�。比如在實現(xiàn)�1的播放內(nèi)容時,一般需要程�?qū)懗扇缦滦问健?Play(Address1); Delay(xxx); Play(Address2); Delay(xxx); Play(Address4); Delay(xxx); Play(Address5); 這種實現(xiàn)方法無疑是對程序存儲器的一種極大浪費。而且由于在播放指令發(fā)出時,MCU必須對相�(yīng)的控制線或者IO�(jìn)行操�,指令的反復(fù)使用也是對CPU資源的浪�。更糟糕的是在播放指令執(zhí)行過程當(dāng)�,一旦有中斷等意外發(fā)生的�,很容易出現(xiàn)播放�?,F(xiàn)象�
�1� 基于分割播放的一般方�� OKI的語音芯片為了使控制MCU的開銷小,在語音芯片�(chǎn)品中加入了ROM Edit功能,通過在制作語音數(shù)�(jù)�,指定需要復(fù)用和延時的部分,把絕大部分處理工作交給語音合成芯片來完成,大幅度降低控制MCU的開�� 例如使用OKI的ROM Edit功能播放圖示的兩段內(nèi)容時,可以使用下述程序: Play(ROM Edit area1); Play(ROM Edit area2); 語音芯片接受到這兩條指令后,將自行按照ROM Edit�(lǐng)域的指定,自動將相應(yīng)地址的語音數(shù)�(jù)�(jìn)行播放連接,這些過程將無須MCU參與。由于ROM Edit�(lǐng)域中使用的僅僅只是地址信息,所以對于存儲器的占用率是相�(dāng)?shù)偷摹�?dāng)然在ROM Edit�(lǐng)域指定存儲器地址的同�,也可以插入相應(yīng)的延時信�,由芯片自行完成播放之間的延時處理� 簡單�(yīng)對多國語言�(chǎn)品開�(fā) 如何將同樣的核心�(shè)計適用到不同地區(qū)的市�,是很多�(shè)備生�(chǎn)廠商都要考慮的問�。對于使用語音芯片作為人機交互手段的�(chǎn)品來說,首要面臨的問題就是如何設(shè)計多國語言的版�。到目前為止,當(dāng)提示語言改變�,將不可避免地造成控制軟件的修�,而且針對不同語言的產(chǎn)品必須準(zhǔn)備不同版本的語音芯片,給庫存和管理都造成壓力。OKI的語音產(chǎn)品通過存儲器的庫切換功�,輕松實�(xiàn)了在同一塊芯片上整合不同語言版本的功�� 圖示為在同一塊芯片中存入了中英文兩種語言信息。各種語言信息所對應(yīng)的事件都是一樣的,使用完全一樣的控制軟件。在�(shè)計不同語言的產(chǎn)品時,只需要簡單地將SEL0,SEL1的設(shè)置�(jìn)行相�(yīng)切換,就可以輕松實現(xiàn)同一個設(shè)計的中英文版�。OKI的語音芯片多可以劃分�4個庫,也就是說使用同一塊芯片可以實�(xiàn)4個語種的播放�
�2:基于ROM Edit功能的分割播�。的存儲器方� 語音芯片的應(yīng)用開�(fā)人員面臨的一個棘手問題是如何決定在開�(fā)測試階段和規(guī)模量�(chǎn)階段�(jìn)行切�。語音數(shù)�(jù)需要�(jìn)行較長時間音�(zhì)評估和適用性測�,這個過程一般都是使用Flash或者OTP(One-timeーprogramming)方式的存儲器,以便快速對語音�(shù)�(jù)�(jìn)行評�。一旦評估結(jié)束后,在量產(chǎn)�(chǎn)品中一般都傾向于使用性價比更高的MaskROM存儲�。但是MaskROM的漫長生�(chǎn)周期,起訂數(shù)量的限制和不便宜的掩膜費用都加重了開�(fā)人員的壓�,客戶要求的頻繁變更更是雪上加霜。以至于很多�(yīng)用設(shè)計直接將Flash或者OTP方式的語音芯片應(yīng)用到了量�(chǎn)�(chǎn)品中,而這樣又對量產(chǎn)的效率和管理直接造成了影�� 為了更好地平衡語音芯片評估階段的方便快捷和量�(chǎn)階段高的大量廉價生產(chǎn),OKI的語音芯片采用了OKI獨自的P2ROM(Production programmed ROM)存儲�。這種的存儲器不同于MaskROM需要在芯片生產(chǎn)的前端工藝流程中�(jìn)行寫入操作,可以在芯片的封裝測試階段�(jìn)行數(shù)�(jù)寫入操作。因此芯片生�(chǎn)廠可以事先準(zhǔn)備不同容量的芯片,等待客戶的�(shù)�(jù)定好�,在芯片的封裝測試階段�(jìn)行寫入操�� 由于不需要經(jīng)過前端工藝漫長的生產(chǎn)流程,工廠可以在極短的時間內(nèi)(7-10�)完成�(shù)�(jù)的寫入測試和出貨,大大縮短了交貨時間。而且極低的起訂數(shù)量和零寫入費用對于開�(fā)工程師來說更是吸引力。對于生�(chǎn)管理部門而言,P2ROM極短的交貨期,的量產(chǎn)�(yīng)對能�,以及工廠到工廠的點對點方式,減少了庫存,降低了生產(chǎn)成本,減少了貼片前的測試流程,大大提高了生產(chǎn)效率。OKI使用P2ROM 存儲器的語音芯片直接覆蓋了開�(fā)、試�(chǎn)、量�(chǎn)的全部階段。設(shè)計工程師再也不用�(fā)愁如何應(yīng)對客戶規(guī)格的突然變更和量�(chǎn)成本之間的矛盾了� 方便快捷的語音數(shù)�(jù)開發(fā)工具 語音芯片的應(yīng)用開�(fā)人員面臨的另外一個棘手的問題就是如何�(zhǔn)備語音數(shù)�(jù)。通常語音�(shù)�(jù)的制作都需要聘請專門的播音員,租用專用的錄音棚�(jìn)行錄�。不但費用高,而且費時費力� 有些開發(fā)商為了省事,干脆使用PC機加麥克�(fēng)�(jìn)行錄�,導(dǎo)致各種討厭的背景噪音和語音芯片如影隨�。這些問題都直接或間接地限制了語音芯片的應(yīng)�� OKI新開�(fā)了利用TTS(Text to Speech)技�(shù)的語音數(shù)�(jù)生成工具“隨心錄�。自然流暢的�、英、韓、日等多國語言的語音數(shù)�(jù)合成引擎,大大方便了語音芯片的應(yīng)用開�(fā)人員,實�(xiàn)了“芯”隨字動。使用OKI的專用工具可以完成從語音�(shù)�(jù)的生�、波形編�、ROM編輯、測�、燒寫、聲音評估等一連串的工�。大幅縮短了開發(fā)周期,節(jié)約了開發(fā)成本。彈指間完成語音�(shù)�(jù)�(zhǔn)備的日子已經(jīng)來到,應(yīng)用開�(fā)工程師可以將自己的更多才智和時間放在更有�(chuàng)造�、更具靈動性的�(shè)計開�(fā)工作��
�3� 利用存儲器切換功能實�(xiàn)多語種播�� 本文小結(jié) 為了獲得更好的用戶體�,通用化設(shè)�(Universal design)已經(jīng)開始在以家電,游戲機,車載設(shè)備等為主的領(lǐng)域生根發(fā)�。作為通用化設(shè)計的一個側(cè)面,利用語音交互的人機接口設(shè)計今后會變得越來越普�。OKI的語音合成芯片在各個方面都已經(jīng)做好�(zhǔn)�,可以方便快速地�(yīng)用到不同的設(shè)計領(lǐng)域中�
維庫電子�,電子知�,一查百通!
已收錄詞�153979�