“宿主,你能要點(diǎn)臉不?你哪來的自信,出賣身體,能賺幾千萬。”
“我……我……”林奇竟然無言以對(duì)。
林奇仔細(xì)思考了下,發(fā)現(xiàn)自身記憶力驚人,學(xué)知識(shí)的速度快。但是也不能教授給別人,別人學(xué)不來的,他們沒有這些機(jī)遇。
那利用已經(jīng)學(xué)習(xí)到的知識(shí),怎么能在短時(shí)間內(nèi)賺那么多的錢呢?
自己是把學(xué)校里面的東西學(xué)會(huì)了,但是這該怎么賺錢?辦補(bǔ)習(xí)班,來錢太慢了。
除此以外林奇也就學(xué)習(xí)了電池制造相關(guān)的東西,正是因?yàn)橐却笠?guī)模生產(chǎn)才這么缺錢,所以這條路也走不通。
那就剩余一個(gè)了——自己之前學(xué)習(xí)的編程,還在算法大賽中取得第二名,贏得過20萬獎(jiǎng)金。
但是應(yīng)該通過什么賺錢呢,開發(fā)出來游戲嗎?小游戲是簡單,但是沒有一個(gè)好的創(chuàng)意,很難有大的影響力。大的游戲又不是一時(shí)半會(huì)能開發(fā)出來的。
林奇拿著手機(jī)打開了手機(jī)內(nèi)的軟件。
打車軟件,共享單車軟件,新聞客戶端,郵件系統(tǒng),短信,語音,視頻,聊天工具。
看了一個(gè)又一個(gè)的軟件,林奇突然腦中一閃,語音通話。
現(xiàn)在聊天工具能直接進(jìn)行視頻和語音通話,還有一些軟件只有語音通話功能。
這些語音通話軟件有一個(gè)共同的特點(diǎn)就是:都消耗的是流量,不用話費(fèi)。
最近幾年,語音通話的軟件是越來越多,并且不用話費(fèi)。
有很大一部分人都用這個(gè)來代替打電話。但是因?yàn)檫@些需要的是流量,所以通話質(zhì)量不是那么的有保證,質(zhì)量和和網(wǎng)絡(luò)的穩(wěn)定性成正比。
如果是在良好的4g網(wǎng)絡(luò)下或者wifi環(huán)境下,通話質(zhì)量都挺好的,但是在3g甚至2g,或者信號(hào)不穩(wěn)定的地方,發(fā)文字還正常,但是語音通話就不行,通話雙方會(huì)感覺卡頓,對(duì)方聽不到,聽不清這是經(jīng)常會(huì)發(fā)生的事情。
如果能開發(fā)出一個(gè)軟件可以在各種復(fù)雜的網(wǎng)絡(luò)環(huán)境下讓語音通話都依然流暢,應(yīng)該很有市場。
林奇通過看手機(jī)上的各種軟件,想到了這么一個(gè)賺錢的機(jī)會(huì)。
怎么才能實(shí)現(xiàn)這個(gè)目標(biāo)呢?最好的就是發(fā)送文字,因?yàn)槲淖终加玫膸捵钌倭耍词咕W(wǎng)絡(luò)很不穩(wěn)定也能收到,除非是完全沒有網(wǎng)絡(luò)。
最后林奇想到了一個(gè)非常精妙的方法,能實(shí)現(xiàn)這個(gè)功能。
那就是通過機(jī)器學(xué)習(xí)來建立每個(gè)人的音色庫,然后再把不同的文字用上不同的語氣,只要這個(gè)個(gè)人的模型訓(xùn)練好,發(fā)送對(duì)方的手機(jī)里面,然后把要說的話轉(zhuǎn)換為文字,每次都只發(fā)送文字過去,這樣需要傳輸?shù)男畔⒕蜁?huì)小很多。
雖然這個(gè)方法想起來非常的簡單,但是做起來可不是這么容易的。
首先每個(gè)人都有一個(gè)自己的語音模型,訓(xùn)練這個(gè)模型需要有一個(gè)很優(yōu)秀的訓(xùn)練好的模型,然后做遷移學(xué)習(xí)。
但是訓(xùn)練基礎(chǔ)模型的時(shí)候,是需要很多數(shù)據(jù)的,程序林奇很快的就做好了,但是沒有語音數(shù)據(jù)是硬傷。
最后林奇收集了很多的網(wǎng)絡(luò)上公開的音頻資料,來輸入到模型中進(jìn)行訓(xùn)練,剛開始的時(shí)候找來了很多的漢語的音頻。包括從電視劇,電影還有廣播,新聞等里面抽取的音頻。
等訓(xùn)練好之后林奇測試之后發(fā)現(xiàn)針對(duì)標(biāo)準(zhǔn)的普通話,這個(gè)表現(xiàn)很好,但是如果是方言甚至是另一種少數(shù)民族,比如蒙古語,這個(gè)軟件表現(xiàn)的就非常的不盡人意。
后來林奇換了一個(gè)思路,不把每個(gè)人的語音轉(zhuǎn)換為文字。而是讓機(jī)器自己發(fā)明一種能發(fā)音的文字,不需要人類能看懂,只需要這個(gè)軟件自己能看懂就好,可以把聽到的任何聲音都轉(zhuǎn)換為這種機(jī)器自己能識(shí)別的文字。
修改了核心的算法之后,林奇再次把數(shù)據(jù)輸入進(jìn)去,同時(shí)這次增加了很多的其他的數(shù)據(jù),包括英語,德語,日語……幾十種語言的數(shù)據(jù)。還有很多的大自然的聲音,樂器的聲音,等等。
電腦分析這些數(shù)據(jù)建立一個(gè)模型過程是很慢的,經(jīng)過漫長的等待之后,終于重新生成了一個(gè)模型。
經(jīng)過測試之后,效果出奇的好,林奇發(fā)現(xiàn)尤其是針對(duì)有規(guī)律的東西,包括語言,樂器這些東西,都能有很好的效果。
然后這些數(shù)據(jù)經(jīng)過壓縮之后,體積比文字的還小了很多,即使網(wǎng)絡(luò)環(huán)境再不好,只要不是完全沒有,通話的質(zhì)量都是很完美的。
但是美中不足的是,針對(duì)不太規(guī)律的東西,這個(gè)模型處理的效果就不是很好,比如一些環(huán)境噪音或者大自然的風(fēng)聲雨聲鳥叫等。
林奇接著又去修改了模型,但是訓(xùn)練后的結(jié)果都不是很好。
后來林奇想了想“環(huán)境噪音,在語音通話過程中,人們應(yīng)該是不想要的,我干嘛還要費(fèi)那么大的力氣給加上。這不正是幾千塊錢的所謂的主動(dòng)降噪耳機(jī),或者是骨傳導(dǎo)耳機(jī)追求的降噪的功能嗎?”
想至此,林奇想抽自己兩巴掌,白白浪費(fèi)了那么多時(shí)間。
至于一些風(fēng)聲什么的,林奇也有了一個(gè)很好的解決方法,就是在算法里面判斷這個(gè)聲音,如果是沒有規(guī)律的,但是和環(huán)境噪音又有些區(qū)別的,那么就保留原有的語音通話,只有這種有語言的才智能的運(yùn)用自己這套系統(tǒng)。
這個(gè)系統(tǒng)的價(jià)值在于能讓語言的傳輸大大減小體積,同時(shí)還能高度還原原聲,甚至帶有主動(dòng)降噪功能。
而這個(gè)系統(tǒng)的難點(diǎn)在于:模型的訓(xùn)練。
訓(xùn)練的時(shí)候剛開始針對(duì)的是普通話,到了后來,林奇徹底的放開了自己的思維,讓機(jī)器自己去生成一種能傳輸?shù)淖约赫J(rèn)識(shí)的語言,這樣效果大大的提升了,不用針對(duì)每一種語言來訓(xùn)練好一個(gè)模型,而是針對(duì)所有的聲音,訓(xùn)練出了一套通用的模型。
在使用的時(shí)候,只需要把這個(gè)模型加載到用戶的手機(jī),用戶只需要說幾句話,模型就會(huì)自動(dòng)生成對(duì)應(yīng)的音色,還有對(duì)應(yīng)的語言的機(jī)器翻譯。
通過實(shí)際的使用,林奇測試發(fā)現(xiàn),這完全秒殺了世面上所有的語音通話軟件。
【精彩東方文學(xué) www.nuodawy.com】 提供武動(dòng)乾坤等作品手打文字版最新章節(jié)首發(fā),txt電子書格式免費(fèi)下載歡迎注冊(cè)收藏。