人工智能助力《中國新歌聲》,新莫扎特將如何奏響智能制造新曲?

時間:2016-08-16

來源:網(wǎng)絡(luò)轉(zhuǎn)載

導(dǎo)語:最近《中國新歌聲》開播,然而整個節(jié)目幾乎沒有什么亮點,使得觀看過程無聊大于愉悅。作為一個曾經(jīng)追過《中國好聲音》的人,不得不說,即使拋開版權(quán)之爭導(dǎo)致的問題,這屆《中國新歌聲》似乎很難抓住觀眾的耳朵和眼球了。

最近《中國新歌聲》開播,然而整個節(jié)目幾乎沒有什么亮點,使得觀看過程無聊大于愉悅。作為一個曾經(jīng)追過《中國好聲音》的人,不得不說,即使拋開版權(quán)之爭導(dǎo)致的問題,這屆《中國新歌聲》似乎很難抓住觀眾的耳朵和眼球了。

尤其參選的選手選唱曲目簡直毫無新意,總是拿著四位導(dǎo)師的作品和一些老歌翻來覆去的唱,觀眾的耳朵早就聽出了繭子。而作為一個科技控,我想,如果在這個時候,有一位選手上來跟大家說,演唱的歌曲作者不是人,而是人工智能的話,一定會讓所有人眼前一亮,甚至讓這個節(jié)目瞬間火爆。

這可不僅僅是一個設(shè)想。作為人工智能的技術(shù)開拓者,百度的人工智能技術(shù)正在逐漸實現(xiàn)這個設(shè)想:在聯(lián)手尤倫斯當(dāng)代藝術(shù)中心舉辦的“AI科技與藝術(shù)之夜”的活動中,百度利用人工智能技術(shù),完成了機器讀圖和音樂再創(chuàng)作,將美國藝術(shù)大師羅伯特·勞森伯格的傳奇式巨作《四分之一英里畫作》的其中兩聯(lián)分別譜成了20余秒的鋼琴曲,實現(xiàn)了視覺呈現(xiàn)向聽覺表達的轉(zhuǎn)化。

人工智能是如何做到看圖譜曲的

事實上,在目前來說,全球范圍內(nèi)能夠?qū)崿F(xiàn)人工智能自動譜曲的僅有百度和谷歌,而本次百度嘗試將圖像所體現(xiàn)的情感“移情”轉(zhuǎn)變?yōu)閹в新曇粜畔⒌募夹g(shù)則更為復(fù)雜。在給我們帶來極大的想象空間的同時,也說明了百度在人工智能技術(shù)方面的領(lǐng)先優(yōu)勢。

在百度的努力下,也許,下一個莫扎特將會是一臺擁有人工智能的機器。

據(jù)悉,百度用上千臺PC服務(wù)器和近1000臺GPU服務(wù)器構(gòu)建了世界上規(guī)模最大的深度神經(jīng)網(wǎng)絡(luò),支持萬億參數(shù)、千億樣本、千億特征訓(xùn)練;在算法上百度應(yīng)用了深度神經(jīng)網(wǎng)絡(luò)等分布式算法,支持的功能包括語音識別、圖像識別、自然語言處理等等。此次的人工智能看圖譜曲,正是通過其全球最大規(guī)模的深度神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)算法由機器自主學(xué)習(xí)實現(xiàn)的。

百度神經(jīng)網(wǎng)絡(luò)在“看到”圖像后,首先會對圖像進行分析解讀,為圖像打上若干具象化的標(biāo)簽,然后通過搜索挖掘相關(guān)的音樂信息,對音樂拆分重組,再合成與圖片內(nèi)容相匹配的音樂旋律,最終拼接成完整的曲子。僅僅從過程來說,看圖譜曲和這比常規(guī)意義上的我們理解的譜曲更加困難,正如同命題作文和自由作文的區(qū)別。

創(chuàng)作是人類作為高級生物的優(yōu)勢之一,寫詩畫畫譜曲對于藝術(shù)家來說并不是件難事,但如何讓機器像人類一樣自主創(chuàng)作,卻是人工智能領(lǐng)域的難題之一。而作為國內(nèi)最具技術(shù)基因的互聯(lián)網(wǎng)巨頭,看圖譜曲已不是百度第一次嘗試讓人工智能自主創(chuàng)作。

早在2013年,百度就曾使用人工智能技術(shù)對用戶上傳的圖片進行深度學(xué)習(xí),為用戶創(chuàng)作詩歌。把人工智能即使從作詩延伸到看圖譜曲,體現(xiàn)了百度在人工智能等前沿技術(shù)領(lǐng)域中的領(lǐng)先性和創(chuàng)新精神,也展示出百度在人工智能方面的技術(shù)實力。

百度在人工智能領(lǐng)域的到底有多強

人工智能將會是推動產(chǎn)業(yè)革新發(fā)展的重要力量,這是所有人的共識。而在國際上,谷歌、微軟、Facebook等國際巨頭一直都把未來賭在人工智能上。伴隨著中外科技巨頭爭相加大在人工智能領(lǐng)域的投資布局,人工智能技術(shù)的大規(guī)模商業(yè)應(yīng)用開始初露端倪。如今人工智能技術(shù)已被越來越廣泛地應(yīng)用在了互聯(lián)網(wǎng)服務(wù)、智能家居、智能汽車、機器人等眾多前沿領(lǐng)域。

在百度首席科學(xué)家吳恩達看來,百度最核心的人工智能技術(shù)包括圖像、語音、自然語音理解、機器學(xué)習(xí)平臺和大數(shù)據(jù)等幾個部分。目前百度在這些領(lǐng)域已經(jīng)擁有較多技術(shù)專利,并處于世界領(lǐng)先水平。之所以能夠取得這個成果,是因為百度一直以來,都把人工智能當(dāng)做一個大力投入的方向。

全球發(fā)達國家都在人工智能領(lǐng)域加快行動,尤其是許多先進的技術(shù)公司紛紛布局深度學(xué)習(xí)、人機交互和圖像語言識別等技術(shù)。在這一領(lǐng)域,百度早早的就開始謀劃布局。例如在2013年就成立了全球首家深度學(xué)習(xí)研究院,后擴充為百度研究院,下設(shè)人工智能實驗室、深度學(xué)習(xí)實驗室以及大數(shù)據(jù)實驗室,招募吳恩達等人工智能頂級專家,建成了全球最大的深度神經(jīng)網(wǎng)絡(luò)“百度大腦”,同谷歌、微軟等企業(yè)爭奪人工智能技術(shù)制高點。

近日,《麻省理工科技評論》評選出2016全球了“50家最聰明公司”,百度名列第二。

《麻省理工科技評論》如此評價百度:“百度在核心的搜索業(yè)務(wù)之外,語音識別、人工智能技術(shù)領(lǐng)域的積累已經(jīng)讓百度在語音識別上可與真人相媲美,并且百度在硅谷成立自動駕駛研發(fā)部門,也是視覺識別、傳感器等領(lǐng)域的領(lǐng)先企業(yè)。”這證明了百度在人工智能方面的布局成功。

在人工智能領(lǐng)域,百度不止想制造下個莫扎特

看圖譜曲只是百度技術(shù)體現(xiàn)的一個例子。實際上,過去的五年是人工智能突飛猛進的階段,而百度在圖像識別技術(shù)上已做到了全球領(lǐng)先。目前,百度的DeepImage計算機視覺系統(tǒng)已經(jīng)能夠?qū)D片內(nèi)容進行識別,在模式識別上取得了重大突破,其中LWF人臉識別精度高達99.86%。而百度自主研發(fā)的人工智能機器人“度秘”已經(jīng)在肯德基的智能點餐、高考的智能信息服務(wù)等多種場景中實現(xiàn)了運用。

可以這么說,百度的人工智能幾乎已經(jīng)滲透到百度所有的產(chǎn)品線當(dāng)中,之所以如此,是因為長期以來,百度一直在研發(fā)人工智能技術(shù)在家居、汽車、無人系統(tǒng)、安防等領(lǐng)域的推廣應(yīng)用,并豐富移動智能終端、可穿戴、虛擬現(xiàn)實等產(chǎn)品的服務(wù)及形態(tài),推動人工智能與機器人技術(shù)的深度融合。

相信在未來,百度人工智能技術(shù)將會進行更多領(lǐng)域的嘗試,將情感分析和理解的成果應(yīng)用于產(chǎn)品中,為用戶提供個性化和精準(zhǔn)化的智能服務(wù),全面提升用戶體驗。

百度總裁張亞勤上月曾表示,去年百度在研發(fā)方面投入超過100億元,而“百度大腦”作為百度在人工智能領(lǐng)域的核心,已孵化出如無人駕駛、智能搜索等創(chuàng)新技術(shù)。目前“百度大腦”已具備視、聽、說和預(yù)測、規(guī)劃決策以及行動控制的能力,并將被應(yīng)用到金融、汽車、醫(yī)療等領(lǐng)域。他同時表示,“智能交通”將是中國企業(yè)彎道超車的好機會。

自計算機誕生之日起,人類便不斷追尋賦予機器以“生命”。百度人工智能技術(shù)正試圖讓看似天方夜譚的事情,變成現(xiàn)實。而當(dāng)不用手便可以操作手機的語音識別等技術(shù)慢慢便利了人類生活后,人工智能便被賦予在工業(yè)、生活等領(lǐng)域的發(fā)展厚望。而如何將這些人工智能應(yīng)用到各個領(lǐng)域撬動剛需,將會決定人工智能擴展的邊界。

總之,隨著人工智能看圖譜曲的技術(shù)日趨成熟后,下一個莫扎特真的會是臺機器的日子不遠了。但即使如此,人工智能的爆發(fā)卻還遠未結(jié)束,相信在未來,會有更多的不可思議讓我們體驗到技術(shù)的魅力。

(原標(biāo)題:人工智能看圖譜曲:下個莫扎特會是一臺機器嗎?)

中傳動網(wǎng)版權(quán)與免責(zé)聲明:

凡本網(wǎng)注明[來源:中國傳動網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國傳動網(wǎng)(www.siyutn.com)獨家所有。如需轉(zhuǎn)載請與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個人轉(zhuǎn)載使用時須注明來源“中國傳動網(wǎng)”,違反者本網(wǎng)將追究其法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明其他來源的稿件,均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請保留稿件來源及作者,禁止擅自篡改,違者自負版權(quán)法律責(zé)任。

如涉及作品內(nèi)容、版權(quán)等問題,請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

關(guān)注伺服與運動控制公眾號獲取更多資訊

關(guān)注直驅(qū)與傳動公眾號獲取更多資訊

關(guān)注中國傳動網(wǎng)公眾號獲取更多資訊

最新新聞
查看更多資訊

熱搜詞
  • 運動控制
  • 伺服系統(tǒng)
  • 機器視覺
  • 機械傳動
  • 編碼器
  • 直驅(qū)系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯(lián)
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機界面
  • PLC
  • 電氣聯(lián)接
  • 工業(yè)機器人
  • 低壓電器
  • 機柜
回頂部
點贊 0
取消 0