時間:2018-03-07 15:02:26來æºï¼šä¸åœ‹å‚³å‹•ç¶²
近年來,人工智能在國內外掀起了新一輪技術創新的浪潮,人工智能æ£åœ¨æˆç‚ºç”¢æ¥é©å‘½çš„æ–°é¢¨å£ã€‚據BBCé æ¸¬ï¼Œåˆ°2020年,全çƒäººå·¥æ™ºèƒ½å¸‚å ´è¦æ¨¡å¯é”到1190å„„å…ƒã€‚è‰¾ç‘žå’¨è©¢é æ¸¬ï¼Œåˆ°2020年,ä¸åœ‹äººå·¥æ™ºèƒ½å¸‚å ´è¦æ¨¡ç´„91億元。
ç›®å‰ï¼Œæ”¿ç–ã€ç¶“濟ã€äººæ‰ã€æŠ€è¡“儿–¹é¢éƒ½ç‚ºäººå·¥æ™ºèƒ½æä¾›äº†å¾ˆå¥½çš„æ¢ä»¶ï¼š
(1) 政ç–:人工智能進入國家戰略層é¢ã€‚åœ‹å‹™é™¢åœ¨ã€Šé—œäºŽç©æ¥µæŽ¨é€²â€œäº’è¯ç¶²+â€è¡Œå‹•的指導æ„見》ä¸å°‡äººå·¥æ™ºèƒ½æŽ¨ä¸Šåœ‹å®¶æˆ°ç•¥å±¤é¢ã€‚在國家“å三五â€è¦åŠƒçš„â€œç§‘æŠ€å‰µæ–°-2030é …ç›®â€ä¸ï¼Œæ™ºèƒ½åˆ¶é€ 和機器人被列為é‡å¤§ç™¼å±•工程。2016å¹´ï¼Œç‚ºåŠ å¿«äººå·¥æ™ºèƒ½ç”¢æ¥ç™¼å±•,國家發展改é©å§”ã€ç§‘技部ã€å·¥æ¥å’Œä¿¡æ¯åŒ–部ã€ä¸å¤®ç¶²ä¿¡è¾¦åˆ¶å®šäº†ã€Šâ€œäº’è¯ç¶²+â€äººå·¥æ™ºèƒ½ä¸‰å¹´è¡Œå‹•實施方案》。2016年科大訊飛ã€è¯ç‚ºç‰è¡Œæ¥çŸ¥å伿¥ï¼Œåœ¨æ·±åœ³å…±åŒç™¼å¸ƒä¸åœ‹ã€Šäººå·¥æ™ºèƒ½æ·±åœ³å®£è¨€ã€‹ï¼Œç©æ¥µæŽ¢ç´¢æ”¿ã€ç”¢ã€å¸ã€ç ”ã€ç”¨åˆä½œæ©Ÿåˆ¶ï¼ŒæŽ¨å‹•人工智能產æ¥çš„å”åŒç™¼å±•。2017å¹´å二屆全國人大會è°ä¸ï¼Œåœ‹å‹™é™¢ç¸½ç†æŽå…‹å¼·æå‡ºï¼Œè¦æŽ¨å‹•內地與港澳深化åˆä½œï¼Œç ”究制定“粵港澳大ç£å€â€åŸŽå¸‚群發展è¦åŠƒï¼Œæå‡åœ¨åœ‹å®¶ç¶“濟發展和å°å¤–開放ä¸çš„地ä½èˆ‡åŠŸèƒ½ã€‚
(2) 經濟:互è¯ç¶²ç¶“濟高速發展,據艾瑞咨詢估計,2015å¹´ä¸åœ‹ç¶²çµ¡ç¶“濟增長約33%ï¼Œå¸‚å ´è¦æ¨¡è¶…éŽåƒå„„,并有æŒçºŒå¢žé•·è¶¨å‹¢ã€‚2014å¹´é–‹å§‹ï¼ŒæŠ•è³‡æ©Ÿæ§‹åœ¨äººå·¥æ™ºèƒ½é ˜åŸŸæŠ•è³‡é‡‘é¡ï¼Œæ•¸é‡å‡å¤§å¹…åº¦å¢žåŠ ã€‚æ“šå’¨è©¢å…¬å¸Venture Scanner統計,2016å¹´å…¨çƒäººå·¥æ™ºèƒ½å…¬å¸å·²çªç ´1000家,èžè³‡é«˜é”48億美元。
(3) 人æ‰ï¼šåœ¨ä¸åœ‹ç§‘ç ”æŠ•å…¥å å…¨çƒçš„20%ï¼Œåƒ…æ¬¡äºŽç¾Žåœ‹ï¼Œä¿¡æ¯æŠ€è¡“äº’è¯ç¶²é ˜åŸŸæ˜¯åœ‹å®¶çš„é‡é»žæŠ•å…¥å°è±¡ï¼Œè¿‘äº”å¹´ï¼Œç§‘ç ”äººå“¡ä¿æŒ20%çš„æŒçºŒå¢žé•·ï¼Œç‚ºäººå·¥æ™ºèƒ½çš„發展æä¾›äº†å……è¶³çš„äººæ‰æ”¯æ’。
(4) æŠ€è¡“ï¼šç›®å‰æˆ‘國已在計算機視覺,智能語音ç‰é ˜åŸŸå¯¦ç¾äº†æŠ€è¡“çªç ´ï¼Œè™•äºŽåœ‹éš›é ˜å…ˆæ°´å¹³ã€‚åœ‹å…§å…·æœ‰ä»£è¡¨æ€§çš„å…¬å¸æˆ–æ©Ÿæ§‹åŒ…æ‹¬ï¼šç™¾åº¦ï¼Œé˜¿é‡Œå·´å·´ï¼Œé¨°è¨Šï¼Œç§‘å¤§è¨Šé£›ï¼Œæ› è¦–ç§‘æŠ€ï¼Œå•†æ¹¯ç§‘æŠ€ç‰ã€‚
在人工智能技術ä¸ï¼Œæ™ºèƒ½èªžéŸ³æŠ€è¡“是一個é‡è¦çš„分支,是人機交互éŽç¨‹ä¸ä¸å¯æˆ–缺的部分。語音技術包å«ï¼šèªžéŸ³è˜åˆ¥ã€èªžéŸ³åˆæˆã€è²ç´‹è˜åˆ¥ã€èªžéŸ³è©•測ã€èªžéŸ³è½‰æ›ç‰ï¼Œå…¶ä¸ç™¼éŸ³æª¢éŒ¯ç³¾éŒ¯å’ŒèªžéŸ³è½‰æ›æŠ€è¡“近期有了新的çªç ´ã€‚
發音檢錯糾錯
英語是當今世界上最為通用的語言,其é‡è¦æ€§å·²ç‚ºæ‰€æœ‰äººæ·±åˆ»é ˜æœƒã€‚由于英語的強勢地ä½ï¼Œç›®å‰è¢«è¶…éŽ100個國家作為外語教å¸çš„第一外語。據EFè‹±åšæ•™è‚²ç™¼å¸ƒçš„《2015å¹´è‹±èªžç†Ÿç·´åº¦æŒ‡æ¨™å ±å‘Šã€‹é¡¯ç¤ºï¼Œä¸åœ‹äººæ¯å¹´èŠ±è²»åƒå„„元用于英語培訓,但實際效果ä¾ç„¶ä¸ä½³ï¼Œåœ¨å…¨çƒ70個國家和地å€ä¸ï¼Œä¸åœ‹å¤§é™¸æŽ’å47ä½ã€‚雖然英語水平ä»è™•äºŽä½Žç†Ÿç·´ç¨‹åº¦ï¼Œä½†è¿‘å¹´ä¾†å‘ˆç¾æ˜Žé¡¯å¢žé•·è¶¨å‹¢ã€‚據ä¸åœ‹ç¤¾æœƒèª¿æŸ¥æ‰€å…¬å¸ƒçš„ä¸åœ‹å±…æ°‘æ¶ˆè²»èª¿æŸ¥å ±å‘Šçµ±è¨ˆï¼Œä¸åœ‹å·²æˆç‚ºå…¨çƒè‹±èªžåŸ¹è¨“é ˜åŸŸå¢žé•·é€Ÿåº¦æœ€å¿«çš„å¸‚å ´ï¼Œå¹´å¢žé•·çŽ‡é«˜é”12%。在如æ¤å»£é—Šçš„è‹±èªžåŸ¹è¨“å¸‚å ´ä¸‹ï¼Œç·šä¸‹è‹±èªžåŸ¹è¨“é¢è‡¨è‘—師資數é‡çŸç¼ºï¼Œæ•™å¸«å£èªžæ°´å¹³åƒå·®ä¸é½Šã€â€œæ·»é´¨å¼â€èˆ‡â€œæ‡‰è©¦å¼â€æ•™å¸ä»¥åŠç„¡æ³•有效改善å£èªžè½åŠ›æ°´å¹³ç‰å˜åœ¨è«¸å¤šçŸ›ç›¾ã€‚
å¦å¤–ï¼Œä¸æ–‡æ‹¼éŸ³èˆ‡è‹±èªžéŸ³æ¨™ç™¼éŸ³æ–¹æ³•å’Œä½ç½®æœ‰æ‰€å€åˆ¥ï¼Œä½†è¨±å¤šä¸åœ‹å¸ç”Ÿåœ¨å‰›æŽ¥è§¸è‹±èªžæ™‚ç¿’æ…£ç”¨ç†Ÿæ‚‰çš„ä¸æ–‡æ‹¼éŸ³ä¾†æ¨™æ³¨ã€è¨˜æ†¶è‹±èªžå–®è©žçš„發音。久而久之,養æˆäº†ä¸è‰¯çš„ç™¼éŸ³ç¿’æ…£ï¼ŒåŒæ™‚還由于ä¸åœ‹å¸ç”Ÿæ™®éé¦è…†ï¼Œä¸Šèª²å£èªžè¨“練時間ä¸è¶³ï¼Œèª²åŽå£èªžç·´ç¿’å¾—ä¸åˆ°å饋,以åŠå¤§éƒ¨åˆ†è‹±èªžè€å¸«çš„ç™¼éŸ³ä¸æ¨™æº–ç‰å› ç´ é€ æˆäº†ä¸åœ‹å¸ç”Ÿçš„ç™¼éŸ³ä¸æ¨™æº–。由于發音一直是ä¸åœ‹å¸ç”Ÿå¸ç¿’英語時一個難關,有許多人愿æ„為了糾æ£ç™¼éŸ³ï¼Œæ”¯ä»˜é«˜æ˜‚çš„å¸è²»ï¼Œè«‹å¤–教糾æ£è‡ªå·±çš„發音。隨著移動在線語言å¸ç¿’的興起,催生了AI語音評測,促進了AI糾音技術的發展。
é›–ç„¶ç›®å‰å¸‚å ´ä¸Šæœ‰è¨±å¤šåœ¨ç·šçš„è‹±èªžå¸ç¿’è»Ÿä»¶ï¼Œä½†å¤§å¤šæ•¸éƒ½åªæ˜¯ç°¡å–®åœ°æ’æ”¾éŸ³è¦–é »å¸ç¿’資料,å¸ç”Ÿè·Ÿè®€ï¼Œç³»çµ±æ’æ”¾éŒ„éŸ³ã€‚åªæœ‰ç‚ºæ•¸ä¸å¤šçš„軟件,具備打分評測的功能,而評測的準確性,一直為å¸ç”Ÿæ‰€è©¬ç—…ã€‚å› æ¤ï¼Œå¸‚å ´è¿«åˆ‡éœ€è¦èƒ½æä¾›é«˜å¯é 的打分評測技術。
圖1 ç›®å‰å¸‚é¢ç›¸é—œç”¢å“
å¦å¤–,除了æä¾›é«˜å¯é 的打分評測技術,å¸ç”Ÿä¹Ÿè¿«åˆ‡éœ€è¦å…·é«”的發音診斷的å饋建è°ã€‚å› ç‚ºå–®ç´”çš„æ‰“åˆ†è©•æ¸¬æŠ€è¡“ï¼Œåªèƒ½å¤ 指出å¸ç”Ÿçš„發音ä¸å¤ 好,但å¸ç”Ÿå¹¶ä¸ç†è§£è‡ªå·±çš„ç™¼éŸ³éŒ¯èª¤åœ¨å“ªé‡Œï¼ŒåŠæ‡‰è©²å¦‚何改進發音。比如把讀錯的單詞標紅出來,需å復尿¯”åŽŸè²æ‰èƒ½åˆ†æžå‡ºéŒ¯èª¤çš„細節,這在明顯讀錯的情æ³ä¸‹é‚„好實ç¾ï¼Œå¦‚:steak/steik/,讀錯為/sti:k/。
但以下情æ³å°±éžå¸¸å›°é›£äº†ï¼Œç‰¹åˆ¥æ˜¯å¸ç¿’者ä¸ç†Ÿæ‚‰è‹±èªžçš„æ‹¼è®€ç™¼éŸ³è¦å‰‡ï¼Œèªžæ³•çš„æ¢ä»¶ä¸‹ã€‚
(1)如records/'rek??dz/,讀錯為/'rek??ds/。
(2)如the apple /ei/,讀錯為/e?/(the在輔音å‰ç™¼ /e?/,元音å‰ç™¼ /ei/)。
(3)長çŸéŸ³å¦‚book/b?k/,讀錯為/bu?k/ï¼›Lily/'l?li:/,讀錯為/'li:li:/。
如果å¸ç¿’者在å復練習éŽç¨‹ä¸ä¸èƒ½åŠæ™‚發ç¾å…·é«”的錯誤細節,會é™ä½Žå¸ç¿’效率和興趣,甚至å復錯誤發音,產生錯誤的肌肉記憶。這個å•題,在å¸è¡“ç ”ç©¶ä¸Šè¢«ç¨±ç‚ºâ€œéŒ¯èª¤ç™¼éŸ³æª¢æ¸¬åŠè¨ºæ–·â€ã€‚為了解決這個å•題,在éŽåŽ»çš„å多年ä¸ï¼Œä¸–ç•Œä¸Šçš„è¨±å¤šé ‚ç´šç§‘ç ”æ©Ÿæ§‹éƒ½æŠ•å…¥äº†å¤§é‡çš„äººåŠ›ç‰©åŠ›ï¼Œå…¶ä¸æœ€å…·å½±éŸ¿åŠ›çš„åŒ…æ‹¬é¦™æ¸¯ä¸æ–‡å¤§å¸ï¼Œæ¸…è¯å¤§å¸ï¼Œè‡ºç£å¤§å¸ï¼Œç¾Žåœ‹éº»çœç†å·¥å¤§å¸ï¼Œæ–°åŠ å¡è³‡è¨Šé€šä¿¡ç ”ç©¶é™¢ï¼Œå¾®è»Ÿäºžæ´²ç ”ç©¶é™¢ï¼ŒIBMç‰ç‰ã€‚
圖2 多任務å¸ç¿’çš„è²å¸éŸ³ç´ 模型
“錯誤發音檢測åŠè¨ºæ–·â€çš„難點在于它們ä¸åŒäºŽä¸€èˆ¬çš„語音è˜åˆ¥æŠ€è¡“,å°äºŽè¨“ç·´æ¨¡åž‹å’Œè¨“ç·´æ•¸æ“šæœ‰è‘—æ›´åš´æ ¼çš„è¦æ±‚,并且ä¸åŒæ¯èªžçš„人群在å¸ç¿’英語的éŽç¨‹ä¸æ˜“出ç¾çš„錯誤也ä¸åŒã€‚å› æ¤è¦æ”¶é›†å¤§é‡ä»¥ä¸æ–‡ç‚ºæ¯èªžçš„人群的英文錄音,并邀請專æ¥äººå£«å°æ•¸æ“šé€²è¡Œäº†äººå·¥æ¨™æ³¨ã€‚隨著深度å¸ç¿’的發展,和多年的技術ç©ç´¯ï¼Œè²å¸Œç§‘技æŽå¤åšå£«ç‰äººå¯¦ç¾äº†æ¤é ˜åŸŸçš„é‡å¤§çªç ´ï¼Œåˆ©ç”¨æ·±åº¦ç¥žç¶“網絡å°è²å¸ç‰¹å¾å’Œæ¨™æº–ç™¼éŸ³é€²è¡Œé æ¸¬ï¼Œè¼¸å‡ºåŽé©—概率(如圖2所示)。ä¸åƒ…實ç¾äº†å°éŒ¯èª¤ç™¼éŸ³çš„æª¢éŒ¯å’Œè¨ºæ–·ï¼Œé‚„能å°é‡éŸ³ï¼Œèªžèª¿ï¼Œæµåˆ©åº¦ç‰å¯¦ç¾è©•測(如圖3所示)。
圖3 發音,é‡éŸ³ï¼ŒéŸ³èª¿æª¢éŒ¯ç³¾éŒ¯æŠ€è¡“展示
語音評測技術的çªç ´è®“AI系統æˆç‚ºç§äººç™¼éŸ³è€å¸«æˆç‚ºå¯èƒ½ã€‚當系統知é“å¸ç”Ÿå…·é«”的錯誤åŽï¼Œå°±èƒ½è‡ªå‹•匹é…相應的教å¸å…§å®¹å’Œç·´ç¿’é¡Œç›®ï¼Œå¯¦ç¾æ›´ç²¾æº–çš„è‡ªé©æ‡‰æŽ¨è–¦ã€‚如果新技術能得到普åŠï¼Œé‚£å°‡å¤§å¤§æ”¹å–„ä¸åœ‹å¸ç”Ÿçš„發音ç¾ç‹€ï¼Œç‰¹åˆ¥æ˜¯è§£æ±ºè¾²æ‘鄉鎮地å€çš„æ•™è‚²è³‡æºå’Œèªžè¨€ç’°å¢ƒå•題。
å¦å¤–,隨著ä¸åœ‹åœ¨åœ‹éš›ä¸Šåœ°ä½çš„æå‡ï¼Œç‰¹åˆ¥æ˜¯ä¸€å¸¶ä¸€è·¯çš„æŽ¨å‹•,愈來愈多外國人開始å¸ç¿’漢語,資料顯示全çƒå¸ç¿’漢語的外國人已經超éŽ1å„„ã€‚è€Œä¸æ–‡ç™¼éŸ³æ˜¯ä¸æ–‡å¸ç¿’ä¸çš„é‡å¤§é›£é¡Œï¼Œç™¼éŸ³è©•測的新技術能é‡å°å¤–åœ‹ä¸æ–‡å¸ç¿’者的發音錯誤的特點,利用å¯é çš„ç™¼éŸ³è‡ªå‹•è©•æ¸¬æ–¹æ³•åŠæ™‚ã€æº–確地糾æ£ç™¼éŸ³éŒ¯èª¤ï¼Œå¯ä»¥å¤§å¤§æé«˜ä¸æ–‡è¼”助語音教å¸ç³»çµ±çš„æ•™å¸æ•ˆæžœã€‚
語音轉æ›
éš¨è‘—èªžéŸ³ä¿¡è™Ÿè™•ç†æŠ€è¡“ï¼ˆåŒ…æ‹¬èªžéŸ³è˜åˆ¥å’ŒèªžéŸ³åˆæˆï¼‰çš„發展,在人機交互ä¸èªžéŸ³å·²æˆç‚ºæœ€è‡ªç„¶æœ€æ–¹ä¾¿äº¤äº’æ–¹å¼ä¹‹ä¸€ã€‚語音ä¸åƒ…å¯ä»¥å‚³éžä¿¡æ¯ï¼Œä¹Ÿå¯ä»¥å‚³éžæƒ…æ„Ÿã€æ…‹åº¦å’Œèªªè©±äººçš„個人特å¾ã€‚å…¶ä¸ï¼Œèªªè©±äººçš„個人特å¾åœ¨æˆ‘們日常交æµä¸æ‰®æ¼”é‡è¦è§’色,它å…許我們在電話ã€å»£æ’節目ã€é›»å½±ç‰åª’é«”ä¸å€åˆ†èªªè©±äººã€‚除æ¤ä¹‹å¤–,智能語音助手變得越來越æµè¡Œï¼Œæ¯”如 Apple Siriã€Microsoft Cortanaã€Amazon Alexa。大多數人å°èªžéŸ³åŠ©æ‰‹çš„éŸ³è‰²æœ‰å¾ˆå¼·çš„åå¥½ï¼Œå› æ¤ç”Ÿæˆå…·æœ‰ç‰¹åˆ¥éŸ³è‰²çš„èªžéŸ³åœ¨äººæ©Ÿäº¤äº’é ˜åŸŸéžå¸¸é‡è¦ã€‚
圖4 語音轉æ›ç¤ºæ„圖
ä¸Šè¿°å ´æ™¯å¯æ¸çµç‚ºèªžéŸ³è½‰æ›ï¼ˆVoice Conversion)å•題,目標在于修改éžç›®æ¨™èªªè©±äººNon-target(NT)Speaker的語音音色,使其è½èµ·ä¾†åƒæ˜¯ç›®æ¨™èªªè©±äººTarget(T)Speakerçš„èªžéŸ³ï¼Œä½†åŒæ™‚ä¿æŒèªªè©±çš„內容T- Contentä¸è®Šï¼ˆå¦‚圖4所示)。
深度å¸ç¿’æ˜¯äººå·¥æ™ºèƒ½é ˜åŸŸåŠƒæ™‚ä»£çš„é©å‘½æŠ€è¡“,隨著深度å¸ç¿’çš„æ‡‰ç”¨ï¼ŒåˆæˆèªžéŸ³å’Œè½‰æ›èªžéŸ³çš„è‡ªç„¶åº¦å’Œæµæš¢åº¦éƒ½æœ‰å¾ˆå¤§çš„æå‡ã€‚åœ¨èªžéŸ³åˆæˆé ˜åŸŸï¼ŒGoogle Deepmind 在2016å¹´æå‡ºçš„Wavenet模型將自然度æé«˜äº†50%。2017å¹´Yoshua Bengioç‰æå‡ºç«¯å°ç«¯åˆæˆæ¨¡åž‹ï¼Œä½¿å¾—模型å¯ä»¥å¾žæ–‡æœ¬ç›´æŽ¥ç”ŸæˆèªžéŸ³è€Œä¸éœ€è¦å‰ç«¯é 處ç†ã€‚在國內,康世胤ç‰åœ¨2013年將深度信念網絡(Deep Belief Networksï¼‰ç”¨äºŽèªžéŸ³åˆæˆï¼Œç‚ºå¸ç•Œæ¥ç•Œæœ€æ—©ä¹‹ä¸€ã€‚2017å¹´ï¼Œç™¾åº¦ç ”ç©¶é™¢æå‡ºDeep Voiceæ¨¡åž‹æ”¹é€²äº†èªžéŸ³åˆæˆé€Ÿåº¦ï¼Œå¯¦é©—è‰æ˜Žè©²æ¨¡åž‹å¯ä»¥ç”¨äºŽå¯¦æ™‚èªžéŸ³åˆæˆã€‚
èªžéŸ³è½‰æ›æŠ€è¡“çš„æœ€æ—©å˜—è©¦åœ¨1988å¹´ç”±Abeç‰å¸è€…完æˆã€‚在1988年到2013年期間,大部分算法基于Codebook Mappingã€Frequency Warpingã€Unit Selectionã€Gaussian Mixture Models。2013年開始,深度å¸ç¿’被應用到語音轉æ›ä¸ï¼ŒNakashikaç‰å°‡æ·±åº¦ç¥žç¶“網絡(Deep Neural Networks)用于在高ç¶ç©ºé–“ä¸ï¼Œå°‡éžç›®æ¨™èªªè©±äººèªžéŸ³æ˜ å°„åˆ°ç›®æ¨™èªªè©±äººèªžéŸ³ã€‚é›–ç„¶èªžéŸ³è½‰æ›æŠ€è¡“è¼ƒä»¥å‰æœ‰å¾ˆå¤§æå‡ï¼Œä½†æ˜¯èªžéŸ³è‡ªç„¶åº¦å’ŒéŸ³è‰²ç›¸ä¼¼åº¦æ–¹é¢ä»æœ‰å¾ˆå¤§çš„æ”¹å–„空間,å¦å¤–在實用é©ç”¨æ€§æ–¹é¢ä¸å¤ 完善比如åªèƒ½æ”¯æŒç‰¹å®šäººåˆ°ç‰¹å®šç›®æ¨™äººçš„轉æ›ï¼ˆä¸€è½‰ä¸€ï¼‰ï¼Œä»¥åŠéœ€è¦åš´è‹›çš„æ•¸æ“šæ¢ä»¶ï¼Œéœ€è¦ç›®æ¨™äººä¸Šåƒå¥çš„語音數據。
圖5 深度循環神經網絡(DBLSTM-RNNs)示æ„圖
在2015年,è²å¸Œç§‘技è¯åˆå‰µå§‹äººå«ç«‹ç™¼åšå£«åœ˜éšŠç‰åˆ©ç”¨æ·±åº¦å¾ªç’°ç¥žç¶“網絡(DBLSTM-RNNs)來改進轉æ›èªžéŸ³çš„è‡ªç„¶åº¦å’Œæµæš¢åº¦ï¼ˆå¦‚圖5所示),傳統的深度神經網絡DNNåªèƒ½æ˜ 射單一幀到單一幀之間的關系忽略了語音連續信號幀之間的相關性,DBLSTM-RNNs很好的解決了這個å•題從而å¯ä»¥æå‡è‡ªç„¶åº¦å’Œæµç¨‹åº¦ã€‚
圖6 éžå¹³è¡Œèªžå¥å¤šå°ä¸€èªžéŸ³è½‰æ›æ¡†æž¶åœ–
在2016年,å«ç«‹ç™¼åšå£«ç‰åˆ©ç”¨å¾žèªžéŸ³è˜åˆ¥æ¨¡åž‹æå–到的åŽé©—æ¦‚çŽ‡ä¾†æ˜ å°„éžç›®æ¨™èªªè©±äººå’Œç›®æ¨™èªªè©±äººï¼ˆå¦‚圖6所示),å¯ä»¥å¯¦ç¾å¤šå°ä¸€çš„轉æ›å¹¶ä¸”é™ä½Žäº†å°è¨“ç·´æ•¸æ“šçš„è¦æ±‚,大大æé«˜äº†èªžéŸ³è½‰æ›æŠ€è¡“的實用性。語音轉æ›å…·æœ‰å»£æ³›çš„æ‡‰ç”¨ï¼š
(1ï¼‰å€‹æ€§åŒ–èªžéŸ³åˆæˆã€‚å°‡èªžéŸ³è½‰æ›æŠ€è¡“èˆ‡ç¾æœ‰çš„èªžéŸ³åˆæˆç³»çµ±çµåˆï¼Œç”Ÿæˆç”¨æˆ¶æƒ³è¦çš„音色。
(2)計算機輔助語言å¸ç¿’ä¸çš„個性化語音å饋。目å‰èªžè¨€å¸ç¿’者在å¸ç¿’çš„éŽç¨‹ä¸åƒç…§çš„æ¨™æº–發音是統一的錄音,語音轉æ›ç³»çµ±å¯ä»¥åˆæˆå‡ºå…·æœ‰ç”¨æˆ¶è‡ªå·±éŸ³è‰²çš„æ¨™æº–ç™¼éŸ³ï¼Œå¹«åŠ©ç”¨æˆ¶é€²è¡Œè·Ÿè®€å°æ¯”。
(3)機器翻è¯ã€‚æ©Ÿå™¨ç¿»è¯æŠ€è¡“å¯ä»¥å°‡ä¸€å¥èªžéŸ³å¾žä¸€ç¨®èªžè¨€ç¿»è¯åˆ°å¦å¤–ä¸€ç¨®èªžè¨€ï¼Œè€ŒèªžéŸ³è½‰æ›æŠ€è¡“å¯ä»¥è¼”助機器翻è¯ï¼Œè®“ç¿»è¯åŽçš„語音ä»ç„¶ä¿æŒèªªè©±äººçš„音色。
(4)語言障礙患者的個性化輔助。語言障礙為ä¸é¢¨ã€å¸•金森ç‰ç–¾ç—…的常見åŽéºç™¥ã€‚語言障礙會影響患者的日常交æµå’Œå€‹æ€§åŒ–和情感表é”ã€‚èªžéŸ³è½‰æ›æŠ€è¡“åŠ ä¸ŠèªžéŸ³åˆæˆæŠ€è¡“å¯ä»¥è¼”助患者進行æ£å¸¸çš„語音æºé€šï¼Œå¹¶ä¸”找回自己è²éŸ³çš„音色。
(5ï¼‰å¨›æ¨‚é ˜åŸŸã€‚æ½›åœ¨æ‡‰ç”¨åŒ…æ‹¬é›»å½±é›»è¦–é…音,游戲é…音,導航é…音ç‰ã€‚
å«ç«‹ç™¼åšå£«
é¦™æ¸¯ä¸æ–‡å¤§å¸åšå£«ï¼Œä¸åœ‹ç§‘å¸æŠ€è¡“å¤§å¸å¸å£«ï¼Œæ›¾ä»»ç¡…è°·è˜‹æžœå¯¦ç¿’ç”Ÿã€‚ç ”ç©¶æ–¹å‘主è¦ç‚ºèªžéŸ³è½‰æ›ï¼ŒèªžéŸ³åˆæˆï¼Œ2016年榮ç²é ‚級國際會è°ICME2016唯一一個最佳論文çŽã€‚曾任香港ä¸åœ‹å‰µæ–°å‰µæ¥å”會ç†äº‹, å…¨çƒé’å¹´é ˜å°ŽåŠ›è¯ç›ŸGYL香港社å€è¯å¸ä¸»å¸ï¼Œé¦™æ¸¯ä¸æ–‡å¤§å¸å…§åœ°å¸ç”Ÿå¸è€…è¯èª¼æœƒCSSA主å¸ã€‚
ç¾ç‚ºè²å¸Œç§‘技è¯åˆå‰µå§‹äººå…¼CEO,專注于人工智能+在線教育,2017å¹´è²å¸Œç§‘技榮膺ä¸åœ‹å‰µæ–°å‰µæ¥å¤§è³½å…¨åœ‹ç¬¬äº”å,為廣æ±çœå”¯ä¸€ä¸€å€‹å…¥é¸ç¸½æ±ºè³½çš„åˆå‰µä¼æ¥ï¼Œç‚ºå”¯ä¸€ä¸€å€‹å…¥é¸ç¸½æ±ºè³½çš„æ™ºèƒ½èªžéŸ³ä¼æ¥ã€‚
æŽå¤åšå£«
æ›¾ä»»é¦™æ¸¯ä¸æ–‡å¤§å¸ç ”究助ç†ï¼Œåšå£«åŽç ”ç©¶å“¡ã€‚æ“æœ‰5é …åœ‹å…§åŠåœ‹éš›å°ˆåˆ©ï¼Œç™¼è¡¨è¶…éŽ15篇å¸è¡“è«–æ–‡ã€‚å…¶è«–æ–‡æ›¾ç² ICME 2016年度最佳論文çŽï¼Œå¹¶æ¦®ç™»IEEE/ACM transactions期刊å°é¢ï¼ˆ2017å¹´ï¼‰ã€‚åŒæ™‚æ˜¯å¤šå®¶åœ‹éš›é ‚ç´šèªžéŸ³æœŸåˆŠå¯©ç¨¿äººï¼ŒåŒ…æ‹¬IEEE/ACM transactions, Computer Speech & Language, The Journal of the Acoustical Society of America.
æŽå¤åšå£«äºŽ2016年創立è²å¸Œç§‘技,主è¦è² 責開發基于人工智能的語言å¸ç¿’ç³»çµ±ã€‚ä»–å¸¶é ˜çš„åœ˜éšŠç²å¾—å¤šé …æ”¿åºœåŠå°ˆæ¥åœ˜é«”的資助,包括深圳科創委和香港數碼港的創æ¥è³‡åŠ©ï¼Œç´¯è¨ˆé‡‘é¡è¶…éŽ100è¬äººæ°‘幣。其團隊屢次摘得創æ¥å¤§çŽï¼ŒåŒ…括深圳市創新創æ¥å¤§è³½äº’è¯ç¶²è¡Œæ¥ä¸‰ç‰çŽã€ä¸åœ‹å‰µæ–°å‰µæ¥å¤§è³½äº’è¯ç¶²è¡Œæ¥ä¸‰ç‰çŽç‰ã€‚ç›®å‰ï¼ŒæŽå¤åšå£«é–‹ç™¼çš„æŠ€è¡“å·²æˆåŠŸæ‡‰ç”¨äºŽç™¾è©žæ–¬ã€ç¹½ç´›è‹±èªžã€çŽ©çž³ç‰å¤šå®¶æ•™è‚²å…¬å¸çš„產å“。
標簽:
上一篇:雕銑機解決方案
下一篇:一種基于強化注æ„力機制和åº...
ä¸åœ‹å‚³å‹•網版權與å…è²¬è²æ˜Žï¼šå‡¡æœ¬ç¶²æ³¨æ˜Ž[來æºï¼šä¸åœ‹å‚³å‹•ç¶²]的所有文å—ã€åœ–片ã€éŸ³è¦–å’Œè¦–é »æ–‡ä»¶ï¼Œç‰ˆæ¬Šå‡ç‚ºä¸åœ‹å‚³å‹•ç¶²(www.siyutn.com)ç¨å®¶æ‰€æœ‰ã€‚如需轉載請與0755-82949061è¯ç³»ã€‚任何媒體ã€ç¶²ç«™æˆ–å€‹äººè½‰è¼‰ä½¿ç”¨æ™‚é ˆæ³¨æ˜Žä¾†æºâ€œä¸åœ‹å‚³å‹•ç¶²â€ï¼Œé•å者本網將追究其法律責任。
本網轉載并注明其他來æºçš„稿件,å‡ä¾†è‡ªäº’è¯ç¶²æˆ–æ¥å…§æŠ•稿人士,版權屬于原版權人。轉載請ä¿ç•™ç¨¿ä»¶ä¾†æºåŠä½œè€…ï¼Œç¦æ¢æ“…自篡改,é•è€…è‡ªè² ç‰ˆæ¬Šæ³•å¾‹è²¬ä»»ã€‚
相關資訊