傳動網 > 新聞頻道 > 技術前沿 > 資訊詳情

谷歌推出視頻數據庫 挑戰高難度機器視覺識別技術

時間:2017-10-23

來源:網絡轉載

導語:谷歌在機器視覺學習方面積累大量的數據以及技術,最近,他們推出了一個新的視頻數據庫,名稱為“原子視覺行為(AVA)“,該數據可由一個或多個標簽組成,能夠推動計算機視覺識別影像中行為的研究。

谷歌在機器視覺學習方面積累大量的數據以及技術,最近,他們推出了一個新的視頻數據庫,名稱為“原子視覺行為(AVA)“,該數據可由一個或多個標簽組成,能夠推動計算機視覺識別影像中行為的研究。

說到圖像識別,其實谷歌的照片應用就可以自動識別出寵物圖像,很多公司也在圖片識別上作出很多優化嘗試,比如Shutterstock上周公布了一項全新的測試功能,用戶可以根據自己的布局來搜索股票照片。

相較于這些發生在靜態圖像領域的機器視覺識別技術,應用到視頻中的難度會更大,因為在視頻中,每一幀畫面的都包括各種復雜的場景,而且很多時候視頻中一個動作是由不同的人發出的。不過視頻識別方面的應用現在也有一些案例,比如著名色情網站Pornhub,它可以自動對成人視頻進行分類,包括讓系統識別出特定的性姿勢。

谷歌的軟件工程師也解釋道,“讓機器去識別影像中的人類行為是發展計算機視覺的一大難題,盡管過去幾年在圖像分類和尋找物體方面取得了突破。”所以谷歌推出了這個AVA數據庫,AVA包括80多個被動作標簽標注的Youtube視頻網址,比如握手、接吻、喝酒、擁抱等等。

谷歌希望通過開放這個數據庫,進一步改進他們基于視頻識別的機器視覺能力。

中傳動網版權與免責聲明:

凡本網注明[來源:中國傳動網]的所有文字、圖片、音視和視頻文件,版權均為中國傳動網(www.siyutn.com)獨家所有。如需轉載請與0755-82949061聯系。任何媒體、網站或個人轉載使用時須注明來源“中國傳動網”,違反者本網將追究其法律責任。

本網轉載并注明其他來源的稿件,均來自互聯網或業內投稿人士,版權屬于原版權人。轉載請保留稿件來源及作者,禁止擅自篡改,違者自負版權法律責任。

如涉及作品內容、版權等問題,請在作品發表之日起一周內與本網聯系,否則視為放棄相關權利。

關注伺服與運動控制公眾號獲取更多資訊

關注直驅與傳動公眾號獲取更多資訊

關注中國傳動網公眾號獲取更多資訊

最新新聞
查看更多資訊

熱搜詞
  • 運動控制
  • 伺服系統
  • 機器視覺
  • 機械傳動
  • 編碼器
  • 直驅系統
  • 工業電源
  • 電力電子
  • 工業互聯
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機界面
  • PLC
  • 電氣聯接
  • 工業機器人
  • 低壓電器
  • 機柜
回頂部
點贊 0
取消 0