測試廣告1「我們和youtube現在正在聯合研發一款智能識別圖片及視頻的系統。道友閣 www.daoyouge.com
研發完成後,它將用於甄別、封禁油管平台上發佈的仇恨、種族歧視、血腥、黃/暴及其他違反各國法律規定的圖片、視頻。」
得知夏景行前來視察工作,吳恩達和李飛飛作為復興工業(美國)人工智能研究院的正、副院長親自帶着大老闆在各個實驗室參觀了起來。
一行人邊走邊聊。
夏景行笑着說道「這段時間辛苦你們了,違禁視頻一直是油管的一塊心病。
因為這玩意兒,油管經常被社會各界抨擊,快被形容成傳播毒瘤的網站了。」
吳恩達笑道「油管每個月有來自幾十個國家的幾億人訪問和上傳視頻,這種大型平台的管理確實是件令人頭疼的事情。。
光依靠人工審核視頻, 很難實現高效的審核,同時還會造成大量的人力支出。
擁有一款高識別精準率的審核系統,可以為油管省很多事。
不過現階段的ai識別精準率很難達到完全不依賴人工審核的程度。
未來很長一段時間內,還是需要ai和人工一起搭配審核,ai為主,人工為輔。」
夏景行笑了一下, 「我明白, 人工智能也會出錯,把正常視頻判別成違禁視頻。」
吳恩達點點頭,道「要想徹底解決這個問題,還需要繼續訓練我們的算法模型,才能使它的識別更精確。
怎麼訓練人工智能呢?我們需要更多的標註數據。」
李飛飛在一旁補充道「我之前曾開發了一個iage數據庫,下載了10億張圖片,為了找人標註這些圖片,我使用了亞馬遜的眾包服務平台at,但幾年時間過去了,僅僅只標註了幾百萬張圖片。」
夏景行微微點頭,亞馬遜at,又名ai富土康。
顧名思義,這就是一個網上接單做兼職的平台,其中最多的任務就是標註數據。
怎麼標註呢?很簡單,坐在電腦前,對數據進行手工輸入、分類,區分出一張照片中是否有「狗」,辨別語句中的「bass」到底是低音還是鱸魚。
每標註一張圖片、一段語音,可以掙3美分。
看起來掙得很少, 但積少成多, it外包業務發達的印度就有很多家庭婦女把這份兼職工作做成了全職工作,每天工作8小時,一個月能掙700美元。
聽起來感覺好像還不錯,但其實比工廠打螺絲還枯燥乏味。
不過畢竟是兼職工作,也沒人站在旁邊督促,想干就干,算是比較自由的工作。
夏景行問道「我們開發的fx數據庫,現在標註了多少張照片?」
吳恩達嘆了口氣,「就一百多萬張,因為找不到那麼多人幹這活,亞馬遜at上面的活躍用戶太少,很多人幹着幹着就不幹了。」
夏景行皺起了眉頭,「太少了,標註數據就是人工智能的飼料,要趕緊想個辦法把標註數量提升上去。」
說到這,夏景行心中突然一動,脫口而出道「哎,我們可以考慮把這個產業引入中國啊?
一個月掙四五千塊,應該還是能吸引一些人當數據標註員的。」
夏景行一下子聯想到了很多東西,西哥可以在老家辦個外呼中心,自己也可以在老家辦個數據標註中心啊!
找一幫有一定文化基礎的婦女,培訓一下就可以上崗了,而且還可以在家裏幹活,相當於補貼家用了。
夏景行把自己的想法給吳恩達和李飛飛講了一下。
李飛飛老家也是蓉城的,而且這是為婦女提供工作崗位,她對這件事很感興趣,立馬針對性的提出了不少建議。
吳恩達提出了不同意見「選擇眾包模式,估計標註員只能標註一些簡單的圖片。
而視頻標註和3d標註有些複雜,每一幀畫面都需要標註數據。
尤其是戴倫你提過的自動駕駛,想想都覺得數據量恐怖。」
夏景行記得前世湧現出了一些專業的數據標註公司,他們的主