女人国产香蕉久久精品,免费中文熟妇在线影片密芽,免费av永久免费网址,欧美+视频,久久天堂综合亚洲伊人hd

×

4006-234-116

13681552278

手機版

公眾號

天晴創(chuàng)藝網(wǎng)站建設(shè)公司。主要為北京、天津全國各地提供網(wǎng)站建設(shè)與網(wǎng)頁設(shè)計制作服務(wù),歡迎大家咨詢。您的IP地址是:154.194.152.162。今天是:,,(),,現(xiàn)在是:18:26:24,

在Google做數(shù)據(jù)標注,你得有醫(yī)師資格證

作者:天晴創(chuàng)藝發(fā)布時間:2019/1/21 17:14:18瀏覽次數(shù):11642文章出處:北京自適應(yīng)網(wǎng)站建設(shè)

      在一排一排的電腦前,這里的年輕人們一邊瀏覽照片和視頻,一邊標記他們看到的每樣東西。
      有的是在為無人駕駛公司標注路上的汽車和紅綠燈,有的是在為無人售貨公司標注面包牛奶巧克力。
 數(shù)據(jù)標注
河南省郟縣睿金科技公司工人正在標注數(shù)據(jù)
      據(jù)《紐約時報》的報道,在位于中原腹地的河南河北,數(shù)據(jù)標注正在漸漸成為最新的勞動密集型行業(yè)。
      有多少人工,就有多少智能。目前的人工智能在被投喂了大量數(shù)據(jù)之后營銷型網(wǎng)站制作,才能認出三歲小孩子都能認出的東西,學會“黑貓白貓都是貓”。
數(shù)據(jù)標注

當然,貍花貓也是貓
      然而,在人工成本更高以及對數(shù)據(jù)標注要求更復雜的硅谷,工程師們需要尋找其他出路來獲取大規(guī)模的高質(zhì)量有標記數(shù)據(jù)。
      1.眾包
      在人工費用高昂的硅谷,工人的最低時薪約為13美元左右。對于很多創(chuàng)業(yè)公司和中小企業(yè)來說,雇工人標注數(shù)據(jù)實在承受不起。
      最經(jīng)濟的方法就是把大量任務(wù)拆分成小任務(wù),再以低廉的價格分發(fā)到用戶手中。
      其中最有名的在線眾包平臺就是亞馬遜旗下的Amazon Mechanical Turk了。
      在Mechanical Turk 上,發(fā)布者可以自行上傳標注任務(wù),用戶只需要填寫簡單的個人信息就可以開始工作。
      為了搞清楚Mechanical Turk到底是怎么工作的,我們也注冊了一個賬號。
      在Mechanical Turk的開始頁面,有各種奇奇怪怪的任務(wù)。這其中包括“標注廚房里的事物”,“找出電子郵件地址和發(fā)件人名字”,“給圖片中的物體勾線”等等。
      每個任務(wù)中包含若干個被稱為HIT(人類智能任務(wù),Human Intelligence Task)的小任務(wù),標注員每完成一個小任務(wù)可以獲得相應(yīng)的報酬。
      其中最便宜的一個是給圖片中的建筑分類,判斷這個小樓是屬于拉丁裔、亞裔還是中東人。每完成一個可以獲得1美分(約7分人民幣)報酬。
      而最貴的一個,是找一位中文母語者按要求錄150句中文,可以獲得6美元。
      除了這些簡單易懂,點一下鼠標就能完成的任務(wù),在Mechanical Turk上還有更多高要求的標注工作。
      比如,有一個任務(wù)要求標注者看10秒鐘視頻,并用一句話描述視頻里的內(nèi)容。
      在描述時,不能出現(xiàn)拼寫和語法錯誤,也不能加以主觀臆斷,在囊括所有重要內(nèi)容的同時又不能描述太多不重要的細節(jié)。
      而實現(xiàn)這么一個高要求的任務(wù),發(fā)布者只需要付出0.3美元賞金。
數(shù)據(jù)標注
建議家長拿這個玩意兒訓練小朋友寫英語短句
      盡管任務(wù)復雜報酬低廉,Mechanical Turk上的任務(wù)還是供不應(yīng)求。一些低要求的工作被放出來不到十秒,就被搶光了。
      截至2011年1月,Mechanical Turk上的注冊工人數(shù)量已經(jīng)達到了50萬,在這些人的幫助下,有無數(shù)資金不充裕的人工智能研究得以實現(xiàn)。
      此外,在網(wǎng)站輸入驗證碼時,其實我們也在順便做數(shù)據(jù)標注,只不過得不到報酬罷了。
數(shù)據(jù)標注
比如這種標出路牌的驗證碼
      而其實,Mechanical Turk(直譯為機械土耳其人)的名字早就劇透了人工智能訓練的本質(zhì)。
      1769年,初代Mechanical Turk的發(fā)明者——匈牙利機械師沃爾夫?qū)?#8226;馮•肯佩倫制造了一個“能戰(zhàn)敗人類”的下棋木偶。
      這個“智能”木偶在歐洲和美洲幾乎戰(zhàn)無不勝,連拿破侖一世和本杰明•富蘭克林都成了它的手下敗將。
      然而直到1857年,《國際象棋月刊》才揭露,其實傀儡里坐了一個象棋國手。
      而電腦屏幕背后的人,又和機器里坐著的象棋國手有什么區(qū)別呢?

      2.和專業(yè)人士合作
      眾包模式固然有種種優(yōu)點,但它的缺點也是致命的。
      當我向一位Google工程師朋友提起Mechanical Turk的時候,他表示“我們不敢用Turk 標注”。
      因為眾包模式,通過Mechanical Turk標注的數(shù)據(jù)良莠不齊,花錢標注已經(jīng)花了大功夫,整理和“清洗”數(shù)據(jù)又要浪費很多時間。
      尤其對于很多專業(yè)領(lǐng)域來說,普通人根本無法完成數(shù)據(jù)標注。

數(shù)據(jù)標注

比如這種,你能告訴我哪個是有病變的嗎?

      2017年,Google AI公布了一項突破性研究成果:通過機器學習技術(shù),AI能夠從病人的視網(wǎng)膜眼底照片中自動診斷出潛在的病變情況,來提前發(fā)現(xiàn)糖尿病性視網(wǎng)膜病變,進行及時的治療和預防,讓患者保住視力。
      但想要教會AI什么是正常的眼底照片,什么是有潛在病變的眼底CES,這個過程并不容易。
      為了獲得高質(zhì)量的標注圖片,真正讓AI的診斷水平達到執(zhí)業(yè)醫(yī)師的同等標準,Google與印度和美國的眼科醫(yī)生合作,創(chuàng)建了含有12萬張圖像的開發(fā)數(shù)據(jù)集,再由3到7名眼科醫(yī)生聯(lián)合評估圖片中的病變。
      最終,共計54名醫(yī)生從這些視網(wǎng)膜眼底照片素材中標記出超過88萬個確診癥狀。
      這些圖片和標記全部被用來訓練深度卷積神經(jīng)網(wǎng)絡(luò),最終使得AI的診斷準確率逼近甚至超越了醫(yī)生。
      在Google Brain參與另一個與壽命預測相關(guān)的項目的工程師Steven Zhan告訴我,他們的數(shù)據(jù)集標注工作基本無法眾包,都是交給醫(yī)生來完成的。
      雖然在未來,AI很有可能發(fā)展到“自己教自己”這一步。
      但目前為止,大部分的數(shù)據(jù)標注工作都是由真人完成的。這個工作不像大家想象的那么簡單,而是充滿了復雜的判定和繁瑣的重復。
      而隨著人們對數(shù)據(jù)的需求越來越高,也有越來越多的人開始靠標注數(shù)據(jù)為生。
      皮尤研究中心預測,這種零碎的數(shù)據(jù)標注工作將在未來幾年內(nèi)成為美國經(jīng)濟的重要組成部分。
      在2016年,有大約5%的美國人通過Mechanical Turk這樣的在線標注平臺賺錢——這個數(shù)量已經(jīng)超過了優(yōu)步司機。
      在可見的未來里,人類還將繼續(xù)為人工智能打工。
      在中國如此,在美國也一樣。

杰創(chuàng)網(wǎng)絡(luò)科技,

文章來源:北京自適應(yīng)網(wǎng)站建設(shè)

文章標題:在Google做數(shù)據(jù)標注,你得有醫(yī)師資格證

文本地址:http://www.cxgb.com.cn/info_960.html

收藏本頁】【打印】【關(guān)閉

本文章Word文檔下載:word文檔下載 在Google做數(shù)據(jù)標注,你得有醫(yī)師資格證

用戶評論

客戶評價

專業(yè)的網(wǎng)站建設(shè)、響應(yīng)式、手機站微信公眾號開發(fā)

© 2010-2022 北京天晴創(chuàng)藝科技有限公司 版權(quán)所有 京ICP備16050845號-2   

關(guān)注公眾號 關(guān)注公眾號

進入手機版 進入手機版