“抬頭是山,低頭是煤。”曾在山西傳統(tǒng)煤礦工作8年, 整天盯在電腦屏幕前監(jiān)測礦井瓦斯?jié)舛鹊墓窂膩頉]有想過,有一天自己的工作會和人工智能有了聯(lián)系。
成都創(chuàng)新互聯(lián)公司服務項目包括甘州網(wǎng)站建設、甘州網(wǎng)站制作、甘州網(wǎng)頁制作以及甘州網(wǎng)絡營銷策劃等。多年來,我們專注于互聯(lián)網(wǎng)行業(yè),利用自身積累的技術(shù)優(yōu)勢、行業(yè)經(jīng)驗、深度合作伙伴關(guān)系等,向廣大中小型企業(yè)、政府機構(gòu)等提供互聯(lián)網(wǎng)行業(yè)的解決方案,甘州網(wǎng)站推廣取得了明顯的社會效益與經(jīng)濟效益。目前,我們服務的客戶以成都為中心已經(jīng)輻射到甘州省份的部分城市,未來相信會繼續(xù)擴大服務區(qū)域并繼續(xù)獲得客戶的支持與信任!兩年前,因為孩子來省會城市太原上學,郭梅在附近求職,做起了數(shù)據(jù)標注。同樣是盯在電腦屏幕前,現(xiàn)在郭梅每天的工作是給圖片、文本或者聲音進行標注,再把它們交給機器訓練和學習。從一開始每天只能標注兩三百張,到現(xiàn)在的日均完成1300多張,郭梅按件計酬的收入逐漸提升,已高于當?shù)仄骄杖胨健?/p>
人工智能行業(yè)里有句話:有多少智能,背后就有多少人工。像郭梅一樣,AI數(shù)據(jù)標注師成為了隨著人工智能發(fā)展而出現(xiàn)的新興就業(yè)崗位。2020年2月,“人工智能訓練師”正式成為新職業(yè)并納入國家職業(yè)分類目錄。
他們被稱為人工智能背后的人。數(shù)據(jù)采集和標注是他們的主要工作,目的就是要教會AI認識數(shù)據(jù),轉(zhuǎn)化成AI能消化和吸收的“語言”。有了足夠多、足夠好的數(shù)據(jù),AI才能夠?qū)W會像人類一樣去感知、思考和決策,更好地為人類服務。
這項工作看起來簡單枯燥,但意義非常。“就像一臺車沒有汽油走不了,數(shù)據(jù)就是人工智能發(fā)展的燃料。有了我們的數(shù)據(jù),機器(算法)不斷迭代,就能推動人工智能往更好的方向發(fā)展。” 從事數(shù)據(jù)標注的山西麟諾公司總經(jīng)理李應維對第一財經(jīng)表示。
“從沒想過做人工智能”
20出頭的李宇龍從未親眼見過自動駕駛汽車,但他的工作卻和自動駕駛的AI算法息息相關(guān)。
他曾經(jīng)在生產(chǎn)電子類產(chǎn)品的工廠工作,轉(zhuǎn)做AI數(shù)據(jù)標注后,老板交給他的第一個項目就是“車道線打點”。
簡單來說,就是給無人駕駛進行車道線標注。當無人車行駛到一段路時,會自動連續(xù)拍攝圖片,李宇龍要做的,就是對圖片上車輛所行駛的車道旁邊兩側(cè)的線進行標注,識別虛線還是實線,匹配所對應的屬性,從而告訴人工智能虛線車輛可以進行變道,實線不可以進行變道。而標注的難點,在于交匯和分岔。
當時的李宇龍,還不知道數(shù)據(jù)標注師到底是什么,更對人工智能沒有具體概念,老板只交給他一套規(guī)則,讓他按照規(guī)則在電腦上認車道線。好學的他在短時間內(nèi)就掌握了規(guī)則和難點,總結(jié)出了標注車道的規(guī)律。
他把自己的工作比作“幼教“,當他拿出一個紅蘋果給機器并教會它識別,再拿一個綠蘋果給它時,因為顏色差異,機器就無法認出了。李宇龍的工作就是不斷地幫助機器識別不同的顏色、大小,甚至是被咬了一口的蘋果或是壞蘋果,直到隨便拿出一個蘋果,它都能認出來。
李宇龍告訴第一財經(jīng)記者,數(shù)據(jù)標注的工作是“按件計酬”,他的日均收入在300元左右。數(shù)據(jù)顯示,2019年,太原市的城鎮(zhèn)居民全年人均可支配收入36362元。他說,自己的工資水平在整個基地標注師日均收入中處于中等水平,“據(jù)我了解,有人日均收入甚至能破千。”
對于自己的工作,李宇龍說,剛開始接觸時,只把它看做一個重復性的工作,并沒有想太多。直到后來接觸項目多了,涉及的領域包括教育、安防、金融、交通醫(yī)療和電商等,每天都在挑戰(zhàn)學習能力,也會想要更深入了解自己標注的內(nèi)容可以應用到的行業(yè)。 雖然還沒有坐過無人車,但他說,現(xiàn)在看到無人駕駛的時候,會想到這里面也包含了自己的標注成果。
像李宇龍、郭梅的工作一樣,第一財經(jīng)記者看到,在每一間數(shù)據(jù)標注的辦公室里,都是類似的工作場景:一排排電腦屏幕前,年輕的數(shù)據(jù)標注師根據(jù)各自分配的任務,對文本、圖片、語音和視頻做標記、標重點、打標簽、框?qū)ο?、做注釋等方式對?shù)據(jù)集作出標注,他們可能在為無人車標注車道線、紅綠燈,也可能是在為肺部影像標注病毒數(shù)據(jù)。
以人臉為例,目前能實現(xiàn)對約150個特征點的標注。疫情期間,采集大量的戴口罩的人臉照片后,數(shù)據(jù)標注師對人臉的眉毛、眼鏡、顴骨等人臉關(guān)鍵點進行精準標注,標注特征點越多,AI就越能精確識別出戴口罩場景下的人臉。最終實現(xiàn)即使不摘口罩,也能實現(xiàn)精確測量體溫,或是通過人臉閘機。
是不是“AI富士康”?
數(shù)據(jù)標注產(chǎn)業(yè)促進了不少城鎮(zhèn)和農(nóng)村就業(yè),在河南、河北、貴州等地,還出現(xiàn)了一些特色的“數(shù)據(jù)標注村”。
據(jù)IDC統(tǒng)計,全球每年生產(chǎn)的數(shù)據(jù)量將從2016年的16.1ZB猛增至2025年的163ZB,其中80%-90%是非結(jié)構(gòu)化數(shù)據(jù),這些數(shù)據(jù)經(jīng)過清洗與標注才能被喚醒價值。在我國,每年需要進行標注的語音數(shù)據(jù)超過200萬小時,圖片則有數(shù)億張,這就產(chǎn)生了源源不斷的清洗與標注需求。 李應維對第一財經(jīng)記者說, 他預計明年企業(yè)的用工將翻一倍,從160多人擴展到300人左右。
李應維公司所在的百度(山西)人工智能基礎數(shù)據(jù)產(chǎn)業(yè)基地,已經(jīng)成為中國人員和產(chǎn)值規(guī)模第一的單體數(shù)據(jù)標注基地。AI數(shù)據(jù)標注師從業(yè)人員超過2000人,實現(xiàn)營業(yè)收入超億元,企業(yè)入駐35家。該基地計劃在未來5年培養(yǎng)5萬名AI數(shù)據(jù)標注師,并引入更多AI合作伙伴。
百度(山西)人工智能基礎數(shù)據(jù)產(chǎn)業(yè)基地負責人尉赤告訴記者,人工智能是個高速發(fā)展的行業(yè),數(shù)據(jù)服務又與人工智能息息相關(guān)。“我們的線上眾包注冊用戶有將近2000萬人,目前每個月在線上為我們提供服務的人將近5萬人。如果按照行業(yè)增長速度來看,培養(yǎng)5萬人還不一定夠。”
不過,數(shù)據(jù)標注師看上去是人工智能領域一個“入門”工種:技術(shù)門檻低,招工人群范圍廣泛。他們通過每天數(shù)千次的重復動作,和最前沿科技的人工智能產(chǎn)生聯(lián)系。也因此,外界給這個行業(yè)貼上了“AI富士康”的標簽。
數(shù)據(jù)標注帶來了技術(shù)紅利,但如果人工智能發(fā)展到一定程度,甚至有可能夠取代數(shù)據(jù)標注師的工作。
艾瑞咨詢在一份人工智能相關(guān)報告指出,隨著算法需求越來越旺盛,依賴人工標注不能滿足市場需求,因此增強數(shù)據(jù)處理平臺持續(xù)學習能力,由機器持續(xù)學習人工標注,提升預標注和自動標注能力對人工的替代率將成趨勢。此外,隨著 AI對數(shù)據(jù)的要求越來越高,數(shù)據(jù)標注行業(yè)也正逐步進入精細化階段。
對于數(shù)據(jù)標注這一職業(yè)的未來,李應維對記者舉例,自己公司一名員工入職后,因為表現(xiàn)優(yōu)異,不久已被百度公司聘用。而且,數(shù)據(jù)標注師也在為人工智能培養(yǎng)和發(fā)現(xiàn)人才。
尉赤則認為,目前大家更多地聚焦在數(shù)據(jù)加工這件事,但如果再往前看,更多的是數(shù)據(jù)的優(yōu)化、還有一些相關(guān)的解決方案。數(shù)據(jù)標注是一個很好的入門,進來之后有機會更深度參與到產(chǎn)業(yè)鏈協(xié)作當中,例如后續(xù)當數(shù)據(jù)標注越來越機器化,人工和自動化之間要有機的協(xié)同,這也對員工提出了更高的要求。
此外,當數(shù)據(jù)標注越來越機器化,人工智能訓練師是一個轉(zhuǎn)換工種的機會,標注員們現(xiàn)在標注數(shù)據(jù),未來可能向數(shù)據(jù)治理、數(shù)據(jù)解決方案設計和項目管理等方向發(fā)展。
例如,現(xiàn)在李宇龍的工作重心已經(jīng)轉(zhuǎn)向培訓,同時接觸到更多的項目管理,根據(jù)每個項目對應的特點判斷與之匹配的能力。 在他看來,自己比很多傳統(tǒng)行業(yè)的人們更早地接觸到未來的發(fā)展方向和未來的生活、工作場景,“看到了未來的發(fā)展需求,也就比別人更早找到更多發(fā)展機會。”
分享題目:人工智能背后的“人工”:誰在訓練AI?
標題鏈接:http://jinyejixie.com/article12/cjdpgc.html
成都網(wǎng)站建設公司_創(chuàng)新互聯(lián),為您提供移動網(wǎng)站建設、外貿(mào)建站、面包屑導航、手機網(wǎng)站建設、定制開發(fā)、網(wǎng)站排名
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)