2019-08-30 16:04:00
昔日流水線上的工人,成為了教“人工智能”認(rèn)識(shí)蘋果、桌子、椅子的第一位老師。
芒種剛過,河南郟縣東郊,望不到邊的農(nóng)田里,農(nóng)民們彎腰割起了小麥。不遠(yuǎn)處機(jī)械廠、汽車修理廠,機(jī)器聲此起彼伏。但再往西的建材廣場(chǎng)卻人來人往,這些天,廣場(chǎng)三樓,來了幾百個(gè)被采集者。
這幾百個(gè)人中,有剛從玉米地里匆匆趕過來的農(nóng)民,連草帽也沒來得及摘下。有機(jī)關(guān)大樓下了班的公務(wù)員,也有服裝店里請(qǐng)了假的導(dǎo)購(gòu)員。年輕小姑娘們聚在一起,談?wù)撝o(hù)膚和美妝。角落里,大腹便便的中年大叔點(diǎn)了根煙,低頭玩起手機(jī)。
他們被輪流帶進(jìn)了臨時(shí)搭的攝影棚里——一個(gè)光線昏暗、不到30平米的小房間,墻壁不久前剛被刷得雪白,里面擺著椅子、三腳架和燈光器材。
有人指引他們坐在椅子上,面朝一部被固定在黑色三腳架上的手機(jī),手機(jī)和被拍攝者之間的距離是固定的,不能多,也不能少。每次開拍前,一名皮膚黝黑,身材微胖,長(zhǎng)著老實(shí)憨厚方臉的員工都會(huì)掏出卷尺,仔細(xì)再量一遍。
方臉員工叫張凱。量完距離后,他需要用幾部像素不同的手機(jī)拍攝這些被采集者。
在白光、黃光、暗光等不同光線下,張凱拍了四輪,加起來總共100張。一般情況下,他3分鐘就能拍完,不會(huì)超過5分鐘。
這項(xiàng)工作名為“數(shù)據(jù)采集”,被拍攝者能得到一個(gè)價(jià)值一二十元的塑料大桶作為獎(jiǎng)品。采集而來的照片、語音等數(shù)據(jù),將會(huì)提供給人工智能企業(yè),用于機(jī)器的訓(xùn)練和學(xué)習(xí)。
剛接下任務(wù)時(shí),領(lǐng)導(dǎo)告訴張凱,這次的數(shù)據(jù)收集要嚴(yán)格按照給定的規(guī)則,做數(shù)據(jù)收集,但具體的應(yīng)用場(chǎng)景,領(lǐng)導(dǎo)沒說,張凱也沒問。
拉對(duì)一個(gè)框能賺4分錢
去年夏天,張凱有了孩子,他辭掉了原本在石子廠維護(hù)器械的工作,回家照顧妻兒。一兩個(gè)月后,張凱得重新工作養(yǎng)家,一家名為“千機(jī)數(shù)據(jù)”的公司正好在招人,“輕松、離家近、工資高”。
公司在縣城東邊一個(gè)建材廣場(chǎng)的三層,從張凱的老家長(zhǎng)橋鎮(zhèn)開車過來,只用20分鐘。他推開公司門的那一刻,空調(diào)的涼風(fēng)灌進(jìn)身體,面前的場(chǎng)景讓他有些震驚:幾百名員工坐在棕色的沙發(fā)上,埋在電腦屏幕前,不停地拖動(dòng)鼠標(biāo),敲擊鍵盤,“像個(gè)大網(wǎng)吧”。
河南郟縣一家數(shù)據(jù)的辦公室,如同一個(gè)大網(wǎng)吧 。記者周小琪 攝
人力主管向他介紹說,公司主要做數(shù)據(jù)標(biāo)注,簡(jiǎn)單來說就是給圖片上的物體拉框框,只要會(huì)用電腦就能干。每天8點(diǎn)上班,中午管飯,休息1個(gè)半小時(shí),下午6點(diǎn)30下班,每個(gè)月有三四天的假期,工資保底2000塊,多勞多得。
張凱聽得迷迷糊糊,他從沒聽說過“數(shù)據(jù)標(biāo)注”,也不懂為什么拉框。但公司環(huán)境好,不像以前一樣風(fēng)吹日曬,當(dāng)即決定留下來。
他被安排在一個(gè)有電腦的工位上。入職后,領(lǐng)導(dǎo)傳來一個(gè)文件包,里面是一份軟件的教學(xué)文檔和幾百?gòu)垙N房、餐廳的圖片。張凱需要做的是:把圖片上的碗、碟、杯子、筷子等餐具都框出來,然后選好屬性、分好類。拉對(duì)一個(gè)框能賺4分錢。
張凱覺得很新奇——把這些鍋碗瓢盆框出來能干嘛?但初來乍到,他沒好意思多打聽。
第一天上班,張凱費(fèi)勁拉了幾百個(gè)框。他不熟悉規(guī)則,比如,三個(gè)堆在一起的碗,是應(yīng)該一起拉一個(gè)框,還是分開拉三個(gè)框?
可一周后,他已經(jīng)熟練到每天能拉幾千個(gè)框,掙100多塊錢。時(shí)間久了,張凱看什么都帶框,看到家里廚房的鍋碗瓢盆,他第一反應(yīng)是,框框應(yīng)該從哪個(gè)角度拉?拉多大比較合適?
才來三個(gè)月,張凱就開始挑戰(zhàn)難度更高的3D全景圖。圖片都是立體的,有多個(gè)平面,分布著各種車輛,有卡車、小汽車、大巴車等,張凱要把車輛都框出來,再分門別類。
這項(xiàng)工作要有良好的空間感才能完成。玩“穿越火線”(一款射擊類游戲)的經(jīng)驗(yàn)幫上了張凱,那款游戲的場(chǎng)景也是立體的,常常需要切換視角來觀察敵人。張凱沒費(fèi)多少力氣就上手了。
但他偶爾還是有犯難的時(shí)候。一次,他框出了一輛三個(gè)輪子的電動(dòng)車,選屬性時(shí)糾結(jié)了好一會(huì)兒,選了“三輪車”。剛提交上去,就被審核的領(lǐng)導(dǎo)打了回來,“用電的都是電動(dòng)車,后面帶斗的、不用電的才是三輪車”。
工作了大半年,張凱就已經(jīng)是公司最優(yōu)秀的員工之一,但他依舊沒問過,拉這些框是為了什么?“我的原則是,我賺我的錢就行,其他的不用管那么多”。
8月9日上午,張凱在測(cè)試一款新的采集軟件。記者周小琪 攝
拍人像
“數(shù)據(jù)標(biāo)注”的工作干了一年,張凱開始接手新任務(wù)“數(shù)據(jù)采集”。這份工作不再是坐在電腦前敲鍵盤,需要走出去,到廣場(chǎng)、鄉(xiāng)野或工廠,給符合條件的采集對(duì)象拍照、錄音。
采集而來的數(shù)據(jù),將會(huì)被打包上傳給人工智能企業(yè),企業(yè)再把這些數(shù)據(jù)分配其他公司進(jìn)行“數(shù)據(jù)標(biāo)注”,最后再傳回去,成為計(jì)算機(jī)的學(xué)習(xí)資料。這些資料能教計(jì)算機(jī)分辨車輛、廚具等不同的物體,讓它們像人一樣,去認(rèn)識(shí)大千世界。
張凱的第一個(gè)項(xiàng)目是拍攝手勢(shì)識(shí)別的項(xiàng)目,公司給定的年齡必須均衡。
找人從公司內(nèi)部開始。500多名員工,只要領(lǐng)導(dǎo)在公司里吆喝一聲,滿足條件的就自覺過去排隊(duì)。
員工拍完以后,再發(fā)動(dòng)他們拉著自己的親朋好友來拍攝。除此之外,公司還聯(lián)系了各個(gè)村子有威望、人緣好的人,給他們中介費(fèi),讓他們來幫忙找,這種方法效果最好。
一開始張凱完全不清楚為什么采集要在不同的光線和場(chǎng)景下,在他看來,光線的敏感度、場(chǎng)景的變化,沒有什么必然的聯(lián)系,對(duì)他來說都是一些重復(fù)性的動(dòng)作拍攝工作。
為了拍攝任務(wù),張凱研究了很多照片,經(jīng)過領(lǐng)導(dǎo)點(diǎn)撥,終于搞清楚了,每個(gè)場(chǎng)景的光線及場(chǎng)景變化會(huì)在給后期算法的會(huì)有很大影響,因?yàn)橐虝?huì)機(jī)器在各種場(chǎng)景各種光線中的準(zhǔn)確識(shí)別,例如暗光,正常光,逆光的需求,雨天,晴天,陰天的場(chǎng)景。
在拍攝前,張凱少不了要回答被拍攝者的質(zhì)疑。有人問,“照片上有我們的正臉,你們會(huì)不會(huì)拿來做違法的事?要是把它們用來刷臉支付怎么辦?”
張凱想了想,給出解釋:“大街上那么多攝像頭,如果拍幾張照片就能用來刷臉支付的話,走在路上是不是也不安全?”
見對(duì)方神情松動(dòng),張凱繼續(xù)說,“我們公司是正規(guī)的,在郟縣開了兩年了,幾百號(hào)人,跟我們合作的都是大企業(yè),你就放心吧。”
參與過拍攝的人會(huì)被拉進(jìn)微信群,下次再有拍攝時(shí),直接在群里吆喝一聲,也能拉來不少人。去年夏天,公司接了一個(gè)大項(xiàng)目,一次性采集了兩萬多人的影像,這些人都成了公司的人脈。
人像采集現(xiàn)場(chǎng)。記者周小琪 攝
張凱的同事蘇樂丹就做過這個(gè)“兩萬多人的大項(xiàng)目”。項(xiàng)目在一間廢棄的二層工廠進(jìn)行,以三十人或五十人為一組,排好隊(duì),依次戴上墨鏡、口罩或帽子,在一樓、二樓或室外轉(zhuǎn)幾圈,轉(zhuǎn)完圈就可以獲贈(zèng)一口印有“千機(jī)數(shù)據(jù)”的鐵鍋。
攝像頭固定在廠房的不同角落,蘇樂丹的任務(wù)是,拿一個(gè)大喇叭,維持轉(zhuǎn)圈圈的秩序,讓他們控制恰當(dāng)?shù)拈g距。三四個(gè)月下來,她的喉嚨撐不住了,每天都要喝四五杯胖大海水。
這個(gè)項(xiàng)目小孩老人都能參加,蘇樂丹叫婆婆也來,婆婆不明白為什么要轉(zhuǎn)圈。蘇樂丹解釋,是用于攝像頭的對(duì)焦測(cè)試,檢測(cè)在不同場(chǎng)景、不同裝扮下,攝像頭能否識(shí)別出同一個(gè)人。
但婆婆不能理解。蘇樂丹拉著婆婆到村口,指著監(jiān)控說,“就是測(cè)試這個(gè)能不能精確地拍到犯罪分子”,婆婆樂意了。
參與采集的居民,可以獲贈(zèng)開水壺、蒸鍋等禮品
讓AI認(rèn)識(shí)蘋果
創(chuàng)辦千機(jī)數(shù)據(jù)之前,公司的CEO劉洋鋒也很少聽說“人工智能”這個(gè)詞,他是公司學(xué)歷最高的人之一,今年32歲。在他小時(shí)候,電腦還是個(gè)稀罕物,他看鄭少秋演的《大時(shí)代》,沒被縱橫捭闔的證券市場(chǎng)吸引,只覺得每天坐在電腦面前敲鍵盤很酷。上中專時(shí),他開始學(xué)計(jì)算機(jī),次次專業(yè)課考試都是第一名。
但進(jìn)入社會(huì)后,劉洋鋒的工作幾乎都碰不著計(jì)算機(jī)的邊。他在重慶、云南和廣東都待過,開過挖掘機(jī)、賣過飲料和化肥。他去過最遠(yuǎn)的地方是南美洲,在智利賣產(chǎn)自深圳華強(qiáng)北的山寨手機(jī)。
但他說,干計(jì)算機(jī)的夢(mèng)想從沒有被磨滅。打工時(shí),別的工人都在宿舍喝酒、吹牛,他買了一大袋跟計(jì)算機(jī)有關(guān)的書,一個(gè)人躺在床上看。有時(shí),晚上做夢(mèng)也會(huì)夢(mèng)見計(jì)算機(jī),時(shí)隔太久,他已經(jīng)記不清夢(mèng)境的具體內(nèi)容,只記得夢(mèng)里的自己對(duì)計(jì)算機(jī)有種強(qiáng)烈的擁有感。
從智利回國(guó)后,劉洋鋒和兩個(gè)發(fā)小湊到一起,準(zhǔn)備創(chuàng)業(yè)。去年,一個(gè)偶然的機(jī)會(huì),他們?cè)诰W(wǎng)上看到一個(gè)轉(zhuǎn)讓的“數(shù)據(jù)標(biāo)注”的單子,這是劉洋鋒第一次聽說“數(shù)據(jù)標(biāo)注”這個(gè)詞。
劉洋鋒先是試用了一下軟件,在照片上框出了一個(gè)在馬路上的行人,操作很容易??伤幻靼?ldquo;數(shù)據(jù)標(biāo)注”是干什么的,網(wǎng)上搜不出多少信息,大部分他都理解不了,直到在一個(gè)網(wǎng)頁(yè)看到這段話:
“要理解數(shù)據(jù)標(biāo)注,得先理解AI其實(shí)是部分替代人的認(rèn)知功能?;叵胍幌挛覀兪侨绾螌W(xué)習(xí)的,例如我們學(xué)習(xí)認(rèn)識(shí)蘋果,那么就需要有人拿著一個(gè)蘋果到你面前告訴你,這是一個(gè)蘋果。然后以后你遇到了蘋果,你才知道這玩意兒叫做‘蘋果’。類比機(jī)器學(xué)習(xí),我們要教他認(rèn)識(shí)一個(gè)蘋果,你直接給它一張?zhí)O果的圖片,它是完全不知道這是個(gè)啥玩意的。我們得先有蘋果的圖片,上面標(biāo)注著‘蘋果’兩個(gè)字,然后機(jī)器通過學(xué)習(xí)了大量的圖片中的特征,這時(shí)候再給機(jī)器任意一張?zhí)O果的圖片,它就能認(rèn)出來了。”
8月9日,員工們正在進(jìn)行新項(xiàng)目的培訓(xùn)。記者周小琪 攝
這淺顯直白的解釋,劉洋鋒懂了。他把“蘋果”的例子講給發(fā)小聽,他們都覺得“這事兒能成”。
從上世紀(jì)50年代,美國(guó)科學(xué)家第一次提出了“人工智能”的概念后,經(jīng)過60年的技術(shù)更迭,人工智能已逐漸滲透進(jìn)人類的生活。
手機(jī)聽懂了人類的語言,車輛學(xué)會(huì)了選擇最優(yōu)路線,能繞過桌子腿、捕捉每一?;覊m的掃地機(jī)器人走進(jìn)了千家萬戶。而廣為人知的人臉識(shí)別技術(shù),不僅幫警方在張學(xué)友演唱會(huì)上先后抓到了多名逃犯,也在今年6月,幫四名走失10年的孩子找到了家。
劉洋鋒并不了解人工智能相關(guān)的技術(shù),但從新聞上感覺到人工智能會(huì)是未來科技發(fā)展的新趨勢(shì)。
他們仨一起湊了10萬塊錢,在縣城租下了一間30平方米的單間,從鄭州拉回了20臺(tái)價(jià)值1000多塊的二手電腦,拉回來才發(fā)現(xiàn)只擺得下12臺(tái)。然后通過微信群和朋友圈招了十幾個(gè)員工。
乘著“人工智能”的東風(fēng),劉洋鋒的單子越來越多,短短幾月,劉洋鋒把公司規(guī)模擴(kuò)大了,租下了一整層的空間,差不多3000平方米,可以容納數(shù)百名員工,每年租金將近5萬?,F(xiàn)在,除郟縣外,他們還在鄭州、許昌、平頂山等地開設(shè)了分公司。
他不再“來者不拒”,有公司聯(lián)系他談采集項(xiàng)目,內(nèi)容是讓采集員拍攝地上的廢紙、果核、頭發(fā)絲兒,包括貓屎,用來訓(xùn)練掃地機(jī)器人的視覺。劉洋鋒拒絕了,“不能天天讓員工趴地上拍貓屎,太奇怪了”。
流水線上的老師
千機(jī)數(shù)據(jù)現(xiàn)在共有500多名員工,大多都和張凱一樣,本地人,年輕,只有初中或高中學(xué)歷,對(duì)電腦、互聯(lián)網(wǎng)和人工智能沒有太多認(rèn)知。
劉洋鋒招人最重要的標(biāo)準(zhǔn)要能“坐得住”。前不久,有個(gè)年輕男生來應(yīng)聘,說自己工作了兩年,在鄭州和蘇州都待過。劉洋鋒直接拒絕了他,“兩年就能跑兩個(gè)城市,說明非常不穩(wěn)定。”
在所有員工中,女性占大多數(shù),她們大多已經(jīng)結(jié)婚生子,丈夫在外地打工,在家照顧老人小孩的重?fù)?dān)都?jí)涸谒齻兩砩?。到了夏天,一些女性員工會(huì)選擇辭職,回去看管放暑假的孩子。還有的員工會(huì)直接把孩子帶到公司來,讓他們坐在空位玩電腦游戲。
去年5月,劉研娜在朋友圈看到千機(jī)數(shù)據(jù)招聘電腦操作員的消息,要求很簡(jiǎn)單,“18歲到38歲,男女不限,簡(jiǎn)單懂電腦,有上進(jìn)心,細(xì)心耐心”,“工資3000到8000,上不封頂,多勞多得”。
劉研娜的第一反應(yīng)是“騙人的”、“搞傳銷的”。在這座河南中部的小縣城,像她這樣只有中學(xué)學(xué)歷的年輕女孩,能找到的工作基本只有超市營(yíng)業(yè)員、商店導(dǎo)購(gòu)或是飯店服務(wù)員,月薪不會(huì)超過2000塊。直到來公司轉(zhuǎn)了一圈后,劉研娜才放下顧慮,成為“網(wǎng)吧”的一員。
8月7日下午,劉研娜正在給不同種類的汽車?yán)?。新京?bào)記者周小琪 攝
劉研娜一個(gè)月最多可以拿到6000塊,她三個(gè)小時(shí)就能完成483張照片的標(biāo)注,拉956個(gè)框。大部分員工一天可能只能拉100到150張圖片,平均工資只有3000塊。
剛來的時(shí)候,出于好奇,劉研娜向身邊的同事打聽,這些框都是干嘛的,沒人答得上來。大多數(shù)人都只是低頭做事,不關(guān)心這些,私底下也不討論這些話題。直到有一次,領(lǐng)導(dǎo)在開會(huì)時(shí)偶然提到,這些數(shù)據(jù)主要應(yīng)用在無人駕駛和美顏軟件上,“為人工智能服務(wù)”,她才似懂非懂。
8月8日上午,公司門口,張凱拿著一部手機(jī),正在測(cè)試一項(xiàng)新的采集任務(wù)。在背光、偏亮和正常三種光線下,被采集者分別作出了高興、厭惡等表情。作到“驚訝”時(shí),張凱提醒他,“眼睛瞪大點(diǎn)”、“嘴巴再?gòu)堥_一點(diǎn)”。
上個(gè)月,張凱升任了主管,不用再親自負(fù)責(zé)采集工作,只需要對(duì)采集員進(jìn)行指導(dǎo),但每次采集開始前,他都要先學(xué)會(huì)如何操作。升職后,張凱的工作越來越忙,以前六點(diǎn)半就能準(zhǔn)時(shí)下班,現(xiàn)在晚上十點(diǎn)回家成了常態(tài)。
到千機(jī)數(shù)據(jù)工作后,張凱成為了全家離高科技最近的人。
他的母親在東莞工廠的流水線上工作,父親在深圳做裝修、鋪地板磚。弟弟今年19歲,高中還沒上完,就一個(gè)人去新疆賣手機(jī)配件了。妻子原來在郟縣的一家超市當(dāng)導(dǎo)購(gòu),去年生完孩子后,在家當(dāng)家庭主婦。
剛找到工作時(shí),家人和朋友都會(huì)問他,這份工作是干什么的?他的答案是:標(biāo)注是坐在電腦前拉框,采集是天天給別人拍照。其他的,張凱不會(huì)多說,家人也不會(huì)追問。
張凱沒想到自己會(huì)跟人工智能產(chǎn)生關(guān)聯(lián)。他在長(zhǎng)橋鎮(zhèn)的一座小村莊長(zhǎng)大,家家戶戶都種玉米、小麥和花生,那個(gè)年代,很少有人知道“電腦”是什么。等上了中學(xué),同齡人都喜歡泡在網(wǎng)吧玩《夢(mèng)幻西游》,他不喜歡那款游戲,因?yàn)橛螒?ldquo;靠運(yùn)氣、要砸錢”。他只好一個(gè)人在院子里摔“紙面包”、蹦彈珠。
對(duì)村里的多數(shù)年輕人來說,輟學(xué)、打工是必然的命運(yùn),沿海工廠的流水線上,隨處可見他們的身影。
張凱念完初中后,跟媽媽一起去了東莞,后來又到了深圳、泉州,他干過最長(zhǎng)的一份工作是對(duì)講機(jī)組裝。四年的時(shí)間里,張凱用手指把無數(shù)塊鐵制的電池片壓進(jìn)了對(duì)講機(jī)盒子里,這些電池片和喇叭、天線、主機(jī)板一起,組成了成千上萬個(gè)對(duì)講機(jī),銷往世界各地。
蘇樂丹和張凱有過相似的經(jīng)歷。2005年,她跟表姐一起去了廣東,在電子廠做過品鑒、在寶石廠穿過珠子,每天從早上七點(diǎn)半工作到晚上七點(diǎn)半,一個(gè)月休息兩天,月薪800多塊錢。
對(duì)張凱、蘇樂丹和千機(jī)數(shù)據(jù)的其他普通員工來說,他們現(xiàn)在采集、標(biāo)注的數(shù)據(jù),和穿過的珠子、壓過的電池片沒有什么不同,都是流水線上的一個(gè)部件。
唯一的不同是,他們知道珠子怎么穿成手串和項(xiàng)鏈、電池片怎么和其他部件組成對(duì)講機(jī),但不知道數(shù)據(jù)要如何“喂”給機(jī)器、機(jī)器要如何學(xué)習(xí)。
張凱到了千機(jī)數(shù)據(jù)之后才第一次聽說“人工智能”這個(gè)詞,即便已經(jīng)升任主管,他對(duì)工作的認(rèn)識(shí)也只停留在“為人工智能提供前期數(shù)據(jù)”的層面。有幾次,北京的研究員來郟縣調(diào)研,劉洋鋒帶著他們到公司視察,張凱只是在遠(yuǎn)處望了幾眼。
在通往公司的樓梯間,貼著幾張巨幅海報(bào),海報(bào)上都是機(jī)器人和電腦,看起來科技感十足。劉洋鋒把“人工智能如何認(rèn)識(shí)蘋果”的那段話也印在了上面,張凱一次也沒認(rèn)真讀過。
8月9日下午,劉洋鋒在辦公室里,看一篇與人臉標(biāo)注相關(guān)的論文。記者周小琪 攝
“萬物皆可AI”
昔日流水線上的工人,成為了教“人工智能”認(rèn)識(shí)蘋果、桌子、椅子的第一位老師,把認(rèn)知事物的經(jīng)驗(yàn)濃縮進(jìn)一張張圖片中以后,他們對(duì)人工智能也開始有了更敏銳的感知。
今年6月,張凱第一次坐上了高鐵。以前為了省錢,他習(xí)慣坐20多個(gè)小時(shí)的大巴。這一次他興奮地發(fā)了朋友圈,配了一張高鐵時(shí)速304km/h的圖片,說:“這玩意最快能跑多少?”
進(jìn)高鐵站時(shí),張凱拿著身份證和高鐵票,經(jīng)過一道需要人臉識(shí)別的閘機(jī),攝像頭對(duì)著他的臉掃描了幾秒鐘后,顯示“請(qǐng)通過”。他突然想到,以前做標(biāo)注時(shí)做過人臉標(biāo)點(diǎn),會(huì)不會(huì)應(yīng)用在了這上面?
兩年前,張凱花8萬塊買了一輛小轎車,出行時(shí),常常用到車載語音系統(tǒng)。現(xiàn)在,他明白了語音系統(tǒng)之所以能順利運(yùn)作,是建立在大量的語音采集、標(biāo)注基礎(chǔ)上的。
刷到跟人工智能相關(guān)的新聞時(shí),張凱也會(huì)打開看。他對(duì)一個(gè)“5G時(shí)代高科技抓逃犯”的視頻印象深刻,視頻里,地鐵站的監(jiān)控能捕捉到每一個(gè)行人的面部信息,精準(zhǔn)地識(shí)別出犯罪嫌疑人的樣貌。
偶爾,張凱也有擔(dān)憂和恐懼。前幾天,他看到有品牌出了一款能自動(dòng)系鞋帶的運(yùn)動(dòng)鞋,他無法理解,連系鞋帶這樣簡(jiǎn)單的事都要靠機(jī)器來做,那人該干什么?
“科技如果發(fā)展得太快,會(huì)淘汰掉很多東西”,張凱最擔(dān)心的是,機(jī)器會(huì)取代掉那些流水線上的工人,他們都會(huì)失業(yè)。
2017年,李開復(fù)曾公開表示,“一項(xiàng)本來由人從事的工作,如果可以在5秒鐘以內(nèi)能對(duì)工作中需要思考和決策的問題作出相應(yīng)的決定,那么,這項(xiàng)工作就有非常大的可能被人工智能全部或部分取代”。
他預(yù)測(cè),翻譯、銷售、司機(jī)、家政等工作,未來10年將有約90%被人工智能全部或部分取代。“但是,還有很多人所特有的、綜合素質(zhì)的技能是無法被取代的。此外,因?yàn)槿伺c機(jī)器產(chǎn)生了新的協(xié)作方式,還會(huì)出現(xiàn)新的工作類型。”
同年7月,國(guó)務(wù)院發(fā)布的人工智能計(jì)劃提出,到2030年,中國(guó)要成為人工智能創(chuàng)新核心。工信部教育考試中心副主任周明曾向媒體透露,中國(guó)人工智能人才缺口超過500萬人。
張凱覺得,像他們這樣這些做數(shù)據(jù)采集和標(biāo)注的工人,很難被替代。“畢竟機(jī)器還要通過我們來學(xué)習(xí),想象一下,如果機(jī)器會(huì)自己學(xué)習(xí),那就說明它們已經(jīng)無法把控了,這很可怕。”
劉洋鋒也思考過這個(gè)問題。前幾天,在接受電視臺(tái)采訪時(shí),他把人工智能產(chǎn)業(yè)比作了一個(gè)人,“算法工程師他們負(fù)責(zé)的是大腦,而我們負(fù)責(zé)的是四肢”,二者都不可或缺。他們公司采集、標(biāo)注好的數(shù)據(jù),要經(jīng)過一套特定的算法加工,才能喂給機(jī)器,算法是人工智能中最核心的部分。
劉洋鋒也擔(dān)憂,畢竟“承接的都是重復(fù)性的工作”。他想,隨著技術(shù)的發(fā)展,原本需要一萬張照片數(shù)據(jù)才能完成的學(xué)習(xí),或許只需要五張照片就能完成,屆時(shí),他們的工作量將會(huì)面臨大幅減少的情況。
為了防止這種情況的出現(xiàn),劉洋鋒開始把業(yè)務(wù)向高端化、專業(yè)化轉(zhuǎn)移。去年,他承接了一項(xiàng)醫(yī)療數(shù)據(jù)項(xiàng)目,需要對(duì)病例進(jìn)行分析,公司的員工都做不來,他在網(wǎng)上找了幾十個(gè)醫(yī)學(xué)研究生來做兼職。
劉洋鋒擔(dān)心被淘汰,他加了很多人工智能相關(guān)的學(xué)術(shù)交流群。來自清華、北大等知名高校的教授和研究生們,常常會(huì)在里面更新研究進(jìn)展,或是轉(zhuǎn)發(fā)研究論文。
劉洋鋒每條消息都會(huì)點(diǎn)開看,再轉(zhuǎn)到朋友圈。群里發(fā)的很多論文都是英文,劉洋鋒看不懂,就用電腦自帶的翻譯軟件一句一句地翻。有些文章的專業(yè)性太強(qiáng),劉洋鋒就只看摘要和那些跟數(shù)據(jù)處理相關(guān)的部分。
效果很明顯,“以前都是工程師們說什么就是什么,現(xiàn)在我至少可以從專業(yè)的角度,來和他們探討一些東西,比如數(shù)據(jù)采集、標(biāo)注的具體要求等等”。
但碰上算法的問題,劉洋鋒就沒轍了。一次,員工們忙活了一個(gè)星期,做完了一個(gè)人臉標(biāo)點(diǎn)項(xiàng)目,每張臉上標(biāo)84個(gè)點(diǎn),一共一萬張圖。對(duì)接的部門打包驗(yàn)收完以后,算法工程師卻說,有幾個(gè)點(diǎn)的位置與算法的要求不符,需要調(diào)整,必須打回來重做。劉洋鋒只好帶著員工們多干了一周,并多發(fā)了一份工資。
在劉洋鋒過去的人生中,人工智能神秘、新奇且遙不可及。短短兩年,他發(fā)現(xiàn),“萬物皆可AI”。比如,手機(jī)里的視頻軟件,錄制時(shí)的美顏功能要靠人工智能,加特效要靠人工智能,給用戶推送的內(nèi)容也要靠人工智能。
和張凱不同,劉洋鋒期待那個(gè)充滿人工智能的未來。創(chuàng)業(yè)這兩年,公司接了很多無人駕駛的項(xiàng)目,框出了數(shù)不清的路標(biāo)、紅綠燈和斑馬線。劉洋鋒看著這些圖片,常?;孟耄谐蝗漳苜I一輛無人駕駛汽車,坐進(jìn)車?yán)?,?dòng)動(dòng)嘴,把目的地告訴系統(tǒng),然后倒頭大睡,車子便把自己送到目的地。
“那一天一定不會(huì)太遠(yuǎn)”。(作者 周小琪 梁文雪)