AI浪潮中的數據標註者

2023年7月3日

隨著AI技術的發展,數據標註市場迎來了前所未有的熱潮。一方面是AI公司對標註資料的殷切需求,另一方面標註從業者也看到了發展機會。但是在熱潮下,他們也面臨著收入下降、工作強度增加以及被AI替代的困境。本文將討論AI時代數據標註從業者的現狀和困境。

一、 訂單多到做不過來

隨著ChatGPT的興起,AI行業迎來熱潮。仅今年一季度就新增註冊了17萬家AI相關企業。這些公司都有數據標註的需求,直接帶動了下游的標註市場需求激增。

標註從業者感受到,無論是文字、圖像、還是語音數據,標註項目在明顯增加。甚至一些原本衰敗的文本標註項目,也因為AI 2.0而再度分化為各種小眾需求。資本市場也重新看好這塊新興藍海,多家標註企業獲得融資。

一些標註公司迅速擴張,新的標註基地、辦公室紛紛成立。據從業者透露,訂單增多到難以負荷,生產能力與交付進度捉襟見肘。

二、更卷,也更嚴格

但是,訂單增加並未為標註從業者帶來收入增加。行業內部分包層層轉包,競價內卷導致單價持續下降。一位服務商抱怨,同一項目他報價200元,竟有人只報價80元。

數據顯示,各類標註項目的單價只有0.5-1.5元/框。標註人員收入銳減,從此前的每月4-5千元,降至2-3千元。

與此同時,隨著AI精度要求提高,標註工作變得更加複雜。以前標註只要大致框住物體就行,現在要求框與物體嚴格貼合,偏差只能在毫米級。医療、法律等專業領域的標註,也需要專業知識。

從業者無奈地表示,工作雖然更累,但報酬卻在降低。

三、AI替代的陰影

更大的問題在於,AI正在侵蝕人工標註的需求。大模型可以自動生成標註,效率遠超人工。

一些圖像標註項目已開始由AI生成標框,人工只需檢查修正。有研究表明,ChatGPT的單位標註成本只有傳統人工標註的1/20。 汽車企業使用大模型進行自動標註,效率是人工的1000倍。

AI替代已成為標註從業者的夢魘。他們花費時間學習標註技能,卻面臨被自己訓練出的AI取代的困境。行業發展趨勢將從人工轉向自動化。

一些標註公司正在轉型,開發自動標註工具。但對個人標註工而言,前景悲觀。行業內流動性極低,最終可能被淘汰。

四、結語

AI為標註行業帶來短期繁榮,但長遠看,自動化標註將大幅壓縮人力空間。在熱潮下,標註從業者也面臨收入下滑和技術被替代的困境。他們需要及早尋找自身的出路。