国产精品一区二区久久_亚洲国产精品久久久久秋霞不卡_欧美精品在线看_一本久久知道综合久久_久久福利视频导航_日韩一级片网址_亚洲色图制服丝袜_日韩一级欧洲_国产日韩成人精品_亚洲国产天堂久久国产91_欧美精品二区三区四区免费看视频_99精品久久_国产精品网站一区_日韩视频免费观看_亚洲摸下面视频_久久一区二区三区四区五区

時薪上千,大模型公司搶985文科生給AI當老師

來源:吳曉波頻道CHANNELWU

這篇文章開始之前,先邀請大家猜猜下面這份招聘要求對應的是什么崗位。

揭曉答案:這份看起來要求不低的工作,招聘的是AI數據標注員。在BOSS直聘上,這個崗位月薪最高接近兩萬元;部分崗位直接注明“重點大學本碩博優先”。

通俗地說,數據標注員就是AI的老師,負責對文本、圖像、音頻等原始數據進行分類、標記或注釋,從而教會機器識別、理解并學習人類世界的邏輯和知識。

2020年起,“人工智能訓練師”正式被納入國家職業分類目錄,“數據標注員”是其中的重要工種之一。據國家數據局,截至今年9月底,我國7個數據標注基地共有標注企業362家,標注從業人員達8.5萬人。

但這個行業仍缺乏人才。量子位智庫2023年底發布的《中國AIGC數據標注產業全景報告》顯示,未來5年,中國數據標注專業人才缺口或達百萬量級。

那么,數據標注到底是一份什么樣的工作?

“985”“QS100”碩博,

給AI當老師

小鵝本科就讀于一所“211”高校,目前在一家“985”高校讀研,學的是歷史學專業。她曾在大四那年做過一份數據標注實習的工作。

她每天的工作,就是面對一張科技公司發來的、填滿后臺收集的用戶提問和AI生成答案的Excel表格,給AI的答案打分。小鵝處理一條數據平均花費的時間是15分鐘左右,少數棘手的任務,單條就要花上近一個小時。

這份實習不需要面試,招聘方會提供一份打分標準手冊和一套測試題,要求自學手冊內容后,在測試題中選5道,完成后上交,正確率超過80%即視為通過。

小鵝當初花了一個下午學習這份標注手冊,又花了2個小時完成5道測試題,才通過了考核。

起初覺得易如反掌的小巴,嘗試了小鵝發來的兩道題,結果正確率不足50%。這才發現,這份工作遠比我們想象的困難。

◎?首先,標注手冊中包含大量術語,理解門檻極高。比如,“缺少富媒體形式”,是指答案中沒有包含短視頻鏈接;“prompt外泄”,是指答案暴露了提問未涉及的內部指令;“弱相關內容或冗余殘留”,就是答案和提問沒關系。

◎?其次,打分要求極其繁瑣、嚴格。標注者需要在“0、1、2、3”四個檔位中給3個答案分別打分,并根據答案在準確性、結構性、相關性、全面性等方面的缺陷,分別打好標簽,備注原因;然后把三個答案依次排序,逐一解釋理由。

進行數據標注的工作人員

對于如何判定分數和標簽,接近6萬字的標注手冊列舉出了幾十種具體分析場景,這些分析費時費力。比如,判斷是否出現幻覺,需要一一核對參考資料;涉及專業知識,需要自己查找資料去驗證。

除了打分,另一種常見的標注形式是“出題”,難度更大。剛獲得海外語言類專業博士學位的小凡,求學時做了長達5年的數據標注兼職。她的工作是在一家海外眾包標注平臺上給AI出題并寫出解答,難度達到博士級別。這些文本會被作為訓練語料,喂給AI。

從招聘市場情況看,這份職業的天花板極高。

今年以來,各家頭部大模型公司開始在招攬專家級標注員上競速。比如,阿里搭建了“曉天睿士”專家社區,學歷要求頭部高校碩士起步,行業專家級人才最高時薪可達1000元。字節跳動成立了Xpert兼職眾包標注平臺,需要標注者上傳簡歷、選擇標注的細分專業領域,并完成難度較高的專業知識測試。

另一方面,行業的“入場券”也在快速漲價。

一位負責多家頭部企業標注人員招聘的HR告訴小巴,近兩年,標注崗位招聘要求不斷提高。

早期招聘要求的學歷水平大多在??啤⒏咧?,無需經驗、上手就能做。但今年,候選人本科以上學歷的占比超過五成。通用類AI標注開始有經驗要求;垂直類一般要求相關專業或行業經驗,部分崗位需要做專業筆試。

競爭也逐漸激烈,目前招聘通過率大約是2:1。

持續吸納高端人才,成為標注行業肉眼可見的趨勢。

部分公司數據標注招聘要求

不算體面的工種

頂尖人才正涌入數據標注行業,但身處其中的人們,大多態度悲觀。

在高強度的標注實習中,小鵝感受到了這個行業巨大的矛盾。

??其一,缺乏尊嚴。

小鵝最反感的是工作中沒完沒了的扯皮。文字判斷有巨大的主觀模糊空間,作為乙方的標注員與作為甲方的質檢員經常會發生爭執。比如,甲方認為A答案的邏輯性更強,而乙方認為B答案更完善。

在這些爭論中,她感到標注員角色的巨大矛盾性:雖然承擔著AI工程里超過60%的工作量,但他們在這個系統里是不被尊重的。隨著模型的進化和調整,甲方給出的打分標準會經常變動,但標注員們往往無法撼動現有的標準,只能接受甲方的評判。

她也感到這份工作缺乏獲得感。即便標注已經成為一個知識密集行業,但仍采取著流水線式的管理方式,絕大多數標注工作采取計件制計薪。標注的工作本質是消耗腦力處理一條條數據,但并不知道這些數據從哪來、到哪去,甚至不少標注員不知道自己標注的是哪個大模型。

??其二,性價比低。

小鵝此前實習的公司是一家外包標注機構,項目團隊里大多是兼職的大學生,每人每天至少完成10條,日薪100元,超額完成按10元/條計。

部分公司數據標注僅招聘兼職人員

即便是專家級別的標注,性價比也很低。一位入駐某家國內大模型專家社區的在讀博士告訴小巴,自己在平臺上出題的時薪大約在100—300元,收入并不比家教等其他兼職有吸引力。他很快放棄了這份兼職。

從招聘市場的薪資報價看,全職數據標注員的門檻水漲船高,但待遇低,在北京、上海這樣的地區,不少標注崗位要求研究生級別學歷,但月薪只有六七千元。

??其三,上升空間狹窄。

一位AI產品經理向小巴介紹,他所在的頭部互聯網企業,標注崗位除了極個別管理崗位,其余均為外包,人員流動率極高,能待上超過一年的人并不多。

雖然理論上,數據標注員可以依次向標注組長、質檢、質控、數據運營乃至算法類崗位發展,但因為技術類崗位的天然壁壘,真正實現的概率極低,絕大部分標注員會一直停留在原崗位上。

??其四,即使門檻被知識抬高,標注本質上還是一份極易被AI替代的工作,“教會徒弟、餓死師傅”。

科技公司正在普遍采用合成數據減少對人工的依賴。比如,業內常見的降本手法“蒸餾”,即用ChatGPT等更高級的大模型生成的答案去訓練更初級的大模型。中小型大模型廠商大多使用這種方法,降低數據成本。

因為這些原因,高端人才們進入標注行業,大多要么是尋求臨時過渡工作,要么只是作為兼職獲得一份收入,行業對他們難有長期吸引力。

大模型巨頭開始“卷”數據

問題的本質,是標注行業的社會認知和管理方式,都沒能跟上AI“知識饑渴”的速度。

過去8年,數據標注行業經歷了巨大的變化。

這曾經是個非常底層的工種。它興起于2017年前后,早期被廣泛應用于智能駕駛。那時任務簡單重復,比如框選圖片上的紅綠燈、汽車、障礙物。

因為又苦又累,多年來,海外科技巨頭把這份工作轉移到勞動力最廉價的地區。牛津大學的一項調查顯示,全球有數百萬數據標注員集中在烏干達、肯尼亞等欠發達國家,他們每天工作9小時以上,時薪僅約1.16美元(約合人民幣8.3元),項目結束即失業。

OpenAI合作外包公司Sama公司員工

圖源:Sama公司官網

在中國,數據標注產業主要聚集在中西部及三四線城市。在標注基地打標的員工,不少是待業青年、中老年人、殘障人士,只要會使用電腦即可。

所以在大部分新聞報道中,數據標注員是一群AI世界里隱形的底層勞動力,在全世界欠發達國家、地區賺著“賽博流水線”上的微薄收入。

但最近兩年,高端化的趨勢開始在海外興起。海外數據標注龍頭Scale AI,從2024年開始關閉肯尼亞、尼日利亞、巴基斯坦等地的承包站點,轉而招聘美國本土高學歷人士。

據港媒報道,截至今年年初,Scale AI參與模型優化的人員中,12%擁有分子生物學等領域的博士學位,超40%擁有所在領域的碩士學位、法律學位或MBA學位。

相較于時薪僅1美元出頭的低端標注,這些高端標注員平均時薪達到40美元。

而對專家級標注員的投入也確實推動了公司的增長,Scale 2024年營收約8.7億美元,預計今年營收達20億美元。Scale AI創始人Alex Wang公開發言稱:“我們需要最優秀和最聰明的頭腦來貢獻數據。”

其競品、美國另一數據標注巨頭Surge AI,已經成為全球大模型追求高端數據時的首選。它把高質量的數據標注比作“寫詩”,組建了一支由哲學家、工程師、常春藤盟校畢業生等構成的標注團隊。

而國內的高端化趨勢,很大程度上是從DeepSeek開始的。

2023年起,DeepSeek開始招聘“數據百曉生”崗位,不限專業、不限經驗,實習生日薪超過500元,正職年薪可達百萬。崗位要求之一是“涉獵廣泛、博聞強識,對各行各業的知識都擁有強烈的興趣”。

“數據百曉生”的主要任務,就是給AI出題、編寫“理想態”的優質答案作為學習資料、給AI生成的答案打分和調試,等等。

結果也很驚人:DeepSeek上線7天用戶破億,靠文采飛揚、金句頻出和嚴謹的深度思考破圈,業內盛傳其標注團隊由北大哲學系的學生組成。

此后,國內大模型界風向逐漸轉變,開始在“特級教師”上做文章。

這種從“普通老師”到“特級教師”的需求變化,是AI進化到一定程度的必然結果。

AI行業有句經典名言“Garbage In Garbage Out”,一個模型能力行不行,很大程度上取決于訓練模型的數據質量。據IBM的一項研究,僅注釋質量提高5%,就可以將復雜計算機視覺任務的模型準確率提高15%—20%。

算法、算力、數據,是業內公認的AI三要素。頭部大模型們在算法和算力上難分伯仲,數據質量成了最有機會“卷”出差距的方向。

AI變成精英以后?

可以說,自數據標注被正式認定為職業,經過5年的發展,這個行業仍面臨著低壁壘競爭和勞動剝削等諸多問題,處于一個難以定性的狀態。

但在每個新興行業出現、創造新工種的早期,都會出現類似的問題。所有的職業,都是先出現,再進化的。

這份工作的前景也未必真如想象中渺茫。比如,它提供了一種職業轉型路徑:成了一條文科生在AI領域大展拳腳的神奇過渡帶。一些頭部大模型已經開始組建“AI人文訓練師”團隊,訓練AI識別“仇恨言論”和撰寫“高情商回復”。

而這些文科生,也在這份工作中不斷觸碰AI與社會的邊界。小鵝說,在結束這份實習以后,她手機里的AI總是比別人的好用,因為理解底層邏輯,她更擅長下達精確的指令。

這是個需要高質量人文社科人才的崗位,因為只有最善于思考人與世界關系的人類,才能教會AI怎么更好地做一個人。

學習使用AI辦公技巧

換個角度看,在高學歷人才該不該去“打螺絲”之外,還有一件事值得關注。

在小鵝標注的上千條數據中,她印象最深刻的一條記錄是,一位用戶向AI提問“殘疾人患腦癌能不能進養老院”。小鵝翻閱此人的過往提問記錄,發現她向AI傾訴了很多自己各方面的困難,包括離婚、家暴、病重和無人贍養。但對于AI而言,這些提問不過是一條條平平無奇的數據流。

當AI在頂尖老師的訓練下變得越來越頂尖,它就像一個含著金湯匙出生、接受正統通識教育的古希臘式精英,逐漸無法再看到更基層的需求。

或許下一步,新的鯰魚就會從這些被忽視的需求中跳出來。

*文中受訪者姓名均為化名

本篇作者?|溫若梅|?責任編輯?|?徐濤

主編?|?何夢飛?|?圖源?|?VCG、網絡

特別聲明:以上內容僅代表作者本人的觀點或立場,不代表新浪財經頭條的觀點或立場。如因作品內容、版權或其他問題需要與新浪財經頭條聯系的,請于上述內容發布后的30天內進行。

上一篇:8萬余名學子扎根邊疆的青春答卷
下一篇:用跨學科項目培養創新思維
免責聲明:

1、本網站所展示的內容均轉載自網絡其他平臺,主要用于個人學習、研究或者信息傳播的目的;所提供的信息僅供參考,并不意味著本站贊同其觀點或其內容的真實性已得到證實;閱讀者務請自行核實信息的真實性,風險自負。

2、如因作品內容、版權和其他問題請與本站管理員聯系,我們將在收到通知后的3個工作日內進行處理。

国产精品一区二区久久_亚洲国产精品久久久久秋霞不卡_欧美精品在线看_一本久久知道综合久久_久久福利视频导航_日韩一级片网址_亚洲色图制服丝袜_日韩一级欧洲_国产日韩成人精品_亚洲国产天堂久久国产91_欧美精品二区三区四区免费看视频_99精品久久_国产精品网站一区_日韩视频免费观看_亚洲摸下面视频_久久一区二区三区四区五区
亚洲丁香婷深爱综合| 亚洲欧美日韩第一区| 亚洲精品日日夜夜| 久久精品国产999大香线蕉| 亚洲一区二区免费| 欧美视频久久| 欧美伊人精品成人久久综合97| 国产精品日韩一区二区三区| 欧美日韩亚洲一区二区| 中文精品一区二区三区| 亚洲一区免费视频| 久久一区二区三区超碰国产精品| 亚洲国产激情| 亚洲在线免费| 久久免费视频这里只有精品| 欧美日韩国产色视频| 欧美日韩1区2区| 亚洲欧洲另类国产综合| 欧美日韩一区二区三区四区在线观看| 亚洲精品一区二区三区av| 国产亚洲一区二区三区| 久久亚洲私人国产精品va| 久久精品视频99| 在线视频你懂得一区| 欧美一区二区三区四区高清| 国产精品亚洲综合天堂夜夜| 欧美福利精品| 国产精品毛片高清在线完整版| 亚洲毛片一区二区| 欧美午夜影院| 国内精品嫩模av私拍在线观看| 日韩视频在线一区| 亚洲欧美综合一区| 欧美日韩爆操| 美女主播视频一区| 欧美三区视频| 国产精品欧美精品| 亚洲国产精品ⅴa在线观看| 国产精品h在线观看| 欧美高清视频一区二区三区在线观看| 亚洲日本在线视频观看| 牛牛国产精品| 一区二区三区欧美在线| 亚洲欧美一区二区三区在线| 亚洲电影在线观看| 欧美日韩国产综合网| 久久久久**毛片大全| 久热精品视频在线观看一区| 国产日韩免费| 久久精品91| 亚洲毛片播放| 蜜桃av一区二区在线观看| 久久裸体艺术| 蜜桃精品久久久久久久免费影院| 亚洲综合社区| 欧美日韩另类综合| 欧美一区二区三区在线观看| 亚洲欧美日韩久久精品| 国产精品一区免费在线观看| 狠狠色香婷婷久久亚洲精品| 欧美精品999| 午夜精品久久99蜜桃的功能介绍| 99视频国产精品免费观看| 久久午夜影视| 国产精品白丝av嫩草影院| 亚洲图片你懂的| 久久国产精品99久久久久久老狼| 亚洲精品在线观看免费| 欧美午夜激情视频| 欧美亚日韩国产aⅴ精品中极品| 久久综合伊人77777| 国产精品日韩专区| 国产欧美一区二区三区在线看蜜臀| 亚洲综合二区| 欧美中文字幕在线| 亚洲小说区图片区| 亚洲精品国产精品国自产观看浪潮| 中文在线资源观看网站视频免费不卡| 国产精品对白刺激久久久| 久久精品国产在热久久| 亚洲一区二区三区国产| 亚洲女与黑人做爰| 国产一区深夜福利| 久久精品五月| 午夜精品视频在线观看一区二区| 欧美成人一二三| 看欧美日韩国产| 国产主播一区二区| 蜜臀久久99精品久久久画质超高清| 影音先锋久久久| 国产美女精品免费电影| 麻豆成人在线| 国产日韩欧美中文在线播放| 久久精品女人天堂| 久久久久久久999| 国产精品久久久久久久午夜片| 欧美色图一区二区三区| 在线午夜精品自拍| 一区二区三区精品国产| 男人天堂欧美日韩| 国产精品电影在线观看| 国产色产综合产在线视频| 国产性做久久久久久| 欧美激情aⅴ一区二区三区| 好吊一区二区三区| 午夜国产不卡在线观看视频| 亚洲欧美乱综合| 韩国av一区二区| 亚洲欧美三级在线| 国产精品日韩在线一区| 国产精品亚洲综合色区韩国| 一区二区精品| 欧美日韩一区二区三| 欧美色一级片| 狠狠色噜噜狠狠色综合久| 国产精品theporn| 悠悠资源网久久精品| 国产精品视频一| 欧美视频一区在线| 亚洲人屁股眼子交8| 日韩视频中午一区| 欧美成人精品高清在线播放| 午夜精品久久久99热福利| 亚洲精品一区二区三区婷婷月| 一本色道久久综合狠狠躁篇怎么玩| 欧美sm重口味系列视频在线观看| 欧美日韩国产精品一区二区亚洲| 国产免费观看久久| 国产精品一区久久久| 亚洲人成在线观看一区二区| 欧美精品免费播放| 欧美成ee人免费视频| 卡通动漫国产精品| 久久久蜜桃一区二区人| 国产女主播视频一区二区| 亚洲欧美日本伦理| 亚洲资源av| 午夜欧美理论片| 欧美日韩中文字幕日韩欧美| 欧美日韩视频不卡| 亚洲精品国产无天堂网2021| 欧美国产欧美亚州国产日韩mv天天看完整| 欧美日韩国产成人在线观看| 狠狠色综合一区二区| 欧美日韩国产影片| 亚洲国产一二三| 1000精品久久久久久久久| 欧美高清视频在线观看| 欧美成人一区二区三区片免费| 欧美jizzhd精品欧美巨大免费| 亚洲午夜在线观看| 老牛嫩草一区二区三区日本| 欧美在线999| 在线视频日韩精品| 亚洲欧美中文在线视频| 久久久精品久久久久| 国产欧美日韩在线播放| 国内精品久久久久影院优| 欧美日韩在线视频观看| 国产精品久线观看视频| 亚洲精品国产精品乱码不99按摩| 亚洲免费小视频| 亚洲一区二区三区四区五区黄| 一区二区三区中文在线观看|