草根影响力新视野 黎松子 

说起小镇青年,我第一印象便想到贾樟柯导演的电影,山西某个县城里的游戏厅、台球厅晃荡的小镇青年,他们不占有社会资源,也没有过硬的生存本领,但时代的洪流裹挟著他们,安稳活著已经不容易。

他们怎么会与高大上的人工智能搭上关系 ?

没错,他们就是人工智能训练师,是资源闭塞的小镇青年能打的为数不多的一种工作。

众所周知,人工智能的三大基石是资料、算力与算法,数量越多品质越高的资料,往往越能够训练出更“聪明”的模型。人工智能需要资料喂养,人工智能训练师就是为人工智能提供“饲料”的饲养员。他们将大量的文字、语音、图像打上标记,比如一条道路的街景,要将上面的物体标注出来,记好名称、大小、颜色等基本信息,俗称“拉框”。这些被标注过的资料,才能为各类人工智能所用。

一个熟手,平均一天可以拉两千到三千个框 ,一个框4分钱,一个月可以挣三千多块钱。

简而言之,就是资料标注员。资料标注是人工智能获取训练资料的主要管道,应用场景广泛。从语音转录、人脸识别、自动驾驶到AI聊天,人工智能模型训练所需要的海量资料目前几乎全部依赖资料标注员手工标注。

这份工作,起点低,有手就行,唯一的缺点是费眼。四五线小镇,没什么产业,青年们有一份月入3000多的工作已经不错了。现在一般的城镇都只剩下老头儿老太太,年轻人在家没工可打 ,只能外流,而现在很多农村类视频博主,拍拍农村生活,带带农村土特产,主打就是一个贩卖乡愁,但这些博主可能都未必真正生活在农村,也就是拍段子的时候才回去,很多已经都是成熟的MCN团队运营了,城镇和农村,留人很难,所以资料标注员真是留下来的小镇青年为数不多的选择。这份工作显然是枯燥的,每天重复拉框标注,没什么技术含量,以最简单的技能,与最前沿的技术产生了联系。

因特网 标牌 公司 现代 数字 高科技 在线 应用程序 建筑 徽 符号 关闭 外观 信 中国 加州 标志 美国 司令部 中国的 牌 图标 网站 企业 正面 公司 技术 美国 标志 美国 业务 办公室 研究 服务 发育 标识
图片取自:(示意图123rf)

贵州,西南腹地,有一个百鸟河数字小镇,位于黔南州惠水县城西南部,距惠水县城约10公里,真正大山深处的 “高科技”基地,她是由政府推动的以大资料应用为引领的新型数码产业园。这里有很多资料标注公司,有大量小镇青年为百度、阿里、京东、HTC、科大讯飞、鲲云科技等知名大资料关联企业提供资料加工处理服务。这些数码标准员很少211,985,一般就是普通本科,很多还是附近职业学院的学生。

山西,贾樟柯电影中的山西,一般人印象中的产煤大省,也有百度布局的资料标注基地。资料标注员超过2000多名。

在疫情期间,他们标注病人的肺炎影像图,平常医生可能需要几分钟判断一张CT,加入了人工智能标注作为辅助手段以后,几秒张就能判断一张CT上是否有病毒。他们还完成了戴口罩的人脸图像标注,采集大量的戴口罩的人脸照片后,资料标注师对人脸的眉毛、眼镜、颧骨等人脸关键点进行精准的标注,标注的特征点越多,AI就越能精确地识别戴口罩场景下的人脸,让人们在不摘口罩的情况下也能实现精确的体温测量,或是通过人脸闸机。看似简单重复的工作,也能带来巨大的价值。

百度山西太原资料标注基地2023年招聘工作人员简章上招聘要求只有六点:1、大专及以上学历,有工作经验者优先,特别优秀者可放宽至中专。可接受实习生。2、年龄18到40周岁之间,特别优秀者可适当放宽年龄条件。3、身体健康,无色盲、色弱、色差。4、掌握电脑的基础操作。5、具有较好的学习能力和理解能力。6、工作积极主动,责任心强,细心耐心。这基本上完美契合了小镇青年的工作期望,门槛低,入手快,工资将就。

在新疆,新疆和田皮山县,也有数字产业园,,政府重点发展呼叫中心、电子商务、直播平台、资料标注、人才培养基地等五大重点产业领域,其中资料标注被放在了首要位置。有4000人在产业园从事资料标注工作。

现在全国各地都有规模在1000人以上的资料标注基地,他们大多都建在二三线城市,为大量城镇青年提供就业机会。这些地方经济欠发达,产业不健全,年轻人就业机会少,从职业技能来讲也卷不过大城市名牌大学生。CHAT GPT的资料标记员就来源于相对不发达的非洲肯尼亚、乌干达地区。一个缺工作,一个缺大量劳动力,两者双相奔赴,很多做标注员的青年也许并不清楚自己工作的性质,也可能不会意识到自己当下的工作与人工智能有什么联系,对他们来说,这仅仅就是一份工作而已。

他们喂养人工智能,而人工智能最终替代他们。 但人工智能领域有一句流传甚广的老话,即“人工智能行业,有多少人工就有多少智慧”。著名图片数据库ImageNet,官网上介绍有14197122 张图片, 21841 个同义词索引,这个资料量的背后是来自于167个国家的五万名标注员长达三年的辛苦工作。所以,就目前来看,人工智能还需大量资料喂养,小镇青年一时半会也不会被人工智能替代,但是否有一天,人工智能否会获得足够多的资料,自主学习,不再需要“喂养”?不管怎样,作为标注员的小镇青年,可能是最底层的因特网民工,他们以简单粗暴、最没科技含量的方式跟当下最具科技含量的人工智能产生联系,他们教会人工智能如何理解世界。