这里生产你美颜时「一键瘦脸」的尖下颌,你一起学猫叫时的动态胡须,生产张学友演唱会被实时识别的犯人,生产未来的自动驾驶,智能门禁…… 这里是中国特色的数据车间,他们遍布在河南、山东、河北等地的四五线小城里,日以继夜地为世界领先的 AI 产品服务。 越来越多的人正在加入他们的行列,成为为人工智能打工的人。 「梯子(可以移动的)」 马萌利面前出现一张欧洲户外咖啡馆的照片。她移动鼠标,绿色的画框浮现在照片上,显示备注「椅子」,她迅速在一瓶花束上补了一个绿框,标上「花(放在容器中)」。 下一张,一个日本花卉市场,几排密密麻麻的绿植中,马萌利检查了每一个标出的「花盆」。 下一张,一个美国孩子的卧室,「椅子」、「桌子」…… 她飞速删掉了「梯子」的画框——客户要求是能移动的梯子,这种高低床上已经焊死的梯子就不能算。 下一张、下一张、下一张,不管眼前是什么场景,马萌利手速不变,依次圈出「梯子」、「茶几」、「地毯」、「沙发」。 「梯子」、「茶几」、「地毯」、「沙发」。「梯子」、「茶几」、「地毯」、「沙发」…… 如此周而复始,不停重复循环。马萌利每天的工作从早晨 8 点钟开始,坐到工位,打开电脑,输入用户名和密码,移动鼠标开始标记,日复一日,每天持续 9 个小时。 屏幕上的图片很模糊,这些都是从全球社交网络上抓取的,角度混乱,像素也不高。那张韩国泡菜摊的照片,很明显来自一个角落里的摄像头。马萌利放大图片,在路人的脚边,圈出一个糊成一团的轮廓:「垃圾桶」。 旁边工位有人打开了音箱,活泼的流行歌响了起来:「燃烧我的卡路里!」 房间里有几百个屏幕,闪动着颜色不一的图片,每个人都在框选同样的内容:垃圾桶、梯子、茶几、地毯…… 这是河南省平顶山市郏县,一家叫千机数据的公司,房间看起来像一个网吧,在网络神曲伴奏下,年轻的员工们窝在柔软的沙发里,不停地拉框。马萌利是最后的审核员,她和同事要检查所有人拉的框,以保证每个画框都严丝合缝地贴着目标的边缘,图片里所有目标都要被框出来,不能有任何遗漏。 马萌利每天要检查至少 1000 张图。手头这个单子已经干了两个月,同事们标注了上万个垃圾桶、梯子、茶几、地毯……29 岁的马萌利知道,这些标好框的图片汇总后,将发回北京一家 AI 独角兽公司,变成人工智能的学习材料。 她不知道的是,这几万个「梯子(可以移动的)」标注,展示了梯子的无数个样子,再经过深度学习算法加工,最终让计算机认识,这就是梯子,可以移动的那种。 她日复一日标注的数据来自百度、京东、阿里、旷视、Momenta 等大公司,全部应用于人工智能训练。一种行业说法是,任何人类能在 5 岁之后做的事,对机器人来说都很简单,但是 5 岁之前,人类用本能就能理解的实际信息,计算机要用最笨的办法学习。这时候,就需要数以万计的马萌利们为人工智能提供标注服务了。 计算机认识沙发、梯子又有什么用? 马萌利回答不了这个问题,转头去问老板刘洋锋。刘洋锋今年 31 岁,是他去北京竞标抢到的这批活儿。他搔了搔头发,想起甲方提过一次,9 月 8 号他们要去国外参加一场世界级人工智能比赛。「这些是给那场比赛用的?」他不太确定。再往下说,他也不懂了。 为 AI 服务 我来郏县的第一顿饭,刘洋锋和合伙人刘磊带我去吃了本地一家网红??面,面馆有位漂亮的女主播,靠拍餐厅各种日常,在一家短视频平台上有 88 万粉丝。中午,餐厅两层楼坐得满满当当,一半是食客,一半是慕名而来的粉丝。 我们正好遇到女孩做直播,我发现,主播本人跟视频不一样:屏幕上她皮肤变好了,眼睛大大的,下巴更尖,苹果肌更圆。 是短视频软件的滤镜把她变美了。跟自拍软件一样,直播平台的滤镜靠的是人工智能,可以实时瘦脸、大眼并磨皮。APP 之所以能识别哪儿是眼睛、哪儿是下巴,正是此前有 AI 数据标注工人标记了那些人脸的五官。 一直到我们离开,女孩仍一刻不停地招呼新进直播间的观众,对着镜头羞涩地笑:「我是单身,没有男朋友。」 「她是那家老板的儿媳妇呀。」说起女主播,马萌利一边对着一张俄罗斯餐厅图片拉框,一边哈哈大笑。郏县很小,藏不住什么秘密。她比画了一下公司的员工们:「生拉硬扯,我们都能扯上关系。」 同在一个县城,几年前,马萌利和女主播的处境差别不大。但技术后来将她们塑造成了两类人:马萌利成了每天为 AI 打工的人,而女主播运用 AI 提供的便利赚钱致富。 马萌利今年 29 岁,一见面就热情地笑,问什么说什么。初中毕业她就出门打工,在制衣厂做过缝纫,也进过富士康,做了 4 年线外流动员:流水线制造惠普电脑屏幕,她要随时给人做替补,前面做组装,把显示器的面板、外壳、支架都装好。后面做测试,用数据线测屏幕上有没有亮点,往屏幕上贴标签。 回乡后,她开过网吧,做过超市收银员。去年,她应聘了这份「电脑操作员」,每个月收入 3~4 千,比收银员高,比富士康低。她觉得工作环境不错:坐着用电脑,有空调,下班早,晚上回家还能陪孩子玩一会儿。而且,3 个老板都是熟人,「我们村子都挨着,打小就认识」。 过去一年里,马萌利见过各种稀奇古怪的图片,她给人体标注过关节点,从头顶、脖子、膝盖到脚踝,一共打 17 个关节点;给道路图里的汽车、摩托车、自行车拉过边框,黑夜里的照片要比白天难一倍;她还录过一下午音,对着手机,念了 300 句话,有的短,就两个字、五个字,有的是十几二十几个字,具体内容,公司不让往外说。 2012 年,谷歌大脑做了一个著名的实验:1000 台计算机组成了超过 10 亿个「突触」连接的神经网络,研究者输入了 1000 万个静态图像,通过 3 天的密集寻找重复出现的模式后,谷歌大脑终于可以识别出一些特定的重复类别:人类面孔和人类身体,或者是一只猫。 马萌利这样的 AI 数据标注工人,就是给计算机输入图像,为人工智能提供学习材料的人。他们用的是最原始的办法,一张图接一张图地手动标记。他们在人脸上标注几百个记号点,让计算机知道哪里是内眼角、外眼角,瞬间扩出大眼睛;他们录入的语音信息,被拆分标注后,能让智能音箱懂得「关机」和「十分钟后给我老公打电话」是什么意思。未来,自动驾驶的车辆之所以能在路口停下,就是因为工人们标注过红灯、斑马线和一帧一帧移动的行人。 关于这项技术,最为人所熟知的一个例子是,在张学友南昌、赣州、嘉兴、金华 4 场巡回演唱会上,警方用安检时的人脸识别系统,一共抓获了 5 |
免责声明:本网站内容由网友自行在页面发布,上传者应自行负责所上传内容涉及的法律责任,本网站对内容真实性、版权等概不负责,亦不承担任何法律责任。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。