人工智能
2017年,一款皂液分发器走红网络:在推特用户Chukwuemeka Afigbo上传的视频中,一位白人男性在分发器下方挥手,皂液正常流出;而黑皮肤的手放到分发器下时,机器却毫无反应。这两个人交谈着,再一次测试这台冒犯人的、乐柏美商务用品出品的机器。一人问:“你的手怎么回事?”另一个回答说:“太黑了。”
他说的也有道理。皂液分发器通过红外发光二极管灯泡发射不可见光,接收手的反射光启动机器。肤色较暗的人吸收的光多于反射的光,因此阻碍了皂液分发器的正常工作。
这则视频在全球广泛流传,被分享成百上千次,也激起不少民愤;这告诉了我们一个简单的道理:不同于长期以来技术推动人类进步的说法,技术仍然存在种族差异。
技术在娱乐应用程序里的失败技术应用是一回事,但环顾四周会发现,生活中常用的技术出现种族差异是另一回事。如果你怀疑世界建立之初就只考虑到了白人,不妨看看新一轮技术热潮是如何在早期开发过程中忽略“有色人种”的。
开发者承担了大部分责任,同时科技初创公司正尝试填补硅谷及其他地区“白人男性”开发者留下的空缺。到了2017年,开发人员自主研发不再是什么新鲜事,但让技术忽略大部分全球人口,无非是个亏本买卖。有关新闻(附带视频)报道了一名刘姓中国学生的iPhone X面部识别功能如何无法分辨他和他的母亲。技术的失误带来的安全隐患仅仅基于种族问题。
肤色问题在面部识别软件中的无能表现得更为严峻:后者在遇到执法过程中无法摆脱对黑人面孔的无意识偏见。Alexandria Ocasio-Cortez议员于五月就亚马逊和移民和海关执法局(ICE)对众议院监管委员会(House Oversight Committee)提出质询,她指出,“这些算法的有效程度因人而异”,并进一步提问,它对女性、有色人种和不同性别是否有效。得到回应均为否定时,她提出了一个尖刻的问题:这些算法对谁最有效?回答很简短:“肯定是白人男性。”
今年,也许最令人担忧的是一份Georgia Tech的报告,该报告考察了自动驾驶汽车问题,并分析了多种“机器视觉”系统识别不同肤色行人的有效程度。结果表明,比起较深肤色的人,AI系统更善于识别浅色皮肤的行人,成功识别白人行人的几率比黑人高出10%。另一份近期的报告指出,Fitbit等可穿戴心率追踪器在有色人种身上不太靠谱,因为它利用了一种极易被黑色素吸收的绿光。
无数实例表明,技术设计忽视种族是当今社会的“时兴”问题。长期以来,世界的发展就没有考虑过有色人种,现在随着朝AI和自动化方向的变革,未来似乎仍没有顾及这群人。尽管自动化汽车和面部识别远未在全球范围内普及,此时此刻,人们日常生活中普遍使用的技术正在他们的口袋里传达着有关种族优越的信息。
“iPhone里的Siri是我现在唯一常用的技术,我主要用它识别像‘带我回家’之类的基础句子,”Julian Mendel在Facetime上说,“但有几次它听到我的声音后没有反应或压根没听懂我在说什么。”
凭借自己在牙买加长大、近期移居美国的经历,用户Julian Mendel正用(英国人听来)浓重的牙买加口音外加美式鼻音解释Siri的用户体验。“我觉得我的确在用一个不同的声音和Siri说话,因为它绝对听不懂方言。我不认为牙买加那边有这种东西,所以我坚信这种技术还有很长一段路要走。对很多人而言,它几乎没什么作用。很多人能够支付技术的费用,却没办法使用它,因为平常大家会说方言。”
有色人种为了被人理解而采用更清晰(意作:更接近白人)的语音屡见不鲜,但让一些人为新技术而顺应白人的语音习惯至少可以说是令人沮丧的。毕竟,根据口音缩小市场的技术能有多有效呢?
Mendel不是唯一受这类问题困扰的人。我和带有浓重的印度、韩国和西班牙口音的人交谈过,他们都表示遇到过类似情况。何况还有其他没有说到的语言。所以,有没有方法解决这个让一部分全球人口无法使用技术的问题吗?
在多伦多的Collision(北美最大的技术会议)会场上,Mozilla的创意总监Katharina Borchert正面对200名听众。她展示的主题是:用语音数据弥补市场的空白。她穿着时髦,有一头栗色的头发,戴眼镜,说着一口带德语鼻音的口音,Borchert正在解释技术公司代表的“白皮肤的陈旧男性”垄断势力如何怠慢被她称为来自“新兴市场”的人群。她强调了很多人已经知道的事实:语音识别不能满足有口音或非英语母语者的需求(她指出,即使像中文普通话一样的通用语言也以男性语音为主)。她倡导Common Voice,一个意在通过收集个体声音作为数据集,促进A.I.语音多样化的项目。点击Common Voice,录制诸如“所有房子都由木材建成”,或“带有种族成见的各种民族恐慌和偏见”等句子贡献语音。
“我们意识到,数据生态系统十分闭塞,因为总是那么几个大公司拥有训练数据集,”Borchert结束演讲后在茶歇时间说,“苹果、亚马逊、谷歌、Nuance和微软,你可以利用它们的数据集,也可以利用亚马逊Alexa的技能,但这些对于像Mozilla这样有使命感、重视开放式网络、立志创造充满机遇的生态系统的公司来说,规模就远远不够。”
“我们从几年前开始开发语音识别的公司那里得知,他们通常将公共电台的声音收录到数据集中,这样就不必太担心版权问题。这些音频大多来自说母语、接受过发声训练的男性,所以最后得到的语音是清晰的,因为数据集里大部分声音都如此。自然而然会导致不公正的结果,因为数据就那些。收集的女声不多,更没有夸张口音。这就是为什么早期版本在识别女性声音方面有很大的问题,因为女性音调与男性的不同。所以,讲话人语音越多样,数据从长远来讲质量也越好。”
这种方法存在一些问题——数据集的大小取决于讲话人参与的积极性,人们还会担心收集数据的用途。Borchert目前正与从柏林到卢旺达大大小小的社区合作;在东非地区,人们自然会怀疑白人“创意执行官”为什么要找东非原住民录制声音。“当然,找到愿意说英语的人比找到愿意说卢旺达语的人容易很多,因为掌握后者的人数更少。”她解释道。“所以英语的数据容量比其他语言更容易扩大,不过我认为具体实施还要看社区积极性和参与度。”
Borchert也认识到,人们在不知道这些数据的最终去向时,是不愿意提供声音信息的。(Borchert保证,其条款是数据不被非法使用的保障,所有语音数据均会匿名,无法分辨其中的个人信息)
“我们不想拥有所有数据”她强调,“我们不想构建所有语音系统。我希望我们能引发下一波语音平台创新的热潮。我母亲的英语有浓重的德语口音,她能使用德语版本的Amazon Echo,但她用不了英语版本,也不能用Siri……我的父亲不会用英语和Siri对话。
她辩称,收集到的数据不仅可以用于养老,理想条件下,还可以用于移动医疗,无需打字就可以问一些简单的问题。显然这样的项目除了调节语音的平衡,还能成为政治活动的工具。Borchert回忆了近期发生的一件事:政治活动家和高校人员共同将加泰罗尼亚语和威尔士语的语音引入项目,当时正为这两种语言即将失传而担忧的政治氛围中。
Common Voice的进程漫长而艰辛。但它提供了很好的企业方案,有望借助大家的声音反抗现有种族格局,大大改变全球多数老龄化人口使用技术的方式。但见证真正的改变发生还需要对企业的部署结构进行根本性的改革,必须用现在的问题重新设定未来。在未来世界里,人们的技术将源自日常生活。
目前,我们只做到了第一步,即认识到技术的种族差异。这或许听起来难以接受,但如果你是正在争取技术获取权,希望在家庭日常生活中使用AI的有色人种来说,你比世界上的其他人更难找到方向——假装白人的语音,把白色餐巾偷偷放在皂液分发器下,失去养老的机会,承担比白人行人更高的风险,可能是你未来短期内需要面对的境况。
来源:搜狐
全部0条评论
快来发表一下你的评论吧 !