原文:venturebeat
编译:定义之路,凯尔
人工智能(AI)迅速改变了我们的生活和工作方式。与此同时,AI数据偏差带来的挑战也已浮出水面。随着我们迈向Web3的未来,我们自然会看到使用Web3和人工智能的创新产品、解决方案和服务。而且,虽然有评论认为去中心化技术可以解决数据偏差的问题,但事实并非如此。
图片来源:迷宫AI生成
Web3的市场规模仍然相对较小,难以量化,因为Web3生态系统仍处于早期发展阶段,Web3的确切定义仍在发展中。虽然2021年Web3的市场规模估计接近20亿美元,但各种分析师和研究公司报告称,预计年复合增长率(CAGR)约为45%,随着Web3解决方案和消费者采用率的快速增长,到2030年Web3市场的价值将达到约800亿美元。
虽然Web3增长很快,但是行业现状和科技行业其他因素的结合才是AI数据偏向错误道路的原因。
数据偏差、质量和数量之间的关系
AI系统依靠大量高质量的数据来训练它们的算法。OpenAI的GPT-3(包括ChatGPT模型)已经在大量高质量的数据上进行了训练。OpenAI没有透露用于训练的确切数据量,但估计在1000亿字或更多的量级。
对数据进行过滤和预处理,以确保其高质量和与语言生成任务的相关性。OpenAI使用先进的机器学习(ML)技术(如Transformer)在这个大型数据集上训练模型,使其能够学习单词和短语之间的模式和关系,并生成高质量的文本。
AI训练数据的质量对ML模型的性能影响很大,数据集的大小也是决定模型对新数据和任务能力泛化的关键因素。然而,质量和数量都会对数据偏差产生重大影响,这也是事实。
数据偏差的独特风险
人工智能中的数据偏差是一个重要问题,因为它可能导致就业、信贷、住房和刑事司法领域的不公平、歧视性和有害的结果。
2018年,亚马逊被迫放弃了一款显示出对女性偏见的AI工具。该工具接受了过去10年提交给亚马逊的简历的训练,主要包括男性候选人,这导致AI减少了包含“女性”和“女人”字样的简历。
2019年,研究人员发现一种用于预测患者预后的商业AI算法对黑人患者有偏见。算法主要训练白人患者的数据,导致黑人患者的假阳性率较高。
结合人工智能的Web3解决方案的去中心化特性带来了独特的偏见风险。在这种环境下,数据的质量和可用性可能是一个挑战,这使得精确训练AI算法变得很困难,不仅因为缺乏正在使用的Web3解决方案,还因为缺乏可以使用它们的人。
我们可以从23andMe等公司收集的基因组数据中得出相似之处,这些数据对贫困和边缘化社区有偏见。DNA检测服务(如23andMe)的成本、可获得性和有针对性的营销限制了来自低收入社区或没有提供这种服务的地区(通常是贫穷和不发达国家)的个人的机会。
因此,这些公司收集的数据可能无法准确反映更广泛人群的基因组多样性,导致基因研究和医疗保健及医学发展的潜在偏差。
这让我们想起了Web3增加AI数据偏差的另一个原因。
行业偏见和对道德的关注
Web3创业行业缺乏多样性是一个主要问题。到2022年,女性占据了26.7%的技术岗位。其中,56%是有色人种女性。在科技行业,女性担任高管职位的比例甚至更低。
在Web3中,这种不平衡加剧了。根据各种分析,不到5%的Web3创业公司有女性创始人。这种多样性的缺乏意味着AI数据偏见很可能被男性和白人创始人无意识地忽略为一个问题。
为了克服这些挑战,Web3行业必须优先考虑其数据源和团队的多样性和包容性。此外,该行业需要改变为什么多元化、平等和包容是必要的说法。
从财务和可扩展性的角度来看,从不同角度设计的产品和服务更有可能服务于数十亿的客户,而不是数百万,这使得团队多元化的创业公司更有可能获得高回报和全球规模的能力。Web3行业还必须关注数据质量和准确性,以确保用于训练人工智能算法的数据是无偏见的。
Web3能否解决AI数据偏差的问题?
应对这些挑战的一个解决方案是开发一个分散的数据市场,允许个人和组织安全透明地交换数据。这有助于降低数据偏差的风险,因为它允许在训练AI算法时使用更广泛的数据。此外,可以使用区块链技术来保证数据的透明性和准确性,使算法不会产生偏差。
然而,最终,我们将面临一个巨大的挑战,即在主流受众使用Web3解决方案之前,找到多年的广泛数据来源。
尽管Web3和区块链继续出现在主流新闻中,但这类产品和服务最有可能吸引初创企业和技术社区的人们——我们知道这些社区缺乏多样性,但它们在全球市场中的份额相对较小。
很难估计世界上有多少人在Web3创业公司工作。近年来,该行业在美国创造了约300万个就业岗位。如果这个数字与美国的总人口相比——且不考虑失去的工作岗位——这个科技行业远远不能代表工作年龄的公民。
在Web3解决方案变得更加主流,其吸引力和应用范围扩展到那些对技术有内在兴趣的人,变得负担得起,并可以被更广泛的人使用之前,获得足够高质量的数据来训练AI系统仍然是一个主要障碍。业界现在必须采取措施解决这个问题。
温馨提示:注:内容来源均采集于互联网,不要轻信任何,后果自负,本站不承担任何责任。若本站收录的信息无意侵犯了贵司版权,请给我们来信(j7hr0a@163.com),我们会及时处理和回复。
原文地址"去中心化api,web2.0去中心化":http://www.guoyinggangguan.com/qkl/176408.html。

微信扫描二维码关注官方微信
▲长按图片识别二维码