原文:“品”摆出“秀文心,说一句话出丑”
作者:闻道
3月16日,“文易欣言”在问答环节并没有“翻车”,因为百度创始人李彦宏在开发会上展示的这款自然语言模型产品的测试过程和结果是提前录制好的。
在“摆姿势”的演示中,文心可以用中文回答问题,续写《三体》,理解“洛阳纸贵”,计算“鸡兔同笼”的数学问题并给出计算过程,还可以生成图片、语音甚至视频。看起来相当强大,但也仅仅局限于外观,远没有早一天OpenAI直接演示GPT-4模型带来的惊艳全网。
展示看似安全,却没有保住股价。李彦宏上台后,港股百度集团股价从130港元下跌。22分钟后跌逾9%,报120港元。发布会结束后,百度股价未能回到130港元。
整个发布会,文心只字未提真实的交互,技术数据细节,和其他大机型的对比。李彦宏和百度CEO王海峰各定了一个PPT,被大众期待了一个多月空。目前,王海峰宣布“邀请测试开放”需要一个邀请码。
这意味着普通大众还无法体验文心的文字。另一方面,GPT-4已经嵌入ChatGPT和搜索引擎Bing,让人工智能技术能够接触到普通人。
相比较而言,百度对文心更有信心的领域似乎是在行业。李彦宏和王海峰都强调了自然语言模型对“千万个行业”的影响,这也是它和ChatGPT的区别之一,chat GPT的“现象级”和“杀手级”评价纯粹来自用户的“自来水”。
1.问答演示系统提前录音,股价大跌。李彦宏一上台就为“文易欣燕”定下了基调——这款基于文心大模型底层的产品在大众的期待中,目标是ChatGPT甚至是GPT-4。“门槛很高。”
他话锋一转,巧妙地避开了百度和OpenAI的对比,而是把对比放在了全球厂商的范畴里。“百度最先发布。大家都知道微软直接叫OpenAI,Google,Meta,Nvidia并没有真正发布同类型同级别的产品。”这句话还没说完,李彦宏清了清嗓子,就像他在以前的新闻发布会上一样,略显紧张。
接下来的15分钟,李彦宏用demo展示了文心的五大能力:文学创作、商业文案、数理逻辑计算、中文理解、多模态生成。与每种能力相对应,他以文字的形式输入了不同的、语境化的需求。
比如,在展示自己的文学创作能力时,他要求文心用一句话概括《三体》的核心内容,然后从哲学角度提出继续写《三体》的要求;在展示商业文案创作时,他让文新根据公司的业务,给公司起名字,生成Slogan,写一篇关于公司成立的新闻稿;在展示梳理逻辑计算时,李彦宏以小学生避不开的“鸡兔同笼”数学题为例,甚至故意输入了错题。文心指出有错误后,给出了修改后问题的正确答案和解题过程。
此时,发布会直播刚刚进入第21分钟。面对全网,李彦宏突然解释说,演示不是在现场进行的,而是事先录制好的。"因为很多单词需要输入,为了节省时间."
此话一出,全网一片哗然。“原来是摆姿势。”两分钟后,港股百度集团股价直接跌至120港元,较14时发布会开始时的130港元下跌逾9%。
发布会期间百度港股股价暴跌的测试演示,继续展示了文心词的“威力”:要回答当时洛阳纸有多贵,用这个习语做一首藏头诗,植根中国的百度能拿出比其他自然语言模型更好的中文理解能力;还可以在输入文字需求后生成海报(图片)、语音(可以是方言)甚至视频,即多模态生成能力。
但“预录”的转折,削弱了文心词的后续展示效果。
一天前,OpenAI的联合创始人格雷格·布罗克曼(Greg Brockman)展示了GPT-4直播的多模态能力,没有PPT和酷炫的开场广告。将一张“笑话网站”模板的手绘草图上传到新模型后,10秒钟就生成了网站。展览持续了不到半个小时,但布罗克曼一直在社交平台Discord上与用户互动,并随机选择用户测试GPT-4。
谁对自己的产品更有信心一目了然。
2.中文能力显示本土优势。跨语言“还在学习”如果信心不谈,那么文心能赢ChatGPT或者GPT-4吗?
无论是数据还是技术细节,无论是李彦宏还是后来上台讲解文心伊彦技术背景的CTO王海峰,都没有在发布会上给出具体的对比,只提到了“5500亿”的事实指标,而GPT四号并没有透露其中的知识。
普通人不一定能从数据对比中得出结论。但作为中国用户,我们把李彦宏对文心输入的中文需求甩给了植入了GPT-4模型的ChatGPT。这种“外来AI”无可厚非,但很容易给出错误答案。
比如把鸡和兔子放在同一个笼子里做数学题的错误没说,梗里的错误没指出;将习语“洛阳纸贵”解释为“高分试卷在洛阳广为流传”、“昭示珍贵、珍重、价值”,属于《晋书·左传》中三都赋的典故。我想知道这个习语的原意是不是“通俗作品”的隐喻。
ChatGPT似乎从字面上理解中国成语。有意思的是,ChatGPT还回答了“洛阳纸贵”在现代经济学原理中代表“供求”的引申意义。当它用这首习语作藏文诗时,前三个字都藏在诗中,而“桂”却写成了“气”,未能正确识别这个汉字。
正如李彦宏所说,文心植根于中国,它必须比其他国家的自然语言模型更了解汉语和中国文化。对于跨语言,文心还在学习。“英语也可以,但肯定不如汉语。”
GPT-4改编的“母语”明显是英语,但为了初步测试模型在其他语言中的能力,OpenAI的研究团队使用Azure Translate将MMLU benchmark(一组14000个选择题,涵盖57个主题)翻译成多种语言。GPT-4的英语准确率(85.5%)高于GPT-3.5 (70.1%),而GPT-4的跨语言准确率在普通话方面可以达到80.1%,高于日韩等亚洲国家。
作为中国土生土长的ChatGPT,学好中文当然是我们的职责。对于用户和客户来说,这也是最明显的优势,语言门槛低,应用和使用也会相应带来便利。但在全球竞争中,这种优势在最多使用中文的国家和地区都能体现出来,OpenAI将辐射英语地区。
多模态生成中,文心的Demo展示了输出图片、语音、视频的能力;GPT-4还透露,它将拥有输出图片和视频的能力,但目前还不能在ChatGPT上展示给更广泛的公众,其对网络“梗图”的理解也让网友感到惊讶。当然,最令人惊讶的是它用草图框架生成代码的能力。
写代码这种多模态的能力,在发布会上并没有表现出来。但是已经获得测试资格的媒体Quantum Bit的成员在晚间直播中测试了文心一个字写代码的能力,给出的评价是“一般般”。“Python语言可以,其他语言不行。”他还测试了文欣怡是否具备GPT-4的角色扮演能力,结论是“没门”。
3.聚焦企业客户,以用户反馈推动迭代。“从我自己的内测经验来看,文新真的不能称之为完美。”李彦宏谦虚地说:“但是为什么要在今天发布呢?”屏幕前一定有人认为他是想讲竞争,讲出一个字的难度。没想到,他自问自答:因为有市场需求。
他说,百度的各种产品线,从搜索和智能云到自动驾驶,都在等待使用这项技术。“更重要的是,我们的客户和合作伙伴正等着使用这项技术。大家都在催促我们尽快发布。”
总之,李彦宏讲的是文心的企业级场景,客户和合作伙伴成为重中之重。后页的PPT上写着“文新让每一家公司更贴近客户。”
李彦宏解释了大模型的工业机会。在解释文心的话以及底层文心大模式会带来哪些创业机会和投资机会时,李彦宏表示,大模式会带来三大产业机会,包括新云计算、行业模式微调和应用开发,而与文本、图像、音视频生成、数字人和3D生成相关的应用开发是“最大的机会”。
此时此刻,万众瞩目的文燕发布会就像一场“商业路演”,等待客户上门。在本次大会的前一个月,有上百家公司正式宣布加入文心伊彦生态,百度给出的数据是650多家。
To B可能是文心的一个重要优势。毕竟这个产品是百度几个大模型的产物,包括ERNIE和PLATO,而且两个模型都出了很多企业级模型,涵盖金融、医疗、航天、传媒、汽车等等。一句话文心被企业用,简直是天经地义。
此前,有两家“官方公布”的公司告诉“元宇宙天爆”,“先占坑,测试后再看怎么用。”企业的需求到底有多强,还有待观察。观察窗口期也开始了。发布会上,百度CTO王海峰现场宣布,“邀请测试”将于当天上线,获得邀请码即可参与测试,包括合作伙伴和个人。
很快,文心怡雅的测试入口打开了。当然,开始测试需要一个邀请码。当晚10点,百度发布文新“邀请测试”消息,6.5万家企业申请调用。
测试演示是提前录制的,真正的测试将在有限的用户中进行。总之,文心强不强,测试用户就知道了。那么个人用户如何获得邀请权限呢?百度公布计划:在测试门户网站点击“立即体验”参与排队。更大范围的个人用户想要使用这款产品,有很大概率会正式推出。
并不是说百度不重视C端。在发布会上,李彦宏表示,大语言模型的产品一旦发布,就会得到真实用户的反馈。"有了这个反馈,它的迭代速度和能力将会提高得非常快."
可见,“真实用户”的C端也有其价值,为文颜的大模型贡献了“反哺”,提高了迭代速度和能力。希望这个贡献对C端来说是免费的,这样才能和ChatGPT区分开来。毕竟,那个“外国AI”会向体验GPT-4模型的用户收取Plus版本的订阅费。
温馨提示:注:内容来源均采集于互联网,不要轻信任何,后果自负,本站不承担任何责任。若本站收录的信息无意侵犯了贵司版权,请给我们来信(j7hr0a@163.com),我们会及时处理和回复。
原文地址"收获满满是代表啥生肖,收获满盈是什么意思":http://www.guoyinggangguan.com/qkl/176262.html。

微信扫描二维码关注官方微信
▲长按图片识别二维码