李彦宏想借百度版ChatGPT洗耻莆田系资本市场不看好


李彦宏想借百度版ChatGPT洗耻莆田系

资本市场不看好


百度版ChatGPT下周就要见面了,此前,百度的宣传拉满了弓,显示出李彦宏对于这次赌博的重视,而回顾百度的创业史和豪赌史,李彦宏除了从infoseek工程师回来做中国搜索是正确的之外,其他很多事情都为人不耻。

不过,资本市场似乎对百度版ChatGPT并不看好,除了内地A股资本市场的牛鬼蛇神炒作了很多梦想之外,百度正股在美国和中国香港资本市场都在跌,这有点如google当初的样子。


//

莆田系:百度永远的耻辱



在百度历史留下的最大从耻辱就是莆田系医院事件。当时,在经济的压力之下,百度铤而走险,把莆田系医院的诈骗垃圾广告作为主力收入,在百度的竞价排名商业模式中,尤其就排搜索第一,不管你真假,最终一名叫魏则西的学生因为得滑膜肉瘤,在通过百度搜索和央视得知“武警北京总队第二医院”后去医药看病,这家医院其实是莆田系承包的黑医院,魏则西全家人财两空,而百度搜索也成为全民声讨的对象。

当时,有公开媒体报道指出,莆田系在百度上投放了巨额的广告推广费用,“占到百度广告收入总额的一半。”此前,莆田市委书记梁建勇曾公开表示,“百度2013年的广告总量是260亿元,莆田的民营医院在百度上就做了120亿元的广告。”


//

资本市场不看好



从百度股票知道走势看,资本市场对百度能搞出什么并不看好。凌通社觉得是有道理的,因为作为最早的搜索引擎,李彦宏当初拷贝infoseek的技术和google的搜索模式,百度填补了中文搜索的空白。后来借助莆田系等金主,百度的收入也增加很快。

但是,后来百度的各种战略似乎没有任何成功。从各种收购到电动汽车,到All in AI,都没干成。而此前百度的AI其实走偏了, 一直到ChatGPT出来,凌通社不知道作为当初北大信息系的专业工作者,百度竟然没有监控到全球AI的大趋势?

百度版ChatGPT不被看好,首先是中文信息处理比英文复杂很多,记得当时凌通社在交大时,中文信息处理的专业很好但大家都知道很难出成果,因为在中国老婆都有无数个说法,而且各种方言错别字假消息造谣估计美帝牛逼机构也搞不成,所以你想别说机器训练了,人都搞不清哪个是真假。当然,在美帝对中国制裁之后,其实百度也没办法弄到巨量的GPU还有巨量的电力和钱来训练。

一篇外媒报道,在最后的时刻,百度开发团队马不停蹄地工作,包括在1月底为期一周的春节假期期间。他们说,该项目目前已经降低目标,从此前希望创建能够用中文和英文对话的双语聊天机器人转变为以中文为主的机器人。其实,凌通社觉得,这个目的大致也是无法达到的,最后的结果,百度能够搞出比现在百家号已经在用的小工具已经不错了。




//

文心一言夜以继日赶工


此前,外媒报道,距离3月16日百度计划推出名为文心一言的聊天机器人仅剩一周时间,但夜以继日赶工的员工说这款AI聊天机器人仍在接受训练。

文心一言,(Ernie Bot),不知道李彦宏自己取的名字还是找取名大师取的, 完全不朗朗上口,不知道是什么。英文更是不能读下去。这个开端很不好。

媒体报道,据知情人士透露,为了开发这款名为文心一言(Ernie Bot)的人工智能(AI)聊天机器人,数百名员工一直在夜以继日地工作。他们说,其他团队被要求支援人手和功能强大的计算机芯片。受美国制裁影响,中国公司不能再购买这类芯片。

其中一些知情人士表示,在预定的发布日期之前,这个聊天机器人基于的AI模型仍在接受数据训练。本次发布在中国科技行业备受期待。一些员工说,他们没有足够的时间来打造一款功能完善的产品。

据听取了该计划简报的人士透露,百度计划分阶段推出该产品,首先向部分用户开放进行公开测试。上个月,百度表示,将首先在其搜索引擎中嵌入文心一言,并将于3月份向公众开放。

上述赶工情况反映出,为了抢在最近宣布类似计划的中国竞争对手之前,百度正在进行一场精心策划的冒险。该公司称,已经与400多家中国公司签署了协议,这些公司将能够在其产品和服务中使用文心一言。百度表示,通过与生态伙伴合作,该聊天机器人能够在不同场景下运行积累经验,以帮助提高其性能。

百度近年来失去了投资者的青睐,如果文心一言成功推出,将有助该公司重新跻身中国最杰出科技公司之列。若失败,则可能会导致该公司遭遇与谷歌类似的命运。谷歌直到最近还坚持对AI采取相对谨慎的做法,但在其AI聊天机器人搜索在演示中产生事实错误后,该公司市值蒸发了1,000亿美元。

百度未予置评。


百度一直在依靠强大的英伟达芯片来帮助训练文心一言。

多年来,百度在开发大语言模型方面投入了大量资金,将谷歌和OpenAI的此类模型的英文版本改编为适用于中文。大语言模型是ChatGPT的基础技术。百度在2019年发布了第一个相关模型,将其命名为文心,英文名为Ernie。此前谷歌将其模型命名为Bert。Ernie和Bert都是美国儿童节目《芝麻街》(Sesame Street)中的角色。

去年12月下旬,随着ChatGPT热度上升,百度首席执行官李彦宏向员工谈到了这项新发展。根据《华尔街日报》(The Wall Street Journal)看到的一份内部文字记录,李彦宏当时表示,我们有这么酷的技术,那我们能不能把它变成人人都需要的产品?李彦宏说,这一步其实才是最难的,也是最伟大、最能够产生影响力的。

据熟悉该项目情况的人士称,1月初,百度的高管让其自然语言处理团队开始用文心大模型整合出一款对标ChatGPT的产品。

但上述人士表示,与其他从事类ChatGPT技术的AI开发者所遇到的情况一样,这一项目面临一些挑战。其中一个挑战是,需要教该模型对有多种释义的短语或可指代多人的名字进行辨别,从而能对用户的要求做出更精确的反应。另一个挑战是使该聊天机器人生成的语言看起来更像人类说的话。

第三个挑战是提高事实准确性,这是大语言模型的一个技术限制;大语言模型会根据不同词语可能出现在一起的概率将句子串起来,而不是根据信息片段。这种限制也使得这种模型难以控制以避免敏感话题,这是审查方面的一个障碍。

这些人士说,百度已经聘请了合同工来帮助评估和改进聊天机器人的答案。

这些人士称,每个步骤都需要时间。AI研究人员已表示,即使使用几千块芯片来训练如此大型的模型,要得到相对理想的结果也可能需要数周或数月的时间。

知情人士说,本周,工程师和产品经理正加紧改善文心一言的基本功能,比如对用户请求的响应速度,以及如何对搜索结果进行总结。

展开阅读全文

页面更新:2024-04-25

标签:莆田   资本市场   夜以继日   英文   中文   中国   机器人   此前   模型   人士   李彦宏

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2008-2024 All Rights Reserved. Powered By bs178.com 闽ICP备11008920号-3
闽公网安备35020302034844号

Top