business analysis of GPT

简述3月中旬几个重要的GPT发布节点以来的可能影响

2023年2月 ChatGPT用户突破1亿再次席卷中文互联网

2023年3月 Microsoft集成了早期GPT4模型将其进行搜索特化变成了 New Bing (Chat)

2023年3月15日 GPT4发布支持图片和文字多模态

2023年3月16日百度发布类ChatGPT模型文心一言

2023年3月17日既Google宣布将类ChatGPT模型集成进workspace后 Microsoft将GPT4集成进Microsoft 365

Emergent Abilities of Large Language Models

标题名为: 大语言模型的涌现能力

当OpenAI在ChatGPT上证明大语言模型的涌现能力之后商业公司和普通体验者都震惊了

最典型的反应就是微软直接裁掉了元宇宙部分并且加大投资OpenAI

在ChatGPT大获成功之后其他公司和机构也开始推出自己的大模型 (最典型的失败案例是Google演示Bard不顺利导致股价暴跌)

ChatGPT的早期试用可以参考前文

New Bing 用于论文搜索总结

GPT4: the end of NLP and CV

3月上旬微软德国发声说下周OpenAI将发布GPT4

同时期确定的消息是百度将于3月16日发布百度类ChatGPT模型: 文心一言

结果OpenAI在北京时间3月15日1时在Twitter公布GPT4 同时公布了一份关于GPT4性能的技术报告

支持图文多模态的GPT4 在多个任务表现优异让人直呼NLP和CV已经不存在了

如果说ChatGPT只是揭示了大模型能够涌现新能力这个实现那么GPT4就是大模型新时代的冲锋号了让人无法回避大模型所带来的对于全球的冲击

另外值得一提的是微软解散了它的关于OpenAI语言大模型的风险评估团队开始了基于OpenAI大模型的狂野扩张

Baidu 文心可言

百度在北京时间3月16日14:00全平台直播了文心一言的新闻发布会但是只是用slides进行讲解没有实机演示同时CEO与CTO演讲皆不佳导致了当日百度集团股价最高10%的港股下跌

事前我对百度模型的期望是能够媲美ChatGPT早期版本的水平就能够在目前中国这片没有 OpenAI 的类GPT模型蓝海市场站住阵脚

但是由于百度发布会的简陋的slides演讲人员的表现和没有任何实际演示让我觉得也许它的能力不太行

但是3月17日经过他人的测评结果发现其实文心一言在中文上的表现与ChatGPT各有千秋

同时结合百度发布会的一些关键信息:

可以离线部署
图文视频多模态(视频暂不可使用)

再结合百度的预期布局来看百度是有想法做垂直领域的

Baidu-insights

我们可以认为在这样的模型实际表现下百度能快速扩张并实现它的目标

关于发布会的一些思考

发布会受众?

大众
技术人员
企业管理层

至少中前两类受众来看发布会并不过关既没有介绍好产品的特性又没有突出产品的对比优势

很像是受到了前一天GPT4发布的刺激临时改的稿子

CEO没说清楚商业 CTO没讲明白技术整体效果不如知乎的体验回答

商业发布会?

CEO介绍系统与合作伙伴
CTO介绍平台和层次架构

意图用稳健的预先准备避免可能的现场出错但是当天港股下跌最高10%

国内市场分析

看完百度之后可以再回头看看国内的几个有能力的“大玩家”

阿里巴巴: 目前核心是阿里云/淘宝
字节跳动: 目前核心是短视频(抖音&TikTok)和推荐算法(头条->短视频)
腾讯: 主打社交/游戏 (半个投资公司)

可以从目前的核心业务看出类ChatGPT并不太能直接增益主要业务可以不一定正确地认为追 OpenAI 的相关工作并不是占用太多的资源(其中阿里淘宝系的智能客服可能算一部分但是由于不需要那么高的通用能力同时这只是一个小的组件投入产出比不对等)

对百度的展望与其他分析

百度

现在对于文心一言的使用是邀请制
模型可以离线部署
文心一言所说的多模态是图/文/视频但视频现在不开放使用(可能是人工)
国产化在国内市场的扩张速度(以前可以参考的例子是华为[鸿蒙系统]和统信[UOS系统])

数据存储和数据安全问题对于B端用户很重要

在此之前复旦大学的团队公布自己的类ChatGPT大模型 MOSS

那么应该有其他的高校有一定的资源进行自己的大模型训练

同时会有一些企业开始追赶热潮竞争目前的这一片蓝海

结语

如果GPT4还没出生那么我认为造一个类ChatGPT没那么紧急但是现在LLaMA成为了公开的秘密 GPT4也已经是端上桌的一盘好菜那么抢占蓝海以战养战势在必行