简述3月中旬几个重要的GPT发布节点以来的可能影响
2023年2月 ChatGPT用户突破1亿 再次席卷中文互联网
2023年3月 Microsoft集成了早期GPT4模型 将其进行搜索特化 变成了 New Bing (Chat)
2023年3月15日 GPT4发布 支持图片和文字多模态
2023年3月16日 百度发布类ChatGPT模型文心一言
2023年3月17日 既Google宣布将类ChatGPT模型集成进workspace后 Microsoft将GPT4集成进Microsoft 365
Emergent Abilities of Large Language Models
标题名为: 大语言模型的涌现能力
当OpenAI在ChatGPT上证明大语言模型的涌现能力之后 商业公司和普通体验者都震惊了
最典型的反应就是微软直接裁掉了元宇宙部分 并且加大投资OpenAI
在ChatGPT大获成功之后 其他公司和机构也开始推出自己的大模型 (最典型的失败案例是Google演示Bard不顺利 导致股价暴跌)
ChatGPT的早期试用可以参考前文
New Bing 用于论文搜索总结
GPT4: the end of NLP and CV
3月上旬 微软德国发声说下周OpenAI将发布GPT4
同时期确定的消息是百度将于3月16日发布百度类ChatGPT模型: 文心一言
结果OpenAI在北京时间3月15日1时在Twitter公布GPT4 同时公布了一份关于GPT4性能的技术报告
支持图文多模态的GPT4 在多个任务表现优异 让人直呼NLP和CV已经不存在了
如果说ChatGPT只是揭示了大模型能够涌现新能力这个实现 那么GPT4就是大模型新时代的冲锋号了 让人无法回避大模型所带来的对于全球的冲击
另外值得一提的是 微软解散了它的关于OpenAI语言大模型的风险评估团队 开始了基于OpenAI大模型的狂野扩张
Baidu 文心可言
百度在北京时间3月16日14:00全平台直播了文心一言的新闻发布会 但是只是用slides进行讲解 没有实机演示 同时CEO与CTO演讲皆不佳 导致了当日百度集团股价最高10%的港股下跌
事前我对百度模型的期望是能够媲美ChatGPT早期版本的水平 就能够在目前中国这片没有 OpenAI 的类GPT模型蓝海市场站住阵脚
但是由于百度发布会的简陋的slides演讲人员的表现和没有任何实际演示 让我觉得也许它的能力不太行
但是3月17日 经过他人的测评结果发现其实文心一言在中文上的表现与ChatGPT各有千秋
同时结合百度发布会的一些关键信息:
- 可以离线部署
- 图文视频多模态(视频暂不可使用)
再结合百度的预期布局来看 百度是有想法做垂直领域的
我们可以认为 在这样的模型实际表现下 百度能快速扩张并实现它的目标
关于发布会的一些思考
发布会受众?
- 大众
- 技术人员
- 企业管理层
至少中前两类受众来看 发布会并不过关 既没有介绍好产品的特性 又没有突出产品的对比优势
很像是受到了前一天GPT4发布的刺激 临时改的稿子
CEO没说清楚商业 CTO没讲明白技术 整体效果不如知乎的体验回答
商业发布会?
- CEO介绍系统与合作伙伴
- CTO介绍平台和层次架构
意图用稳健的预先准备避免可能的现场出错 但是当天港股下跌最高10%
国内市场分析
看完百度之后 可以再回头看看国内的几个有能力的“大玩家”
- 阿里巴巴: 目前核心是阿里云/淘宝
- 字节跳动: 目前核心是短视频(抖音&TikTok)和推荐算法(头条->短视频)
- 腾讯: 主打社交/游戏 (半个投资公司)
可以从目前的核心业务看出 类ChatGPT并不太能直接增益主要业务 可以不一定正确地认为追 OpenAI 的相关工作并不是占用太多的资源(其中阿里淘宝系的智能客服可能算一部分 但是由于不需要那么高的通用能力 同时这只是一个小的组件 投入产出比不对等)
对百度的展望与其他分析
百度
- 现在对于文心一言的使用是邀请制
- 模型可以离线部署
- 文心一言所说的多模态是图/文/视频 但视频现在不开放使用(可能是人工)
- 国产化在国内市场的扩张速度(以前可以参考的例子是华为[鸿蒙系统]和统信[UOS系统])
数据存储和数据安全问题对于B端用户很重要
在此之前 复旦大学的团队公布自己的类ChatGPT大模型 MOSS
那么应该有其他的高校有一定的资源进行自己的大模型训练
同时会有一些企业开始追赶热潮 竞争目前的这一片蓝海
结语
如果GPT4还没出生 那么我认为造一个类ChatGPT没那么紧急 但是现在LLaMA成为了公开的秘密 GPT4也已经是端上桌的一盘好菜 那么抢占蓝海 以战养战 势在必行