OpenAI ChatGPT 小玩

ChatGPT 使用体验(前面部分是ChatGPT 后面部分是GPT3 text-davinci-003 模型)

ChatGPT

昨天发现使用错模型了然后ChatGPT要排队今天补充一些ChatGPT的样例

对于一个可能没出现的鸡兔同笼问题它会正确的给出逻辑然后算错

$math-infer-Chat$

能解决到括号的算数计算但是进位有点问题

不知道是不是受到 self-attention 和 short penalty 的问题 ChatGPT会倾向于生成大段的检索结果

让ChatGPT对话模型去模拟一个终端现在仍然是可以的有一定的可玩性。

这里先看两个比较正经的示例

这里多种语句包括一般的白话句、多重否定句和文言

除了“怀民亦未寝”这种节选半句其他的效果都还可以 (红框标记为效果不太行)

retell

在隐含指代情况下的多轮对话效果不好(这里的两轮对话效果不错)

multi-phase-dialogue

这里尝试了几个简单的数学问题发现它并不擅长推理

在 1+1 和经典九章算法的回答上是正确的

但是要是自己出题可能就搜索不到答案了

$math-prob$

在 few-shot 的情况下测试了消极语句转换为积极语句的效果整体还行

positive-generate

一个简单代码改错的例子: 用模型模拟用户我模拟终端来逐步修改编译的报错

1
2
3
4
5
// 最初的代码
int main() {
  cout<<"hello"
  return 0;
}

图中绿色内容为模型的输出可以看到模型的理解能力很强但同时也还是不能完全理解没开停用词的话会生成很多内容

一个简单任务: 将 Cpp 代码转换为 Python 代码(多轮对话)

图中红色矩形部分为模型生成内容

能看出模型见过一些常用的Linux包管理器但有印象的也只是 apt/yum 了

同时能看出在多轮对话的情况下也会忘掉刚才的错误(这里表现出推理能力可能不太够包管理下不了包应该认为没有更新index)

infer-ability

从一个点证实模型是独立的: 每次清空内容后问时间都是不一样的

date