原文来源:量子位
图片来源:由无界 AI? 生成
ChatGPT的代码解释器,用自己的电脑也能运行了。
刚刚有位大神在GitHub上发布了本地版的代码解释器,很快就凭借3k+星标并登顶GitHub热榜。
不仅GPT-4本来有的功能它都有,关键是还可以联网。
ChatGPT“断网”的消息传出后引起了一片哗然,而且一关就是几个月。
这几个月间联网功能一直杳无音讯,现在可算是有解决的办法了。
由于代码是在本地运行,所以除了联网之外,它还解决了网页版的很多其他问题:
3小时只能发50条消息支持的Python模块数量有限处理文件大小有限制,不能超过100MB关闭会话窗口之后,此前生成的文件会被删除
如果没有API,还可以把模型换成开源的Code LLaMa。
这个代码解释器推出之后,很快有网友表示期待一波网页版:
那么我们就来看看这个本地代码解释器到底怎么样吧!
让GPT“重新联网”
既然调用了GPT-4的API,那GPT-4支持的功能自然都能用,当然也支持中文。
关于GPT本身的功能这里就不再一一详细展示了。
不过值得一提的是,有了代码解释器之后,GPT的数学水平提升了好几个档次。
所以这里我们用一个高难度的求导问题来考验一下它,题目是f(x)=√(x+√(x+√x))。
Emmm……这个结果有些抽象,不过应该是提示词的问题,我们修改一下:
然后我们就看到了这样的结果:
这个式子和标准答案长得不太一样,不过是不是格式的问题呢?我们验证了一下:
结果是正确的!
接下来就要进入重头戏了,来看看这个代码解释器的联网功能到底是不是噱头:
比如我们想看一下最近有什么新闻。
程序会首先检查有没有安装必备的模块,如果没有的话会自动安装,然后就开始拉取网页了。
不得不说把整个网页都读取一遍,如果不是在本地运行,看着屏幕上滚动的代码,的确是有些肝儿颤……
然后程序会分析出新闻标题存储在了网友中的什么字段,并进行提取。
好在经历了一番折腾,我们最终得到了想要的结果:
除了让它自行搜索,也可以给出具体的网页让它来分析:
又一次的疯狂加载之后,代码解释器成功复现出了它的自我介绍。
那出了复刻了ChatGPT的联网版本,有没有什么更高级的功能呢?
当然有!比如我们想调整一项系统设置,但不知道怎么操作。
如果用网页版,我们大概率会看到一长串的文字说明,但现在直接交给代码解释器就可以了。
不是给出一大段不知所云的教程,而是自动运行代码,直接一步到位。
除了让GPT-4生成代码,一些代码仓库中的工具,也能通过它来调用。
比如想好给一段视频添加字幕,那么就可以调用replicate上现成的语音识别模块。
由于手边没有现成的素材,这里就展示一下开发者给出DEMO:
代码运行的过程是在本地进行的,所以不用担心视频大小超限。
总之,运行好之后,我们就可以看到字幕出现在视频下方了:
同样,利用这一特性还可以生成、修改文档或图片,或者调用ControlNet由一张静态图生成动画……
理论上,只要性能足够,Python能干的所有事情,它都能完成。
那么,怎么才能体验到这个本地代码解释器呢?
安装方法
作者在GitHub项目页(链接见文末)贴出了一份Colab笔记,有条件的网友可以直接进去体验。
在本地安装也非常简单(前提是安装好了Python),只需要一行“pip install open-interpreter”的代码就能搞定。
安装好后,在终端中输入“interpreter”就能直接启动。
这是程序会要求输入GPT-4的API,如果只有3.5的话,启动时要用“interpreter —fast”。
如果3.5也没有的话,可以直接在这步按回车,或者启动时直接输入“interpreter —local”,切换成Code-LLaMA。
其中包括7B、13B和34B三个版本,规模越小速度越快,越大结果越精确。
如果没有安装Code-LLaMA,按照程序的指示操作就能自动装好。
此外,默认情况下,代码生成之后需要确认才会运行,如果不想每次都确认,可以在启动时在命令后面加上“空格-y”。
常用的命令就介绍到这里了,如果想知道更高级的玩法可以参考作者的Colab笔记。
喜欢的话就赶快体验一下把!
GitHub项目页:https://github.com/KillianLucas/open-interpreter