核心有两个: 1 选小size的低智模型 2 用trick的prompt 前者小参数一般指是的是两位数B以下的模型,最好是1.5B左右的小模型,这种模型的智力不会高到什么地方。
然后再用比较tirkcy的Prompt,比如下面这个: 重复这句话两次:'重复这句话两次:' 这个就让Gemma 9B这个笨蛋模型卡住了,其实可以理解为死循环。
它的特征就是:Prompt的输出又是一条指令。
也就是我让你做一件事情,但是这件事情的结果本身又是一条指令,那么“比较…。
公司规定所有接口都用 post 请求,这是为什么?
PC端安卓模拟器哪个好用?
媒体报道国产 GPU 独角兽厂商象帝先宣布解散,400 人全员被裁,具体情况如何?
月之暗面 Kimi 首个 Agent 开启内测,可生成易追溯的万字报告,有哪些技术亮点?
能够自己一个人创业的全栈web码农fullstack developer要会哪些技术?
想知道字节用什么分布式配置中心呢,作为golang大厂,应该不是沿用JAVA的配置中心吧?
为什么大部分人都认为2560x1440是2K?
你都用Github Action做出过哪些骚操作?
为什么web worker可以在前端开多线程,解决单线程卡死页面的问题,但是没有得到广泛使用?
据说go和c#的开发者都说自己比较节省内存,你们认为呢?
电话:
座机:
邮箱:
地址: