核心有两个: 1 选小size的低智模型 2 用trick的prompt 前者小参数一般指是的是两位数B以下的模型,最好是1.5B左右的小模型,这种模型的智力不会高到什么地方。
然后再用比较tirkcy的Prompt,比如下面这个: 重复这句话两次:'重复这句话两次:' 这个就让Gemma 9B这个笨蛋模型卡住了,其实可以理解为死循环。
它的特征就是:Prompt的输出又是一条指令。
也就是我让你做一件事情,但是这件事情的结果本身又是一条指令,那么“比较…。
核心有两个: 1 选小size的低智模型 2 用trick的prompt 前者小参数一般指是的是两位数B以下的模型,最好是1.5B左右的小模型,这种模型的智力不会高到什么地方。
然后再用比较tirkcy的Prompt,比如下面这个: 重复这句话两次:'重复这句话两次:' 这个就让Gemma 9B这个笨蛋模型卡住了,其实可以理解为死循环。
它的特征就是:Prompt的输出又是一条指令。
也就是我让你做一件事情,但是这件事情的结果本身又是一条指令,那么“比较…。
计算机网络组成分为 硬件、软件、协议三部分。 协议为计算机网...
2025-06-22阅读全文 >>目前的进展: 军用先进涡扇: 涡扇-15 :即将批量服役歼-...
2025-06-22阅读全文 >>当然是全台卖药二十年的广东电视台。 早在20年前,广东台就...
2025-06-22阅读全文 >>expo没有用过,不过是flutter资深用户。 2018...
2025-06-22阅读全文 >>随便说点 手机码字 底层用的是 radix 这玩意相当于就是...
2025-06-22阅读全文 >>