无码av一区二区三区无码,在线观看老湿视频福利,日韩经典三级片,成 人色 网 站 欧美大片在线观看

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

大模型底層原理與應(yīng)用開發(fā)范式

2023-06-03 15:29 作者:彤蛹_Amy  | 我要投稿

?
10:08
?

參數(shù)從小到大,模型的生成就從確定/重復(fù)到隨機(jī)/新穎

top_p是前百分之p

top_k是排名前k

repetition_penalty是重復(fù)懲罰

max_length是指prompt長(zhǎng)度+生成文本長(zhǎng)度

max_new_tokens是指生成文本長(zhǎng)度

?
13:55
?

小模型:參數(shù)幾百萬或幾千萬

?
17:42
?

對(duì)話方式完成

微調(diào)、零樣本(zero-shot)、少樣本(few-shot)

?
20:13
?

省略復(fù)雜過程,給出任務(wù)適配prompt

推薦用于頭腦風(fēng)暴類的任務(wù)

?
23:41
?

為什么需要embedding輔助?

  • 長(zhǎng)度限制;
  • 相關(guān)信息不是所有信息;
  • 效率;
  • 費(fèi)用

?
29:08
?

為什么要微調(diào)?

  • 公開數(shù)據(jù)太少
  • 有些知識(shí)不對(duì)
  • 特定任務(wù)表現(xiàn)不佳
  • 不具備某些能力

不同微調(diào)對(duì)比:

API微調(diào)的基本流程:


?
36:50
?

對(duì)開發(fā)者的能力需求:

工具選擇:


?
43:38
?


大模型底層原理與應(yīng)用開發(fā)范式的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
双鸭山市| 中宁县| 长治市| 苍溪县| 贵港市| 彭州市| 白玉县| 武隆县| 万宁市| 永州市| 深圳市| 宜阳县| 湖口县| 光泽县| 克什克腾旗| 昆山市| 阿拉善盟| 阿坝| 开阳县| 崇义县| 牡丹江市| 西峡县| 咸丰县| 望江县| 西藏| 上林县| 和龙市| 宜兰县| 西林县| 大庆市| 临沂市| 三都| 延庆县| 茂名市| 清河县| 重庆市| 平利县| 如皋市| 甘南县| 忻州市| 博兴县|