无码av一区二区三区无码,在线观看老湿视频福利,日韩经典三级片,成 人色 网 站 欧美大片在线观看

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

基于SVD的單詞分布式表示

2023-03-16 18:56 作者:Hedarko  | 我要投稿


參考了《深度學(xué)習(xí)進(jìn)階:自然語言處理》的第二章,基于共現(xiàn)矩陣計(jì)算點(diǎn)互信息,然后用SVD降維做word embedding

感想:拿基于統(tǒng)計(jì)的方法做詞嵌入還是太慢了!雖然解釋性比較強(qiáng),但是對(duì)于大的詞表來說算起來太慢了。莎士比亞的數(shù)據(jù)我只敢喂一小部分,全部喂進(jìn)去詞表維度有兩萬維,算共現(xiàn)矩陣的時(shí)間復(fù)雜度是n方,SVD降維時(shí)時(shí)間復(fù)雜度是n立方!數(shù)據(jù)清洗也很麻煩,拿到的原始數(shù)據(jù)得用正則表達(dá)式先處理下,正則匹配的時(shí)候記得用re.escape()方法來處理pattern。

數(shù)據(jù)集:https://ocw.mit.edu/ans7870/6/6.006/s08/lecturenotes/files/t8.shakespeare.txt


基于SVD的單詞分布式表示的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國家法律
贵港市| 来凤县| 营山县| 祥云县| 伊宁市| 托克逊县| 离岛区| 晋中市| 石家庄市| 木里| 抚顺县| 白沙| 青神县| 衡山县| 贵定县| 松滋市| 岳普湖县| 奉贤区| 西盟| 揭东县| 大连市| 石狮市| 两当县| 邓州市| 东城区| 鄂州市| 宣武区| 南召县| 乌鲁木齐县| 枣阳市| 双牌县| 农安县| 田阳县| 隆昌县| 石景山区| 吉水县| 铜川市| 白朗县| 乌海市| 石台县| 孝感市|