无码av一区二区三区无码,在线观看老湿视频福利,日韩经典三级片,成 人色 网 站 欧美大片在线观看

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

網(wǎng)易云微專業(yè)大數(shù)據(jù)開發(fā)工程師

2022-09-28 13:44 作者:血霽玫瑰與櫻花  | 我要投稿

大數(shù)據(jù)計算原理

  1. 在待處理的數(shù)據(jù)存儲在服務器集群的所有服務器上,主要使用HDFS系統(tǒng),將文件分成很多塊(Block),以塊為單位存儲在集群的服務器上

  2. 大數(shù)據(jù)引擎根據(jù)集群里的不同服務器的計算能力,在每臺服務器上啟動若干分布式任務執(zhí)行進程,這些進程會等待給它們分配執(zhí)行任務

  3. 使用大數(shù)據(jù)計算框架支持的編程模型進行編程,比如Hadoop的MapReduce編程模型,或Spark的RDD編程模型,編寫應用程序,例如python或java程序

  4. 用Haddop或Spark的啟動命令執(zhí)行這個應用程序,執(zhí)行引擎會解析程序要處理的數(shù)據(jù)輸入路徑,根據(jù)輸入數(shù)據(jù)量的大小,將數(shù)據(jù)分片,每個片分配給一個任務執(zhí)行進程去處理

  5. 任務執(zhí)行進收到任務后檢查是否有任務對應的程序包,沒有就去下載,下載后加載程序

  6. 加載程序后,任務根據(jù)分配的數(shù)據(jù)片的文件地址和數(shù)據(jù)在文件內(nèi)的偏移量讀取數(shù)據(jù),并把數(shù)據(jù)輸入給應用程序相應的方法去執(zhí)行,從而實現(xiàn)分布式服務器集群中并行處理的計算目標


網(wǎng)易云微專業(yè)大數(shù)據(jù)開發(fā)工程師的評論 (共 條)

分享到微博請遵守國家法律
尼勒克县| 衡山县| 彭水| 板桥市| 隆回县| 黄山市| 阳城县| 五家渠市| 黄陵县| 商城县| 达拉特旗| 佳木斯市| 黄石市| 大港区| 台山市| 唐海县| 宁远县| 芷江| 桐城市| 托里县| 盱眙县| 璧山县| 浮山县| 衡山县| 开封市| 扎鲁特旗| 常德市| 泽州县| 阳朔县| 岗巴县| 通州区| 涞源县| 卓资县| 广平县| 大同县| 郁南县| 子长县| 新乡县| 凭祥市| 白玉县| 南华县|