无码av一区二区三区无码,在线观看老湿视频福利,日韩经典三级片,成 人色 网 站 欧美大片在线观看

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

基于 Flink CDC 構(gòu)建 MySQL 到 Databend 的 實時數(shù)據(jù)同步

2023-06-25 15:21 作者:Databend  | 我要投稿
作者:韓山杰??Databend Cloud 研發(fā)工程師??https://github.com/hantmac

這篇教程將展示如何基于 Flink CDC 快速構(gòu)建 MySQL 到 Databend 的實時數(shù)據(jù)同步。本教程的演示都將在 Flink SQL CLI 中進(jìn)行,只涉及 SQL,無需一行 Java/Scala 代碼,也無需安裝 IDE。

假設(shè)我們有電子商務(wù)業(yè)務(wù),商品的數(shù)據(jù)存儲在 MySQL ,我們需要實時把它同步到 Databend 中。接下來的內(nèi)容將介紹如何使用 Flink Mysql/Databend CDC 來實現(xiàn)這個需求,系統(tǒng)的整體架構(gòu)如下圖所示:

準(zhǔn)備階段

準(zhǔn)備一臺已經(jīng)安裝了 Docker 和 docker-compose 的 Linux 或者 MacOS 。

???準(zhǔn)備教程所需要的組件

接下來的教程將以 "docker-compose"?的方式準(zhǔn)備所需要的組件。

???debezium-MySQL

docker-compose.yaml


???Databend

docker-compose.yaml

在 "docker-compose.yml"?所在目錄下執(zhí)行下面的命令來啟動本教程需要的組件:

該命令將以 detached 模式自動啟動 Docker Compose 配置中定義的所有容器。你可以通過 docker ps 來觀察上述的容器是否正常啟動。

???下載?Flink?和所需要的依賴包

  • 下載?Flink 1.16.0[1]?并將其解壓至目錄 "flink-1.16.0"

  • 下載下面列出的依賴包,并將它們放到目錄 "flink-1.16.0/lib/"?下:

  • 下載鏈接只對已發(fā)布的版本有效, SNAPSHOT 版本需要本地編譯

  • flink-sql-connector-mysql-cdc-2.3.0.jar[2]

編譯?flink-connector-databend

將 target/flink-connector-databend-1.16.0-SNAPSHOT.jar 拷貝到目錄 "flink-1.16.0/lib/"?下。

???準(zhǔn)備數(shù)據(jù)

在?MySQL?數(shù)據(jù)庫中準(zhǔn)備數(shù)據(jù)

進(jìn)入 MySQL 容器

創(chuàng)建數(shù)據(jù)庫 mydb 和表 "products",并插入數(shù)據(jù):


???Databend 中建表

啟動 Flink 集群和 Flink SQL CLI
使用下面的命令跳轉(zhuǎn)至 Flink 目錄下

使用下面的命令啟動 Flink 集群

啟動成功的話,可以在?http://localhost:8081/?訪問到 Flink Web UI,如下所示:

使用下面的命令啟動 Flink SQL CLI

在?Flink?SQL?CLI?中使用 Flink?DDL?創(chuàng)建表

首先,開啟 checkpoint,每隔3秒做一次 checkpoint

然后, 對于數(shù)據(jù)庫中的表 "products"?使用 Flink SQL CLI 創(chuàng)建對應(yīng)的表,用于同步底層數(shù)據(jù)庫表的數(shù)據(jù)

最后,創(chuàng)建 d_products 表, 用來訂單數(shù)據(jù)寫入 Databend 中

使用 Flink SQL 將 products 表中的數(shù)據(jù)同步到 Databend 的 d_products 表中:

此時 flink job 就會提交成功,打開 flink UI 可以看到:

同時在 databend 中可以看到 MySQL 中的數(shù)據(jù)已經(jīng)同步過來了:

同步 Insert/Update 數(shù)據(jù)

此時我們在 MySQL 中再插入 10 條數(shù)據(jù):

這些數(shù)據(jù)會立即同步到 Databend 當(dāng)中。

假如此時 MySQL 中更新了一條數(shù)據(jù):

那么 id=10 的數(shù)據(jù)在 databend 中也會被立即更新:

環(huán)境清理

操作結(jié)束后,在 "docker-compose.yml"?文件所在的目錄下執(zhí)行如下命令停止所有容器:

在 Flink 所在目錄 "flink-1.16.0"?下執(zhí)行如下命令停止 Flink 集群:


結(jié)論

以上就是基于 Flink CDC 構(gòu)建 MySQL 到 Databend 的 實時數(shù)據(jù)同步的全部過程,通過 Flink CDC connectors 可以替換 Debezium+Kafka 的數(shù)據(jù)采集模塊,實現(xiàn) Flink SQL 采集+計算+傳輸一體化,減少維護(hù)的組件,簡化實時鏈路,減輕部署成本的同時也能達(dá)到 Exactly Once 的語義效果。


引用鏈接

[1]?Flink 1.16.0:?https://archive.apache.org/dist/flink/flink-1.16.0/flink-1.16.0-bin-scala_2.12.tgz
[2]?flink-sql-connector-mysql-cdc-2.3.0.jar:?https://repo1.maven.org/maven2/com/ververica/flink-sql-connector-mysql-cdc/2.3.0/flink-sql-connector-mysql-cdc-2.3.0.jar

[3]?flink-connector-databnend:https://github.com/databendcloud/flink-connector-databend

基于 Flink CDC 構(gòu)建 MySQL 到 Databend 的 實時數(shù)據(jù)同步的評論 (共 條)

分享到微博請遵守國家法律
金堂县| 吉首市| 池州市| 吉安市| 尼玛县| 凤冈县| 南川市| 岑溪市| 临湘市| 荆州市| 若尔盖县| 光泽县| 崇义县| 南京市| 博爱县| 大理市| 淮阳县| 荥阳市| 谷城县| 社会| 象州县| 婺源县| 潜江市| 西昌市| 汨罗市| 边坝县| 揭东县| 连南| 阳新县| 聂拉木县| 清徐县| 松阳县| 神农架林区| 万山特区| 玉门市| 锦屏县| 海口市| 扶风县| 辛集市| 赣州市| 思南县|