「万字长文」详解Flink作业提交流程（二)

2.1.3 虚拟 Transformation 的转换

虚拟的 Transformation 生成的时候不会转换为 SteramNode，而是添加为虚拟节点。

private void addEdgeInternal(Integer upStreamVertexID,
   Integer downStreamVertexID,
   int typeNumber,
   StreamPartitioner<?> partitioner,
   List outputNames,
   OutputTag outputTag,
   ShuffleMode shuffleMode) {
  //当上游是sideoutput时，递归调用，并传入sideoutput信息
  if (virtualSideOutputNodes.containsKey(upStreamVertexID)) {
   int virtualId = upStreamVertexID;
   upStreamVertexID = virtualSideOutputNodes.get(virtualId).f0;
   if (outputTag == null) {
    outputTag = virtualSideOutputNodes.get(virtualId).f1;
   }
   addEdgeInternal(upStreamVertexID, downStreamVertexID, typeNumber, partitioner, null, outputTag, shuffleMode);
  }
  //当上游是select时，递归调用，并传入select信息
  else if (virtualSelectNodes.containsKey(upStreamVertexID)) {
   int virtualId = upStreamVertexID;
   upStreamVertexID = virtualSelectNodes.get(virtualId).f0;
   if (outputNames.isEmpty()) {
    // selections that happen downstream override earlier selections
    outputNames = virtualSelectNodes.get(virtualId).f1;
   }
   addEdgeInternal(upStreamVertexID, downStreamVertexID, typeNumber, partitioner, outputNames, outputTag, shuffleMode);
  }
  //当上游是Partition时，递归调用，并传入Partition信息
  else if (virtualPartitionNodes.containsKey(upStreamVertexID)) {
   int virtualId = upStreamVertexID;
   upStreamVertexID = virtualPartitionNodes.get(virtualId).f0;
   if (partitioner == null) {
    partitioner = virtualPartitionNodes.get(virtualId).f1;
   }
   shuffleMode = virtualPartitionNodes.get(virtualId).f2;
   addEdgeInternal(upStreamVertexID, downStreamVertexID, typeNumber, partitioner, outputNames, outputTag, shuffleMode);
  }
  //不是以上逻辑转换的情况，真正构建StreamEdge
  else {
   StreamNode upstreamNode = getStreamNode(upStreamVertexID);
   StreamNode downstreamNode = getStreamNode(downStreamVertexID);
   // If no partitioner was specified and the parallelism of upstream and downstream
   // operator matches use forward partitioning, use rebalance otherwise.
   //没有指定partitioner时，会为其选择forward或者rebalance
   if (partitioner == null && upstreamNode.getParallelism() == downstreamNode.getParallelism()) {
    partitioner = new ForwardPartitioner

「万字长文」详解Flink作业提交流程（二)

2.1.3 虚拟 Transformation 的转换

2.2 作业图

2.2.1 JobGraph 核心对象

2.2.2 JobGraph 生成过程

2.2.3 算子融合

2.3 执行图

2.3.1 ExecutionGraph 核心对象

2.3.2 ExecutionGrap 生成过程

火山引擎张鑫：到2025年将有95%的应用负载会运行在云原生基础设施之上

用户信息被窃取，蔚来需要担责吗？

车企引以为傲的智能座舱是不是个伪命题

高通正式发布Snapdragon Satellite 可实现卫星双向通信

网络编程课程如何做设计报告

比特币黎明前的安静，多看少动

号称“智驾卷王”的飞凡R7，还是卷不过小鹏G9

Windows 11 22H2又出新bug 这次是资源管理器

一切互联网优势都是效率优势，所有竞争最终都是效率之争

索尼公布了适配PS5的无障碍手柄

中国品牌崛起，祥鑫科技：新能源领域加速导入，订单充足业绩可期

超前与未来，绮物！坚果TNT工作站显示器评测连载4

“0门槛、0干预、0盲区” 微博微眸为企业个人信息保护降本增效

手机行业失败芯片盘点 - 高通骁龙810高居榜首，A16处理器也在其中

策略-A股白酒、医药、新能源都涨了！下一个是半导体？

这一数据公布，美股三大股指全线下跌！什么情况？

三星S23或全系升级256GB起步内存，网友：苹果快来抄作业！

Windows服务器安装SQL Server数据库

鸿萌推荐-Recover My Files 数据恢复软件

6000家、150万！麒麟生态宣布重要数据，比尔盖茨说得没错！

做少有人涉足的向量数据库，是种什么体验？- 快公司

大数据的有效利用—电解质水

工业数据分析为什么要用FusionInsight MRS IoTDB？

大数据更懂你：APP年度报告如何刷屏你的社交圈？

护航数据安全，360亿方云入选“2022年数据安全优秀实践