about云开发

 找回密码
 立即注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

about云开发 首页 大数据
订阅

大数据

零基础入门Flink CEP
问题导读 1.什么是CEP? 2.CEP解决什么问题? 3.CEP如何实现? Flink CEP是比较难以理解的,那么它是什么?它解决了什么问题?该如何使用? Flink CEP是其实一个Flink库,跟机器学习库是一样的。它是为 ...
分类:    2019-6-24 19:31
大数据工作流全面比较:Airflow、Azkaban、Conductor、Oozie
问题导读 1.本文列举了哪些工作流组件? 2.工作流组件有哪些优点和缺点? 3.这里最成熟的是哪个组件? AirflowAzkabanConductorOozieAWS Step函数所有者Apache (以前是Airbnb)LinkedInNetflix公司阿帕 ...
分类:    2019-6-20 20:26
Flink难点:彻底明白CEP3:独立模式算子Pattern Operation
问题导读 1.独立模式有哪些条件? 2.循环模式模式该如何停止? 3.subtype的作用是什么? 上一篇: Flink难点:彻底明白CEP2,条件分类 http://cqjsp.com/forum.php?mod=viewthreadtid=27295 ...
分类:    2019-6-11 10:32
Flink难点:彻底明白CEP2,条件分类
问题导读 1.对于接受事件该如何实现过滤? 2.CEP都有哪些条件? 3.迭代条件和简单条件有什么区别? 4.如何组合条件? 接上篇 Flink难点CEP1:什么是CEP以及量词的含义 http://cqjsp.com/forum.p ...
分类:    2019-6-11 10:32
Flink难点CEP1:什么是CEP以及量词的含义
问题导读 1.Flink CEP解决什么问题? 2.如何使用Flink CEP 3.CEP有哪些模式? 4.CEP量词的作用是什么? 5.本文讲了哪些量词? Flink CEP是Flink的一个难点,很多人都不明白CEP是干啥的,从英文的意思来 ...
分类:    2019-6-11 10:30
大数据开发架构
我们在学习大数据的时候,经常想全部了解大数据的内容,网上发现一个不错的架构,给大家分享下
分类:    2019-6-5 10:25
kafka分区的 原则是什么?
很多成员在设计kafka的时候,感觉该如何设计几个分区而发愁?其实我们要明白kafka分区的目的是为了让数据均衡分区,消费起来更加的均衡。因此我们设计可以根据机器的个人和数据分类来考虑设计分区。比如数据有几个类 ...
分类:    2019-5-23 12:44
producer如何发送数据集及副本间是如何复制数据的
Producer向kafka发送消息的步骤:1,一条record过来时,首先根据topic向kafka申请这个topic的元数据,包括topic每个partition存储在哪个broker上(Ip地址端口号)。2,拿到元数据后,根据producer的partioner进行数 ...
分类:    2019-4-29 18:44
Sqoop导出hive表数据测试
最近工作涉及了从hive表---》drds的数据迁移,近期做了一些简单的测试:建表语句如下:hive单表:CREATE TABLE item_zc_test1(num_id string,dp_id string,approve_status string,title string,price string,nick str ...
分类:    2019-4-3 19:10
大数据容器化案例:携程Redis容器化落地的一些实践经验
问题导读 1.Redis使用规模有多少? 2.携程为什么要容器化 3.携程Redis对于能否容器化做了哪些对比? 4.Redis容器化遇到了哪些问题?5.在容器化的时候,有哪些是携程自研的? 携程的Redis使用规模有200T+, ...
分类:    2019-2-25 12:16
彻底明白Hadoop map和reduce的个数决定因素【白话】
问题导读 1.Hadoop 设置map的个数后为什么不生效? 2.map的个数有什么来决定? 3.如何确定分片的大小? 4.reduce个数该如何设置? 5.reduce个数由什么来决定? Hadoop map和reduce的个数设置,困扰了很多 ...
分类:    2018-12-21 12:44
彻底明白Flink系统学习13:【Flink1.7】流连接器介绍及如何添加连接器
问题导读 1.Flink有哪些内置连接器? 2.Flink二进制发布包中是否直接可以使用连接器? 3.如何才能添加连接器? 4.连接器使用有那两种方式添加? 5.连接器添加jar包的方式,如何才能生效? 上一篇: 彻底 ...
分类:    2018-12-19 18:48
彻底明白Flink系统学习12:【Flink1.7】如何控制流物理分区
问题导读 1.如何实现Flink流分区? 2.对于数据倾斜,该使用什么函数实现数据均衡? 3.Rescaling与rebalance有什么区别? 上一篇: 彻底明白Flink系统学习11:【Flink1.7】事件时间、处理时间、提取时间有什 ...
分类:    2018-12-17 12:17
彻底明白Flink系统学习11:【Flink1.7】事件时间、处理时间、提取时间有什么区别
问题导读 1.事件时间、处理时间、提取时间的顺序是什么? 2.事件时间为何需要水印? 3.处理时间是否提取的当前系统的时间? 4.数据到达Flink的时间是什么时间? 上一篇: 彻底明白Flink系统学习10: ...
分类:    2018-12-13 20:25
彻底明白Flink系统学习2:Flink分布式执行包括调度、通信机制、检查点等
问题导读 1.Flink提交到运行程序涉及哪些进程? 2.Flink slot是什么? 3.Job客户端是不是Flink内部部分,它的作用是什么? 4.Flink通信机制是什么? 5.Actor系统包含哪些内容? 关注最新经典文章,欢迎关注 ...
分类:    2018-12-12 20:13
1234下一页

相关分类

关闭

推荐上一条 /3 下一条

QQ|小黑屋|大发快3-首页 ( 京ICP备12023829号

GMT+8, 2019-6-27 06:22 , Processed in 0.163859 second(s), 13 queries , Gzip On.

Powered by Discuz! X3.2 Licensed

返回顶部