1
PHP操作Elasticsearch7.6

首先打开Elasticsearch官网了解对应编程语言的API https://www.elastic.co/guide/en/elasticsearch/client/index.html 点击 PHP API即可查看当前7.X版本的文档内容了 安装操作Elasticsearch的PHP库 我们使 ...

itbsl @ 2020/07/29

2
IK分词器的安装与使用

分词器 什么是IK分词器? 分词:即把一段中文或者别的划分成一个个的关键字,我们在搜索时会把自己的信息进行分词,会把数据库中或者索引库中的数据进行分词,然后进行一个匹配操作,Elasticsearch的标准分词器,会将中文分为一个一个的字,而不是词,比如:“石原美里”会被分为“石”、“原”、“美”、 ...

itbsl @ 2020/07/28

3
CentOS7安装Elasticsearch7.6.2

最近登录到Elasticsearch官网发现Elasticsearch已经更新到7.8的版本了,但是自己公司使用的还是6.4版本,查了下,发现7.X的版本与6.X的版本差别还挺大的,所以准备在自己的个人服务器上搭建一个7.6的版本,提前了解一下新特性,为以后公司迁移到ES7.X提前做好准备,这里把自 ...

itbsl @ 2020/07/27

4
CentOS7安装Kibana7.6.2

为了更方便的操作elasticsearch,我们需要安装kibana kibana提供了一个开发工具,可以很方便的操作elasticsearch 打开kibana官网下载页面 https://www.elastic.co/cn/downloads/kibana 安装kibana 修改kibana相关 ...

itbsl @ 2020/07/27

5
SQL 基础整理

SQL语句执行顺序 From 表连接 on连接条件,形成新的虚拟表 where 筛选条件 group by 生成新的结果集合 group by 分组列表 having 分组后筛选 select 选出显示的 order by 排序 limit 分页/个数限制 子查询顺序 除了exists,先执行子查询 ...

园狐 @ 2020/07/27

6
初识Elastic search—附《Elasticsearch权威指南—官方guide的译文》

Elastic search 趣简史 安装 基础知识 核心概念 ...

CoderBaby @ 2020/07/24

7
【赵强老师】Flink的Watermark机制(基于Flink 1.11.0实现)

在使用eventTime的时候如何处理乱序数据?我们知道,流处理从事件产生,到流经source,再到operator,中间是有一个过程和时间的。虽然大部分情况下,流到operator的数据都是按照事件产生的时间顺序来的,但是也不排除由于网络延迟等原因,导致乱序的产生,特别是使用kafka的话,多个分 ...

赵强老师 @ 2020/07/21

8
数据库周刊33丨腾讯Tbase新版本发布;“2020数据技术嘉年华”有奖话题遴选;阿里云技术面试题;APEX 实现数据库自动巡检;MYSQL OCP题库……

墨天轮数据库周刊第33期发布啦,每周1次推送本周数据库相关热门资讯、精选文章、干货文档。 ...

墨天轮 @ 2020/07/21

9
Kafka 配置文件详情

kafka的配置分为 broker、producter、consumer三个不同的配置 一 、BROKER 的全局配置 最为核心的三个配置 broker.id、log.dir、zookeeper.connect 。 系统 相关 ##每一个broker在集群中的唯一标示,要求是正数。在改变IP地址,不 ...

浅雨凉 @ 2020/07/21

10
zookeeper 配置文件详情

目录结构 目录名作用 bin 存放系统脚本 conf 存放配置文件 contrib zk附加功能支持 dist-maven maven仓库文件 docs zk文档 lib 依赖的第三方库 recipes 经典场景样例代码 src zk源码 conf 目录 conf 目录用来存档配置文件,zoo.cf ...

浅雨凉 @ 2020/07/21

11
java大数据最全课程学习笔记(5)--MapReduce精通(一)

目前CSDN,博客园,简书同步发表中,更多精彩欢迎访问我的gitee pages MapReduce精通(一) MapReduce入门 MapReduce定义 MapReduce优缺点 优点 缺点 MapReduce核心思想 总结:分析WordCount数据流走向深入理解MapReduce核心思想。 ...

假装文艺范儿 @ 2020/07/19

12
kafka之消息队列

大数据工具 kafka 学习 之前需要先了解队列的相关知识 了解万队列就知道kafka的用处 之后再详细了解kafka的具体知识和操作 ...

家明 @ 2020/07/17

13
java大数据最全课程学习笔记(4)--HDFS NN,2NN,DN及HDFS2.x新特性

目前CSDN,博客园,简书同步发表中,更多精彩欢迎访问我的gitee pages HDFS NN,2NN,DN及HDFS2.x新特性 NameNode和SecondaryNameNode(重点) NN和2NN工作机制 第一阶段:NameNode启动 第一次启动NameNode格式化后,创建fsima ...

假装文艺范儿 @ 2020/07/17

14
ClickHouse源码笔记2:聚合流程的实现

上篇笔记讲到了聚合函数的实现并且带大家看了聚合函数是如何注册到ClickHouse之中的并被调用使用的。这篇笔记,笔者会续上上篇的内容,将剖析一把ClickHouse聚合流程的整体实现。 第二篇文章,我们来一起看看聚合流程的实现~~ 上车! 1.基础知识的梳理 ClickHouse的实现接口 Blo ...

HappenLee @ 2020/07/17

15
java大数据最全课程学习笔记(3)--HDFS 简介及操作

目前CSDN,博客园,简书同步发表中,更多精彩欢迎访问我的gitee pages HDFS 简介及操作 HDFS概述 HDFS产出背景及定义 HDFS优缺点 HDFS组成架构 HDFS文件块大小(重点) 块在传输时,每64K还需要校验一次,因此块大小,必须为2的n次方,最接近100M的就是128M! ...

假装文艺范儿 @ 2020/07/16

17
比较全的大数据技术组件整理以及相关理论论文整理

框架 Apache Hadoop:分布式处理架构,结合了 MapReduce(并行处理)、YARN(作业调度)和HDFS(分布式文件系统); Tigon:高吞吐量实时流处理框架。 分布式编程 AddThis Hydra :最初在AddThis上开发的分布式数据处理和存储系统; AMPLab SIMR ...

张永清 @ 2020/07/16

18
java大数据最全课程学习笔记(2)--Hadoop完全分布式运行模式

目前CSDN,博客园,简书同步发表中,更多精彩欢迎访问我的gitee pages Hadoop完全分布式运行模式 步骤分析: 准备3台客户机(关闭防火墙、静态ip、主机名称) vim /etc/sysconfig/network 三台机器各自的配置分别为HOSTNAME=hadoop101;HOST ...

假装文艺范儿 @ 2020/07/16

19
实验1:基于Weka的典型数据挖掘应用

#一、实验目标 理解数据挖掘的基本概念,掌握基于Weka工具的基本数据挖掘(分类、回归、聚类、关联规则分析)过程。 #二、实验内容 下载并安装Java环境(JDK 7.0 64位)。 下载并安装Weka 3.7版。 基于Weka的数据分类。 基于Weka的数据回归。 基于Weka的数据聚类。 基于W ...

_西瓜不甜 @ 2020/07/14