ScalaPie's Blog

以梦为马 诗酒趁年华

深入理解ClickHouse之4-部署ClickHouse集群

————配置hostname、zookeeper和集群文件

部署集群,过程其实大同小异,不管是hadoop集群还是clickhouse集群,道理是相通的。要做的其实就是让各个机器能相互沟通,然后连城一体,发挥威力。本文将手把手教你部署一个2分片2备份的4节点clickhouse集群,更多节点的集群,均可在此基础进行扩展。不建议采用3分片3备份3节点的方式来部署集群,因为扩展性太差,而且clickhouse官方也不建议这么做。 在开始部署之前,肯定是需要有4

「转」史上最简单的 IntelliJ IDEA 教程

————好学若饥,谦卑若愚

前言   IntelliJ IDEA(简称 IDEA),是 Java 语言开发的集成环境,IDEA 在业界被公认为最好的 Java 开发工具之一,尤其在智能代码助手、代码自动提示、重构、J2EE 支持、各类版本工具(Git、SVN、GitHub 等)、JUnit、CVS 整合、代码分析和创新的 GUI 设计等方面的功能都值得称道。至于 Eclipse 本人接触的不多,因此也无法比较,但殊途同归,无

利用Nginx部署个人网站

————丝般顺滑的Nginx反向代理

之前的文章中已将讲到过用Tomcat作为app代理来部署静态个人网站了,本文尝试用nginx方案再部署一次。 虽然Tomcat和Nginx是不同的东西(前者是APP层面的服务器代理,后者是http-server协议层面的代理),但是二者均可以用来代理静态网页,而且均比较简单。由于nginx比较流行,本文尝试用nginx实现。 1. 安装nginx ubuntu下安装命令如下: 根据上面的命令安装后

深入理解ClickHouse之3-理解集群的概念

————集群、分布式、并行计算

从本章开始,我的黑手就慢慢的伸向了大数据所涉及的两个最核心的问题——分布式和并行计算了。 大数据计算涉及两个最核心的命题——分布式和并行计算。分布式是为了解决要计算的数据过大算不了的问题,并行计算是要解决计算太慢突破单机性能的问题(当然了这里面也涉及算法问题,后面再表)。当然,即便你再怎么突破,也是无法突破硬件的瓶颈的,所以归根揭底,大数据的核心命题应该是CPU和内存等硬件? 1. 理解几个核心概

深入理解ClickHouse之2-部署单机版ClickHouse

————Linux用户和Mac OSX用户看过来

由于ClickHouse是不支持Windows系统的,所以只能安装在Linux或者Mac OSX系统上。如果Windows用户需要尝试的话,需要通过虚拟机或者其它方式安装。本文将一步步带领Linux用户和Mac OSX用户从零开始安装部署单机版ClickHouse。 根据官网的描述,ClickHouse可以运行在任何Linux系统上,前提是支持SSE 4.2;ClickHouse可以运行在64位M

月薪3千招聘数据分析/挖掘工程师的公司究竟有多恶心人

————不要让别人毁了你的职业自豪感

我觉得数据分析/数据挖掘工作是这个世界上难度最大的工作之一。但是它的价值和作用都远远被低估了。虽然我已经不做分析师很多年了,但仍然想聊几句公道话。 一直有个习惯,不管离职在职都会时不时上招聘网站看看。一来了解市场上需要怎么样的人才,自己的能力距离自己想要的职位/薪水还有多远的距离,明确努力的方向;二来了解下市场行情,更精准的定位自己。 今天写这个文章,纯粹是一个偶然。顺手搜了下,竟然真的有3000

深入理解ClickHouse之1 - 初识ClickHouse

————高性能的列式数据库

谈起ClickHouse,应该很多人都会很陌生。一来它是一个新生事物,听过的使用过的人非常少;二来可能没有hadoop生态那么完善和健壮,所以稳定性和功能还有所欠缺。但这些都不影响其迅速获得的良好的口碑和开挂的性能,作为特定领域的数据库,极其看好ClickHouse。 1. 什么是ClickHouse? 这里引用官网的一段话: ClickHouse is a column-oriented dat

利用Github Pages部署个人博客网站

————jekyll + Hux Blog Theme + Github Pages

前面已经讲过了利用Tomcat和阿里云ESC服务器来搭建个人博客网站,这个技术方案的主要优点是访问速度快,而且不用托管代码(私密性)。现在介绍另外一种部署方案——利用Github Pages。 利用Github Pages来部署个人网站的优点是代码在线上,随时可以操作,而且不用申请国内的服务器和域名,所以流程就相对简单一些,今天部署今天就能看见自己的网站并访问。 缺点嘛,一来访问速度可能会很慢特别

从零开始部署个人网站上线之4

————jekyll + Hux Blog Theme + Tomcat

9. 配置Tomcat Apache Tomcat是一个轻量级的web应用服务器代理, 在中小型系统和并发访问用户不是很多的场合下被普遍使用。一般来说Apache家族的开源软件都是又笨重又复杂的,但是稳定性和功能都比较健壮。关于Tomcat的详细特点和应用细节,可以去官网了解。这里我们只需要用到它很小的一部分功能,所以即使不了解也不必胆怯。 在服务器端配置Tomcat有如下几个步骤: 1) 下载T

从零开始部署个人网站上线之3

————jekyll + Hux Blog Theme + Tomcat

6. 配置jdk 首先需要安装的是oracle版本的jdk( ),不是jre(jre是java程序的运行环境,不是编译和开发环境),也不是open jdk。 配置jdk需执行如下几步操作: 1)从 oracle官网下载jdk8 ,注意下载对应的版本(操作系统、32位/64位);以ubuntu64位为例,下载linux x64以 为结尾的文件即可 2)将文件上传至远程服务器预先建立好的文件夹并解压