ScalaPie's Blog

以梦为马 诗酒趁年华

第1章 初识ClickHouse(下)

————clickhouse适用场景

接续前文 1.2.3 【数据小知识3】单指令多数据 单指令多数据(single instruction multiple data),顾名思义就是一条指令计算多份数据,与其对应的是单指令单数据(SISD)。 相比SISD,SIMD在一个指令周期内能够处理更多数据。对于数据密集型应用而言,使用支持SIMD的CPU能够提升吞吐量和计算效率。 SIMD使用的是一种空间换时间的优化思路,通过使用更宽的寄存

第1章 初识ClickHouse(上)

————clickhouse特性与优点

作者于2020年写了一本关于列式数据库clickhouse的书籍,书名都想好了叫《Clickhouse in Action》。后因各种原因中途放弃,导致该书未能刊印发版,现将整书内容补全并在线发表于本网站。回想2020年当时市面上只有一本关于clickhouse的中文书籍,而且内容简略缺乏实际生产环境数据应用实战指引。但站在2024年的今天,clickhouse的整个生态早已是沧海桑田了。我在20

尽量选择一个人能干的互联网小生意

作为技术人,偶然在微信上看到了这篇文章,觉得可以探讨下,所以转发过来。 1 说说裁员这件事 在职业生涯这几年,我经历4次裁员。当被裁的那一刻,情绪是很复杂的, 有自我怀疑,委屈,愤怒。像极了一个被女神拒绝的小伙子。 同时,我也意识到在职场这个劣币驱逐良币,分工合作瓦解个人能力的环境当中, 你是没有说不的权利。可以说职场中的我们,都像感恩节前那只要被宰杀的火鸡。你唯一能做的就是早日觉醒,提前规划。知

使用solr给网站增加博文搜索功能

————依赖ik-analyzer实现中文分词和索引

上一篇文章中介绍的 lunr.js 实现的浏览器客户端搜索功能虽然部署简单,但是其将所有博文索引信息直接暴露在浏览器中,一旦博文数量庞大,页面加载和内容搜索必然都会变得缓慢。另外,通过上一篇文章中的探索可以发现,lunr.js对于纯浏览器客户端实现的中文搜索支持还是蛮曲折的,且lunr.js和lunr-languages两个git项目长期活跃度较低,遇到问题可能会得不到必要的支持。 为了解决搜索功

使用lnur.js给网站增加博文搜索功能

————简易便捷的浏览器客户端实现方式

日积月累时光流逝,随着网站博文越来越多,变成几百篇、上千篇后,给每篇博文打上tag关键字并让用户点击对应的关键字来获取相关联的博文内容已经不可持续了,需要寻找新的方法来提高博文信息的检索效率。 我首先想到的便是给用户提供搜索界面,让用户可以根据自己的需要获取对应的信息。而提起搜索功能,大家首先想到的是ElasticSearch,因为其背后的lucene项目提供了一种全新的数据结构————索引。索引

给个人博客网站增加浏览记录统计功能

上几篇文章中,我们讲了使用社会化评论系统waline来给网站加上评论的功能。本篇将继续讲解如何给网站加上页面浏览记录统计的功能。 网站浏览记录统计,是非常重要且基础的一项功能。详细的数据统计能够帮助网站所有者分析网站流量的大小及构成,从而洞察用户喜好,让网站内容更贴近用户需求。 下面介绍3种可以用户进行网站流量统计的工具。 1. 使用Waline自带的浏览统计功能 社会化评论系统waline是自带

个人网站评论功能加强与优化

在上篇文章中,我们讲解了如何部署waline社会化评论系统给网站增加用户评论功能,本文将在基础功能之上继续加入更多的功能。 本文将介绍给网站加入以下一些非常重要的功能: 样式美化 字数统计及阅读时长预估 文章reaction,如点赞、点踩等表情 评论通知 1. 样式美化 在部署完waline评论系统后,可以使用waline提供的一些css变量,来根据自己的网站布局,调整评论框的显示效果。 完整的变

将博文评论系统从Disqus切换至Waline

————不是Disqus不好用,而是Waline在墙内性价比更高

在此之前,这个网站的博文评论系统是使用的Disqus系统,但是呢Disqus在国内被wall了,这导致很多用户以为此网站博文压根就无法评论。哎,无奈! 这段时间一直在寻找一个disqus的替代品,其中最大的诉求就是必须要在国内的网络环境能够无障碍使用。除此之外,还有一些其它的诉求: 能够对于服务部署、评论数据存储等有较强的控制权,这样能够保持自主性和灵活性 评论样式可调整,支持表情、reactio

全自助签发SSL证书为网站安全护航

————将HTTP升级为HTTPS

HTTPS相较于HTTP有非常大的提升,建议所有人、所有老的服务都进行一下升级。 HTTP不仅会导致安全漏洞和数据泄露,而且会对网站的用户造成极强的 的心理暗示造成用户可能流失,因为浏览器对于输入的http协议的网址会进行安全提示。而从HTTP升级至HTTPS又不是看起来那么简单的一件事情,有的SSL证书没法自动更新需要自己时不时地进行手动更新;有的服务商如阿里云、腾讯云,对于网站的SSL证书是进

Hadoop之5-HDFS HA配置

———基于zookeeper的自动故障转移

上文讲述了HDFS的手动故障转移,本文将在其基础上论述自动故障转移。 前面在讲clickhouse的时候已经讲过zookeeper的部署了,zookeeper是集群状态的守护者。 前文也已经讲过,高可用其实就是做了冗余设计,比如一个hadoop中3个DataNode,如果设置数据备份数为2,那么每个数据块都会写2份(写在3个数据节点中的哪2个节点上系统会自行决定),这算是一层冗余设计。另外,Nam