2022-06-11 牛客SQL1-20题 MySQL 牛客网SQL题库 牛客SQL1-20题SQL1查找最晚入职员工的所有信息,现在给一张员工表 注意:这个业务有可能存在最晚入职员工有多个的情况,OLAP场景 123456789101112//考虑最晚的员工如果不止一个的情况//先找到最晚的hire_data
2022-04-15 Redis字典 Redis 《Redis设计与实现》读书笔记 Redis字典字典是用于保存键值对的抽象数据结构。当一个哈希键包含的键值对比较多时,或者键值对中的元素都是比较长的字符串时,Redis就会使用字典作为哈希键的底层实现 字典的定义Redis的字典使用哈希表作为底层实现,一个哈希表里面可以有多
2022-04-14 Redis链表 Redis 《Redis设计与实现》读书笔记 Redis链表链表的定义123456789//链表节点typedef struct listNode{ //前置节点 struct listNode *prev; //后置节点 struct listNod
2022-04-14 简单动态字符串SDS Redis 《Redis设计与实现》读书笔记 简单动态字符串SDS Redis中,涉及可以被修改的字符串值时,都用简单动态字符串(simple dynamic string,SDS)来实现 SDS还被用作缓冲区,比如AOF模块中的AOF缓冲区,客户端状态中的输入缓冲区 S
2022-04-09 Spark资源参数调优 Spark Spark性能优化 Spark资源参数调优Spark资源参数讨论 美团性能优化指南 配置资源前牢记的一些理论 Hadoop/Yarn/OS的守护进程,例如 NameNode、Secondary NameNode、DataNode、JobTracker 和
2022-02-26 内存管理机制 Spark 《Apache Spark设计与实现》读书笔记 内存管理机制一方面,在Spark执行过程中,需要在内存中处理大量数据。另一方面,数据缓存机制也会在内存中缓存大量数据避免重复计算。所以,需要设计一个内存管理机制 内存消耗的来源首先我们要梳理一下spark中内存消耗的来源: 第一个就是用户
2022-02-24 错误容忍机制 Spark 《Apache Spark设计与实现》读书笔记 错误容忍机制在使用Spark大数据处理的过程中,有时候会出现一些软硬件故障导致任务执行失败和数据丢失,这时候就需要设计一个容错机制来解决以下问题: 硬盘网络问题、节点挂了、内容不够等问题从而IO异常、响应超时等导致任务执行失败 节点挂了导
2022-02-23 数据缓存机制 Spark 《Apache Spark设计与实现》读书笔记 数据缓存机制数据缓存机制是什么?在执行数据操作算子的过程中,可能会对一些数据多次访问,需要花费大量时间。Spark提供了数据缓存机制,可以把这些数据缓存起来,加快处理速度。 我们来看一个具体的例子: 之前我们学过了job是根据action
2022-02-18 Spark中的Shuffle机制 Spark 《Apache Spark设计与实现》读书笔记 在之前章节,我们了解了Spark如何将逻辑处理流程转化为物理执行计划,也学习了如何执行计算任务(task),但是没有详细讨论上下游stage之间和不同节点上的task之间是如何传递数据的,这个数据传递过程实际就是Shuffle机制。 什么是
2022-02-17 Spark物理执行计划 Spark 《Apache Spark设计与实现》读书笔记 本章的核心问题是如何将逻辑处理流程转化为物理执行计划,下面将详细讲解,请读者结合大数据处理框架图进行学习 物理执行计划生成方法: Spark采用3个步骤来生成物理执行计划,下面将详细介绍这三个步骤 根据action()操作顺序将应用划分为作