mactql的小站

本笔记是对《贝叶斯网络结构学习算法研究》论文进行学习时所写首先通过摘要可以了解到该论文研究的方向，即在大数据情况下基于遗传算法的贝叶斯网络结构算法执行效率问题作者将混合方式的 BN 结构学习算法与 Spark 分布式计算平台结合在构建超结

3.1.1 重入锁ReentrantLock和synchronized的区别123456789101112public static ReentrantLock lock = new ReentrantLock();@Overridepub

第3章垃圾回收

怎么判断对象是否需要回收？引用计数法：给对象添加一个引用计数器，每有一个地方引用它就+1，引用失效就-1，如果是0则回收。优点：效率高；缺点：无法回收循环引用的对象可达性分析法：当一个对象到GC Roots对象没有任何引用链，则

第18章 java I/O

java的IO分为字符流和字节流：字节流一般处理图像数据或字节文件这类的二进制数据，其他数据一般是字符流字符流：（以输入流为例）字符流中最基本的CharArrayReader和StringReader，从字符数组或字符串的数据元

第6章 TCP与UDP

传输层有两个代表性的协议，TCP和UDP。TCP提供可靠的通信传输，而UDP用于让广播和细节控制交给应用的通信传输 6.1.1 传输层的定义IP首部有一个协议字段，用来标识网络层的上一层所采用的是哪一种的传输层协议，判断数据是TCP内容还是

浏览器是怎样通信的

第1步，从在浏览器中输入网址开始：首先网址就是URL，通常是访问web服务器，用”http:”，即HTTP协议 URL的格式会随着协议的不同而不同 URL的各种格式如下：访问Web服务器或FTP服务器时，URL包括域名和文件路径名，有时

第17章集合深入研究

17.1 完整的集合分类 ArrayList源码分析 ArrayList是一种集合类，其底层基于数组实现，所以查找操作可在O(1)的时间范围内实现 ArrayList允许空值和重复元素当向ArrayList中添加的元素数量大于其底层数组

第11章集合

11.2 基本概念 Collection接口： List接口： LinkedList：链表，没有同步，线程不安全 ArrayList：数组，没有同步，线程不安全 Vector：数组，同步，线程安全 Stack：继承Vector，线程安全

2022-02-16

Spark常用的数据操作算子

《Apache Spark设计与实现》读书笔记

常用Transformations()操作 rdd2 = rdd1.map(func) 对rdd1中的每个元素进行处理和输出 P51 rdd2 = rdd1.mapValues(func) 对rdd1中的每个<K,V&g

2022-02-13

Spark逻辑处理流程

《Apache Spark设计与实现》读书笔记

逻辑处理流程四部分：数据源：从hdfs，hbase甚至内存里的数据结构，流式处理还可以是网络流数据模型： MR里面是<K,V>形式的，只能map(K,V)或者reduce(K,list(V))，不灵活。而spark用的是R

2022-02-08

jk式万能回溯法

Leetcode刷题笔记

步骤：画出解空间树型图根据经验写出dfs需要的参数写上结束条件根据树型图写出for循环，并与图中每一层比较是否对应接下来套回溯模版即可若返回值需要存入数据结构且会被回溯清空，需要另外备份一份才能存入使用案例1：leetc

2021-10-16

概率论基本知识

硕士课题学习笔记

什么叫联合概率？联合概率：P(AB)代表了A、B两个事件同时发生的概率大小什么叫条件概率？条件概率：P(A|B)表示A在B发生的条件下的发生的概率，当P(B)>0时，条件概率如下

2021-10-15

《NAS-BERT：神经架构搜索与自适应BERT压缩》论文笔记

硕士每周论文笔记

基本信息题目：《NAS-BERT: Task-agnostic and Adaptive-size BERT Compression with Neural Architecture Search》理论方法阐释首先给定一个Teache

2021-09-30

Spark job中的stage划分与三种提交模式

《Spark性能优化的道与术》课程笔记

首先要了解宽依赖和窄依赖是什么？窄依赖：每个RDD对应一个父RDD，每个父子RDD是一对一的关系宽依赖：父RDD的partition被多个子RDD使用，父子RDD是错综复杂的关系产生了shuffle操作就是宽依赖什么是sta

2021-09-30

《分布式进化算法及其模型：最新进展综述》论文笔记

硕士每周论文笔记

基本信息题目：Distributed evolutionary algorithms and their models: A survey of the state-of-the-art 作者：Gong Y-J, Chen W-N, Zh

2021-09-24

剖析HDFS/MR小文件与数据倾斜问题

《拿来就用的企业级解决方案》课程笔记

什么是小文件问题？ HDFS上如果小文件很多，每个小文件都会在NameNode中占用150字节的内存空间而在MR中每个小文件都会占一个block，每个block都会产生数据分片对应一个Map任务，导致Map任务特别多，消耗了很多启动Map

2021-09-21

《Hadoop和Spark上遗传算法分布式架构》论文笔记

硕士每周论文笔记

基本信息题目：Parallel and distributed architecture of genetic algorithm on Apache Hadoop and Spark 作者：Hao-chun Lu，F.J.Hwang，Y

2021-09-17

Redis数据类型

《快速上手内存数据库Redis》课程笔记

Redis常见数据类型上一章我们了解了Redis常见的五种数据类型，string、set、hash、sortedset、list，这里我们详细介绍一下首先是stringstring可以存任何形式的内容，甚至是二进制数据或图片在这些操作的

2 / 8