0%

HBase – Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用 HBase 技术可在廉价 PC Server 上搭建起大规模结构化存储集群。HBase可以依靠横向扩展,通过不断增加廉价的商用服务器,来增加计算和存储能力。

阅读全文 »

实习开始,头儿让我一起参与数据库服务器迁移的项目,是 Flume+Kafka+HBase(Storm)+Hadoop 的解决方案。

阅读全文 »

在 GFW 越来越厉害的时代,在 Digital Ocean 上申请最廉价的 5 刀/月的 VPS 服务器,对于个人用户来说是足够了,就可以科学上网!安心学术上不了谷歌,真是辛酸。

阅读全文 »

对手论证,一般用于给出问题的下界。若用 $P$ 表示所讨论的问题,$I$ 表示问题的输入,$A$ 表示解决问题的基于比较运算的算法,$T(,A,,I)$ 表示对于输入 $I$,算法 $A$ 的计算时间复杂性,那么函数 $U(n)=min\{ max \{ T(A,,I) \},\text{ for each } I \},\text{for each } A$ 表示问题 $P$ 在输入大小为 $n$ 时在最坏情况下的最好时间下界,它是问题所固有的。

阅读全文 »

一个操作序列中,可能存在一、两个开销比较大的操作,在一般地分析下,如果割裂了各个操作的相关性或忽视问题的具体条件,那么操作序列的开销分析结果就可能会不够紧确,导致对于操作序列的性能做出不准确的判断。用平摊分析就可以得出更好的、更有实践指导意义的结果。因为这个操作序列中各个操作可能会是相互制约的,所以开销很大的那一两个操作,在操作序列总开销中的贡献也会被削弱和限制。所以最终会发现,对于序列来讲,每个操作平摊的开销是比较小的。

阅读全文 »

图的经典算法,除了 DFS 和 BFS 之外,最短路径(Shortest Path)也是很重要的类别,并且与最小生成树(MST)中的 Prim 算法、Kruskal 算法也有千丝万缕的联系,可以用贪心策略解决...

阅读全文 »