管理大数据存储的十大技巧
SAN的构建则是为了更大的规模和更高的效率提供共享的池存储。Hadoop已经逆转了这一趋势回归DAS。每一个Hadoop集群都拥有自身的——虽然是横向扩展型——直连式存储,这有助于Hadoop管理数据本地化,但也放弃了共享存储的规模和效率。
有关大数据的6大误区
你的组织是否在考虑分析数据的最佳方式?以下是在你采用大数据分析之前,需要注意的有关大数据的6个误区。
我与分布式机器学习的故事
从毕业加入Google 开始做分布式机器学习,到后来转战腾讯广告业务,至今已经七年了。我想说说我见到
大数据背后的神秘公式(下):“贝叶斯革命”
贝叶斯公式在联邦党人文集作者公案和天蝎号核潜艇搜救中大显身手后(详见大数据背后的神秘公式(上):贝叶斯公式),开始引起学术界的注意和重视,而其上世纪八十年代在自然语言处理领域的成功,向我们展示了一条全新的问题解决路径。计算能力的不断提高和大数据的出现使它的威力日益显现,一场轰轰烈烈的“贝叶斯革命”正在发生。