加入收藏 | 设为首页 | 关于本站 | RSS订阅
站内搜
您当前的位置:首页 > IT资讯 > 互联网

Google 每天处理约 20000TB 的数据

时间:2008-11-29 12:36:40  来源:google blog  作者:
  Google 热衷于处理全球的信息,每天,他们花费大量时间探索更好的信息整理技术,他们目前使用的技术为 MapReduce,这是一种可以对数据进行并发处理的软件架构。鉴于其简单性与处理大规模数据的能力,MapReduce 是 Google 日常数据处理的完美技术方案。



  Google 的数据整理实验一直以每 TB 数据表现为基准。这些标准话实验帮助 Google 理解和对比不同技术的优秀劣,并获得经验和教训,以改进下一代数据处理技术。

  目前,Google 的每 TB 数据处理能力为,在1000台计算机中处理 1TB 数据的时间为68秒(使用 Google File System 将 1TB 数据保存在100亿个 100 字节的非压缩文本文件中),以前的表现为 910 台电脑 209秒。

  但 Google 要处理的数据远超过 TB 级,因此,Google 做了 PB 级数据处理实验。1PB 数据是 1TB 的1000倍,或者,形象一点说,1PB 数据相当于 2008 年5月,美国国会图书馆存档的 Web 数据的 12 倍。2008年1月的统计结果显示,Google 每天处理的数据为平均为 20PB,相当于 20000TB。在 4000 台计算机中处理 1PB 数据花费6小时领2分钟。

  有一个有趣的问题,就是,如何保存这么多数据。Google 将这些数据保存在 48000 个硬盘中(每个只利用了部分空间),每次进行数据整理,至少有一个硬盘坏掉(鉴于处理的时长,硬盘的数目和硬盘本身的寿命,这并不奇怪),因此,为了保证数据安全,Google 将每份数据都在不同的硬盘上写三份。

相关文章
·Google Chrome市场份额依然不足1% ·商业回报的刺激 Google封杀宝马的背后
·向Google学习开放、合作、创意、快乐 ·ZDNET:微软退出搜索市场能对Google造更大伤害
·Google SearchWiki上线 被指别有用心 ·Live Search将更名为Kumo挑战Google?
·Google首次允许用户修改搜索结果 不影响算法 ·Google Chrome明年1月结束测试 考虑OEM预装
·OpenOffice、Google Docs使用率合计仅6% ·Mozilla:感谢天感谢地感谢Google的支持
发表评论 共有 条评论
用户名: 验证码: 匿名发表
新闻排行
  1. 谷歌天气预报悄悄开始收费 官方回应是
  2. 囧!Google街景地图拍到有人在街头小
  3. 字体也环保 荷兰公司推省墨字体
  4. 微软大幅降价 用户仍不“买账”
  5. 9岁印度女孩成最年轻微软认证专家
  6. IE欧洲市场占有率跌破60%
热门软件
精品教程
图片新闻
谷歌天气预报悄悄开始收费 官方回应是故障
谷歌天气预报悄悄开
囧!Google街景地图拍到有人在街头小便
囧!Google街景地图
9岁印度女孩成最年轻微软认证专家
9岁印度女孩成最年轻
IE欧洲市场占有率跌破60%
IE欧洲市场占有率跌

 

关于本站 | 广告服务 | 版权声明 | 业务合作 | 联系我们 | 网站地图 
Copyright? 中国电脑急网_CNPC120.COM All Rights Reserved 沪ICP备05050967