注册登录

专栏名称: 硅谷io

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

目录

相关文章推荐

今天看啥 › 专栏 › 硅谷io

设计Facebook图片存储系统

硅谷io · 掘金 · · 2019-11-05 15:49

文章预览

2019年11月05日阅读 1

设计Facebook图片存储系统

为什么 Facebook 要自己做图片存储？

PB级别的Blob数据量
传统的基于NFS的设计（每个图像存储为文件）都存在元数据瓶颈：庞大的元数据严重限制了元数据命中率。
- 以下是细节解释：

对于图片应用程序，图片的权限等大多数元数据是无用的，从而浪费了存储空间。然而，更大的开销在于，必须将文件的元数据从磁盘读入内存中才能找到文件本身。虽然对于小规模存储来说这微不足道，但当乘以数十亿的照片和数PB的数据时，那么访问元数据将是吞吐量的瓶颈。

解决方案

通过把数以十万计的图像聚集到单个Haystack存储文件中，从而消除了元数据负荷。

结构

Facebook Photo Storage Architecture

数据布局

索引文件（用于快速加载内存）+ 包含很多图片的haystack存储文件。

索引文件布局

index file layout 1

index file layout 2

储存文件

haystack store file

CRUD操作

增: 写入存储文件，然后异步写入索引文件，因为建立索引并不是关键的步骤。
删: 通过在标志字段中标记已删除的位来进行软删除。通过紧凑操作执行硬删除。
改: 在更新时，只能追加 (append-only)，如果遇到了重复的键，应用程序可以选择具有最大偏移量的键去改和读。
查: 读取操作（偏移量，健，备用键，Cookie 以及数据大小）

用例

上传

Photo Storage Upload

下载

Photo Storage Download

本文首发于硅谷io

………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

财新 · 深耕阿克苏数年新疆“70后”政法厅官马国强被开除党籍

2 月前

第一新声 · 倒计时三年：国产数据库100%替代走到哪了？

1 月前

环化地生 · 262.Environ. Sci. Technol.微生物代理：管理方式变化下缺氧微位点的变化及其对土壤碳浓度的部分解释

1 月前

关于移动版 · Py中国 · RSS之家 · CodingPro · Code · Link之家 · 卧龙AI搜索 · 小百科

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号