美国华人网FuninUSA_唐人社区_北美华人论坛:找礼品卡,找折扣,找报价,找工作,找内推,找项目,找股票

 找回密码
 立即注册
  • 否认完南京大屠杀又抨击犹太人 APA这是要撕全世界?
  • 中国发起“厕所革命”:各国管理洗手间方式大不同
  • 宋小宝龙凤胎曝光!颜值竟然这么高
  • 于正谈"袁姗姗滚出娱圈":自己经历过的一件大事
  • 上海戏剧学院艺考进入三试阶段 林妙可初试就落榜
  • 有点乱 张俪男友朱镇模自曝曾被章子怡暗恋
  • 美媒:美海关严查持F1签证者 多名中国留学生被遣返
  • 日媒:特朗普在贸易层面上点名批评中日 有何目的?
  • 美媒:特朗普欲将工厂搬回美 是否影响中方战略?
  • 揭秘中国生物安全实验室:研究世上最危险病原体
  • 道琼斯、标准普尔、Nasdaq和罗素创纪录新高,上涨超过10%
  • AMD股票预期将回升
  • 推动美国股市走高的动力与阻力
Logo1-800-PetMeds Free Shipping $49Take $10 Off Your First Order w/code: SAVE10 - 234 x 60
ASICS AmericaPagoda Piercing Banner 234x60Sierra Trading Post
搜索
查看: 3051|回复: 9

内推面经 -G家店面design题目- 唐人社区|北美华人论坛

[复制链接]

7

主题

228

帖子

236

积分

注册会员

Rank: 2

积分
236
QQ
发表于 2016-11-5 02:41:40 | 显示全部楼层 |阅读模式
分享到:
{$content}

唐人社区-北美华人论坛-内推面经版-G家店面design题目


  JobHunting
标 题: G家店面design题目


设计一个数据库。用户可以从数据库读取数据

要求:
1) very large dataset (tens of TB)
2) dataset is updated every few hours
3) dataset consists of key-value pairs. The size of the value for any given
key is bounded by 100KB
4) The only operation is get(key), which returns the associated value for
that key, or null if no value exists
5) The frequency of calling get() is >10,000/sec, and the latency required
is in order of ms
--

新浪微博官方号:美国华人网FunInUSA 新浪微博官方号:美国省钱快报FunInUSA 微信公众号:玩美生活FunInUSA
回复 百度谷歌雅虎搜狗搜搜有道360奇虎

举报

30

主题

115

帖子

175

积分

注册会员

Rank: 2

积分
175
QQ
发表于 2016-11-5 03:12:47 | 显示全部楼层
JobHunting
标  题: Re: G家店面design题目


由给定的数据,怎么估算server数量和latency?

【 在 sikuyu (supercalifragilisticexpialidocious) 的大作中提到: 】
: 设计一个数据库。用户可以从数据库读取数据
: 要求:
: 1) very large dataset (tens of TB)
: 2) dataset is updated every few hours
: 3) dataset consists of key-value pairs. The size of the value for any
given
: key is bounded by 100KB
: 4) The only operation is get(key), which returns the associated value for
: that key, or null if no value exists
: 5) The frequency of calling get() is >10,000/sec, and the latency required
: is in order of ms



--
Look. If you had one shot or one opportunity to seize everything you ever wanted in one moment.
Would you capture it or just let it slip?

6

主题

260

帖子

258

积分

中级会员

Rank: 3Rank: 3

积分
258
QQ
发表于 2016-11-5 03:19:02 | 显示全部楼层
JobHunting
标  题: Re: G家店面design题目


cluster memcache or redis. C* is not an optimal solution due to low update
frequency and low latency requirement. You may use it to backup data.

【 在 sikuyu (supercalifragilisticexpialidocious) 的大作中提到: 】
: 设计一个数据库。用户可以从数据库读取数据
: 要求:
: 1) very large dataset (tens of TB)
: 2) dataset is updated every few hours
: 3) dataset consists of key-value pairs. The size of the value for any
given
: key is bounded by 100KB
: 4) The only operation is get(key), which returns the associated value for
: that key, or null if no value exists
: 5) The frequency of calling get() is >10,000/sec, and the latency required
: is in order of ms





--

26

主题

93

帖子

145

积分

注册会员

Rank: 2

积分
145
QQ
发表于 2016-11-5 03:25:43 | 显示全部楼层
JobHunting
标  题: G家店面design题目


设计一个数据库。用户可以从数据库读取数据

要求:
1) very large dataset (tens of TB)
2) dataset is updated every few hours
3) dataset consists of key-value pairs. The size of the value for any given
key is bounded by 100KB
4) The only operation is get(key), which returns the associated value for
that key, or null if no value exists
5) The frequency of calling get() is >10,000/sec, and the latency required
is in order of ms
--

18

主题

83

帖子

124

积分

注册会员

Rank: 2

积分
124
QQ
发表于 2016-11-5 03:46:23 | 显示全部楼层
JobHunting
标  题: Re: G家店面design题目


C*的设计完全可以满足需求吧?
--

20

主题

88

帖子

131

积分

注册会员

Rank: 2

积分
131
QQ
发表于 2016-11-5 06:08:02 | 显示全部楼层
JobHunting
标  题: Re: G家店面design题目


单机即可10k qps
网卡买好一点

--
☆ 发自 iPhone 买买提 1.23
--

24

主题

85

帖子

141

积分

注册会员

Rank: 2

积分
141
QQ
发表于 2016-11-5 06:17:30 | 显示全部楼层
JobHunting
标  题: Re: G家店面design题目


do you have a link for "C*的设计"

职位和数据库完全不沾边,所以我感觉主要还是考察general design. 当然,要是连
cache都不知道那肯定过不了

【 在 peking2 (Lambda) 的大作中提到: 】
: C*的设计完全可以满足需求吧?



--

15

主题

74

帖子

111

积分

注册会员

Rank: 2

积分
111
QQ
发表于 2016-11-5 06:56:11 | 显示全部楼层
JobHunting
标  题: Re: G家店面design题目



c* 可以support 10k 需求 也能用timestamp index
一个key 100KB 一秒 10^4 request 因为要minisec 假设100 minisec

100 KB * 10^4 * 10 = 10^7 KB = 10000MB

一台machine 有5 ssd each ssd 200MB 这样需要有50台server ? 大牛们看看这样行不
行?

--

23

主题

100

帖子

138

积分

注册会员

Rank: 2

积分
138
QQ
发表于 2016-11-5 07:29:20 | 显示全部楼层
JobHunting
标  题: Re: G家店面design题目


这个要求是一个大量读,很少写的案例。

对于并发这么高的要求,10000 qps + 10ms latency, 那么一定得上partition/shard。

我觉得按照dynamo的思路,用consistent hashing做key的partition, 每个node用
Redis + Mysql Engine.

然后可以开始扯consistent hashing, gossip, redis, innodb.

对于key, 根据consistent hashing选择对应node, 再node内,查redis或mysql engine
。redis本身很快,10K qps也可以,但是如果不在redis,mysql engine不会很快。假
定每个shard支持1K qps, 那么需要10个shard. 每个shard有3个node, 每个node支持
333 qps。利用virtual node, 分布30个node到10台服务器。

利用gossip广播membership状态和key space分布。
--

18

主题

1105

帖子

2198

积分

金牌会员

Rank: 6Rank: 6

积分
2198
QQ
发表于 2016-11-28 21:19:44 | 显示全部楼层
发发呆,回回帖,工作结束~
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

美国华人网|唐人社区|什么值得买FunInUSA.net发布的内推面经 -G家店面design题目- 唐人社区|北美华人论坛帖子由网友提供或转载于网络,若发布的内推面经 -G家店面design题目- 唐人社区|北美华人论坛侵犯了您的权益,请联系我们.
Sasa.com

Copyright ©2011 FunInUSA.NET All Right Reserved.  Powered by Discuz! X3.0 小黑屋

本站信息均由会员发表,不代表美国华人网FunInUSA|唐人社区的立场,如侵犯了您的权利请发帖投诉  技术支持: 美国华人网FunInUSA|唐人社区

安全联盟认证 安全联盟认证

快速回复 返回顶部 返回列表