美国华人网FuninUSA_唐人社区_北美华人论坛:找礼品卡,找折扣,找报价,找工作,找内推,找项目,找股票

 找回密码
 立即注册
  • Rain金泰希五年恋爱长跑修正果 鸟叔唱婚礼祝歌
  • 少时徐贤发个人专辑 望展现专属的音乐风韵和品味
  • baby香港顺利生子
  • 为了挽回佟丽娅 陈思诚把头像换成了这张照片
  • 赵薇刘烨素颜合影 两人似乎都喝醉了
  • Angelababy香港顺产生子 黄晓明全程陪护
  • 真敬业!孙俪晒海量剧本 台词标记密密麻麻
  • Baby顺利产子 老公黄晓明曾贴心探班当大厨
  • 欧阳娜娜母亲回应女儿恋上房祖名:大家都疯了
  • 杨紫被偶像赵薇"翻牌" 激动感慨:让我哭会儿先
  • 特朗普的不确定性带来银行股票最糟糕的一天
  • 2008年以来英镑对美元的最佳战绩
  • 谷歌曾反对特朗普,现在想找到共处的方法
Logo1-800-PetMeds Free Shipping $49Take $10 Off Your First Order w/code: SAVE10 - 234 x 60
ASICS AmericaPagoda Piercing Banner 234x60Sierra Trading Post
搜索
查看: 3047|回复: 9

内推面经 -G家店面design题目- 唐人社区|北美华人论坛

[复制链接]

7

主题

223

帖子

236

积分

注册会员

Rank: 2

积分
236
QQ
发表于 2016-11-5 02:41:40 | 显示全部楼层 |阅读模式
分享到:
{$content}

唐人社区-北美华人论坛-内推面经版-G家店面design题目


  JobHunting
标 题: G家店面design题目


设计一个数据库。用户可以从数据库读取数据

要求:
1) very large dataset (tens of TB)
2) dataset is updated every few hours
3) dataset consists of key-value pairs. The size of the value for any given
key is bounded by 100KB
4) The only operation is get(key), which returns the associated value for
that key, or null if no value exists
5) The frequency of calling get() is >10,000/sec, and the latency required
is in order of ms
--

新浪微博官方账号】美国华人网FunInUSA : 每日滚动更新美国商业投资就业招聘留学移民资讯。
回复 百度谷歌雅虎搜狗搜搜有道360奇虎

举报

30

主题

113

帖子

175

积分

注册会员

Rank: 2

积分
175
QQ
发表于 2016-11-5 03:12:47 | 显示全部楼层
JobHunting
标  题: Re: G家店面design题目


由给定的数据,怎么估算server数量和latency?

【 在 sikuyu (supercalifragilisticexpialidocious) 的大作中提到: 】
: 设计一个数据库。用户可以从数据库读取数据
: 要求:
: 1) very large dataset (tens of TB)
: 2) dataset is updated every few hours
: 3) dataset consists of key-value pairs. The size of the value for any
given
: key is bounded by 100KB
: 4) The only operation is get(key), which returns the associated value for
: that key, or null if no value exists
: 5) The frequency of calling get() is >10,000/sec, and the latency required
: is in order of ms



--
Look. If you had one shot or one opportunity to seize everything you ever wanted in one moment.
Would you capture it or just let it slip?

6

主题

252

帖子

258

积分

中级会员

Rank: 3Rank: 3

积分
258
QQ
发表于 2016-11-5 03:19:02 | 显示全部楼层
JobHunting
标  题: Re: G家店面design题目


cluster memcache or redis. C* is not an optimal solution due to low update
frequency and low latency requirement. You may use it to backup data.

【 在 sikuyu (supercalifragilisticexpialidocious) 的大作中提到: 】
: 设计一个数据库。用户可以从数据库读取数据
: 要求:
: 1) very large dataset (tens of TB)
: 2) dataset is updated every few hours
: 3) dataset consists of key-value pairs. The size of the value for any
given
: key is bounded by 100KB
: 4) The only operation is get(key), which returns the associated value for
: that key, or null if no value exists
: 5) The frequency of calling get() is >10,000/sec, and the latency required
: is in order of ms





--

26

主题

93

帖子

145

积分

注册会员

Rank: 2

积分
145
QQ
发表于 2016-11-5 03:25:43 | 显示全部楼层
JobHunting
标  题: G家店面design题目


设计一个数据库。用户可以从数据库读取数据

要求:
1) very large dataset (tens of TB)
2) dataset is updated every few hours
3) dataset consists of key-value pairs. The size of the value for any given
key is bounded by 100KB
4) The only operation is get(key), which returns the associated value for
that key, or null if no value exists
5) The frequency of calling get() is >10,000/sec, and the latency required
is in order of ms
--

18

主题

82

帖子

124

积分

注册会员

Rank: 2

积分
124
QQ
发表于 2016-11-5 03:46:23 | 显示全部楼层
JobHunting
标  题: Re: G家店面design题目


C*的设计完全可以满足需求吧?
--

18

主题

83

帖子

115

积分

注册会员

Rank: 2

积分
115
QQ
发表于 2016-11-5 06:08:02 | 显示全部楼层
JobHunting
标  题: Re: G家店面design题目


单机即可10k qps
网卡买好一点

--
☆ 发自 iPhone 买买提 1.23
--

23

主题

82

帖子

134

积分

注册会员

Rank: 2

积分
134
QQ
发表于 2016-11-5 06:17:30 | 显示全部楼层
JobHunting
标  题: Re: G家店面design题目


do you have a link for "C*的设计"

职位和数据库完全不沾边,所以我感觉主要还是考察general design. 当然,要是连
cache都不知道那肯定过不了

【 在 peking2 (Lambda) 的大作中提到: 】
: C*的设计完全可以满足需求吧?



--

14

主题

73

帖子

101

积分

注册会员

Rank: 2

积分
101
QQ
发表于 2016-11-5 06:56:11 | 显示全部楼层
JobHunting
标  题: Re: G家店面design题目



c* 可以support 10k 需求 也能用timestamp index
一个key 100KB 一秒 10^4 request 因为要minisec 假设100 minisec

100 KB * 10^4 * 10 = 10^7 KB = 10000MB

一台machine 有5 ssd each ssd 200MB 这样需要有50台server ? 大牛们看看这样行不
行?

--

23

主题

99

帖子

138

积分

注册会员

Rank: 2

积分
138
QQ
发表于 2016-11-5 07:29:20 | 显示全部楼层
JobHunting
标  题: Re: G家店面design题目


这个要求是一个大量读,很少写的案例。

对于并发这么高的要求,10000 qps + 10ms latency, 那么一定得上partition/shard。

我觉得按照dynamo的思路,用consistent hashing做key的partition, 每个node用
Redis + Mysql Engine.

然后可以开始扯consistent hashing, gossip, redis, innodb.

对于key, 根据consistent hashing选择对应node, 再node内,查redis或mysql engine
。redis本身很快,10K qps也可以,但是如果不在redis,mysql engine不会很快。假
定每个shard支持1K qps, 那么需要10个shard. 每个shard有3个node, 每个node支持
333 qps。利用virtual node, 分布30个node到10台服务器。

利用gossip广播membership状态和key space分布。
--

18

主题

1076

帖子

2140

积分

金牌会员

Rank: 6Rank: 6

积分
2140
QQ
发表于 2016-11-28 21:19:44 | 显示全部楼层
发发呆,回回帖,工作结束~
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

美国华人网|唐人社区|什么值得买FunInUSA.net发布的内推面经 -G家店面design题目- 唐人社区|北美华人论坛帖子由网友提供或转载于网络,若发布的内推面经 -G家店面design题目- 唐人社区|北美华人论坛侵犯了您的权益,请联系我们.
Sasa.com

Copyright ©2011 FunInUSA.com All Right Reserved.  Powered by Discuz! X3.0 小黑屋

本站信息均由会员发表,不代表美国华人网FunInUSA立场,如侵犯了您的权利请发帖投诉  技术支持: 美国华人网FunInUSA

安全联盟认证 安全联盟认证

快速回复 返回顶部 返回列表