美国华人网FuninUSA|唐人社区|北美华人论坛:找好货,找礼品卡,找折扣,找工作,找内推,找项目,找股票

 找回密码
 立即注册
  • 《汉尼拔》第四季有回归的可能性了!
  • 略惊悚:Wi-Fi变狗仔 还能全息成像
  • 厉害了!中国动车组获欧盟铁路最高认证
  • 黄种人首进9.9秒!苏炳添百米创个人最好成绩
  • 北斗/GPS导航定位基准服务启用!精度/信号大提升
  • 神秘外星人在哪?科学家发现了这个地方...
  • 黄金竟有这神用途:成抗击癌症的“子弹”
  • 海盗传说:真的有海怪、美人鱼吗?
  • 夏天穿浅色衣服更凉快?被骗好多年……
  • 为什么互联网大佬都开始养猪养鸡了?
    Logo1-800-PetMeds Free Shipping $49Take $10 Off Your First Order w/code: SAVE10 - 234 x 60
    ASICS AmericaPagoda Piercing Banner 234x60Sierra Trading Post
    搜索
    查看: 3064|回复: 9

    内推面经 -G家店面design题目- 唐人社区|北美华人论坛

    [复制链接]

    7

    主题

    235

    帖子

    236

    积分

    注册会员

    Rank: 2

    积分
    236
    QQ
    发表于 2016-11-5 02:41:40 | 显示全部楼层 |阅读模式
    分享到:
    {$content}

    唐人社区-北美华人论坛-内推面经版-G家店面design题目


      JobHunting
    标 题: G家店面design题目


    设计一个数据库。用户可以从数据库读取数据

    要求:
    1) very large dataset (tens of TB)
    2) dataset is updated every few hours
    3) dataset consists of key-value pairs. The size of the value for any given
    key is bounded by 100KB
    4) The only operation is get(key), which returns the associated value for
    that key, or null if no value exists
    5) The frequency of calling get() is >10,000/sec, and the latency required
    is in order of ms
    --

    回复 百度谷歌雅虎搜狗搜搜有道360奇虎

    举报

    33

    主题

    122

    帖子

    190

    积分

    注册会员

    Rank: 2

    积分
    190
    QQ
    发表于 2016-11-5 03:12:47 | 显示全部楼层
    JobHunting
    标  题: Re: G家店面design题目


    由给定的数据,怎么估算server数量和latency?

    【 在 sikuyu (supercalifragilisticexpialidocious) 的大作中提到: 】
    : 设计一个数据库。用户可以从数据库读取数据
    : 要求:
    : 1) very large dataset (tens of TB)
    : 2) dataset is updated every few hours
    : 3) dataset consists of key-value pairs. The size of the value for any
    given
    : key is bounded by 100KB
    : 4) The only operation is get(key), which returns the associated value for
    : that key, or null if no value exists
    : 5) The frequency of calling get() is >10,000/sec, and the latency required
    : is in order of ms



    --
    Look. If you had one shot or one opportunity to seize everything you ever wanted in one moment.
    Would you capture it or just let it slip?

    6

    主题

    270

    帖子

    258

    积分

    中级会员

    Rank: 3Rank: 3

    积分
    258
    QQ
    发表于 2016-11-5 03:19:02 | 显示全部楼层
    JobHunting
    标  题: Re: G家店面design题目


    cluster memcache or redis. C* is not an optimal solution due to low update
    frequency and low latency requirement. You may use it to backup data.

    【 在 sikuyu (supercalifragilisticexpialidocious) 的大作中提到: 】
    : 设计一个数据库。用户可以从数据库读取数据
    : 要求:
    : 1) very large dataset (tens of TB)
    : 2) dataset is updated every few hours
    : 3) dataset consists of key-value pairs. The size of the value for any
    given
    : key is bounded by 100KB
    : 4) The only operation is get(key), which returns the associated value for
    : that key, or null if no value exists
    : 5) The frequency of calling get() is >10,000/sec, and the latency required
    : is in order of ms





    --

    28

    主题

    99

    帖子

    157

    积分

    注册会员

    Rank: 2

    积分
    157
    QQ
    发表于 2016-11-5 03:25:43 | 显示全部楼层
    JobHunting
    标  题: G家店面design题目


    设计一个数据库。用户可以从数据库读取数据

    要求:
    1) very large dataset (tens of TB)
    2) dataset is updated every few hours
    3) dataset consists of key-value pairs. The size of the value for any given
    key is bounded by 100KB
    4) The only operation is get(key), which returns the associated value for
    that key, or null if no value exists
    5) The frequency of calling get() is >10,000/sec, and the latency required
    is in order of ms
    --

    20

    主题

    93

    帖子

    139

    积分

    注册会员

    Rank: 2

    积分
    139
    QQ
    发表于 2016-11-5 03:46:23 | 显示全部楼层
    JobHunting
    标  题: Re: G家店面design题目


    C*的设计完全可以满足需求吧?
    --

    21

    主题

    91

    帖子

    136

    积分

    注册会员

    Rank: 2

    积分
    136
    QQ
    发表于 2016-11-5 06:08:02 | 显示全部楼层
    JobHunting
    标  题: Re: G家店面design题目


    单机即可10k qps
    网卡买好一点

    --
    ☆ 发自 iPhone 买买提 1.23
    --

    25

    主题

    91

    帖子

    144

    积分

    注册会员

    Rank: 2

    积分
    144
    QQ
    发表于 2016-11-5 06:17:30 | 显示全部楼层
    JobHunting
    标  题: Re: G家店面design题目


    do you have a link for "C*的设计"

    职位和数据库完全不沾边,所以我感觉主要还是考察general design. 当然,要是连
    cache都不知道那肯定过不了

    【 在 peking2 (Lambda) 的大作中提到: 】
    : C*的设计完全可以满足需求吧?



    --

    17

    主题

    78

    帖子

    117

    积分

    注册会员

    Rank: 2

    积分
    117
    QQ
    发表于 2016-11-5 06:56:11 | 显示全部楼层
    JobHunting
    标  题: Re: G家店面design题目



    c* 可以support 10k 需求 也能用timestamp index
    一个key 100KB 一秒 10^4 request 因为要minisec 假设100 minisec

    100 KB * 10^4 * 10 = 10^7 KB = 10000MB

    一台machine 有5 ssd each ssd 200MB 这样需要有50台server ? 大牛们看看这样行不
    行?

    --

    25

    主题

    109

    帖子

    160

    积分

    注册会员

    Rank: 2

    积分
    160
    QQ
    发表于 2016-11-5 07:29:20 | 显示全部楼层
    JobHunting
    标  题: Re: G家店面design题目


    这个要求是一个大量读,很少写的案例。

    对于并发这么高的要求,10000 qps + 10ms latency, 那么一定得上partition/shard。

    我觉得按照dynamo的思路,用consistent hashing做key的partition, 每个node用
    Redis + Mysql Engine.

    然后可以开始扯consistent hashing, gossip, redis, innodb.

    对于key, 根据consistent hashing选择对应node, 再node内,查redis或mysql engine
    。redis本身很快,10K qps也可以,但是如果不在redis,mysql engine不会很快。假
    定每个shard支持1K qps, 那么需要10个shard. 每个shard有3个node, 每个node支持
    333 qps。利用virtual node, 分布30个node到10台服务器。

    利用gossip广播membership状态和key space分布。
    --

    21

    主题

    1183

    帖子

    2359

    积分

    金牌会员

    Rank: 6Rank: 6

    积分
    2359
    QQ
    发表于 2016-11-28 21:19:44 | 显示全部楼层
    发发呆,回回帖,工作结束~
    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    美国华人网|唐人社区|什么值得买FunInUSA.net发布的内推面经 -G家店面design题目- 唐人社区|北美华人论坛帖子由网友提供或转载于网络,若发布的内推面经 -G家店面design题目- 唐人社区|北美华人论坛侵犯了您的权益,请联系我们.
    Sasa.com

    Copyright ©2011 FunInUSA.NET All Right Reserved.  Powered by Discuz! X3.0 小黑屋

    本站信息均由会员发表,不代表美国华人网FunInUSA|唐人社区的立场,如侵犯了您的权利请发帖投诉  技术支持: 美国华人网FunInUSA|唐人社区

    安全联盟认证 安全联盟认证

    快速回复 返回顶部 返回列表