登录
bigdata
    • 全部主题
    按热度排序
    从Glassdoor, Quora和其他论坛搜刮整理的Data Analyst/Scientistzhen
    自己从Glassdoor, Quora和其他论坛到处搜刮去重整理的Data Analyst/Scientist大科技公司真题,包括Coding, Data Analysis, AB testing, Case Study, Machine Learning,精选的40题,面试大方向上就应该就有个掌握
    haibozhao
    7646
    67
    专注下来,好好刷题
    http://www.1point3acres.com/bbs/forum-84-1.html 工科PhD转数据科学。去年暑假很幸运的做了一个ds intern。今年暑假又很幸运的拿到了实习。但是FB很好的面试机会,因为SQL不过关,挂在了一轮电面。 大概去年九月十月开始刷题,但是零零散
    NewRita
    43721
    295
    求教 想找data science的实习应该怎么刷题?
    求教各位大神 想找ds 的实习应该怎么刷题? 现在在刷leetcode里面的database的题目
    路怒路怒路怒
    9102
    23
    十分钟,记录每天的进程, 想看看自己是怎么坚持下去的
    开贴, 10/28 开始刷LC FB tag题, 按照频率 DESC 开始 --坚持吧
    Wu_kong
    2027
    53
    组队一起刷Datacamp课程
    有兴趣的可以一起刷课,互相鼓励!
    hujuibe
    2357
    47
    Data岗位技术性常考问题与解答分享
    各位,自己收集整理的,data岗位需要的相关技术性问题集锦,希望对大家有帮助! 看到这个论坛基本是CS相关的帖子,所以来分享下,希望有更多对人一起分享! 补充内容 (2019-11-12 15:12): Part2部分请查看更新的贴子哦!
    Mintymentors
    2164
    15
    a collection of data science求二手pdf product单本
    如题,求单本product,可share~
    taropieee
    1675
    20
    想了解ElasticSearch 的 这里是最全的资料
    https://github.com/codevalla/https-github.com-TechBookHunter-Free-Elasticsearch-Books 链接看上面 清单在下面 An Elasticsearch Crash Course Beginning Elastic
    james9989
    302
    0
    分享一本讲数据结构的书 里面用的是python
    我看到很多做数据分析的同学说习惯用python. 而很多讲数据结构的书都用java. 我现在用这本书,感觉还不错,里面的例子都是用python写的。 新人求米,谢谢大家。
    anystone
    1225
    10
    Big Data Engineer 组队打开学习
    https://www.analyticsvidhya.com/blog/2018/11/data-engineer-comprehensive-list-resources-get-started/ 本周先学习如下 A Beginner’s Guide to Data Engineerin
    tonynix
    1011
    11
    关于DA专业的学习内容和未来发展
    大家好, 我现在是本科大三DA专业BA track就读中,近期在准备打Kaggle的一个比赛,准备过程中遇到了关于学习内容的问题想请教一下大家。 学校为DA设置的专业课是CS为主【语言仅涉及Java和C】没有关于python的教学;统计一学期一节,只用R来写作业。但是最近打比赛发现实际运用中还是py
    Spencerclc
    734
    9
    BigData 如何刷题呀?求助~
    我看刷题版块全是刷Leetcode, 我也跟风下了一个Leetcode with me 发现结局是里面的提全是Java或者c+++。 求指导Big data 也是需要刷LeetCode吗?还是有其它题可以刷?我感觉Big data主攻还是python和R呀 补充内容 (2019-4-3 19:
    ihatetaitea
    1686
    8
    周六学习Cassandra
    Cassandra是个支持高量读写的key value nosql key-value数据库。Dynamo和Cassandra非常相近因为两者都是基于同一个paper。consistent hashing这道算法题就是这个数据库中的一个组件。 明天整个白天我都会学习Cassandra并且把
    14417335
    634
    14
    Excel数据分析视频教程分享
    视频比较多,所以存在网盘里,可以有选择性地看,请自取! Excel 数据分析视频教程 链接:https://pan.baidu.com/s/1BIne1nhzgTS033JkuR9FNA 密码:rwv0
    Mintymentors
    858
    5
    求教一道大数据排序的题
    100MB内存,1000MB数据,数据可以是任意类型,但是必须统一,要求排序。。。想不出特别完美的解法,有没有大神帮忙解答一下,我目前就觉得遍历,用hashfunction先把数据分类到是个不同文件,然后分别排序,相加。。感觉不太对
    pengpengche
    1413
    4
    问个data engineer的编程
    来自一个data engineer camp的笔试。也不知道应该分哪一类。我本来是data science方向,对代码效率和复杂度考虑经常不充分。 题目要求:输入文件每行有3个数据:姓名,日期,交易金额 例如: Adam|11142017|80 Bob|11132017|40 Ada
    algrev
    1914
    6
    如何保证消息不被重复消费?如何保证消息消费的幂等性?
    其实这是很常见的一个问题,这俩问题基本可以连起来问。既然是消费消息,那肯定要考虑会不会重复消费?能不能避免重复消费?或者重复消费了也别造成系统异常可以吗?这个是 MQ 领域的基本问题,其实本质上还是问你使用消息队列如何保证幂等性,这个是你架构里要考虑的一个问题。 面试题剖析 回答这个问题
    fby0656
    694
    3
    大数据资料分享下载
    开课吧廖雪峰大数据、八斗大数据、flink、spark等诸多课程资料分享下载, 需要+V jevnopark
    jevnopark
    740
    2
    如果纯小白想看看Hadoop到底怎么回事,应该上哪里看?
    除了wikipedia简介以外,有没有什么地方有点demo性质的?
    K姐
    5300
    16
    关于unsupervised learning 问题
    想向各位大牛请教一下 : 当我明确我需要用unsupervise learning techniques建模(KNN)的时候,我在read in 数据之后,一定要做一个summarystatistics 吗( 去看 有没有missing value, SD之类的)?假设 - 我不需要进行variab
    一亩三分地匿名用户
    680
    4