Fidelity 三轮面试 面经

10083
9
Fidelity是家金融公司,我在学校网站上投了以后大概一个月收到通知说简历筛选过了,然后按照给的链接又填了一份profile,接着就是vedio interview, 有点像托福口语,给你一个情景,让你回答一些behavior question,全程录像然后提交到系统,大概七道题。之后等了一周,接到面试的邀请,面试官是一个中国博士,看着我的简历让我介绍了一些机器学习的算法,
先问了PCA原理,然后问我项目里PCA处理完feature减少了多少;

之后是线性回归和逻辑回归,如何求得LR的系数,我讲了一堆梯度下降法和拉格朗日,但是面试官意思是让我讲怎么直接算系数,我脑抽了没说出来,现在感觉应该是直接抽离出所求变量,plot出来求斜率和截距?又问逻辑回归怎么求covariance,我答最大似然估计,大哥微笑点点头;

之后问了KNN原理,怎么选K,欧式距离,最后预测的准确度。对结果评价我讲了confusionMatrix, 他问我还有没有别的Matrix来分析模型质量,我没想出来,其实还有ROC, AUC,生成分类报告。。。哎,上课光顾着想这些怎么画了,关键时刻没想起来这些用来干嘛。。。我菜了我菜了;

然后准备了一晚上的SVM,博士大哥没问。。。可能是想问我点简单的,怕我菜叭;

还有决策树,随机森林,因为没在项目里写,所以没问。面试官是看着我的简历一条一条问下来的,所以一定要看好自己简历里写的项目;

之后出了一个问题,是如果数据的存储量大于你的内存,无法一下子全部输进去进行回归,你打算怎么办?大哥给我暗示,说如果一部分一部分的回归可能有的feature在这一部分不表现相关性,但是在后一部分就表现了,所以分开回归不是一个好的方法。我听得有点蒙圈,就讲先reduction一下?但是他说如过内存运行不了,reduction 算法没办法apply到数据集上。。然后我就说可能我会看一下数据的分布,然后从中选取一个sample, 想办法使得sample不bias不skew,能够代表data set 整体的属性。。。下来查了一下,我觉得比较好的答案可能是对数据集做一个sensitivity analysis, 确定一下比较有效的训练集大小,然后再选取有代表性的样本?或者每次只对其中某几个feature进行回归分析,最后再耦合到一起?不是很懂,求大神解答。

最后是博士大哥出了一个coding题,给我一个list, 里面是几个单词string, 让我生成一包含list的list, 里面的每个list包含拥有相同字母的单词。。。时间少没想出来。

感觉就一般般,但是尽力了,希望博士大哥给过吧。。。
  • 12
9条回复