(一)选择题(30分,15道)
-
大数据摩尔定律:人类社会数据每2年就会翻一倍
-
python中的三目运算符:min=x if x<y else y
-
聚类算法:K-Means算法不能直接对文本数据使用
-
分类算法:KNN的一个距离,不确定是曼哈顿还是欧式距离
-
分类问题的评估指标:我选的是精确率和召回率,还涉及了ROC曲线
-
模块与包:选择错误的,我选的是模块不一定是.py文件,主要是我记得课件里面就是用.py文件创建的模块,以下是课件图
-
负梯度下降算法:这个我是真没见过,但秉着“一定”就是错的原则,选了“负梯度下降算法会使模型一定更优”
-
回归:选错的,我选了“按因变量个数多少,将回归问题分为线性回归和非线性回归”
-
集合:应该是将列表导入set(),求结果,我选的是“{1,2,3}”
-
列表的切片赋值:大概就是下面这个,给一个列表,对后面的赋值
(二)简答题(20分,4道)
-
大数据的技术特点和生产方式 技术特点:5V(快速化、大量化、真实性、价值密度低,多样化)
生产方式:……
-
python中内置序列的特征
元组、列表、字典、列表……自由发挥
-
不可见对象和可见对象的概念,其在函数参数传递时的不同
-
数据分析的基本流程
(三)程序填空(30分,15空)
-
反转字符串:leetcode第541题 印象中的答案:left+=1,right-=1,reverse(i,j),i+k-1,2k
-
房价预测:线性回归课件中的改编,加了一个pandas的独热编码(很美了)
印象中的答案:“建筑……",get_dummies(),mean,mean_houses,fit_transfomer,fit,predict,train_test_split,y_test,y_pred,coef_
(四)综合分析题(20分,两道)
- 一道文科题,讨论大数据技术造福了哪些行业,说说“从IT时代迈向DT时代”这句话的理解
- 说一说维度灾难的定义、解决方案;说一说模型复杂度、过拟合、欠拟合的联系和三者的概念。
「真诚赞赏,手留余香」
真诚赞赏,手留余香
使用微信扫描二维码完成支付