清风的技术小屋

不为所动, 做更专业的自己

0%

腾讯2018数据分析岗实习笔试题

题目分两大部分,第一部分是不定项选择题,题目有25道,第二部分是问答题,题目有3道。

选择题

问题1

同事小鹅在训练深度学习模型时发现训练集误差不断减少,测试集误差不断增大,以下解决方法错误的是

A. 数据增强

B. 增加网络深度

C. 提前停止训练

D. 添加dropout

问题2

以下关于鞍点上的Hessian矩阵的描述哪个是正确的

A. 正定矩阵

B. 负定矩阵

C. 半正定矩阵

D. 都不对

问题3

在最佳情况下,快速排序的运行时间复杂度是

A. \(O(1)\)

B. \(O(N)\)

C. \(O(N \log N)\)

D. \(O(N^2)\)

问题4

以下图像为深度神经网络的激活函数的函数图像,最有可能发生梯度消失的是:

A.

B.

C.

D.

问题5

使用冒泡排序对 [5 7 0 9 2 3 1 4] 进行从小到大排序,一共需要交换多少次

A. 15

B. 16

C. 17

D. 18

问题6

《绝地求生》游戏中,共有1-3三个等级的头盔,1-3三个等级的防弹衣。假设你从无头盔、无防弹衣开始,每次只捡起没有的装备,或将低等级的装备换成高等级的对应装备,那么达到三级头盔、三级防弹衣,总共有多少种方法? (比如用(x, y)表示当前(头盔,防弹衣)的级别,0为无对应装备,则(0, 0)->(1, 0)->(1, 3)->(3, 3)为一种方法)

A. 6

B. 20

C. 64

D. 106

问题7

以下几种优化方法中,哪种对超参数最不敏感

A. SGD (stochastic gradient descent)

B. BGD (batch gradient descent)

C. Adadelta

D. Momentum

问题8

关于时间复杂度下列说法错误的是

A. 二叉树插入操作的时间复杂度为 \(O(\log N)\)

B. 堆排序时间复杂度为 \(O(N \log N)\)

C. 希尔排序时间复杂度为 \(O(N^{\frac{7}{5}})\)

D. 桶排序最坏情况下时间复杂度为 \(O(N^2)\)

问题9

设总体 \(X\) 在区间 \([-1, 1]\) 上服从均匀分布,已知样本 \(X_1, X_2, \ldots, X_n\) 的样本均值 \(E(X)\) 和样本方差 \(D(X)\),则 $D({X}) = $

A. \(0\)

B. \(\frac{1}{3}\)

C. \(\frac{1}{3} n\)

D. \(3\)

问题10

设随机变量 \(X\) 满足:\(E(X) = \mu\)\(D(X) = \sigma^2\),则由切比雪夫不等式,有 \(P(\vert X - \mu | \ge 4 \sigma) \le\)

A. \(\frac{1}{4}\)

B. \(\frac{1}{2}\)

C. \(\frac{1}{16}\)

D. \(\frac{1}{8}\)

问题11

\(n\) 个观测样本点 \((x, y)\) 进行无截距的线性回归拟合,使得残差平方和最小,回归方程为 \(y=kx\),则可推导出回归系数 \(k\) 为?

A. \(k = \frac{\sum_{i=0}^n x_i y_i - n \bar{x} \bar{y}}{\sum_{i=0}^n x_i^2 - n \bar{x}^2}\)

B. \(k = \frac{\bar{y}}{\bar{x}}\)

C. \(k = \frac{\sum_{i=0}^n x_i y_i }{\sum_{i=0}^n x_i^2}\)

D. 均不正确

问题12

一生产线生产的产品成箱包装,假设每箱平均重50kg,标准差为3kg。若用最大载重量为5000kg的汽车来承运,试用中心极限定理计算每辆车最多装多少箱,才能保证汽车不超载的概率大于0.84 (设 \(\Phi(1) =0.84\),其中 \(\Phi(x)\) 是标准正太分布 \(N(0, 1)\) 的分布函数)

A. 最多装96箱

B. 最多装97箱

C. 最多装98箱

D. 最多装99箱

问题13

分层抽样方法,在下面哪种情况下是比较合适的选择

A. 研究的总体非常小

B. 在调研中希望了解不同子群体的差异

C. 总体中只有一部分样本是可以调研的

D. 没有先验的总体信息

问题14

在无线网络中分别以概率0.6和概率0.4,发出信号"0"和"1",由于通讯系统受到干扰,当发送"0"时,接收方以概率0.8收到"0",概率0.2收到"1",当发送"1"时,接收方以概率0.9收到"1",概率0.1收到"0",则下列说法正确的是

  1. 收到信号"0"的概率是0.52

  2. 收到信号"0"时,发出信号也是"0"的概率是12/13

A. (1) 和(2)都错误

B. (1)正确,(2)错误

C. (1)错误,(2)正确

D. (1)和(2)都正确

问题15

已知 \(f(x) = 3x^2 + 4x f'(x)\),则 \(f'(0) =\)

A. -8

B. -16

C. -24

D. -32

问题16

函数 \(f(x)\)\(x=b\) 处导数存在,为 \(f'(b)\)。则 \(\lim_{h \to 0} \frac{f(b + 4h) - f(b - 2h)}{2h}\)

A. \(f'(b)\)

B. \(\frac{1}{3} f'(b)\)

C. \(3 f'(b)\)

D. \(2 f'(b)\)

问题17

对于矩阵 \(A\),已知 Rank(A) = 3,以下哪项是K可能的值? \[ A = \begin{bmatrix} K & 1 & 1 & 1 \\ 1 & K & 1 & 1 \\ 1 & 1 & K & 1 \\ 1 & 1 & 1 & K \end{bmatrix} \] A. K=-1

B. K=-3 或 K=-1

C. K=-3

D. k=3 或 K=-1

问题18

下面哪种情况是用图的深度优先遍历方法得到的结果

A. 1, 2, 3, 4, 5, 6

B. 1, 2, 4, 6, 5, 3

C. 1, 3, 5, 2, 4, 6

D. 1, 3, 2, 5, 4, 6

问题19

\(Ax = 0\)\(A\) 是以下参数,哪个方程组有非零解?

A \[ \begin{bmatrix} -3 & 4 & -8 \\ -2 & 5 & 5 \end{bmatrix} \] B \[ \begin{bmatrix} 2 & -5 & 8 \\ -2 & -7 & 1\\ 4 & 2 & 7 \end{bmatrix} \] C \[ \begin{bmatrix} -3 & 4 & -8 \\ -2 & 5 & 4 \end{bmatrix} \] D \[ \begin{bmatrix} 2 & -5 & 9 \\ -2 & -7 & 1 \\ 4 & 2 & 7 \end{bmatrix} \]

问题20

给一个整数数组,需要快速查找指定的一个整数是否在其中,需要哪些操作

A. 二分查找

B. 排序

C. 排序,二分查找

D. 顺序遍历

问题21

\(f(x) = \int_{x}^{x^3} e^{-t^2} dt\),则 \(f'(x) =\)

A. \(3x^2e^{-x^6} - e^{-x^2}\)

B. \(2x e^{-x^6} - e^{-x}\)

C. \(2x e^{-x^4} - e^{-x^2}\)

D. \(3x^2 e^{-x^6} - e^{-x}\)

问题22

给定一组数据,以下哪种方法可以检验数据是否服从正态分布?

A. Q-Q图

B. Wilcoxon符号秩检验

C. K-S检验

D. t检验

问题23

关于秩统计量,下列说法正确的是:

A. 需要总体分布符合特定分布

B. 需要总体参数满足一定条件

C. 不需要总体分布符合特定分布

D. 检验统计量与总体分布的具体参数无关

问题24

下列关于协方差和相关系数的说法,正确的是?(假定X、Y是两个变量)

A. 协方差的正或负,反映两个变量X、Y是同向变化或反向变化

B. 协方差的绝对值,反映两个变量X、Y同向或反向变化的程度

C. 两个变量的相关系数是消除量纲和标准化之后的特殊的协方差

D. 相关系数反应两个变量每单位变化的相似程度

问题25

克莱姆法则是线性代数中一个关于求解线性方程组的定理。对于一个具有N个方程、N个未知数的线性方程组,下列说法正确的是:

A. 当方程组的系数行列式不等于零时,则方程组一定有解

B. 如果方程组有两个不同的解,那么方程组的系数行列式必定等于零

C. 如果方程组的系数行列式等于零,那么方程组一定无解

D. 当方程组的系数行列式不等于零时,则方程组可能有多组解

问答题

问题1

试论述机器学习模型中的偏差 (Bias) 和方差 (Variance),并说明各种情况下的解决办法。

问题2

请简诉数理统计中假设检验的基本步骤。

问题3

假如你现在能够拿到微信用户的定位信息 (位置信息),比如用户每一分钟会上传自己的位置到后台。请发挥你的想象力,这些定位数据能够做哪些事情,可以创造哪些社会价值。