## 一、 NLP基础与经典模型(共30题)
### 选择题/填空题
1. **【选择题】** 在自然语言处理中,以下哪种模型最适合处理长距离依赖关系?( )
A. RNN B. LSTM C. GRU D. Transformer
**答案**:D。Transformer通过自注意力机制直接连接序列中任意两个位置的 token,能有效捕捉长距离依赖,而 RNN 及其变体容易产生梯度消失/爆炸。
2. **【选择题】** 以下哪种技术不适合用于解决 NLP 模型中的过拟合问题?( )
A. Dropout B. L2正则化 C. 数据增强 D. 增大模型参数量
**答案**:D。增大模型参数量通常会加剧过拟合,而 Dropout、正则化和数据增强都是常见的防过拟合手段。
3. **【填空题】** 在词嵌入技术中,Word2Vec 主要利用了__________和__________两种算法来学习词向量。
**答案**:Skip-gram;CBOW。Skip-gram 适用于低频词,用中心词预测上下文;CBOW 适用于高频词,用上下文预测中心词。
4. **【选择题】** 计算两个词向量(如“苹果”和“水果”)的语义相似度,最常用的指标是?( )
A. 均方误差 B. 余弦相似度 C. 欧氏距离 D. 曼哈顿距离
**答案**:B。余弦相似度衡量的是两个向量在方向上的夹角,不受向量长度影响,最适合衡量语义相似度。
5. **【