阅读大概需要4分钟

跟随小博主,每天进步一丢丢
导读
最近在梳理文本分类的各个神经网络算法,特地一个来总结下。接下来将要一个文章一个文章的讲解各个算法的理论与实践。目录暂定为:
  1. 多通道卷积神经网络(multi_channel_CNN)
  2. 深度卷积神经网络(deep_CNN)
  3. 基于字符的卷积神经网络(Char_CNN)
  4. 循环与卷积神经网络并用网络(LSTM_CNN)
  5. 树状循环神经网络(Tree-LSTM)
  6. Transformer(目前常用于NMT)
  7. etc..
之后的以后再补充。今天我们先讲第一个,多通道卷积神经网络。
先前知识补充
先说点基础的,我们最刚开始的分类其实就是embedding层之后直接经过线性层进行降维,将其映射到分类上,图为:
然后因为参数太多,计算太慢,所以产生了pooling池化层,取指定维度的一个参数代表整个维度,从而大大降低了计算量,而且效果还不错。图为:
之后又有人想到没有充分的利用到句子的上下词语的关系,所以就讲图像算法的CNN运用到了NLP上,这个就相当于NLP里的n-gram(unigram,bigram,trigram...)一样,寻找相邻词语组合形成的特征。图为:
有了上面的基础,我们引出multi_channel_CNN就容易多了。
multi_channel_CNN
多通道,就是CNN中的一次性卷积要处理的多少组数据。比如图像中,如果是只有灰度值的图像就只有一个通道,如果是彩色图片的话,就会RGB三个图像(也就是三个通道)。那么NLP中怎么利用这个多通道特征呢?有人就想了NLP中不就一个句子长度 * embed维度组成的一个二维输入吗?是这样的,刚开始我们用的都是单通道的。
但是有人就提出了这样的想法:
初始化两个不同的embedding,将句子用两个embedding表示出来,这样就可以有两个通道了。
时间确实是这样的,但是我们常用的是一个是随机初始化的embedding,另一个是使用预训练embedding(w2v or GloVe ...)。图为:
实践
这个其实和图像是想的差不多了。(pytorch)
class Multi_Channel_CNN 初始化:
def __init__(
self
, opts, vocab, label_vocab):

       super(Multi_Channel_CNN,
self
).__init__()


       random.seed(opts.seed)

       torch.manual_seed(opts.seed)

       torch.cuda.manual_seed(opts.seed)


self
.embed_dim = opts.embed_size

self
.word_num = vocab.m_size

self
.pre_embed_path = opts.pre_embed_path

self
.string2id = vocab.string2id

self
.embed_uniform_init = opts.embed_uniform_init

self
.stride = opts.stride

self
.kernel_size = opts.kernel_size

self
.kernel_num = opts.kernel_num

self
.label_num = label_vocab.m_size

self
.embed_dropout = opts.embed_dropout

self
.fc_dropout = opts.fc_dropout


self
.embeddings = nn.Embedding(
self
.word_num,
self
.embed_dim)

self
.embeddings_static = nn.Embedding(
self
.word_num,
self
.embed_dim)


if
opts.pre_embed_path !=
''
:

           embedding = Embedding.load_predtrained_emb_zero(
self
.pre_embed_path,
self
.string2id)

self
.embeddings_static.weight.data.copy_(embedding)

else
:

           nn.init.uniform_(
self
.embeddings_static.weight.data, -
self
.embed_uniform_init,
self
.embed_uniform_init)


       nn.init.uniform_(
self
.embeddings.weight.data, -
self
.embed_uniform_init,
self
.embed_uniform_init)


# 2 convs
self
.convs = nn.ModuleList(

           [nn.Conv2d(
2
,
self
.embed_dim, (K,
self
.embed_dim), stride=
self
.stride, padding=(K
// 2, 0)) for K in self.kernel_size])

       in_fea = len(
self
.kernel_size)*
self
.kernel_num

self
.linear1 = nn.Linear(in_fea, in_fea
// 2)
self
.linear2 = nn.Linear(in_fea
// 2, self.label_num)
self
.embed_dropout = nn.Dropout(
self
.embed_dropout)

self
.fc_dropout = nn.Dropout(
self
.fc_dropout)
这个部分主要将输入的通道数1改为2即可。
数据流通部分:
def forward(
self
, input):

       static_embed =
self
.embeddings_static(input)  
# torch.Size([64, 39, 100])
       embed =
self
.embeddings(input)  
# torch.Size([64, 39, 100])

       x = torch.stack([static_embed, embed],
1
)  
# torch.Size([64, 2, 39, 100])

out
=
self
.embed_dropout(x)


       l = []

for
conv
inself
.convs:

           l.append(F.relu(conv(
out
)).squeeze(
3
))  
# torch.Size([64, 100, 39])

out
= l

       l = []

for
i
inout
:

           l.append(F.max_pool1d(i, kernel_size=i.size(
2
)).squeeze(
2
))  
# torch.Size([64, 100])

out
= torch.cat(l,
1
)  
# torch.Size([64, 300])

out
=
self
.fc_dropout(
out
)


out
=
self
.linear1(
out
)

out
=
self
.linear2(F.relu(
out
))


returnout
这里主要就是一个stack函数的应用,将两个embedding放到一个新的维度里。
数据对比
可以明显看出多通道优点还是很突出的。
github地址:
https://github.com/zenRRan/Sentiment-Analysis/blob/master/models/multi_channel_CNN.py
欢迎fork,有问题大家尽管指出!
PS:上述图片均来自于导师张梅山,唐都钰的《Deep Learning in Natural Language Processing》的情感分析篇。
IELTS a bit
rival n. 竞争对手
        v. 与...相匹敌
roar n/v. 咆哮,吼叫
robust adj. 强劲的;富有活力的
slippery adj. 滑的;光滑的
推荐阅读:

继续阅读
阅读原文