深度学习(十五) TextCNN理解


以下是阅读TextCNN后的理解

步骤:

  1.先对句子进行分词,一般使用“jieba”库进行分词。

  2.在原文中,用了6个卷积核对原词向量矩阵进行卷积。

 

  3.6个卷积核大小:2个4*6、2个3*6和2个2*6,如上图所示;然后进行池化,对相同卷积核产生的特征图进行连接;再进行softmax输出2个类别。

    1).这里对no-static进行阐述,表示在训练的过程中,词向量是可以进行微调的,也叫做fine-tuning。

  4.为什么采用不同大小的卷积核,不同的感受视野,卷积核的宽取词汇表的纬度,有利于语义的提取。

  5.研究证明为什么要采用字,而不采用字,原因是词粒度准确率>字粒度准确率。存在两种模型,一种是词袋模型,第二种是词向量模型。下面对词向量模型来进行讲述。

    词向量模型:

    一般开始为高纬度,高稀疏向量,利用嵌入层对其进行降维,增加稠密性。

    使用词向量进行文本分类的步骤为:

      ①.先使用分词工具提取词汇表。

      ②.将要分类的内容转换为词向量。

        a.分词

        b.将每个词转换为word2vec向量。

        c.按顺序组合word2vec,那么就组合成了一个词向量。

        d.卷积、池化和连接,然后进行分类。

  6.嵌入层

  原来一句话被分成了许多词,因为在训练好的词向量中,是用语料库中所有的词拿来进行训练的,所以训练好的word2vec是一个字典,键值是词,value值就是该词词向量的值,嵌入层的作用就是将一句话中词拿到训练好的词向量字典中去组合词向量,组合好的词向量就是这句话的向量。

优质内容筛选与推荐>>
1、python+selenium链接对象操作
2、asp.net MVC 使用wifidog 协议实现wifi认证
3、课程总结
4、php redis 操作
5、WPF Virtualization


长按二维码向我转账

受苹果公司新规定影响,微信 iOS 版的赞赏功能被关闭,可通过二维码转账支持公众号。

    阅读
    好看
    已推荐到看一看
    你的朋友可以在“发现”-“看一看”看到你认为好看的文章。
    已取消,“好看”想法已同步删除
    已推荐到看一看 和朋友分享想法
    最多200字,当前共 发送

    已发送

    朋友将在看一看看到

    确定
    分享你的想法...
    取消

    分享想法到看一看

    确定
    最多200字,当前共

    发送中

    网络异常,请稍后重试

    微信扫一扫
    关注该公众号