通过这道赛题可以引导大家走入自然语言处理的世界,带大家接触NLP的预处理、模型构建和模型训练等知识点。 任务目标 要求选手根据新闻文本字符对新闻的类别进行分类,这是一个经典文本分类问题。 训练集共200,000条新闻,每条新闻平均907个字符,最短的 ...
参考IMPLEMENTING A CNN FOR TEXT CLASSIFICATION IN TENSORFLOW实现的一个简单的卷积神经网络,用于中文文本分类任务(此项目使用的数据集是中文垃圾邮件识别任务的数据集),数据集下载地址:百度网盘 区别 原博客实现的cnn用于英文文本分类,没有使用word2vec来获取单词 ...