NLPcc2013-2014微博文本情感分类数据集

2023-05-16

从xml中提取的，文件格式为tsv，和csv差不多,可以转为其他格式

链接：https://pan.baidu.com/s/1lDiuvpbT5qPc_uJJs0cPUQ
提取码：t5i7

import  xml.dom.minidom
import csv
import pandas as pd

# 1. 创建文件对象
f = open('Nlpcc2013Train.tsv','a+',encoding='utf-8',newline='')

# 2. 基于文件对象构建 csv写入对象
csv_writer = csv.writer(f)
csv_writer.writerow(['标签','文本'])

#打开xml文档
dom = xml.dom.minidom.parse('Nlpcc2013/微博情绪样例数据V5-13.xml')

#得到文档元素对象
root = dom.documentElement
wb=dom.getElementsByTagName('weibo')

for i in range(len(wb)):
    wbi=wb[i]
    sens=wbi.getElementsByTagName('sentence')
    for j in range(len(sens)):
        senj=sens[j]
        if senj.firstChild is None:
            continue
        if senj.hasAttribute('emotion-1-type'):
            em=senj.getAttribute('emotion-1-type')
        else:
            em='none'
        text=senj.firstChild.data
        csv_writer.writerow([em,text])
        
        
f.close()
在这里插入代码片

在这里插入图片描述

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

NLPcc2013-2014微博文本情感分类数据集的相关文章

通过ssh连接aws（亚马逊云服务器实例）

一 Windows用户 windows可以使用PuTTY 和xshell xff0c 本文使用xshell xff08 1 xff09 第一步 xff1a 配置服务器信息打开xshell xff0c 新建连接 xff0c 在菜单连接填
Spring报错解决一览

Spring错误持续更新贴问题一 springcloud OAuth2 0配置的时候报错 Method springSecurityFilterChain in org springframework security config an
k-Medoids 聚类系列算法：PAM, CLARA, CLARANS, Trimed, BanditPAM

前言如果你对这篇文章感兴趣 xff0c 可以点击访客必读指引页一文囊括主页内所有高质量博客 xff0c 查看完整博客分类与对应链接 k k k Means 作为一种经典聚类算法 xff0c 相信大家都比较熟悉 xff0c 其将簇中所
软聚类算法：模糊聚类 (Fuzzy Clustering)

前言如果你对这篇文章感兴趣 xff0c 可以点击访客必读指引页一文囊括主页内所有高质量博客 xff0c 查看完整博客分类与对应链接在介绍模糊聚类之前 xff0c 我们先简单地列举一下聚类算法的常见分类 xff1a 硬聚类 Hard
层次聚类：BIRCH 聚类、Lance–Williams equation、BETULA 聚类

前言如果你对这篇文章感兴趣 xff0c 可以点击访客必读指引页一文囊括主页内所有高质量博客 xff0c 查看完整博客分类与对应链接 BIRCH 聚类 BIRCH Balanced Iterative Reducing and Clu
演化算法：乌鸦搜索算法 (Crow Search Algorithm)

前言如果你对这篇文章感兴趣 xff0c 可以点击访客必读指引页一文囊括主页内所有高质量博客 xff0c 查看完整博客分类与对应链接在机器学习中 xff0c 我们所要优化的问题很多时候难以求导 xff0c 因此通常会采用一些演化算法
随机多臂赌博机 (Stochastic Multi-armed Bandits)：置信上界算法 (Upper Confidence Bound)

前言如果你对这篇文章感兴趣 xff0c 可以点击访客必读指引页一文囊括主页内所有高质量博客 xff0c 查看完整博客分类与对应链接本篇文章介绍一种针对 Stochastic Multi armed Bandits MAB 问题的算
二进制哈希码快速搜索：Multi-Index Hashing

前言如果你对这篇文章感兴趣 xff0c 可以点击访客必读指引页一文囊括主页内所有高质量博客 xff0c 查看完整博客分类与对应链接哈希方法通常包含两个部分 xff1a 编码将元素通过 data dependent 或 data
对比学习 (Contrastive Learning) 发展历程 - 综述

前言如果你对这篇文章感兴趣 xff0c 可以点击访客必读指引页一文囊括主页内所有高质量博客 xff0c 查看完整博客分类与对应链接本文为对比学习论文综述的笔记 xff0c 其中将对比学习分为了以下四个发展阶段 xff1a 百花
研究的艺术 (The craft of research) 读书笔记

前言如果你对这篇文章感兴趣 xff0c 可以点击访客必读指引页一文囊括主页内所有高质量博客 xff0c 查看完整博客分类与对应链接对于研究者而言 xff0c 写作是一件很重要的事 xff0c 好的写作不仅能让更多人愿意读 xff0
机器学习领域中各学派划分（符号主义、频率主义、贝叶斯主义、连接主义）

前言如果你对这篇文章感兴趣 xff0c 可以点击访客必读指引页一文囊括主页内所有高质量博客 xff0c 查看完整博客分类与对应链接在机器学习领域中 xff0c 算法数量可谓是数不胜数 xff0c 若只关注每个算法本身 xff0c
ChatGPT 各类 Prompt 整理

前言如果你对这篇文章感兴趣 xff0c 可以点击访客必读指引页一文囊括主页内所有高质量博客 xff0c 查看完整博客分类与对应链接文章写作修正论文修正 Proofread this lightly improving clar
访问www.baidu.com完整过程

根据域名 xff0c 操作系统查询本地记录 xff0c 如果没有查到则去查询DNS服务器缓存 61 根DNS服务器 61 顶级域名服务器 61 权威域名服务器 61 浏览器渲染 xff1a DOM Tree 43 cssOM render
生成式 AI 背后的共同框架：Stable Diffusion、DALL-E、Imagen

前言如果你对这篇文章感兴趣 xff0c 可以点击访客必读指引页一文囊括主页内所有高质量博客 xff0c 查看完整博客分类与对应链接框架这些生成式 AI 的整体功能为 xff1a 输入文字 xff0c 返回图像 xff0c 即
生成式 AI 分析：大模型 + 大量数据的神奇效果

前言如果你对这篇文章感兴趣 xff0c 可以点击访客必读指引页一文囊括主页内所有高质量博客 xff0c 查看完整博客分类与对应链接大模型的涌现能力 Emergent Ability 下图是模型性能 xff08 Loss for n
大型语言模型 (LLM) 的两条发展路线：Finetune v.s. Prompt

前言如果你对这篇文章感兴趣 xff0c 可以点击访客必读指引页一文囊括主页内所有高质量博客 xff0c 查看完整博客分类与对应链接在大型语言模型的研究中 xff0c 研究者对其有两种不同的期待 xff0c 也可以理解为是两种不同的
ESP8266建立TCP连接确出现错误AT+CIPSTART=“TCP”,“10.161.13.180”,8080 ERROR CLOSED

资料下载网络调试助手 amp 串口调试助手链接 xff1a https pan baidu com s 1QB5bIx0paLpY0aVq1BB8xw 提取码 xff1a yxxs 问题说明最近学习ESP8266模块 xff0c 想通
vscode 报错Debugger listening on ws..SyntaxError: Unexpected token ＜ at createScript

原因是启动vscode后 xff0c 在运行这个地方 xff0c 没有选择运行哪个debug 选择listen form xdebug后 xff0c 正常
【Linux】CentOS7防火墙开启、停止、关闭，添加删除开放端口

防火墙管理文章目录防火墙管理1 直接关闭防火墙2 firewalld防火墙的基本使用3 防火墙端口管理4 参考资料 CentOS7防火墙 CentOS7默认安装了firewalld防火墙利用防火墙 xff0c 我们可以允许或是限制传输
切身经历，经理都慌了！云服务器连接成功蓝屏，桌面没有任何图标显示

恢复了服务器数据 xff0c 结果服务器桌面任何东西都看不到了 xff0c 只有一个蓝色背景 xff0c 那一刻 xff0c 我心里是慌的解决方案 xff1a 1 使用远程桌面 xff0c 输入您服务器IP地址登陆服务器 2 一个用户黑屏

随机推荐

XCOM串口调试软件的安装与使用（附串口及驱动资源包）

材料 xff1a C340模块或者别的模块 xff0c 我这里直接用的是STM32F407芯片 xff0c 内部集成了C340 一根usb线一下载安装XCOM串口调试助手下载地址 XCOM的详细讲解另外需要安装C340的驱动正点原
（傻瓜教程）TensorBoard可视化工具简单教程及讲解（TensorFlow与Pytorch）

首先庆祝踩坑踩了一万个的我终于搞懂TensorBoard的原理了 xff0c 是我太蠢了 xff01 xff01 xff01 xff01 xff01 xff01 xff01 xff01 xff01 xff01 xff01 xff01 xff
STM32F407-用TB6600驱动器驱动57步进电机（代码+连线）

一硬件 1 硬件准备 57步进电机 xff08 型号57CM18 xff09 xff0c 驱动器TB6600 xff0c 开发板STM32F407ZGT6 2 电气特性 3 连线驱动器右边分有两个区域 Signal xff1a 用于驱动
C/C++常见错误汇总

笔记本 xff1a MacBook Air xff0c 操作系统 xff1a macOS xff0c IDE xff1a CLion xff0c 工具链如下图 xff1a 1 error C 43 43 requires a type sp
如何用Pytorch计算模型参数量Params和计算量Flops查看框架结构等

公式公式来源 xff1a 卷积神经网络模型参数量和运算量计算方法简书 jianshu com 计算模型参数量 1 parameters法通过遍历模型的parameters获取结构以及参数 xff1a model 61 你自己的模型 x
Matlab-基于模型不确定补偿的RBF网络机器人自适应控制仿真

在众多机器人控制算法中基于模型的计算力矩控制方法是十分有效的其操作性能也是相当优秀的然而这种控制算法必须面对两大难题第一必须实现对机器人动力学模型的快速计算第二必须事先精确了解机器人的动力学模型因为计算转矩算法在模型未知的情
超分辨latex论文写作图片排版

latex排版多张局部放大图 xff0c 需要多行多列并排放置 xff0c 并且最左侧图片需要占用两行位置 xff0c 其他图片依次排列 xff0c 并为每个图片添加小标题 xff0c 研究半天写出来了 xff0c 具体如下 xff1a 只
Computers & Graphics(CAG)及Elsevier常见期刊投稿记录

1 期刊地址 Editorial Manager https www editorialmanager com cag default2 aspx 先进行用户注册 xff0c 登录后进入首页点击Submit New Manuscript开始
BasicSR超分辨率框架使用问题记录

报错 xff1a KeyError 34 No object named 39 BSRN 39 found in 39 arch 39 registry 34 或者 xff1a An object named BSRN was alread
JDBC配置教程+总结（sql server/mysql/maven）

Eclipse配置一 JDBC配置百度搜索sql server jdbc下载进入微软下载官网 xff1a https docs microsoft com zh cn sql connect jdbc download microsof
关于module.export的用法

关于module export的用法 module exports 对象是由模块系统创建的在我们自己写模块的时候 xff0c 需要在模块最后写好模块接口 xff0c 声明这个模块对外暴露什么内容 xff0c module exports
VNC之免交互式设置用户登录密码

VNC之免交互式设置用户登录密码由于有几十台机器 xff0c 每台机器需要配置4个VNC账号 xff0c 手动配置太费劲了 xff0c 这里使用免交互式配置密码 xff0c 可以将其改在脚本中 xff0c 减少配置时间方法一 span
iscsi开机自动挂载和认证配置

iscsi开机挂载和认证配置 iscsi 开机自启 span class token comment xff1a 发现iscsi设备 span span class token punctuation span root 64 localh
Linux 修改apt-get为国内镜像源

查看apt get配置文件 cat etc apt sources list 源文件备份 sudo cp etc apt sources list etc apt sources list bak 清空配置文件 echo 34 34 gt
为什么数组下标是从0开始？可能原因

也不是所有的高级程序语言都是如此 xff0c 比如Python数组下标就支持负数原因一 xff1a 历史原因语言出现顺序从早到晚C Java JavaScript C语言数组下标是从0开始 gt Java也是 gt JavaScript
离线部署docker配置文件

systemd config cat gt usr lib systemd system docker service lt lt EOF Unit Description 61 Docker Application Container E
layui.use里面定义的方法外面怎么调用

前言 xff1a layui use里面定义的方法外面怎么调用解决办法 xff1a 方法内部加window 加了window后可以被外部引用 window uploadData 61 function 源码 xff1a layui us
Hadoop（四）HDFS 读写流程

HDFS 的读写流程 HDFS 将文件切割为默认大小的块 xff08 block xff09 存放在不同的 DataNode上 xff1b 上传文件和读取文件是 HDFS 重要的流程 xff1b HDFS 的写文件流程图文解释 xff1a
cocos2dx3.x中Opacity和visible

当我们需要场景中的某个精灵不可见时可能会面临两种选择 xff0c 特别地 xff0c 我们可能经常使用Fadein和Fadeout表示淡入淡出的特效 xff0c 而当我调用Fadeout淡出精灵时 xff0c 其实本质上是在对精灵的Opac
NLPcc2013-2014微博文本情感分类数据集

从xml中提取的 xff0c 文件格式为tsv xff0c 和csv差不多可以转为其他格式链接 xff1a https pan baidu com s 1lDiuvpbT5qPc uJJs0cPUQ 提取码 xff1a t5i7 spa

NLPcc2013-2014微博文本情感分类数据集

NLPcc2013-2014微博文本情感分类数据集 的相关文章

随机推荐

热门标签

NLPcc2013-2014微博文本情感分类数据集的相关文章