时间:2021-07-15 | 标签: | 作者:Q8 | 来源:Ashley Weldon网络
小提示:您能找到这篇{Twitter数据采集以及情感分析方法}绝对不是偶然,我们能帮您找到潜在客户,解决您的困扰。如果您对本页介绍的Twitter数据采集以及情感分析方法内容感兴趣,有相关需求意向欢迎拨打我们的服务热线,或留言咨询,我们将第一时间联系您! |
< ">我不是唐纳德特朗普(Donald Trump)的超级粉丝。严格说来,我一点也不喜欢他。然而,他的个人魅力是不容忽视的,他的名字一直占据着大多数报纸和社交媒体。人们对他的态度是戏剧性的和双边的。他的描述词要么是非常积极的,要么是非常消极的,对于网络搜集和情感分析来说,这是一些完美的材料。 < ">本次研究的目的主要是使用Octoparse爬虫工具抓取Twitter上关于唐纳德特朗普的相关推文。然后,我们使用python语言进行情感分析,以此来分析公众对总统的看法。最后,我们使用Tableau Public进行可视化。 < ">本文特别适合以下人群: < ">1、想了解如何采集社交媒体上的内容或者评论。 < ">2、想了解如何利用Python进行情感分析。 < ">首先我们打开Octoparse官网,下载官方最新版本,并按照指示完成注册,登录后,再打开内置的Twitter简易模板。 < ">采集的数据字段包括: < ">用户名 < ">发布时间 < ">发布内容 < ">图片链接 < ">Tweet链接 < ">评论数,转发数,点赞数 < ">首先在Twitter采集模板的关键词参数中输入"Donald Trump",然后点击启动采集就会自动采集数据,正如下图所示,很简单,我大概采集了1万多条Twitter推文,你可以尽可能多的输入关键词,从而采集更多的推文,采集到推文数据后,将数据导出为文本文件,文件命名为"data.txt"。 利用Python进行情感分析 < ">在开始之前,请确保您的电脑已经安装Python开发环境以及文本编辑器,我文章中使用的是Python2.7和Notepad++文本编辑器。 < ">然后,我们使用了两个情感关键词列表组成的txt文件,来分析之前采集下来的Twitter信息,你可以在文末下载这两个文件。 < ">这里的学生会公关危机想法是把txt文件中的每个情感关键词提取到list列表中,然后计算这些关键词在每条推文中的频率,最后我们把相应包含情感词的推文给记录下来。 < ">首先,把两个txt文件中的积极和消费情感关键词分别存储在plist和nlist的列表中。 < ">然后,对采集下来的Twitter推文进行数据清洗,处理掉所有特殊符号(标点和数字等),将每条推文数据保存到word_list列表中。 < ">经过数据处理后,数据只包含清洗后的推文,让我们更易进行数据分析。后续,我们会创建三个字典:wordcountdict,wordcountpositive,and wordcountnegative。 < ">接下来,定义每个字典,如果在Twitter数据中出现相应的推文,则增加1,并储存到wordcountdict字典中。 < ">接下来的话,确定每条推文是否包含积极或者消极的情感关键词,如果包含了积极的情感关键词,则wordcountpositive字典关键词加1,否则保证一个相同的值。如果包含了消极的情感关键词,wordcountnegative做相同处理。如果推文不包含任何积极或者消极关键词,则不作任何处理。 情感分析:消极还是积极 < ">通过运行上面的Python脚本,我得到了5352个消极关键词以及3894个积极关键词,保存在上面相应的列表中,然后打开Tableau,建立了一个气泡图,如下所示。 < ">由图可以看出,很多积极关键词都是片面的,只有404种积极关键词被使用,最常见的话,例如“like”、“great”和“right”,大多数关键词是基础的并且偏口语化,如“wow”和“cool”,而使用的否定关键词更加多样化,他们大多十分正式并且高级,最常用的是“illegal”、“lies”、“racist”。其他词语,如“delinquent”、“inflammatory”、“hypocrites”也是经常出现的。 < ">上面关键词同时也说明支持者比反对者的教育水平更低,显然,唐纳德特朗普在推特用户中并不受欢迎。 < ">总结: < ">在这篇文章中,我开展开展网络营销们谈到了如何Octoparse软件采集Twitter推文,我们还讨论了如何进行数据清洗和使用Python对Twitter推文进行情感分析。对于代码的完整版本,你可以在以下链接下载。 < ">(https://gist.github.com/octoparse/fd9e0006794754edfbdaea86de5b1a51) 参考链接: https://medium.com/datamonsters/text-preprocessing-in-python-steps-tools-and-examples-bf025f872908 https://www.cs.uic.edu/~liub/FBS/sentiment-analysis“确认传播”专注于品牌策划、效果营销和危机管理的数字整合营销传播公司,我们深度诠释客户的品牌理念、文化及背景,多维深度传播客户的文化底蕴和核心价值观,提升客户品牌的知名度、关注度与美誉度。 https://github.com/jeffreybreen/twitter-sentiment-analysis-tutorial-201107/blob/master/data/opinion-lexicon-English/positive-words.txt http://nohumanbeingisillegal.com/Home“确认传播”专注于品牌策划、效果营销和危机管理的数字整合营销传播公司,我们深度诠释客户的品牌理念、文化及背景,多维深度传播客户的文化底蕴和核心价值观,提升客户品牌的知名度、关注度与美誉度。 |
上一篇:Facebook:手游全球发布硬核指南,玩转海外推广
下一篇:最全整理!Facebook政策更新及问题解决方案
基于对传统行业渠道的理解,对互联网行业的渠道我们可以下这样一个定义:一切...
小米应用商店的后台操作和苹果是比较相似的,因为都能填写100字符关键词,允许...
小米的规则目前是在变更中的,但是根据经验小米的搜索排名评分的高低是个很重...
为了恰饭,有时候是要接入一些广告的,所以FB也专门有一个广告的SDK,这就是A...
在 2018 年于旧金山举行的游戏开发者大会上,Amazon Web Services (AWS) 曾宣布,目前世...
关于Facebook Audience Network如何收款的问题,其实官方已经给了详细的步骤。本文主要...
本文介绍了Audience Network对广告载体的质量检查,以及它重点广告形式需要注意的问...
随着iOS开发,作为开发者或公司需要针对iOS App开发涉及的方方面面作出对应的信息...
Facebook和谷歌对出海企业广告渠道都很熟悉,但事实上,在国外还有一些渠道也很...
卖家从做号的第1分钟开始,就一定要想好变现路径是什么?一定要以变现为目的去...
小提示:您应该对本页介绍的“Twitter数据采集以及情感分析方法”相关内容感兴趣,若您有相关需求欢迎拨打我们的服务热线或留言咨询,我们尽快与您联系沟通Twitter数据采集以及情感分析方法的相关事宜。
关键词:Twitter数据采集以及情感分