Business School
商学院
手机:13798307597
电话:0755-82083850
博士们喜欢的数据分析工具
博士们喜欢的数据分析工具
研究生和博士生以及学者应展示使用数据分析软件进行定量或定性研究的能力。学生和学者使用数据分析软件和平台来执行预测分析功能也变得越来越普遍。这篇博文着眼于一些最适合学生和学者的数据分析软件。
这篇文章由 Rachel Simmons, BA(自由撰稿人)和 Stephanie A. Bosco-Ruggiero 博士(社会工作博士)代表 Dave Maslach 博士为 Mba-sz.com 项目撰写。Mba-sz.com 通过提供对博士和学术生活的真实看法以及如何成为一名成功的研究人员来帮助学生、教师和研究人员。四年多来,该项目一直在为世界各地的学生和研究人员提供建议、社区和鼓励。
在决定使用哪种分析软件来分析定量或定性研究数据时,您可能会对所有可用选项感到不知所措。根据您收集的研究类型和数据,您将有很多选择。
什么是数据分析软件?
数据分析软件和工具使研究人员能够输入来自调查或其他数据收集工具的数据、清理数据、分析数据、创建图表和图形等。数据分析软件可用于分析定量数据或定性数据。软件可以下载到您的计算机上,或者通过某些程序在云中使用。
一些数据分析工具更像是应用程序或更小的软件系统。一个例子是 GPower,它可以帮助您确定为不同的统计测试获得一定水平的能力所需的样本量。做一些研究,你会发现一些方便的应用程序可以与软件程序一起使用,但可能不能代替它们。
学生使用数据分析软件吗?
大多数社会科学、商业、生命科学和其他学术课程都要求学生参加一系列研究课程,其中包括研究和分析的介绍,以及更高级的数据分析平台使用。事实上,一个好的研究生或博士课程将要求你至少参加两门研究课程,并要求你学习一两个数据分析软件程序。
之所以如此重要,是因为了解研究以及如何使用这些平台中的一个或多个将使您更有市场。在一些学生和专业人士回避研究和研究平台的领域尤其如此。我们都有一个同事或同学,或者我们就是这个人,害怕参加研究课程,进行统计分析,甚至使用通用软件。放开你的恐惧,学习一个平台,然后脱颖而出。
所有学生都必须克服对数据分析和数据分析平台的恐惧。如果你是博士生,你应该对自己使用各种工具和平台分析数据,尤其是定量数据的能力充满信心。定量分析工具帮助我们查看以数字衡量的数据,并且可以使用统计数据进行分析。定性平台帮助我们分析来自采访、焦点小组或其他由单词组成的内容(例如书页)的数据。
什么是预测分析?
在商业世界和其他领域,对预测分析工具的需求和使用都在增长。预测分析可用于业务预测,例如检查大量数据存储和预测市场趋势。它还可以用于商业,以促进组织学习并帮助企业规划未来。预测分析也用于产品开发、营销、金融和股票交易。预测分析采用算法、机器建模和统计数据来预测未来的事件和趋势。
在这个 vlog 中,Dave 谈到了商业智能和分析、它的起源以及它是什么:
在社会科学中,预测分析可用于预测某些事件在社会或家庭或个人中发生的可能性。例如,社会工作研究人员或儿童福利质量保证专业人员可以使用数据分析来预测哪些儿童和家庭在未来参与福利系统的风险最大。数据分析也可用于政府预测迁移或网络安全。
预测分析涉及绘制和检查数据以在决策过程的不同分支做出决策。对于使用数据分析工具做出假设、弄清楚模型的组成部分以及您正在寻找什么的过程来说,这一点很重要。看看这个视频博客,戴夫在其中更多地谈论数据分析、它的局限性以及它在业务预测中的用途。
我应该使用哪种软件进行预测分析?
市场上有几种软件产品可供学生和学者用于执行预测分析操作。 例如,SAS是一种预测分析软件,包括“优化和模拟、文本分析、预测和计量经济学、高性能数据挖掘、模型管理器和评分加速器”等功能。该软件最有趣的功能之一是数据挖掘工具,它使您能够基于大量数据创建高度准确的预测模型。
此外,文本分析功能允许学生和研究人员将定性数据合并到模型和图形中。可以说,这是分析混合方法研究项目数据的最佳平台之一。利用 SAS 可以帮助学生、教育工作者和研究人员提出重要问题,并对有影响力甚至改变世界的事件和现象做出预测。
学习和使用数据分析软件难吗?
难度可能会有所不同,但简短的回答是否定的,对于任何被研究生或博士课程录取的学生来说,学习数据分析课程并不太难。你可能会害怕并说服自己你不能做“数学”,或者不明白为什么你会得到你所做的结果,但你会在一位优秀的教授和/或实验室导师的帮助下学习。有些程序比其他程序更容易学习,因为它们使用点击菜单而不是主要依赖于代码;但是每个人的学习方式都不同,并且基于多种因素会更喜欢一个程序而不是另一个程序。
要记住的一件事是,这些程序会不断更新,一旦您接受过培训,这些培训可能在几年后就会过时。查看我们的博客文章,了解如何成为更高效的学生研究员。相信我们,使用您可以使用的技术,您作为研究人员的生活将会更轻松、更高效。
最常用的定量数据分析软件程序有哪些?
有许多定量数据分析工具——这里不一一列举——但这里有一些是课程、大学和研究人员常用的。
IBM SPSS 统计
SPSS 员工点击功能以及允许用户输入代码的语法来进行统计分析。它的多功能和高级软件包有许多统计分析和操作可供选择。然而它很贵。通常,大学或部门会购买许可证,以允许其学生在大学现场免费使用该程序。
如果学生想在家中使用该软件,他们可以购买几个月到几年的短期许可证(参见 studentdiscounts.com)。该软件有基本版本和更高级的版本,IBM 不断更新软件,因此几乎每年都有新版本。以下是该计划不同级别(和成本)可用的统计测试和操作列表:
基础版包含分析功能,例如高级数据准备、描述统计、线性回归、可视化图形和报告
● 主要特征:
★ 基本假设检验
★ 自举
★ 聚类分析
★ 数据访问和管理
★ 非参数检验
★ 单向方差分析
★ 输出管理
★ 可编程性扩展
★ ROC分析
★ 支持 R/Python
附加功能 1:自定义表格和高级统计 — 功能:预测分类结果、应用非线性/逻辑回归、执行多变量建模以及通过自定义表格总结发现
● 主要特征:
★ 2 阶段最小二乘回归
★ 贝叶斯统计
★ 广义线性混合模型 (GLMM)
★ 广义线性建模 (GLM)
★ 对数线性分析
★ 多元分析
★ 嵌套表
★ 概率响应分析
★ 分位数回归
★ 重复测量分析
★ 生存分析
★ 加权最小二乘回归
附加 2:复杂的抽样和测试——能力:处理复杂的样本设计,发现缺失的数据,应用分类回归程序,了解消费者偏好,更准确地处理小样本
● 主要特征:
★ 分类主成分分析
★ 联合分析
★ 决策树
★ 精确测试
★ 缺失值
★ 多维缩放和展开
★ 多重对应分析
★ 神经网络
★ 具有最佳缩放比例的回归,包括套索和弹性网络
★ 时间序列分析
附加 3:预测和决策树 — 功能:使用时间序列数据预测趋势,使用分类、决策树和神经网络发现关系
● 主要特征:
★ ARIMA 建模
★ C&RT
★ CHAID 和详尽的 CHAID
★ 直销分析
★ 多层感知
★ 神经网络
★ 寻求
★ 径向基函数
★ 季节性分解
★ 光谱分析
★ 时间因果建模
R 分析
R 之所以越来越受欢迎,是因为它是一个免费的开源系统,可以在 Mac、Windows 和 Linux 上使用。它具有许多与 SPSS 相同的功能,但没有指向和单击菜单。用户必须学习一些代码才能使用 R 并了解所谓的包,这些包使用户能够执行不同的统计测试集。
R 可以下载到您的计算机上,也可以使用基于云的版本(参见上面的链接)。在 Stephanie 看来,可下载版本更易于使用。以下是可以使用 R 执行的一些操作:
• 数据转换
o 转置数据
o 旋转/熔化台
o 创建新变量
o 重新编码变量
o 计算
• 统计分析
o 双变量线性回归
o 多元线性回归
o T 检验(依赖/独立)
o 统计学意义
• 数据可视化
o 饼状图
o 箱线图
o 表
XLSTAT
Excel 本身在执行统计分析和创建图形方面变得更加有用和用户友好,但请查看 XLSTAT 以获得更高级的操作。XLSTAT 是一个可在 Mac 或 PC 上使用的 excel 插件。它采用点击式菜单,可以集成到 Excel 中。XLSTAT 的功能不亚于 R 和 SPSS,包括双变量和多变量统计。它还提供机器建模、预测分析和风险分析。还有针对不同领域的不同软件包,例如金融或生命科学。使用 XLSTAT 可以轻松地将表格和图形导出到 Word 和其他 Microsoft Office 产品中。与 SPSS 一样,XLSTAT 提供不同大小的软件包,所有专业软件包和功能的最便宜的成本为 295 美元,最大的为 1495 美元。
Stata
Stata 是另一个流行的,主要是定量的数据分析程序。在商业和金融领域非常受欢迎,Stata 提供了一些独特的功能,例如 Python(编程语言)和 JAVA 集成,以及社区贡献的功能。它提供了许多使用其他分析软件可能更难以执行的贝叶斯分析。Stata 图形和表格质量非常高。学生最基本的年度计划费用低于 100 美元。基本包对变量和案例的数量有一些限制,但应该足以满足大多数学生的需求。
定性数据分析软件呢?
定性分析程序使用户能够分析定性数据,其中包括来自焦点小组、访谈、文本和其他内容的数据,这些内容包括您想要分析的模式、趋势、发展理论、跟踪现象的变化以及名单还在继续。以下是一些最著名和常用的平台:
阿特拉斯
• 成本:
o 以 250 美元的价格租用个性化的单用户许可证或以 750 美元的价格购买(在机构/大学进行教学和研究)
o 学生许可证价格——两年 99 美元或六个月 51 美元
• 能力:
o 支持协同工作
o 从 Evernote 或 Twitter 导入数据或调查
o 提供不同的媒体类型(音频、照片)
o 对象管理器、Project Explorer 和 Co-occurrence Explorer 让您可以浏览和浏览您的项目数据
o 随时随地在数字思维导图中可视化您的发现和解释
o 交互式边缘区域是 ATLAS.ti 中独特的工作空间,用于以数字方式传输数据
o 数据可视化工具
o
o
尼维沃
• 费用:学生价格为 99 美元(Windows)或 85 美元(Mac),为期 12 个月
• 能力:
o 通过从包括社交媒体在内的各种来源导入数据来集中不同格式的数据
o 合作
o 转录
o 参考文献管理和笔记记录
o 编码组织
o 数据可视化(频率图、词云和比较图等)
o
o
结论
您还可以探索许多其他分析软件程序和工具,例如 Tableau、Qlik(用于数据挖掘)和 Provalis(定性)。阅读大量软件程序和应用程序,阅读评论,注册免费试用,看看哪些最适合您。当然,有大量书籍可以帮助您成为这些项目中的专业人士,但没有什么可以替代一位出色的实验室讲师。所以不要回避参加那门统计课,即使你不需要,因为这些程序为你做这一切——不需要数学魔法!