14 Nisan 2020. 博客

TDM Studio今天上线。了解它是如何激发职业生涯的发现的

从预测CEO行为到理解莎士比亚的写作风格,ProQuest的新文本和数据挖掘解决方案帮助研究人员发现新的见解,挑战之前的发现。

今天,Proquest推出TDM Studio是一个强大的新解决方案,使文本和数据挖掘的力量直接在研究人员的手中。

TDM Studio为文本和数据挖掘(TDM)解锁了大量当前和历史的ProQuest内容,包括新闻、期刊、论文和论文、主要来源等。用户还可以上传自己的内容,并将其与ProQuest内容相结合,形成一个真正全面的数据集。

揭示与文本和数据挖掘的新连接

一个新的covid-19数据集:Proquest已建立了50万个最近文章的数据集 - 主要来自报纸 - 与Covid-19有关。在TDM Studio分析时,此数据可以帮助研究人员更好地了解当地和国家新闻报告的趋势。TDM Studio的任何用户都可以访问此数据。注册演示。

约翰·狄龙TDM Studio的产品经理表示,他看到该产品为跨学科研究注入了新的活力。

“研究人员现在有这些新方法来回答他们以前没有好的回答的问题,”他说。“当你思考它时,这是吹来的。多年来,许多研究人员需要在适当的计算环境中以机器可读格式访问此内容,并使用分析工具执行TDM,但并不总是可以同时将所有这些元素放在一起。通过TDM Studio,我们能够解决这些挑战。“

在加入ProQuest之前,Dillon是其中一名研究人员。他拥有英国文学博士学位,在他的早期职业生涯中,他试图将有争议的或匿名的文本归为作者。他需要用到的很多统计方法都需要编程知识,所以他参加了编程和数据科学课程。之后,作为博士后,他在IBM Research工作,研究如何根据学生在在线学习平台上的评论和行动预测他们的情绪。

但是,许多可以从TDM受益的人并不擅长计算机或数据科学。这就是为什么TDM工作室正在为所有技能水平的研究人员设计。

Dillon说:“那些会编程的人可以使用预定义的数据分析方法,也可以使用R和Python等开源编程语言创建的自己的方法。”“在未来的版本中,非编码人员将能够使用嵌入分析方法的界面,引导用户可视化并部分操纵结果。”

随着产品的不断发展,其目标是在整个大学范围内提供TDM解决方案,而不管用户对TDM或编码有多熟悉。

该产品的灵活性还包括实时协作和“随时随地”访问。“在校园关闭、大多数研究人员都在远程工作的今天,这一点尤其重要,”他说明迪Pozenel是TDM Studio的产品管理总监。“使用TDM Studio,他们可以在项目上与他们的同事合作,他们也可以在没有大学的网络上登录家庭。”

TDM通过学术图书馆

学术图书馆 - 已经拥有丰富的研究内容 - 可以使用TDM工作室从现有的收藏中推动更多价值,为与研究团队的合作伙伴关系创造新的机会,提高教学和学习。

“图书馆已经订阅了这一内容的重要部分,”Pozenel说。“但即使您有一个高度使用的数据库,也可以读取一百万个文章,并且重大价值仍未开发。当您可以使用TDM从大量此内容导出值时,它将库的角色放大为服务中心 - 以传播知识并为研究工作流创造更多价值。“

TDM工作室如何为一名研究人员“保存了这一天”

虽然TDM工作室是市场的新手,但一些研究人员已经使用它。在过去的一年里,Proquest一直与发展伙伴和早期访问研究人员合作,超过50个不同的研究项目。

Caleb Rawson.是阿肯色州大学会计助理教授,是那些开发伙伴之一。Rawson一直在研究一个研究项目,以确定CEO的信心如何有助于公司未来的成功。他试图了解为什么有些公司领导人自信地谈论他们的商业秘密,而其他公司则没有,以及两种类型的行为的后果。

罗森在接受ProQuest采访时表示:“例如,特斯拉首席执行官埃隆•马斯克喜欢谈论特斯拉正在做的一切。但是为什么呢?这让他的竞争对手有机会花更多的钱在竞争产品上。这就是我们所说的专有成本——披露你的商业秘密的成本,因为竞争对手现在知道你在做什么了。”

为了确定这种行为的结果,RAWSON需要对多年的媒体报道进行广泛分析:CEO简介,访谈,功能,新闻和其他细节。但是答案可能只会来自Rawson无法做到的事情:阅读数十万篇文章。这是他转向Proquest和TDM Studio的帮助时。

使用TDM Studio,创建内容集的时间学者已经减少到几小时,而不是传统方法所需的月份。

Rawson表示,他通过给予Proquest 2,500次公司和首席执行官来开始他的TDM试点项目(特斯拉麝香例如),他所需的出版物的列表以及一系列日期。他的初步搜索结果占有于323,000,这是 - 轻轻地放下它 - “比我期待的更多”,“他说。“如果我不需要,我不想花六个月阅读有关CEO的数千篇文章。这就是TDM跨越的地方,为我拯救了这一天。“

Rawson使用TDM Studio采取了几个步骤来缩小他的数据集。首先,他在广告中删除了提到公司或CEO名称的所有文章。然后,他只保留了包含某些短语的文章,就像自信,谨慎,乐观,悲观保守的。他继续使用额外的文本采矿措施改进他的数据集,直到他达到约22,000篇文章。

“现在,在每一篇文章中,我都能使用一种算法,查看围绕CEO名字出现的、以自信或谨慎的方式描述他们的词语。TDM工作室为我节省了几个月的时间,我本可以花在收集和阅读文章上。”

最终,Rawson了解到过于自信的首席执行官揭示了更多内幕信息和商业秘密。这可以使竞争对手公司成为一个优势,它可以在过度自信的首席执行官公司妨碍研究效率。该研究目前正在等待对等审查的出版物。

罗森断言,会计研究并不像大多数人认为的那样乏味,他目前所做的只是揭示了可能性的冰山一角。Rawson说道:“我对TDM Studio感到非常兴奋。“我看到它在我正在做的研究中有很多应用。”

了解更多关于TDM Studio,包括如何应用于研究,而且还可以在研究中进行教学和学习。

一个新的covid-19数据集

Proquest已建立了50万个最近文章的数据集 - 主要来自报纸 - 与Covid-19有关。在TDM Studio分析时,此数据可以帮助研究人员更好地了解当地和国家新闻报告的趋势。TDM Studio的任何用户都可以访问此数据。注册演示