时间分析:探索和比较世纪使用这个词向量接口

由卡拉玛塔墨西拿

描述

这种课堂活动将向学生介绍模型从不同的世纪使用训练语料词向量接口(WVI)可以通过女性作家向量工具包(WWVT)——使他们开始探索更大的主题关于年表的作用的问题女性作家在网上(WWO)。活动融合WWO可以作为一个起点,时间分析和比较,字嵌入模型和文本分析在教室里。

这个活动将为学习者提供一个机会去探索WWO并执行比较分析的文本集合由女性作家在16 + 17、18、19世纪。这种类型的活动将是有用的课程,关注早期女性作家或早期文学文化更广泛。

这个活动被分成几个部分。首先,学生使用的“集群”功能查看集群相关术语在模型训练文本从一个特定的世纪。接下来,学生感兴趣的查询条件从模型开始。如果有时间,学生们将进行比较分析,通过观察结果的模型从不同的世纪。这个活动的范围根据可用的时间不同;建议至少分配一个小时有意义的探索,分析和讨论。

学习目标

这个活动会使学生:

  • 获得一个基本的了解女性作家词向量接口,尤其是“集群”和“基本”查询选项。
  • 研究如何使用特定的单词在16日,17日,18日和19世纪。
  • 进行比较分析两个世纪的模型。
  • 探讨之间的关系词语料库领带到更大的文化价值。

活动

活动1:集群的世纪

对于这个活动,你的学生将探索“集群”结果为模型的选择(WWO 16 + 17, WWO 18日或WWO 19)。“集群”结果显示10个随机集群从你的模型。每次点击“重置集群”,你得到一个新的随机设置的集群。关于“集群”的更多信息结果和“基本”查询结果,我们鼓励您看看这个活动。

集群为学生提供了一种方法来快速发现的相关术语集在一个模型中,并开始考虑如何字嵌入在向量空间模型的地方话。

开始,让学生选择一个实足的模型界面的左栏,然后单击“集群。“学生搜索集群,继续刷新,直到他们找到一个特别有趣的一个。你可以建议他们保存这些集群未来的探索和分析。

一旦你的学生已经确定至少一个集群的兴趣,鼓励他们使用“基本”查询功能探索文字的集群。让学生有一个小组或全班讨论的结果“基本”查询功能为特定词他们感兴趣,关注结果令人惊讶的或意外。在这些谈话,鼓励学生思考这些一般的结果可能会说什么文本从他们正在探索的世纪。

最后,问学生点击感兴趣的单词,看一看他们是如何使用WWO语料库和比较中使用与他们的期望从探索这个词向量接口。注意,学生可以缩小他们的结果在WWO世纪探索与时间轴或century-selection复选框。

活动2:世纪比较使用集群

要求学生选择一个不同的世纪时间模型和重复与“基本”的搜索查询选项。让他们讨论如何相关术语的相同或不同的是他们发现模型从不同的世纪。讨论特别令人惊讶或有趣的差异作为一个群体,并要求学生考虑这些可能会显示什么文化和时间反映在文本。