代码走查
以下的笔记本提供代码和说明培训和查询模型使用wordVectors
R包由本·施密特和剑。这些版本已经格式化了网络使他们更容易阅读。下载并运行RMarkdown版本,请参阅最新版本在GitHub上。看到代码的全套笔记本,额外上下文添加和指示,请参阅GitHub库。一些笔记本设计RStudio服务器,别人RStudio桌面,和一些可以使用。
- 介绍R和RStudio介绍R编程语言的基本概念和RStudio编程环境。它可以用于RStudio服务器环境和在您自己的计算机。
- 词向量起动器查询提供了一个框架,用于查询模型,已经被训练(不包括模型训练过程)的代码。它假设您正在RStudio服务器环境中,所以它不包括代码加载外部代码包,因为这些服务器环境中提供。
- 词向量训练、查询和验证提供了一个完整的框架,整个过程的训练,查询和验证模型。与起动器查询预排,它假定您正在RStudio服务器环境中,所以它不包括代码加载外部包,和它包括指令让你的输出文件RStudio服务器和你自己的电脑上,和你的文件加载到RStudio服务器环境。
- 词向量的安装、培训、查询和验证像上面的介绍覆盖相同的功能,但它假定您正在运行的代码在您自己的计算机,而不是RStudio服务器。
- 词向量可视化提供更详细的代码可视化现有训练模型,通过一组例子的情节与女性作家网上收集。它可以用于RStudio服务器环境和在您自己的计算机。
额外的资源
我们也发表补充工作表上女性作家项目“参考资料”页面:
- 数据准备指导和检查表:准备一个详细的指南语料库词嵌入模型的工作。
- 模型验证和评估清单:引导词嵌入模型的评估和验证研究。
- 样本模型和查询日志:一个指导跟踪设置,查询,结果当与字嵌入模型试验。
- 语料库搜索指南:指导策略研究语料库和一些建议工具使这一切变得更简单。