
准备统计和机器学习的文本数据
|
135
for col, values in extract_nlp(doc).items():
print(f"{col}: {values}")
输出结果:
lemmas: ['good', 'friend', 'Ryan', 'Peters', 'like', 'fancy', 'adventure', \
'game']
adjs_verbs: ['good', 'like', 'fancy']
nouns: ['friend', 'Ryan', 'Peters', 'adventure', 'game']
noun_phrases: ['adventure_game']
adj_noun_phrases: ['good_friend', 'fancy_adventure', 'fancy_adventure_game']
entities: ['Ryan_Peters/PERSON']
上述返回的列表中包含了下一步所需的列名。我们无需对它进行硬编码,因为我们
可以用一个空文档调用
extract_nlp
即可获取这个列表:
nlp_columns = list(extract_nlp(nlp.make_doc('')).keys())
print(nlp_columns)
输出结果:
['lemmas', 'adjs_verbs', 'nouns', 'noun_phrases', 'adj_noun_phrases', 'entities']
4.7.2 ...