01.如果你是HR
employees ={
'老张':18000,
'老王':28000,
'小李':10000,
'小丽':8000
}
对文本进行信息排名的时候,是用其关键词的相关性来进行的,为了达到这个目的,搜索引擎需要对文本的内容进行NLP分析,会过滤掉那些文本意义不大的词,比如一个的方法就是过滤掉长度<3的单词(a,as,the,how)这些。
下面是一种常见的方式:
但是可以换成一行代码来搞定:
输出:['吃喝', '衣服', '开车']
输出:
[{'job': 'Senior engineer', 'name': 'Sam', 'salary': 18000, 'sex': 'male'},
{'job': 'Junior engineer', 'name': 'Lili', 'salary': 10000, 'sex': 'female'},
{'job': 'PM', 'name': 'Tom', 'salary': 25000, 'sex': 'male'},
{'job': 'data scientist', 'name': 'Leo', 'salary': 22000, 'sex': 'male'}]
本文为原创文章,版权归知行编程网所有,欢迎分享本文,转载请保留出处!
内容反馈