我有一个包含英文和非英文名称的数据框架df_android['App']。我想去掉那些非英语的。这个想法是使用一个代表字母的数字系统。127以上的数字不是英文符号。
我尝试过在lambda中实现它,但我不知道如何将df_android['App']中的每个名称拆分成字母:
for app in df_android['App']:
for letter in app:
letter = ord(letter)
df_android['Lang'] = df_android['App'].apply(lambda x: 'English' if letter < 127 else 'non-English')我如何找出哪个字母是英语/非英语,并将这些知识应用到一个新的专栏中?
示例:

发布于 2019-10-28 18:57:00
答案:df_android['Lang'] = df_android['App'].apply(lambda x: 'English' if all(ord(letter) < 127 for word in x for letter in word) else 'non-English')
https://stackoverflow.com/questions/58587479
复制相似问题