今
日
鸡
汤
在上不骄,高而不危;制节谨度,满而不溢。
大家好,我是皮皮。
前几天在Python白银交流群【大侠】问了一个Pandas实战的问题,一起来看看吧。上一篇文章说到,看上去AI给的答案,似乎让【大侠】不满意,遂来白银交流群问问大佬们。这一篇文章,我们一起来看看【瑜亮老师】给的代码。
粉丝的原始数据中,还是有些乱的,比方说存在空格、中文、存在*号、存在漏括号等等,若想进一步的挖掘数据,必须对原始数据进行预处理。

这里【瑜亮老师】给了具体的代码,如下图所示:

import re
import pandas as pd
result = []
# 打开原始的txt文件
with open('data.txt', 'r', encoding='utf-8') as f:
# 逐行读取原始文件
for line in f:
if '[' in line and ']' in line:
result.append(eval(line))
elif '数据' in line:
if "备注" not in line:
line = re.sub(r"[\u4e00-\u9fa5【】!\]]", "", line).strip()
result.append(eval(line))
elif "*" not in line:
line = line.replace("]", "")
result.append(eval(line))
res = [result[i:i+3] for i in range(0, len(result), 3)]
df = pd.DataFrame(res)
df = df.explode([1, 2], ignore_index=True)
df.columns = ["日期", "股票代码", "data"]
print(df)
df.to_excel("data.xlsx")
代码运行之后,可以得到预期的结果,如下图所示:

后来粉丝按照上述思路,顺利地解决了粉丝的问题。事实证明,能让AI都无法解决的代码问题,大都是自己并没有问清楚,论准确表达的重要性。
大家好,我是皮皮。这篇文章主要盘点了一个Pandas实战的问题,文中针对该问题,给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。
最后感谢粉丝【大侠】提出的问题,感谢【巭孬🕷】、【瑜亮老师】、【隔壁😼山楂】、【甯同学】给出的思路,感谢【莫生气】、【曾是惊鸿照影来】等人参与学习交流。
------------------- End -------------------
欢迎大家点赞,留言,转发,转载,感谢大家的相伴与支持
万水千山总是情,点个【在看】行不行
/今日留言主题/
随便说一两句吧~~
本文分享自 Python爬虫与数据挖掘 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!