首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >盘点一个AI都无法解决的Python基础题目(中篇)

盘点一个AI都无法解决的Python基础题目(中篇)

作者头像
Python进阶者
发布2024-01-06 14:30:39
发布2024-01-06 14:30:39
2350
举报

在上不骄,高而不危;制节谨度,满而不溢。

大家好,我是皮皮。

一、前言

前几天在Python白银交流群【大侠】问了一个Pandas实战的问题,一起来看看吧。上一篇文章说到,看上去AI给的答案,似乎让【大侠】不满意,遂来白银交流群问问大佬们。这一篇文章,我们一起来看看【瑜亮老师】给的代码。

二、实现过程

粉丝的原始数据中,还是有些乱的,比方说存在空格、中文、存在*号、存在漏括号等等,若想进一步的挖掘数据,必须对原始数据进行预处理。

这里【瑜亮老师】给了具体的代码,如下图所示:

代码语言:javascript
复制
import re
import pandas as pd

result = []
# 打开原始的txt文件
with open('data.txt', 'r', encoding='utf-8') as f:
    # 逐行读取原始文件
    for line in f:
        if '[' in line and ']' in line:
            result.append(eval(line))
        elif '数据' in line:
            if "备注" not in line:
                line = re.sub(r"[\u4e00-\u9fa5【】!\]]", "", line).strip()
                result.append(eval(line))
        elif "*" not in line:
            line = line.replace("]", "")
            result.append(eval(line))

res = [result[i:i+3] for i in range(0, len(result), 3)]
df = pd.DataFrame(res)
df = df.explode([1, 2], ignore_index=True)
df.columns = ["日期", "股票代码", "data"]
print(df)
df.to_excel("data.xlsx")

代码运行之后,可以得到预期的结果,如下图所示:

后来粉丝按照上述思路,顺利地解决了粉丝的问题。事实证明,能让AI都无法解决的代码问题,大都是自己并没有问清楚,论准确表达的重要性。

三、总结

大家好,我是皮皮。这篇文章主要盘点了一个Pandas实战的问题,文中针对该问题,给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。

最后感谢粉丝【大侠】提出的问题,感谢【巭孬🕷】、【瑜亮老师】、【隔壁😼山楂】、【甯同学】给出的思路,感谢【莫生气】、【曾是惊鸿照影来】等人参与学习交流。

------------------- End -------------------

欢迎大家点赞,留言,转发,转载,感谢大家的相伴与支持

万水千山总是情,点个【在看】行不行

/今日留言主题/

随便说一两句吧~~

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-01-05,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Python爬虫与数据挖掘 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、前言
  • 二、实现过程
  • 三、总结
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档