盘点一个AI都无法解决的Python基础题目（中篇）

Python进阶者

发布于 2024-01-06 14:30:39

2350

文章被收录于专栏：Python爬虫与数据挖掘Python爬虫与数据挖掘

今

日

鸡

汤

在上不骄，高而不危；制节谨度，满而不溢。

大家好，我是皮皮。

一、前言

前几天在Python白银交流群【大侠】问了一个Pandas实战的问题，一起来看看吧。上一篇文章说到，看上去AI给的答案，似乎让【大侠】不满意，遂来白银交流群问问大佬们。这一篇文章，我们一起来看看【瑜亮老师】给的代码。

二、实现过程

粉丝的原始数据中，还是有些乱的，比方说存在空格、中文、存在*号、存在漏括号等等，若想进一步的挖掘数据，必须对原始数据进行预处理。

这里【瑜亮老师】给了具体的代码，如下图所示：

import re
import pandas as pd

result = []
# 打开原始的txt文件
with open('data.txt', 'r', encoding='utf-8') as f:
    # 逐行读取原始文件
    for line in f:
        if '[' in line and ']' in line:
            result.append(eval(line))
        elif '数据' in line:
            if "备注" not in line:
                line = re.sub(r"[\u4e00-\u9fa5【】！\]]", "", line).strip()
                result.append(eval(line))
        elif "*" not in line:
            line = line.replace("]", "")
            result.append(eval(line))

res = [result[i:i+3] for i in range(0, len(result), 3)]
df = pd.DataFrame(res)
df = df.explode([1, 2], ignore_index=True)
df.columns = ["日期", "股票代码", "data"]
print(df)
df.to_excel("data.xlsx")

代码运行之后，可以得到预期的结果，如下图所示：

后来粉丝按照上述思路，顺利地解决了粉丝的问题。事实证明，能让AI都无法解决的代码问题，大都是自己并没有问清楚，论准确表达的重要性。

三、总结

大家好，我是皮皮。这篇文章主要盘点了一个Pandas实战的问题，文中针对该问题，给出了具体的解析和代码实现，帮助粉丝顺利解决了问题。

最后感谢粉丝【大侠】提出的问题，感谢【巭孬🕷】、【瑜亮老师】、【隔壁😼山楂】、【甯同学】给出的思路，感谢【莫生气】、【曾是惊鸿照影来】等人参与学习交流。

------------------- End -------------------

欢迎大家点赞，留言，转发，转载，感谢大家的相伴与支持

万水千山总是情，点个【在看】行不行

/今日留言主题/

随便说一两句吧~~

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2024-01-05，如有侵权请联系 cloudcommunity@tencent.com 删除

程序人生

本文分享自 Python爬虫与数据挖掘微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

程序人生

登录后参与评论

0 条评论

热度